Hierarchical Reasoning Model

Hierarchical Reasoning Model

層次推理模型(HRM)是一種受大腦啟發的AI架構,它僅使用2700萬個參數即可實現卓越的推理能力,並使用兩個相互依賴的循環模組進行抽象規劃和詳細計算。
https://github.com/sapientinc/HRM?ref=producthunt&utm_source=aipure
Hierarchical Reasoning Model

產品資訊

更新時間:2025年08月09日

什麼是 Hierarchical Reasoning Model

層次推理模型(HRM)是由Sapient Intelligence開發的一種新型循環架構,它徹底改變了AI的推理能力。HRM於2025年7月發布,其靈感來自於人腦中觀察到的層次和多時間尺度處理模式。與依賴於思維鏈(CoT)技術的傳統大型語言模型不同,HRM以最少的訓練數據高效運行,且無需預訓練。該模型在複雜的推理任務中表現出卓越的性能,包括解決極端數獨謎題和大型迷宮中的最佳路徑查找,同時僅使用1,000個訓練樣本。

Hierarchical Reasoning Model 的主要功能

層次推理模型(HRM)是一種受大腦啟發的人工智慧架構,它使用兩個相互依存的循環模組——一個用於抽象規劃的高級模組和一個用於詳細計算的低級模組——來實現複雜的推理能力。 HRM 僅有 2700 萬個參數,並且僅在 1,000 個沒有預訓練的範例上進行訓練,可以透過層次處理、時間分離和循環連接來解決具有挑戰性的任務,從而優於更大的語言模型,同時更有效率和穩定。
層次雙模組架構: 具有兩個以不同時間尺度運作的耦合循環模組——一個用於緩慢、抽象規劃的高級模組和一個用於快速、詳細計算的低級模組
最低限度的訓練要求: 僅使用 1,000 個訓練樣本即可實現卓越的效能,而無需預訓練或思維鏈資料
高效的參數使用: 僅用 2700 萬個參數即可完成複雜的推理任務,遠少於傳統的大型語言模型
單次正向傳遞處理: 在一次正向傳遞中執行循序推理任務,而無需對中間步驟進行明確的監督

Hierarchical Reasoning Model 的使用案例

複雜謎題求解: 以接近完美的準確度解決極端的數獨謎題和其他複雜的數學/邏輯謎題
路徑規劃優化: 有效率地尋找大型迷宮和複雜導航場景中的最佳路徑
抽象推理任務: 在抽象和推理語料庫(ARC)上表現良好,展現了一般智慧任務的能力

優點

高效,參數計數和訓練資料需求極少
穩定的訓練過程,沒有收斂問題
與較大的模型相比,在複雜的推理任務上具有卓越的效能

缺點

在小樣本情境中可能會出現後期過度擬合
在小樣本學習中顯示 ±2 點的準確度方差
需要特定的 GPU 配置和 CUDA 擴充才能獲得最佳效能

如何使用 Hierarchical Reasoning Model

安裝先決條件: 安裝CUDA 12.6、支持CUDA的PyTorch以及用於構建擴展的其他套件。運行:wget CUDA安裝程式,安裝CUDA,設置CUDA_HOME,安裝PyTorch,並安裝套件相依性
安裝FlashAttention: 對於Hopper GPU:克隆flash-attention倉庫並安裝FlashAttention 3。對於Ampere或更早的GPU:通過pip install flash-attn安裝FlashAttention 2
安裝Python相依性: 運行'pip install -r requirements.txt'以安裝所有必需的Python套件
設置Weights & Biases: 通過運行'wandb login'設置W&B以進行實驗追蹤,並確保您已登錄到您的帳戶
準備數據集: 為您的特定任務構建數據集。例如,對於數獨:運行'python dataset/build_sudoku_dataset.py',並使用適當的參數來設置數據集大小和擴充
開始訓練: 使用適當的參數啟動訓練。數獨範例:'OMP_NUM_THREADS=8 python pretrain.py data_path=data/sudoku-extreme-1k-aug-1000 epochs=20000 eval_interval=2000 global_batch_size=384 lr=7e-5'
監控訓練: 通過W&B介面追蹤訓練進度,監控eval/exact_accuracy指標
評估模型: 使用'torchrun --nproc-per-node 8 evaluate.py checkpoint=<CHECKPOINT_PATH>'運行評估,並通過提供的筆記本分析結果
使用預訓練檢查點: 或者,從HuggingFace下載ARC-AGI-2、Sudoku 9x9 Extreme或Maze 30x30 Hard任務的預訓練檢查點

Hierarchical Reasoning Model 常見問題

HRM是一種新穎的遞迴架構,其靈感來自人腦中的分層和多時間尺度處理。它具有兩個相互依賴的遞迴模組:一個用於緩慢、抽象規劃的高階模組,以及一個用於快速、詳細計算的低階模組。它可以在單次正向傳遞中執行序列推理任務,而無需明確的監督。

与 Hierarchical Reasoning Model 类似的最新 AI 工具

Athena AI
Athena AI
Athena AI 是一個多功能的 AI 驅動平台,通過文檔分析、測驗生成、閃卡和互動聊天功能,提供個性化的學習協助、商業解決方案和生活輔導。
Aguru AI
Aguru AI
Aguru AI 是一個本地部署的軟件解決方案,為基於 LLM 的應用提供全面的監控、安全和優化工具,包括行為跟蹤、異常檢測和性能優化等功能。
GOAT AI
GOAT AI
GOAT AI 是一個 AI 驅動的平台,提供一鍵摘要功能,適用於新聞文章、研究論文和視頻等多種內容類型,同時還提供先進的 AI 代理編排,用於特定領域的任務。
GiGOS
GiGOS
GiGOS 是一個 AI 平台,提供多個先進的語言模型,如 Gemini、GPT-4、Claude 和 Grok,並通過直觀的界面讓用戶與不同的 AI 模型互動和比較。