Was sind die wichtigsten Leistungsmerkmale von HRM?

Mit nur 27 Millionen Parametern erzielt HRM eine außergewöhnliche Leistung bei komplexen Denkaufgaben mit nur 1000 Trainingsbeispielen. Es erzielt eine nahezu perfekte Leistung bei anspruchsvollen Aufgaben wie komplexen Sudoku-Rätseln und der optimalen Pfadfindung in großen Labyrinthen. Auf dem ARC-Benchmark erzielt es eine Leistung von 40,3 % und übertrifft damit größere Modelle wie o3-mini-high (34,5 %) und Claude 3.7 (21,2 %).

Was sind die Hauptvorteile von HRM im Vergleich zu traditionellen Modellen?

HRM arbeitet ohne Vortraining oder Chain-of-Thought (CoT)-Daten, benötigt weniger Parameter (27 Millionen) und kann mit kleineren Trainingsdatensätzen (1000 Beispiele) arbeiten. Es erhält sowohl die Trainingsstabilität als auch die Effizienz aufrecht und erreicht gleichzeitig eine beträchtliche Rechenleistung, wodurch die schnellen Konvergenzprobleme vermieden werden, die bei Standard-Rekursionsmodellen auftreten.

Was sind die Systemanforderungen für die Ausführung von HRM?

HRM erfordert PyTorch- und CUDA-Installationen mit spezifischen Anforderungen für FlashAttention (Version 3 für Hopper-GPUs, Version 2 für Ampere- oder frühere GPUs). Es benötigt auch zusätzliche Pakete für den Aufbau von Erweiterungen und verwendet Weights & Biases für die Experimentverfolgung.

Wie lange dauert das Training von HRM für verschiedene Aufgaben?

Die Trainingszeiten variieren je nach Aufgabe: Sudoku Extreme (1k Samples) dauert etwa 10 Stunden auf einer RTX 4070 Laptop-GPU, ARC-1 und ARC-2 dauern jeweils etwa 24 Stunden auf einem 8-GPU-Setup, Maze 30x30 Hard dauert etwa 1 Stunde und Full Sudoku-Hard dauert etwa 2 Stunden.

Hierarchical Reasoning Model

WebsiteFreeLarge Language Models (LLMs)Research Tools

Das Hierarchical Reasoning Model (HRM) ist eine vom Gehirn inspirierte KI-Architektur, die mit nur 27 Millionen Parametern außergewöhnliche Denkfähigkeiten erreicht und zwei voneinander abhängige, wiederkehrende Module für abstrakte Planung und detaillierte Berechnungen verwendet.

Website besuchen

Dieses Tool bewerben

https://github.com/sapientinc/HRM?ref=producthunt&utm_source=aipure

Überblick
Video
Alternativen

Produktinformationen

Aktualisiert:Nov 16, 2025

Was ist Hierarchical Reasoning Model

Das Hierarchical Reasoning Model (HRM) ist eine neuartige, wiederkehrende Architektur, die von Sapient Intelligence entwickelt wurde und die KI-Denkfähigkeiten revolutioniert. Das im Juli 2025 veröffentlichte HRM ist von den hierarchischen und Multi-Timescale-Verarbeitungsmustern inspiriert, die im menschlichen Gehirn beobachtet werden. Im Gegensatz zu herkömmlichen großen Sprachmodellen, die auf Chain-of-Thought (CoT)-Techniken basieren, arbeitet HRM effizient mit minimalen Trainingsdaten und ohne Vortrainingsanforderungen. Das Modell demonstriert eine bemerkenswerte Leistung bei komplexen Denkaufgaben, einschließlich der Lösung extremer Sudoku-Rätsel und der optimalen Pfadfindung in großen Labyrinthen, während es nur 1.000 Trainingsbeispiele verwendet.

Hauptfunktionen von Hierarchical Reasoning Model

Das Hierarchische Denkmodell (HRM) ist eine vom Gehirn inspirierte KI-Architektur, die zwei voneinander abhängige, wiederkehrende Module verwendet - ein High-Level-Modul für abstrakte Planung und ein Low-Level-Modul für detaillierte Berechnungen -, um komplexe Denkfähigkeiten zu erreichen. Mit nur 27 Millionen Parametern und trainiert an nur 1.000 Beispielen ohne Vortraining kann HRM anspruchsvolle Aufgaben durch hierarchische Verarbeitung, zeitliche Trennung und wiederkehrende Konnektivität lösen und dabei viel größere Sprachmodelle übertreffen, während es effizienter und stabiler ist.

Hierarchische Dual-Modul-Architektur: Verfügt über zwei gekoppelte, wiederkehrende Module, die auf unterschiedlichen Zeitskalen arbeiten - ein High-Level-Modul für langsame, abstrakte Planung und ein Low-Level-Modul für schnelle, detaillierte Berechnungen

Minimale Trainingsanforderungen: Erzielt außergewöhnliche Leistung mit nur 1.000 Trainingsbeispielen, ohne dass Vortraining oder Chain-of-Thought-Daten erforderlich sind

Effiziente Parameternutzung: Bewältigt komplexe Denkaufgaben mit nur 27 Millionen Parametern, deutlich weniger als herkömmliche große Sprachmodelle

Single Forward Pass Verarbeitung: Führt sequenzielle Denkaufgaben in einem einzigen Vorwärtsdurchlauf aus, ohne dass eine explizite Überwachung der Zwischenschritte erforderlich ist

Anwendungsfälle von Hierarchical Reasoning Model

Komplexe Rätsellösung: Löst extreme Sudoku-Rätsel und andere komplexe mathematische/logische Rätsel mit nahezu perfekter Genauigkeit

Pfadfindungsoptimierung: Findet effizient optimale Pfade in großen Labyrinthen und komplexen Navigationsszenarien

Abstrakte Denkaufgaben: Schneidet im Abstraction and Reasoning Corpus (ARC) gut ab und demonstriert Fähigkeiten in allgemeinen Intelligenzaufgaben

Vorteile

Hocheffizient mit minimalem Parameteraufwand und Trainingsdatenbedarf

Stabiler Trainingsprozess ohne Konvergenzprobleme

Überlegene Leistung bei komplexen Denkaufgaben im Vergleich zu größeren Modellen

Nachteile

Kann in Small-Sample-Szenarien zu Late-Stage-Overfitting führen

Zeigt eine Genauigkeitsvarianz von ±2 Punkten beim Small-Sample-Lernen

Benötigt spezifische GPU-Konfigurationen und CUDA-Erweiterungen für optimale Leistung

Wie verwendet man Hierarchical Reasoning Model

Voraussetzungen installieren: Installieren Sie CUDA 12.6, PyTorch mit CUDA-Unterstützung und zusätzliche Pakete für die Erstellung von Erweiterungen. Führen Sie Folgendes aus: wget CUDA-Installer, installieren Sie CUDA, setzen Sie CUDA_HOME, installieren Sie PyTorch und installieren Sie Packaging-Abhängigkeiten

FlashAttention installieren: Für Hopper-GPUs: Klonen Sie das Flash-Attention-Repo und installieren Sie FlashAttention 3. Für Ampere- oder frühere GPUs: Installieren Sie FlashAttention 2 über pip install flash-attn

Python-Abhängigkeiten installieren: Führen Sie \'pip install -r requirements.txt\' aus, um alle erforderlichen Python-Pakete zu installieren

Weights & Biases einrichten: Richten Sie W&B für die Experimentverfolgung ein, indem Sie \'wandb login\' ausführen und sicherstellen, dass Sie in Ihrem Konto angemeldet sind

Datensatz vorbereiten: Erstellen Sie den Datensatz für Ihre spezifische Aufgabe. Zum Beispiel für Sudoku: Führen Sie \'python dataset/build_sudoku_dataset.py\' mit geeigneten Parametern für Datensatzgröße und Augmentierung aus

Training starten: Starten Sie das Training mit geeigneten Parametern. Beispiel für Sudoku: \'OMP_NUM_THREADS=8 python pretrain.py data_path=data/sudoku-extreme-1k-aug-1000 epochs=20000 eval_interval=2000 global_batch_size=384 lr=7e-5\'

Training überwachen: Verfolgen Sie den Trainingsfortschritt über die W&B-Schnittstelle und überwachen Sie die Metrik eval/exact_accuracy

Modell bewerten: Führen Sie die Bewertung mit \'torchrun --nproc-per-node 8 evaluate.py checkpoint=<CHECKPOINT_PATH>\' aus und analysieren Sie die Ergebnisse über die bereitgestellten Notebooks

Vortrainierte Checkpoints verwenden: Alternativ können Sie vortrainierte Checkpoints von HuggingFace für ARC-AGI-2, Sudoku 9x9 Extreme oder Maze 30x30 Hard-Aufgaben herunterladen

Hierarchical Reasoning Model FAQs

HRM ist eine neuartige, rekursive Architektur, die von der hierarchischen und multitemporalen Verarbeitung im menschlichen Gehirn inspiriert ist. Sie verfügt über zwei voneinander abhängige, rekursive Module: ein High-Level-Modul für langsame, abstrakte Planung und ein Low-Level-Modul für schnelle, detaillierte Berechnungen. Es kann sequenzielle Denkaufgaben in einem einzigen Vorwärtsdurchlauf ohne explizite Überwachung ausführen.

Hierarchical Reasoning Model Video

Beliebte Artikel

Die beliebtesten KI-Tools von 2025 | 2026 Update von AIPURE

Feb 10, 2026

Moltbook AI: Das erste reine KI-Agenten-Netzwerk von 2026

Feb 5, 2026

ThumbnailCreator: Das KI-Tool, das Ihren YouTube-Thumbnail-Stress löst (2026)

Jan 16, 2026

KI-Smartglasses 2026: Eine Software-orientierte Perspektive auf den Markt für tragbare KI

Jan 7, 2026

Neueste KI-Tools ähnlich wie Hierarchical Reasoning Model

Athena AI

FreemiumAI Productivity Tools Large Language Models (LLMs)

Athena AI ist eine vielseitige KI-gestützte Plattform, die personalisierte Studienhilfe, Geschäftslösungen und Lebensberatung durch Funktionen wie Dokumentenanalyse, Quizgenerierung, Karteikarten und interaktive Chat-Funktionen anbietet.

Aguru AI

Free TrialMonitor & Log Management Large Language Models (LLMs)

Aguru AI ist eine On-Premises-Softwarelösung, die umfassende Überwachungs-, Sicherheits- und Optimierungstools für LLM-basierte Anwendungen mit Funktionen wie Verhaltensverfolgung, Anomalieerkennung und Leistungsoptimierung bietet.

GOAT AI

FreemiumSummarizer Large Language Models (LLMs)

GOAT AI ist eine KI-gestützte Plattform, die Ein-Klick-Zusammenfassungsfunktionen für verschiedene Inhaltsarten, einschließlich Nachrichtenartikeln, Forschungsberichten und Videos, bietet und gleichzeitig fortschrittliche KI-Agentenorchestrierung für domänenspezifische Aufgaben anbietet.

GiGOS

Free TrialLarge Language Models (LLMs)Multi-purpose Tools

GiGOS ist eine KI-Plattform, die Zugang zu mehreren fortschrittlichen Sprachmodellen wie Gemini, GPT-4, Claude und Grok mit einer intuitiven Benutzeroberfläche bietet, um mit verschiedenen KI-Modellen zu interagieren und diese zu vergleichen.

Beliebte KI-Tools wie Hierarchical Reasoning Model

GPT-5.3-Codex | Official

Large Language Models (LLMs)AI Chatbot

GPT-5.3-Codex ist das fortschrittlichste Agentic-Codierungsmodell von OpenAI, das bahnbrechende Codierungsfähigkeiten mit verbesserter Argumentation kombiniert, 25 % schneller läuft und maßgeblich an seiner eigenen Erstellung beteiligt war.

SearchGPT

Free TrialAI Search Engine Large Language Models (LLMs)

SearchGPT ist ein KI-gestützter Suchprototyp von OpenAI, der schnelle, konversationelle Antworten mit klaren Quellen unter Verwendung von GPT-Modellen bietet.

ContextGem

FreeAI Data Mining Large Language Models (LLMs)

ContextGem ist ein kostenloses Open-Source-LLM-Framework, das die Extraktion strukturierter Daten und Erkenntnisse aus Dokumenten mit minimalem Code durch leistungsstarke integrierte Abstraktionen und automatisierte Funktionen vereinfacht.

AI CLI

FreeAI Code Assistant Large Language Models (LLMs)

AI CLI ist ein Open-Source-Befehlszeilen-Interface-Tool, das KI-Funktionen direkt in Ihr Terminal bringt und es Ihnen ermöglicht, mit verschiedenen KI-Modellen wie OpenAIs GPT und Anthropic's Claude über einfache Befehle zu interagieren.

Rangliste

Einreichen & BewerbenNew