Quelles sont les principales réalisations du HRM en matière de performances ?

Avec seulement 27 millions de paramètres, le HRM atteint des performances exceptionnelles sur des tâches de raisonnement complexes en utilisant seulement 1000 échantillons d'entraînement. Il atteint des performances presque parfaites sur des tâches difficiles comme les puzzles de Sudoku complexes et la recherche de chemin optimal dans de grands labyrinthes. Sur le benchmark ARC, il atteint une performance de 40,3 %, surpassant les modèles plus grands comme o3-mini-high (34,5 %) et Claude 3.7 (21,2 %).

Quels sont les principaux avantages du HRM par rapport aux modèles traditionnels ?

Le HRM fonctionne sans pré-entraînement ni données Chain-of-Thought (CoT), nécessite moins de paramètres (27M) et peut fonctionner avec des ensembles de données d'entraînement plus petits (1000 échantillons). Il maintient à la fois la stabilité et l'efficacité de l'entraînement tout en atteignant une profondeur de calcul significative, évitant les problèmes de convergence rapide que l'on trouve dans les modèles récurrents standard.

Quelles sont les exigences système pour exécuter le HRM ?

Le HRM nécessite les installations de PyTorch et CUDA, avec des exigences spécifiques pour FlashAttention (version 3 pour les GPU Hopper, version 2 pour les GPU Ampere ou antérieurs). Il a également besoin de packages supplémentaires pour la construction d'extensions et utilise Weights & Biases pour le suivi des expériences.

Combien de temps faut-il pour entraîner le HRM pour différentes tâches ?

Les temps d'entraînement varient selon la tâche : Sudoku Extreme (1k échantillons) prend environ 10 heures sur un GPU d'ordinateur portable RTX 4070, ARC-1 et ARC-2 prennent environ 24 heures chacun sur une configuration à 8 GPU, Maze 30x30 Hard prend environ 1 heure, et Full Sudoku-Hard prend environ 2 heures.

Hierarchical Reasoning Model

WebsiteFreeLarge Language Models (LLMs)Research Tools

Le modèle de raisonnement hiérarchique (HRM) est une architecture d'IA inspirée du cerveau qui atteint des capacités de raisonnement exceptionnelles avec seulement 27 millions de paramètres, en utilisant deux modules récurrents interdépendants pour la planification abstraite et les calculs détaillés.

Visiter le site web

Promouvoir cet outil

https://github.com/sapientinc/HRM?ref=producthunt&utm_source=aipure

Aperçu
Vidéo
Alternatives

Informations sur le produit

Mis à jour:Oct 16, 2025

Qu'est-ce que Hierarchical Reasoning Model

Le modèle de raisonnement hiérarchique (HRM) est une nouvelle architecture récurrente développée par Sapient Intelligence qui révolutionne les capacités de raisonnement de l'IA. Lancé en juillet 2025, le HRM s'inspire des schémas de traitement hiérarchiques et multi-temporels observés dans le cerveau humain. Contrairement aux grands modèles de langage traditionnels qui reposent sur les techniques de Chaîne de Pensée (CoT), le HRM fonctionne efficacement avec des données d'entraînement minimales et sans exigences de pré-entraînement. Le modèle démontre des performances remarquables sur des tâches de raisonnement complexes, notamment la résolution de puzzles de Sudoku extrêmes et la recherche de chemins optimaux dans de grands labyrinthes, tout en utilisant seulement 1 000 échantillons d'entraînement.

Caractéristiques principales de Hierarchical Reasoning Model

Le modèle de raisonnement hiérarchique (HRM) est une architecture d'IA inspirée du cerveau qui utilise deux modules récurrents interdépendants - un module de haut niveau pour la planification abstraite et un module de bas niveau pour les calculs détaillés - afin de réaliser des capacités de raisonnement complexes. Avec seulement 27 millions de paramètres et entraîné sur seulement 1 000 exemples sans pré-entraînement, HRM peut résoudre des tâches difficiles grâce au traitement hiérarchique, à la séparation temporelle et à la connectivité récurrente, surpassant ainsi des modèles de langage beaucoup plus grands tout en étant plus efficace et stable.

Architecture hiérarchique à double module: Comporte deux modules récurrents couplés fonctionnant à des échelles de temps différentes - un module de haut niveau pour la planification lente et abstraite et un module de bas niveau pour les calculs rapides et détaillés

Exigences minimales en matière de formation: Atteint des performances exceptionnelles en utilisant seulement 1 000 échantillons d'entraînement sans nécessiter de pré-entraînement ni de données de type "Chain-of-Thought"

Utilisation efficace des paramètres: Accomplit des tâches de raisonnement complexes avec seulement 27 millions de paramètres, soit beaucoup moins que les grands modèles de langage traditionnels

Traitement à passage unique: Exécute des tâches de raisonnement séquentielles en un seul passage direct sans avoir besoin d'une supervision explicite des étapes intermédiaires

Cas d'utilisation de Hierarchical Reasoning Model

Résolution de puzzles complexes: Résout des puzzles de Sudoku extrêmes et d'autres puzzles mathématiques/logiques complexes avec une précision quasi parfaite

Optimisation de la recherche de chemin: Trouve efficacement les chemins optimaux dans de grands labyrinthes et des scénarios de navigation complexes

Tâches de raisonnement abstrait: Obtient de bons résultats sur le corpus d'abstraction et de raisonnement (ARC), démontrant des capacités dans les tâches d'intelligence générale

Avantages

Très efficace avec un nombre minimal de paramètres et d'exigences en matière de données d'entraînement

Processus d'entraînement stable sans problèmes de convergence

Performances supérieures sur les tâches de raisonnement complexes par rapport aux modèles plus grands

Inconvénients

Peut connaître un surapprentissage tardif dans les scénarios à petits échantillons

Montre une variance de précision de ±2 points dans l'apprentissage à petits échantillons

Nécessite des configurations GPU spécifiques et des extensions CUDA pour des performances optimales

Comment utiliser Hierarchical Reasoning Model

Installer les prérequis: Installez CUDA 12.6, PyTorch avec le support CUDA, et des paquets supplémentaires pour la construction d'extensions. Exécutez : wget installateur CUDA, installez CUDA, définissez CUDA_HOME, installez PyTorch, et installez les dépendances d'empaquetage

Installer FlashAttention: Pour les GPU Hopper : Clonez le dépôt flash-attention et installez FlashAttention 3. Pour les GPU Ampere ou antérieurs : Installez FlashAttention 2 via pip install flash-attn

Installer les dépendances Python: Exécutez 'pip install -r requirements.txt' pour installer tous les paquets Python requis

Configurer Weights & Biases: Configurez W&B pour le suivi des expériences en exécutant 'wandb login' et en vous assurant que vous êtes connecté à votre compte

Préparer l'ensemble de données: Construisez l'ensemble de données pour votre tâche spécifique. Par exemple, pour le Sudoku : Exécutez 'python dataset/build_sudoku_dataset.py' avec les paramètres appropriés pour la taille de l'ensemble de données et l'augmentation

Démarrer l'entraînement: Lancez l'entraînement avec les paramètres appropriés. Exemple pour le Sudoku : 'OMP_NUM_THREADS=8 python pretrain.py data_path=data/sudoku-extreme-1k-aug-1000 epochs=20000 eval_interval=2000 global_batch_size=384 lr=7e-5'

Surveiller l'entraînement: Suivez la progression de l'entraînement via l'interface W&B, en surveillant la métrique eval/exact_accuracy

Évaluer le modèle: Exécutez l'évaluation en utilisant 'torchrun --nproc-per-node 8 evaluate.py checkpoint=<CHECKPOINT_PATH>' et analysez les résultats via les notebooks fournis

Utiliser les points de contrôle pré-entraînés: Alternativement, téléchargez les points de contrôle pré-entraînés depuis HuggingFace pour les tâches ARC-AGI-2, Sudoku 9x9 Extreme, ou Maze 30x30 Hard

FAQ de Hierarchical Reasoning Model

Le HRM est une nouvelle architecture récurrente inspirée du traitement hiérarchique et multi-échelle du cerveau humain. Il comporte deux modules récurrents interdépendants : un module de haut niveau pour la planification lente et abstraite, et un module de bas niveau pour les calculs rapides et détaillés. Il peut exécuter des tâches de raisonnement séquentielles en une seule passe avant sans supervision explicite.

Vidéo de Hierarchical Reasoning Model

Articles populaires

Veo 3.1 : Le dernier générateur de vidéos IA de Google en 2025

Oct 16, 2025

Codes d'invitation Sora gratuits en octobre 2025 et comment les obtenir et commencer à créer

Oct 13, 2025

Claude Sonnet 4.5 : La dernière centrale de codage IA d'Anthropic en 2025 | Fonctionnalités, Tarification, Comparaison avec GPT-4 et plus

Sep 30, 2025

Comment créer une photo tendance IA Ghostface avec l'invite Google Gemini : Guide Ultime 2025

Sep 29, 2025

Derniers outils d'IA similaires à Hierarchical Reasoning Model

Athena AI

FreemiumAI Productivity Tools Large Language Models (LLMs)

Athena AI est une plateforme polyvalente alimentée par IA offrant une assistance d'étude personnalisée, des solutions commerciales et du coaching de vie grâce à des fonctionnalités telles que l'analyse de documents, la génération de quiz, des cartes mémoire et des capacités de chat interactif.

Aguru AI

Free TrialMonitor & Log Management Large Language Models (LLMs)

Aguru AI est une solution logicielle sur site qui fournit des outils complets de surveillance, de sécurité et d'optimisation pour les applications basées sur LLM avec des fonctionnalités telles que le suivi du comportement, la détection d'anomalies et l'optimisation des performances.

GOAT AI

FreemiumSummarizer Large Language Models (LLMs)

GOAT AI est une plateforme alimentée par l'IA qui fournit des capacités de résumé en un clic pour divers types de contenu, y compris des articles de presse, des documents de recherche et des vidéos, tout en offrant également une orchestration avancée d'agents IA pour des tâches spécifiques au domaine.

GiGOS

Free TrialLarge Language Models (LLMs)Multi-purpose Tools

GiGOS est une plateforme d'IA qui fournit un accès à plusieurs modèles de langage avancés comme Gemini, GPT-4, Claude et Grok avec une interface intuitive pour que les utilisateurs interagissent et comparent différents modèles d'IA.

Outils d'IA populaires comme Hierarchical Reasoning Model

ChatGPT 5.0

Large Language Models (LLMs)AI Chatbot

ChatGPT-5 est le modèle d\'IA le plus avancé d\'OpenAI, doté de capacités de raisonnement améliorées, d\'une conscience contextuelle plus profonde et d\'un système de commutation automatique unifié qui fournit des réponses plus rapides, plus précises et hautement personnalisées dans les domaines de l\'écriture, du codage et des tâches spécialisées.

SearchGPT

Free TrialAI Search Engine Large Language Models (LLMs)

SearchGPT est un prototype de recherche alimenté par l'IA d'OpenAI qui fournit des réponses rapides et conversationnelles avec des sources claires en utilisant des modèles GPT.

ContextGem

FreeAI Data Mining Large Language Models (LLMs)

ContextGem est un framework LLM open source gratuit qui simplifie l'extraction de données structurées et d'informations à partir de documents avec un minimum de code grâce à de puissantes abstractions intégrées et des fonctionnalités automatisées.

AI CLI

FreeAI Code Assistant Large Language Models (LLMs)

AI CLI est un outil d'interface de ligne de commande open source qui apporte des capacités d'IA directement à votre terminal, vous permettant d'interagir avec divers modèles d'IA tels que GPT d'OpenAI et Claude d'Anthropic via de simples commandes.

Classement

Soumettre & PromouvoirNew