Quali sono i principali risultati di performance di HRM?

Con soli 27 milioni di parametri, HRM raggiunge prestazioni eccezionali in compiti di ragionamento complessi utilizzando solo 1000 campioni di addestramento. Ottiene prestazioni quasi perfette in compiti impegnativi come complessi puzzle di Sudoku e la ricerca del percorso ottimale in grandi labirinti. Sul benchmark ARC, raggiunge una performance del 40,3%, superando modelli più grandi come o3-mini-high (34,5%) e Claude 3.7 (21,2%).

Quali sono i principali vantaggi di HRM rispetto ai modelli tradizionali?

HRM opera senza pre-addestramento o dati Chain-of-Thought (CoT), richiede meno parametri (27M) e può funzionare con set di dati di addestramento più piccoli (1000 campioni). Mantiene sia la stabilità che l'efficienza dell'addestramento, raggiungendo al contempo una significativa profondità computazionale, evitando i rapidi problemi di convergenza riscontrati nei modelli ricorrenti standard.

Quali sono i requisiti di sistema per eseguire HRM?

HRM richiede installazioni di PyTorch e CUDA, con requisiti specifici per FlashAttention (versione 3 per GPU Hopper, versione 2 per GPU Ampere o precedenti). Richiede inoltre pacchetti aggiuntivi per la creazione di estensioni e utilizza Weights & Biases per il tracciamento degli esperimenti.

Quanto tempo occorre per addestrare HRM per diversi compiti?

I tempi di addestramento variano a seconda del compito: Sudoku Extreme (1k campioni) richiede circa 10 ore su una GPU RTX 4070 per laptop, ARC-1 e ARC-2 richiedono circa 24 ore ciascuno su una configurazione a 8 GPU, Maze 30x30 Hard richiede circa 1 ora e Full Sudoku-Hard richiede circa 2 ore.

Hierarchical Reasoning Model

WebsiteFreeLarge Language Models (LLMs)Research Tools

L'Hierarchical Reasoning Model (HRM) è un'architettura di IA ispirata al cervello che raggiunge eccezionali capacità di ragionamento con soli 27 milioni di parametri, utilizzando due moduli ricorrenti interdipendenti per la pianificazione astratta e i calcoli dettagliati.

Visita il Sito Web

Pubblicizza Questo Strumento

https://github.com/sapientinc/HRM?ref=producthunt&utm_source=aipure

Panoramica
Video
Alternative

Informazioni sul Prodotto

Aggiornato:Nov 15, 2025

Cos'è Hierarchical Reasoning Model

L'Hierarchical Reasoning Model (HRM) è una nuova architettura ricorrente sviluppata da Sapient Intelligence che rivoluziona le capacità di ragionamento dell'IA. Rilasciato a luglio 2025, HRM trae ispirazione dai modelli di elaborazione gerarchici e multiscala osservati nel cervello umano. A differenza dei tradizionali modelli linguistici di grandi dimensioni che si basano su tecniche Chain-of-Thought (CoT), HRM opera in modo efficiente con dati di addestramento minimi e senza requisiti di pre-addestramento. Il modello dimostra prestazioni notevoli in complesse attività di ragionamento, tra cui la risoluzione di puzzle di Sudoku estremi e la ricerca del percorso ottimale in grandi labirinti, utilizzando solo 1.000 campioni di addestramento.

Caratteristiche principali di Hierarchical Reasoning Model

Il modello di ragionamento gerarchico (HRM) è un'architettura di intelligenza artificiale ispirata al cervello che utilizza due moduli ricorrenti interdipendenti - un modulo di alto livello per la pianificazione astratta e un modulo di basso livello per calcoli dettagliati - per ottenere capacità di ragionamento complesse. Con soli 27 milioni di parametri e addestrato su soli 1.000 esempi senza pre-addestramento, HRM può risolvere compiti impegnativi attraverso l'elaborazione gerarchica, la separazione temporale e la connettività ricorrente, superando modelli linguistici molto più grandi pur essendo più efficiente e stabile.

Architettura gerarchica a doppio modulo: Dispone di due moduli ricorrenti accoppiati che operano su scale temporali diverse: un modulo di alto livello per la pianificazione lenta e astratta e un modulo di basso livello per calcoli rapidi e dettagliati

Requisiti minimi di addestramento: Ottiene prestazioni eccezionali utilizzando solo 1.000 campioni di addestramento senza richiedere pre-addestramento o dati Chain-of-Thought

Utilizzo efficiente dei parametri: Svolge compiti di ragionamento complessi con soli 27 milioni di parametri, significativamente inferiori rispetto ai tradizionali modelli linguistici di grandi dimensioni

Elaborazione a passaggio singolo in avanti: Esegue compiti di ragionamento sequenziale in un unico passaggio in avanti senza necessità di supervisione esplicita dei passaggi intermedi

Casi d'uso di Hierarchical Reasoning Model

Risoluzione di puzzle complessi: Risolve puzzle Sudoku estremi e altri complessi puzzle matematici/logici con una precisione quasi perfetta

Ottimizzazione del pathfinding: Trova percorsi ottimali in grandi labirinti e scenari di navigazione complessi in modo efficiente

Compiti di ragionamento astratto: Funziona bene sull'Abstraction and Reasoning Corpus (ARC), dimostrando capacità in compiti di intelligenza generale

Vantaggi

Altamente efficiente con un numero minimo di parametri e requisiti di dati di addestramento

Processo di addestramento stabile senza problemi di convergenza

Prestazioni superiori su compiti di ragionamento complessi rispetto a modelli più grandi

Svantaggi

Può verificarsi un overfitting in fase avanzata in scenari con piccoli campioni

Mostra una varianza di accuratezza di ±2 punti nell'apprendimento con piccoli campioni

Richiede configurazioni GPU specifiche ed estensioni CUDA per prestazioni ottimali

Come usare Hierarchical Reasoning Model

Installa i prerequisiti: Installa CUDA 12.6, PyTorch con supporto CUDA e pacchetti aggiuntivi per la creazione di estensioni. Esegui: wget programma di installazione CUDA, installa CUDA, imposta CUDA_HOME, installa PyTorch e installa le dipendenze di packaging

Installa FlashAttention: Per GPU Hopper: clona il repository flash-attention e installa FlashAttention 3. Per GPU Ampere o precedenti: installa FlashAttention 2 tramite pip install flash-attn

Installa le dipendenze Python: Esegui 'pip install -r requirements.txt' per installare tutti i pacchetti Python richiesti

Configura Weights & Biases: Configura W&B per il monitoraggio degli esperimenti eseguendo 'wandb login' e assicurandoti di aver effettuato l'accesso al tuo account

Prepara il set di dati: Crea il set di dati per la tua attività specifica. Ad esempio, per Sudoku: esegui 'python dataset/build_sudoku_dataset.py' con parametri appropriati per la dimensione del set di dati e l'aumento

Inizia l'addestramento: Avvia l'addestramento con parametri appropriati. Esempio per Sudoku: 'OMP_NUM_THREADS=8 python pretrain.py data_path=data/sudoku-extreme-1k-aug-1000 epochs=20000 eval_interval=2000 global_batch_size=384 lr=7e-5'

Monitora l'addestramento: Tieni traccia dei progressi dell'addestramento tramite l'interfaccia W&B, monitorando la metrica eval/exact_accuracy

Valuta il modello: Esegui la valutazione utilizzando 'torchrun --nproc-per-node 8 evaluate.py checkpoint=<CHECKPOINT_PATH>' e analizza i risultati tramite i notebook forniti

Usa checkpoint pre-addestrati: In alternativa, scarica i checkpoint pre-addestrati da HuggingFace per le attività ARC-AGI-2, Sudoku 9x9 Extreme o Maze 30x30 Hard

FAQ di Hierarchical Reasoning Model

HRM è una nuova architettura ricorrente ispirata all'elaborazione gerarchica e multiscala nel cervello umano. È caratterizzata da due moduli ricorrenti interdipendenti: un modulo di alto livello per la pianificazione lenta e astratta e un modulo di basso livello per calcoli rapidi e dettagliati. Può eseguire compiti di ragionamento sequenziale in un singolo passaggio in avanti senza supervisione esplicita.

Video di Hierarchical Reasoning Model

Articoli Popolari

Atoms: Una Piattaforma AI Multi-Agente Che Trasforma le Idee in Prodotti Pronti al Lancio

May 22, 2026

Nano Banana SBTI: Cos'è, come funziona e come usarlo nel 2026

Apr 15, 2026

Recensione di Atoms — Il builder di prodotti AI che ridefinisce la creazione digitale nel 2026

Apr 10, 2026

Kilo Claw: Come Distribuire e Utilizzare un Vero Agente AI "Fai-da-Te" (Aggiornamento 2026)

Apr 3, 2026

Ultimi Strumenti AI Simili a Hierarchical Reasoning Model

Athena AI

FreemiumAI Productivity Tools Large Language Models (LLMs)

Athena AI is a versatile AI-powered platform offering personalized study assistance, business solutions, and life coaching through features like document analysis, quiz generation, flashcards, and interactive chat capabilities.

Aguru AI

Free TrialMonitor & Log Management Large Language Models (LLMs)

Aguru AI è una soluzione software on-premises che fornisce strumenti completi di monitoraggio, sicurezza e ottimizzazione per applicazioni basate su LLM con funzionalità come tracciamento del comportamento, rilevamento delle anomalie e ottimizzazione delle prestazioni.

GOAT AI

FreemiumSummarizer Large Language Models (LLMs)

GOAT AI è una piattaforma potenziata dall'AI che fornisce capacità di sintesi con un clic per vari tipi di contenuto, tra cui articoli di notizie, documenti di ricerca e video, offrendo anche un'orchestrazione avanzata degli agenti AI per compiti specifici del dominio.

GiGOS

Free TrialLarge Language Models (LLMs)Multi-purpose Tools

GiGOS è una piattaforma di IA che fornisce accesso a più modelli di linguaggio avanzati come Gemini, GPT-4, Claude e Grok con un'interfaccia intuitiva per gli utenti per interagire e confrontare diversi modelli di IA.

Strumenti AI Popolari Come Hierarchical Reasoning Model

GPT‑5.5 | ChatGPT Official

Large Language Models (LLMs)AI Chatbot

GPT-5.5 in ChatGPT è l'ultimo modello di OpenAI incentrato sul lavoro, progettato per comprendere obiettivi complessi, utilizzare strumenti in modo efficace, controllare il proprio lavoro e portare a termine compiti a più fasi (codifica, ricerca, documenti, fogli di calcolo) con salvaguardie più robuste.

SearchGPT

Free TrialAI Search Engine Large Language Models (LLMs)

SearchGPT è un prototipo di ricerca alimentato dall'IA di OpenAI che fornisce risposte rapide e conversazionali con fonti chiare utilizzando modelli GPT.

ContextGem

FreeAI Data Mining Large Language Models (LLMs)

ContextGem è un framework LLM gratuito e open-source che semplifica l'estrazione di dati strutturati e approfondimenti dai documenti con codice minimo attraverso potenti astrazioni integrate e funzionalità automatizzate.

AI CLI

FreeAI Code Assistant Large Language Models (LLMs)

AI CLI è uno strumento open-source da riga di comando che porta le capacità dell'AI direttamente nel tuo terminale, consentendoti di interagire con vari modelli di AI come GPT di OpenAI e Claude di Anthropic tramite semplici comandi.

Classifica

Invia & PromuoviNew