Quais são as principais conquistas de desempenho do HRM?

Com apenas 27 milhões de parâmetros, o HRM alcança um desempenho excepcional em tarefas de raciocínio complexas usando apenas 1000 amostras de treinamento. Ele alcança um desempenho quase perfeito em tarefas desafiadoras como quebra-cabeças complexos de Sudoku e localização de caminhos ideais em grandes labirintos. No benchmark ARC, ele alcança um desempenho de 40,3%, superando modelos maiores como o3-mini-high (34,5%) e Claude 3.7 (21,2%).

Quais são as principais vantagens do HRM em comparação com os modelos tradicionais?

O HRM opera sem pré-treinamento ou dados de Chain-of-Thought (CoT), requer menos parâmetros (27M) e pode trabalhar com conjuntos de dados de treinamento menores (1000 amostras). Ele mantém a estabilidade e a eficiência do treinamento, ao mesmo tempo em que alcança uma profundidade computacional significativa, evitando os problemas de convergência rápida encontrados em modelos recorrentes padrão.

Quais são os requisitos de sistema para executar o HRM?

O HRM requer instalações do PyTorch e CUDA, com requisitos específicos para FlashAttention (versão 3 para GPUs Hopper, versão 2 para GPUs Ampere ou anteriores). Ele também precisa de pacotes adicionais para construir extensões e usa Weights & Biases para rastreamento de experimentos.

Quanto tempo leva para treinar o HRM para diferentes tarefas?

Os tempos de treinamento variam de acordo com a tarefa: Sudoku Extreme (1k amostras) leva cerca de 10 horas em uma GPU de laptop RTX 4070, ARC-1 e ARC-2 levam aproximadamente 24 horas cada em uma configuração de 8 GPUs, Maze 30x30 Hard leva cerca de 1 hora e Full Sudoku-Hard leva cerca de 2 horas.

Hierarchical Reasoning Model

WebsiteFreeLarge Language Models (LLMs)Research Tools

O Modelo de Raciocínio Hierárquico (HRM) é uma arquitetura de IA inspirada no cérebro que alcança capacidades de raciocínio excepcionais com apenas 27 milhões de parâmetros, usando dois módulos recorrentes interdependentes para planejamento abstrato e computações detalhadas.

Visitar Site

Anunciar Esta Ferramenta

https://github.com/sapientinc/HRM?ref=producthunt&utm_source=aipure

Visão Geral
Vídeo
Alternativas

Informações do Produto

Atualizado:Nov 16, 2025

O que é Hierarchical Reasoning Model

O Modelo de Raciocínio Hierárquico (HRM) é uma nova arquitetura recorrente desenvolvida pela Sapient Intelligence que revoluciona as capacidades de raciocínio da IA. Lançado em julho de 2025, o HRM se inspira nos padrões de processamento hierárquico e multiescala observados no cérebro humano. Ao contrário dos grandes modelos de linguagem tradicionais que dependem de técnicas de Cadeia de Pensamento (CoT), o HRM opera de forma eficiente com dados de treinamento mínimos e sem requisitos de pré-treinamento. O modelo demonstra um desempenho notável em tarefas complexas de raciocínio, incluindo a resolução de quebra-cabeças Sudoku extremos e a descoberta de caminhos ideais em grandes labirintos, usando apenas 1.000 amostras de treinamento.

Principais Recursos do Hierarchical Reasoning Model

O Modelo de Raciocínio Hierárquico (HRM) é uma arquitetura de IA inspirada no cérebro que usa dois módulos recorrentes interdependentes - um módulo de alto nível para planejamento abstrato e um módulo de baixo nível para computações detalhadas - para alcançar capacidades de raciocínio complexas. Com apenas 27 milhões de parâmetros e treinado em apenas 1.000 exemplos sem pré-treinamento, o HRM pode resolver tarefas desafiadoras por meio de processamento hierárquico, separação temporal e conectividade recorrente, superando modelos de linguagem muito maiores, sendo mais eficiente e estável.

Arquitetura Hierárquica de Módulo Duplo: Apresenta dois módulos recorrentes acoplados operando em diferentes escalas de tempo - um módulo de alto nível para planejamento abstrato lento e um módulo de baixo nível para computações detalhadas rápidas

Requisitos Mínimos de Treinamento: Alcança desempenho excepcional usando apenas 1.000 amostras de treinamento sem exigir pré-treinamento ou dados de Chain-of-Thought

Uso Eficiente de Parâmetros: Realiza tarefas de raciocínio complexas com apenas 27 milhões de parâmetros, significativamente menos do que os modelos de linguagem grandes tradicionais

Processamento de Passagem Única Direta: Executa tarefas de raciocínio sequencial em uma passagem direta sem necessidade de supervisão explícita das etapas intermediárias

Casos de Uso do Hierarchical Reasoning Model

Resolução de Quebra-Cabeças Complexos: Resolve quebra-cabeças extremos de Sudoku e outros quebra-cabeças matemáticos/lógicos complexos com precisão quase perfeita

Otimização de Busca de Caminho: Encontra caminhos ideais em grandes labirintos e cenários de navegação complexos de forma eficiente

Tarefas de Raciocínio Abstrato: Tem bom desempenho no Corpus de Abstração e Raciocínio (ARC), demonstrando capacidades em tarefas de inteligência geral

Vantagens

Altamente eficiente com contagem mínima de parâmetros e requisitos de dados de treinamento

Processo de treinamento estável sem problemas de convergência

Desempenho superior em tarefas de raciocínio complexas em comparação com modelos maiores

Desvantagens

Pode apresentar overfitting em estágio tardio em cenários de amostra pequena

Mostra variação de precisão de ±2 pontos no aprendizado de amostra pequena

Requer configurações específicas de GPU e extensões CUDA para desempenho ideal

Como Usar o Hierarchical Reasoning Model

Instalar Pré-requisitos: Instale CUDA 12.6, PyTorch com suporte CUDA e pacotes adicionais para construir extensões. Execute: wget instalador CUDA, instale CUDA, defina CUDA_HOME, instale PyTorch e instale as dependências de empacotamento

Instalar FlashAttention: Para GPUs Hopper: Clone o repositório flash-attention e instale FlashAttention 3. Para GPUs Ampere ou anteriores: Instale FlashAttention 2 via pip install flash-attn

Instalar Dependências do Python: Execute 'pip install -r requirements.txt' para instalar todos os pacotes Python necessários

Configurar Weights & Biases: Configure o W&B para rastreamento de experimentos executando 'wandb login' e garantindo que você esteja logado em sua conta

Preparar Conjunto de Dados: Construa o conjunto de dados para sua tarefa específica. Por exemplo, para Sudoku: Execute 'python dataset/build_sudoku_dataset.py' com parâmetros apropriados para tamanho do conjunto de dados e aumento

Iniciar Treinamento: Inicie o treinamento com parâmetros apropriados. Exemplo para Sudoku: 'OMP_NUM_THREADS=8 python pretrain.py data_path=data/sudoku-extreme-1k-aug-1000 epochs=20000 eval_interval=2000 global_batch_size=384 lr=7e-5'

Monitorar Treinamento: Acompanhe o progresso do treinamento através da interface W&B, monitorando a métrica eval/exact_accuracy

Avaliar Modelo: Execute a avaliação usando 'torchrun --nproc-per-node 8 evaluate.py checkpoint=<CHECKPOINT_PATH>' e analise os resultados através dos notebooks fornecidos

Usar Checkpoints Pré-treinados: Alternativamente, baixe checkpoints pré-treinados do HuggingFace para tarefas ARC-AGI-2, Sudoku 9x9 Extreme ou Maze 30x30 Hard

Perguntas Frequentes do Hierarchical Reasoning Model

O HRM é uma nova arquitetura recorrente inspirada no processamento hierárquico e multiescala no cérebro humano. Ele apresenta dois módulos recorrentes interdependentes: um módulo de alto nível para planejamento lento e abstrato e um módulo de baixo nível para computações rápidas e detalhadas. Ele pode executar tarefas de raciocínio sequencial em uma única passagem direta, sem supervisão explícita.

Vídeo do Hierarchical Reasoning Model

Artigos Populares

Ferramentas de IA Mais Populares de 2025 | Atualização de 2026 da AIPURE

Feb 10, 2026

Moltbook AI: A Primeira Rede Social de Agentes de IA Pura de 2026

Feb 5, 2026

ThumbnailCreator: A Ferramenta de IA Que Resolve o Estresse das Suas Miniaturas do YouTube (2026)

Jan 16, 2026

Óculos Inteligentes com IA 2026: Uma Perspectiva de Software em Primeiro Lugar no Mercado de IA Vestível

Jan 7, 2026

Ferramentas de IA Mais Recentes Semelhantes a Hierarchical Reasoning Model

Athena AI

FreemiumAI Productivity Tools Large Language Models (LLMs)

O Athena AI é uma plataforma versátil alimentada por IA que oferece assistência de estudo personalizada, soluções de negócios e coaching de vida por meio de recursos como análise de documentos, geração de questionários, flashcards e capacidades de chat interativo.

Aguru AI

Free TrialMonitor & Log Management Large Language Models (LLMs)

Aguru AI é uma solução de software local que fornece ferramentas abrangentes de monitoramento, segurança e otimização para aplicações baseadas em LLM, com recursos como rastreamento de comportamento, detecção de anomalias e otimização de desempenho.

GOAT AI

FreemiumSummarizer Large Language Models (LLMs)

GOAT AI é uma plataforma alimentada por IA que fornece capacidades de resumo com um clique para vários tipos de conteúdo, incluindo artigos de notícias, trabalhos de pesquisa e vídeos, enquanto também oferece orquestração avançada de agentes de IA para tarefas específicas de domínio.

GiGOS

Free TrialLarge Language Models (LLMs)Multi-purpose Tools

O GiGOS é uma plataforma de IA que fornece acesso a múltiplos modelos de linguagem avançados como Gemini, GPT-4, Claude e Grok com uma interface intuitiva para os usuários interagirem e compararem diferentes modelos de IA.

Ferramentas de IA Populares Como Hierarchical Reasoning Model

GPT-5.3-Codex | Official

Large Language Models (LLMs)AI Chatbot

O GPT-5.3-Codex é o modelo de codificação agentic mais avançado da OpenAI, que combina capacidades de codificação de fronteira com raciocínio aprimorado, é executado 25% mais rápido e foi fundamental para criar a si mesmo.

SearchGPT

Free TrialAI Search Engine Large Language Models (LLMs)

SearchGPT é um protótipo de busca alimentado por IA da OpenAI que fornece respostas rápidas e conversacionais com fontes claras usando modelos GPT.

ContextGem

FreeAI Data Mining Large Language Models (LLMs)

ContextGem é uma estrutura LLM gratuita e de código aberto que simplifica a extração de dados estruturados e insights de documentos com código mínimo por meio de poderosas abstrações integradas e recursos automatizados.

AI CLI

FreeAI Code Assistant Large Language Models (LLMs)

AI CLI é uma ferramenta de interface de linha de comando de código aberto que traz recursos de IA diretamente para o seu terminal, permitindo que você interaja com vários modelos de IA, como GPT da OpenAI e Claude da Anthropic, por meio de comandos simples.

Classificação

Enviar & PromoverNew