Hierarchical Reasoning Model

Hierarchical Reasoning Model

Hiyerarşik Akıl Yürütme Modeli (HRM), soyut planlama ve ayrıntılı hesaplamalar için iki bağımlı yinelemeli modül kullanarak yalnızca 27 milyon parametre ile olağanüstü akıl yürütme yetenekleri elde eden beyin esinli bir yapay zeka mimarisidir.
https://github.com/sapientinc/HRM?ref=producthunt&utm_source=aipure
Hierarchical Reasoning Model

Ürün Bilgisi

Güncellendi:Aug 8, 2025

Hierarchical Reasoning Model Nedir

Hiyerarşik Akıl Yürütme Modeli (HRM), Sapient Intelligence tarafından geliştirilen ve yapay zeka akıl yürütme yeteneklerinde devrim yaratan yeni bir yinelemeli mimaridir. Temmuz 2025'te piyasaya sürülen HRM, insan beyninde gözlemlenen hiyerarşik ve çok zaman ölçekli işleme kalıplarından ilham almaktadır. Zincirleme Düşünce (CoT) tekniklerine dayanan geleneksel büyük dil modellerinin aksine, HRM minimum eğitim verisiyle ve ön eğitim gereksinimleri olmadan verimli bir şekilde çalışır. Model, yalnızca 1.000 eğitim örneği kullanarak, aşırı Sudoku bulmacalarını çözme ve büyük labirentlerde optimal yol bulma dahil olmak üzere karmaşık akıl yürütme görevlerinde olağanüstü performans gösterir.

Hierarchical Reasoning Model Temel Özellikleri

Hiyerarşik Akıl Yürütme Modeli (HRM), karmaşık akıl yürütme yetenekleri elde etmek için iki bağımlı yinelemeli modül kullanan beyin esinli bir yapay zeka mimarisidir - soyut planlama için üst düzey bir modül ve ayrıntılı hesaplamalar için alt düzey bir modül. Sadece 27 milyon parametre ile ve ön eğitim olmadan sadece 1.000 örnek üzerinde eğitilen HRM, hiyerarşik işleme, zamansal ayrım ve yinelemeli bağlantı yoluyla zorlu görevleri çözebilir, daha verimli ve kararlı olurken çok daha büyük dil modellerinden daha iyi performans gösterir.
Hiyerarşik Çift Modüllü Mimari: Farklı zaman ölçeklerinde çalışan iki eşlenmiş yinelemeli modüle sahiptir - yavaş, soyut planlama için üst düzey bir modül ve hızlı, ayrıntılı hesaplamalar için alt düzey bir modül
Minimum Eğitim Gereksinimleri: Ön eğitim veya Düşünce Zinciri verisi gerektirmeden yalnızca 1.000 eğitim örneği kullanarak olağanüstü performans elde eder
Verimli Parametre Kullanımı: Karmaşık akıl yürütme görevlerini geleneksel büyük dil modellerinden önemli ölçüde daha az olan sadece 27 milyon parametre ile gerçekleştirir
Tek İleri Geçiş İşleme: Ardışık akıl yürütme görevlerini ara adımların açık denetimine ihtiyaç duymadan tek bir ileri geçişte yürütür

Hierarchical Reasoning Model Kullanım Alanları

Karmaşık Bulmaca Çözme: Aşırı Sudoku bulmacalarını ve diğer karmaşık matematiksel/mantıksal bulmacaları neredeyse mükemmel doğrulukla çözer
Yol Bulma Optimizasyonu: Büyük labirentlerde ve karmaşık navigasyon senaryolarında optimum yolları verimli bir şekilde bulur
Soyut Akıl Yürütme Görevleri: Soyutlama ve Akıl Yürütme Külliyatı (ARC) üzerinde iyi performans gösterir ve genel zeka görevlerinde yetenekler sergiler

Artıları

Minimum parametre sayısı ve eğitim verisi gereksinimleri ile son derece verimli
Yakınsama sorunları olmadan kararlı eğitim süreci
Daha büyük modellere kıyasla karmaşık akıl yürütme görevlerinde üstün performans

Eksileri

Küçük örnek senaryolarında geç aşama aşırı öğrenmeye maruz kalabilir
Küçük örnek öğrenmede ±2 puanlık doğruluk varyansı gösterir
Optimum performans için belirli GPU yapılandırmaları ve CUDA uzantıları gerektirir

Hierarchical Reasoning Model Nasıl Kullanılır

Ön Koşulları Yükleyin: CUDA 12.6, CUDA destekli PyTorch ve uzantıları oluşturmak için ek paketler yükleyin. Şunu çalıştırın: CUDA yükleyicisini wget ile indirin, CUDA'yı yükleyin, CUDA_HOME'u ayarlayın, PyTorch'u yükleyin ve paketleme bağımlılıklarını yükleyin
FlashAttention'ı Yükleyin: Hopper GPU'lar için: flash-attention deposunu klonlayın ve FlashAttention 3'ü yükleyin. Ampere veya daha eski GPU'lar için: pip install flash-attn aracılığıyla FlashAttention 2'yi yükleyin
Python Bağımlılıklarını Yükleyin: Gerekli tüm Python paketlerini yüklemek için 'pip install -r requirements.txt' komutunu çalıştırın
Weights & Biases'ı Kurun: 'wandb login' komutunu çalıştırarak ve hesabınızda oturum açtığınızdan emin olarak deney takibi için W&B'yi kurun
Veri Kümesini Hazırlayın: Belirli göreviniz için veri kümesini oluşturun. Örneğin, Sudoku için: Veri kümesi boyutu ve artırma için uygun parametrelerle 'python dataset/build_sudoku_dataset.py' komutunu çalıştırın
Eğitimi Başlatın: Uygun parametrelerle eğitimi başlatın. Sudoku için örnek: 'OMP_NUM_THREADS=8 python pretrain.py data_path=data/sudoku-extreme-1k-aug-1000 epochs=20000 eval_interval=2000 global_batch_size=384 lr=7e-5'
Eğitimi İzleyin: eval/exact_accuracy metriğini izleyerek W&B arayüzü aracılığıyla eğitim ilerlemesini takip edin
Modeli Değerlendirin: 'torchrun --nproc-per-node 8 evaluate.py checkpoint=<CHECKPOINT_PATH>' komutunu kullanarak değerlendirme çalıştırın ve sağlanan not defterleri aracılığıyla sonuçları analiz edin
Önceden Eğitilmiş Kontrol Noktalarını Kullanın: Alternatif olarak, ARC-AGI-2, Sudoku 9x9 Extreme veya Maze 30x30 Hard görevleri için HuggingFace'den önceden eğitilmiş kontrol noktalarını indirin

Hierarchical Reasoning Model SSS

HRM, insan beynindeki hiyerarşik ve çok zaman ölçekli işlemden ilham alan yeni bir yinelemeli mimaridir. İki bağımlı yinelemeli modüle sahiptir: yavaş, soyut planlama için üst düzey bir modül ve hızlı, ayrıntılı hesaplamalar için alt düzey bir modül. Açık denetim olmadan tek bir ileri geçişte sıralı akıl yürütme görevlerini yürütebilir.

Hierarchical Reasoning Model Benzer En Yeni Yapay Zeka Araçları

Athena AI
Athena AI
Athena AI, belge analizi, quiz oluşturma, flash kartlar ve etkileşimli sohbet yetenekleri gibi özellikler aracılığıyla kişiselleştirilmiş çalışma yardımı, iş çözümleri ve yaşam koçluğu sunan çok yönlü bir AI destekli platformdur.
Aguru AI
Aguru AI
Aguru AI, davranış izleme, anomali tespiti ve performans optimizasyonu gibi özelliklerle LLM tabanlı uygulamalar için kapsamlı izleme, güvenlik ve optimizasyon araçları sağlayan yerel bir yazılım çözümüdür.
GOAT AI
GOAT AI
GOAT AI, haber makaleleri, araştırma makaleleri ve videolar gibi çeşitli içerik türleri için tek tıklama ile özetleme yetenekleri sunan AI destekli bir platformdur ve ayrıca alanına özgü görevler için gelişmiş AI ajan orkestrasyonu sağlar.
GiGOS
GiGOS
GiGOS, kullanıcıların etkileşimde bulunabileceği ve farklı AI modellerini karşılaştırabileceği sezgisel bir arayüzle Gemini, GPT-4, Claude ve Grok gibi birden fazla gelişmiş dil modeline erişim sağlayan bir AI platformudur.