nanochat, tokenizasyondan dağıtıma kadar eksiksiz bir ardışık düzenle temiz, minimal ve hacklenebilir bir kod tabanı sağlayan, 8XH100 GPU düğümünde yalnızca 4 saat içinde 100 dolara eğitilebilen, ChatGPT benzeri bir dil modelinin açık kaynaklı, tam yığın uygulamasıdır.
https://github.com/karpathy/nanochat?ref=producthunt&utm_source=aipure
nanochat

Ürün Bilgisi

Güncellendi:Oct 17, 2025

nanochat Nedir

Eski Tesla AI direktörü ve OpenAI kurucu ortağı Andrej Karpathy tarafından oluşturulan nanochat, önceki nanoGPT çalışmasını temel alan kapsamlı bir projedir. ChatGPT tarzı dil modelleri oluşturmak için eksiksiz bir uçtan uca eğitim ve çıkarım ardışık düzeni olarak tasarlanmıştır ve yaklaşık 8.000 satır temiz kodda paketlenmiştir. Proje, Karpathy'nin Eureka Labs'deki LLM101n kursunun bitirme projesi olarak hizmet vermektedir ve büyük dil modeli geliştirmeyi araştırmacılar, öğrenciler ve geliştiriciler için daha erişilebilir ve eğitici hale getirmeyi amaçlamaktadır.

nanochat Temel Özellikleri

Nanochat, Andrej Karpathy tarafından oluşturulan ve 8XH100 GPU düğümünde sadece 4 saat içinde 100 dolara eğitilebilen, ChatGPT benzeri bir modelin tam yığınlı, açık kaynaklı bir uygulamasıdır. Yaklaşık 8.000 satırlık temiz, minimal bir kod tabanında tokenizasyon, ön eğitim, ince ayar, değerlendirme, çıkarım ve web sunumu dahil olmak üzere eksiksiz bir işlem hattı sağlar. Proje, verimliliği ve işlevselliği korurken erişilebilir ve anlaşılabilir hale getirerek LLM geliştirmeyi demokratikleştirmeyi amaçlamaktadır.
Uçtan Uca Eğitim Hattı: Tokenizasyondan web sunumuna kadar eksiksiz uygulama; tüm bileşenler basit komut dosyaları aracılığıyla çalıştırılabilen tek bir kod tabanına entegre edilmiştir
Uygun Maliyetli Eğitim: Sadece 100 dolarlık işlem süresiyle (8XH100 GPU'larda 4 saat) temel ChatGPT benzeri işlevselliğe ulaşır ve bu da onu bireysel araştırmacılar ve küçük ekipler için erişilebilir kılar
Minimum Bağımlılık: Minimum harici bağımlılığa sahip temiz, hacklenebilir kod tabanı, anlaşılmasını ve değiştirilmesini kolaylaştırır
Ölçeklenebilir Mimari: 100 dolarlık temel modellerden 1000 dolarlık daha yetenekli sürümlere kadar farklı hesaplama bütçelerine sahip daha büyük modellerin eğitimini destekler

nanochat Kullanım Alanları

Eğitim Aracı: LLM101n kursu aracılığıyla LLM geliştirmeyi inceleyen öğrenciler ve araştırmacılar için pratik bir öğrenme kaynağı olarak hizmet eder
Araştırma Platformu: Yapay zeka araştırmacılarının LLM mimarileri ve eğitim yöntemleri üzerinde deneyler yapması ve bunları geliştirmesi için bir temel sağlar
Prototip Geliştirme: Minimum yatırımla belirli uygulamalar için özel sohbet robotlarının hızlı bir şekilde geliştirilmesini ve test edilmesini sağlar

Artıları

Giriş seviyesi LLM geliştirme için son derece erişilebilir ve uygun maliyetli
Anlaşılması ve değiştirilmesi kolay, temiz, okunabilir kod tabanı
Minimum bağımlılıkla eksiksiz uçtan uca uygulama

Eksileri

Büyük ticari modellere kıyasla sınırlı yetenekler
Optimum performans için belirli donanım kurulumu (H100 GPU'ları) gerektirir
Maksimum performans için henüz tam olarak optimize edilmemiş veya ayarlanmamış

nanochat Nasıl Kullanılır

Bilgisayar ortamını ayarlayın: Bir bulut sağlayıcısından (örneğin, Lambda GPU Cloud) yeni bir 8XH100 GPU düğümü başlatın. Bunun maliyeti yaklaşık 24$/saat olacaktır.
Depoyu klonlayın: Kodu almak ve proje dizinine girmek için 'git clone [email protected]:karpathy/nanochat.git' ve 'cd nanochat' komutlarını çalıştırın
Speedrun komut dosyasını çalıştırın: Eğitime başlamak için 'screen -L -Logfile speedrun.log -S speedrun bash speedrun.sh' komutunu çalıştırın. Bu işlem yaklaşık 4 saat sürecek ve çıktıyı speedrun.log dosyasına kaydedecektir
Eğitim ilerlemesini izleyin: Ekran oturumu içindeki ilerlemeyi izleyebilir veya 'Ctrl-a d' ile ayrılıp ilerlemeyi görüntülemek için 'tail speedrun.log' kullanabilirsiniz
Sanal ortamı etkinleştirin: Eğitim tamamlandıktan sonra, 'source .venv/bin/activate' ile yerel uv sanal ortamını etkinleştirin
Web arayüzünü başlatın: ChatGPT benzeri web arayüzünü başlatmak için 'python -m scripts.chat_web' komutunu çalıştırın
Arayüze erişin: Düğümünüzün genel IP'sini ve ardından bağlantı noktasını kullanarak gösterilen URL'yi ziyaret edin (örneğin, http://209.20.xxx.xxx:8000/)
Model performansını görüntüleyin: Eğitilmiş modelinizin değerlendirmelerini ve metriklerini görmek için proje dizinindeki oluşturulan 'report.md' dosyasını kontrol edin
Modelle etkileşim kurun: Eğitilmiş LLM'nizle etkileşim kurmak için web arayüzünü kullanın - sorular sorun, hikayeler/şiirler isteyin veya yeteneklerini test edin

nanochat SSS

Nanochat, ChatGPT benzeri bir LLM'nin tek, temiz, minimal, hacklenebilir, bağımlılık içermeyen bir kod tabanında tam yığın uygulamasıdır. Yaklaşık 100 dolarlık işlem maliyetiyle ChatGPT benzeri bir model oluşturmak için tasarlanmıştır.

nanochat Benzer En Yeni Yapay Zeka Araçları

Folderr
Folderr
Folderr, kullanıcıların sınırsız dosya yükleyerek, birden fazla dil modeli ile entegre olarak ve kullanıcı dostu bir arayüz aracılığıyla iş akışlarını otomatikleştirerek özel AI asistanları oluşturmalarını sağlayan kapsamlı bir AI platformudur.
Peache.ai
Peache.ai
Peache.ai, kullanıcıların çeşitli AI kişilikleri ile flörtöz, esprili ve cesur sohbetler yapmalarını sağlayan bir AI karakter sohbet oyun alanıdır.
TalkPersona
TalkPersona
TalkPersona, sanal bir konuşan yüz ile doğal ses ve dudak senkronizasyonu yetenekleri aracılığıyla gerçek zamanlı insan benzeri konuşma sağlayan AI destekli bir video sohbet botudur.
Thaly AI
Thaly AI
Thaly AI, müşteri konuşmalarını ve potansiyel müşteri nitelendirmesini otomatikleştirerek işletmelerin satış operasyonlarını ölçeklendirmelerine yardımcı olan AI destekli bir satış asistanıdır.