Welche Hardwareanforderungen sind erforderlich, um Nanochat auszuführen?

Nanochat ist für die Ausführung auf einem einzelnen 8XH100-Knoten ausgelegt, kann aber auch auf 8XA100-GPU-Knoten ausgeführt werden (wenn auch etwas langsamer). Es kann auf einer einzelnen GPU ausgeführt werden, dauert aber 8-mal länger. Für GPUs mit weniger als 80 GB Speicher müssen Sie die Batch-Größenparameter anpassen.

Wie lange dauert das Training von Nanochat?

Die Basisstufe von Nanochat für 100 Dollar benötigt etwa 4 Stunden Training auf einem 8XH100-Knoten zu 24 Dollar pro Stunde. Es gibt auch größere Modelle: eine 300-Dollar-Stufe, die in ~12 Stunden trainiert und GPT-2 übertrifft, und eine 1000-Dollar-Stufe, die ~41,6 Stunden dauert.

Wurde der Code von Hand oder KI-gestützt geschrieben?

Laut Karpathy ist der Code im Wesentlichen vollständig von Hand geschrieben (mit Tab-Autovervollständigung). Er versuchte, Claude/Codex-Agenten zu verwenden, fand sie aber für dieses Projekt nicht hilfreich.

Was ist der Zweck und die Philosophie hinter Nanochat?

Nanochat zielt darauf ab, den Stand der Technik bei Mikromodellen zu verbessern, die mit Budgets unter 1000 Dollar zugänglich sind. Es konzentriert sich sowohl auf die Kostenzugänglichkeit als auch auf die kognitive Einfachheit, vermeidet komplexe Konfigurationen und pflegt eine lesbare, hackbare Codebasis.

nanochat

WebsiteFreeAI Chatbot Large Language Models (LLMs)

nanochat ist eine Open-Source-Full-Stack-Implementierung eines ChatGPT-ähnlichen Sprachmodells, das für nur 100 US-Dollar in 4 Stunden auf einem 8XH100-GPU-Knoten trainiert werden kann und eine saubere, minimale und hackbare Codebasis mit vollständiger Pipeline von der Tokenisierung bis zur Bereitstellung bietet.

Website besuchen

Dieses Tool bewerben

https://github.com/karpathy/nanochat?ref=producthunt&utm_source=aipure

Überblick
Alternativen

Produktinformationen

Aktualisiert:Nov 16, 2025

Was ist nanochat

nanochat wurde von Andrej Karpathy, dem ehemaligen KI-Direktor von Tesla und Mitbegründer von OpenAI, entwickelt und ist ein umfassendes Projekt, das auf seiner früheren nanoGPT-Arbeit aufbaut. Es ist als vollständige End-to-End-Trainings- und Inferenzpipeline für die Erstellung von Sprachmodellen im ChatGPT-Stil konzipiert, verpackt in etwa 8.000 Zeilen sauberem Code. Das Projekt dient als krönender Abschluss von Karpathys LLM101n-Kurs an den Eureka Labs und zielt darauf ab, die Entwicklung großer Sprachmodelle für Forscher, Studenten und Entwickler zugänglicher und lehrreicher zu gestalten.

Hauptfunktionen von nanochat

Nanochat ist eine vollständige Open-Source-Implementierung eines ChatGPT-ähnlichen Modells, das von Andrej Karpathy entwickelt wurde und für nur 100 US-Dollar in 4 Stunden auf einem 8XH100-GPU-Knoten trainiert werden kann. Es bietet eine komplette Pipeline einschliesslich Tokenisierung, Vortraining, Feinabstimmung, Bewertung, Inferenz und Web-Serving in einer sauberen, minimalen Codebasis von etwa 8.000 Zeilen. Das Projekt zielt darauf ab, die LLM-Entwicklung zu demokratisieren, indem es sie zugänglich und verständlich macht und gleichzeitig Effizienz und Funktionalität beibehält.

End-to-End-Trainingspipeline: Vollständige Implementierung von der Tokenisierung bis zum Web-Serving, wobei alle Komponenten in einer einzigen Codebasis integriert sind, die über einfache Skripte ausgeführt werden kann

Kostengünstiges Training: Erreicht grundlegende ChatGPT-ähnliche Funktionalität mit nur 100 US-Dollar Rechenzeit (4 Stunden auf 8XH100-GPUs), wodurch es für einzelne Forscher und kleine Teams zugänglich wird

Minimale Abhängigkeiten: Saubere, hackbare Codebasis mit minimalen externen Abhängigkeiten, die leicht zu verstehen und zu modifizieren ist

Skalierbare Architektur: Unterstützt das Training grösserer Modelle mit unterschiedlichen Rechenbudgets, von einfachen 100-Dollar-Modellen bis hin zu leistungsfähigeren 1000-Dollar-Versionen

Anwendungsfälle von nanochat

Lernwerkzeug: Dient als praktische Lernressource für Studenten und Forscher, die LLM-Entwicklung im Rahmen des LLM101n-Kurses studieren

Forschungsplattform: Bietet eine Grundlage für KI-Forscher, um mit LLM-Architekturen und Trainingsmethoden zu experimentieren und diese zu verbessern

Prototypenentwicklung: Ermöglicht die schnelle Entwicklung und das Testen von benutzerdefinierten Chatbots für spezifische Anwendungen mit minimalem Investitionsaufwand

Vorteile

Sehr zugänglich und kostengünstig für die LLM-Entwicklung auf Einstiegsniveau

Saubere, lesbare Codebasis, die leicht zu verstehen und zu modifizieren ist

Vollständige End-to-End-Implementierung mit minimalen Abhängigkeiten

Nachteile

Eingeschränkte Fähigkeiten im Vergleich zu grossen kommerziellen Modellen

Erfordert eine spezifische Hardwarekonfiguration (H100-GPUs) für optimale Leistung

Noch nicht vollständig optimiert oder auf maximale Leistung abgestimmt

Wie verwendet man nanochat

Rechenumgebung einrichten: Starten Sie einen neuen 8XH100-GPU-Knoten von einem Cloud-Anbieter (z. B. Lambda GPU Cloud). Dies kostet ungefähr 24 US-Dollar pro Stunde.

Repository klonen: Führen Sie \'git clone [email protected]:karpathy/nanochat.git\' und \'cd nanochat\' aus, um den Code zu erhalten und das Projektverzeichnis zu betreten.

Speedrun-Skript ausführen: Führen Sie \'screen -L -Logfile speedrun.log -S speedrun bash speedrun.sh\' aus, um das Training zu starten. Dies dauert etwa 4 Stunden und protokolliert die Ausgabe in speedrun.log.

Trainingsfortschritt überwachen: Sie können den Fortschritt innerhalb der Bildschirmsitzung beobachten oder sich mit \'Strg-a d\' abmelden und \'tail speedrun.log\' verwenden, um den Fortschritt anzuzeigen.

Virtuelle Umgebung aktivieren: Sobald das Training abgeschlossen ist, aktivieren Sie die lokale virtuelle uv-Umgebung mit \'source .venv/bin/activate\'.

Weboberfläche starten: Führen Sie \'python -m scripts.chat_web\' aus, um die ChatGPT-ähnliche Weboberfläche zu starten.

Auf die Schnittstelle zugreifen: Besuchen Sie die angezeigte URL, indem Sie die öffentliche IP Ihres Knotens gefolgt vom Port verwenden (z. B. http://209.20.xxx.xxx:8000/).

Modellleistung anzeigen: Überprüfen Sie die generierte Datei \'report.md\' im Projektverzeichnis, um Auswertungen und Metriken Ihres trainierten Modells anzuzeigen.

Mit Modell interagieren: Verwenden Sie die Weboberfläche, um mit Ihrem trainierten LLM zu interagieren – stellen Sie Fragen, fordern Sie Geschichten/Gedichte an oder testen Sie seine Fähigkeiten.

nanochat FAQs

Nanochat ist eine Full-Stack-Implementierung eines LLM wie ChatGPT in einer einzigen, sauberen, minimalen, hackbaren, ressourcenschonenden Codebasis. Es wurde entwickelt, um ein ChatGPT-ähnliches Modell für etwa 100 Dollar Rechenkosten zu erstellen.

Beliebte Artikel

FLUX.2 vs. Nano Banana Pro im Jahr 2025: Welches bevorzugen Sie?

Nov 28, 2025

Pixverse Promo-Codes kostenlos im Jahr 2025 und wie man sie einlöst

Nov 26, 2025

Midjourney Promo-Codes kostenlos im Jahr 2025 und wie man sie einlöst

Nov 26, 2025

HiWaifu AI Empfehlungscodes im Jahr 2025 und wie man sie einlöst

Nov 26, 2025

Neueste KI-Tools ähnlich wie nanochat

Folderr

Free TrialAI Chatbot AI Documents Assistant

Folderr ist eine umfassende KI-Plattform, die es Nutzern ermöglicht, benutzerdefinierte KI-Assistenten zu erstellen, indem sie unbegrenzt Dateien hochladen, sich mit mehreren Sprachmodellen integrieren und Arbeitsabläufe über eine benutzerfreundliche Oberfläche automatisieren.

Peache.ai

Free TrialAI Chatbot AI Character

Peache.ai ist ein KI-Charakter-Chat-Spielplatz, der es Benutzern ermöglicht, in flirtende, witzige und gewagte Gespräche mit vielfältigen KI-Persönlichkeiten durch Echtzeit-Interaktionen einzutauchen.

TalkPersona

FreemiumAI Chatbot AI Lip Sync Generator

TalkPersona ist ein KI-gesteuerter Video-Chatbot, der Echtzeit-Gespräche in menschenähnlicher Form durch ein virtuelles sprechendes Gesicht mit natürlicher Stimme und Lippensynchronisationsfähigkeiten bietet.

Thaly AI

Free TrialSales Assistant AI Chatbot

Thaly AI ist ein KI-gestützter Vertriebsassistent, der Kundenkonversationen und die Qualifizierung von Leads automatisiert, um Unternehmen zu helfen, ihre Vertriebsabläufe zu skalieren und gleichzeitig Zeit zu sparen.

Beliebte KI-Tools wie nanochat

ChatGPT 5.1(GPT-5.1) - Official

Large Language Models (LLMs)AI Chatbot

GPT-5.1 von OpenAI ist eine aktualisierte Version von ChatGPT, die zwei neue Modelle einführt - Instant und Thinking - mit verbesserten Konversationsfähigkeiten, adaptivem Denken und anpassbaren Persönlichkeitseinstellungen.

DuckDuckGo AI Chat

FreeAI Chatbot AI Search Engine

DuckDuckGo AI Chat ist eine kostenlose, anonyme Möglichkeit, auf beliebte KI-Chatbots wie GPT-3.5, Claude und andere zuzugreifen und dabei die Privatsphäre der Benutzer zu wahren.

Arch

Contact for PricingAI Chatbot Prompts

Arch ist ein intelligentes Layer-7-Gateway, das auf Envoy Proxy basiert und eine sichere Handhabung, robuste Beobachtbarkeit und nahtlose Integration von Eingabeaufforderungen mit APIs für den Aufbau schneller, robuster und personalisierter KI-Agenten bietet.

Off-grid LLM over Radio

FreeAI Chatbot Multi-purpose Tools

Eine Plattform, die große Sprachmodelle (LLMs) mit Meshtastic-Mesh-Kommunikationsnetzwerken integriert, um netzunabhängige KI-Interaktionen und automatisierte Aufgabenausführung über Funkkommunikation zu ermöglichen.

Rangliste

Einreichen & BewerbenNew

nanochat

Produktinformationen

Was ist nanochat

Hauptfunktionen von nanochat

Anwendungsfälle von nanochat

Vorteile

Nachteile

Wie verwendet man nanochat

nanochat FAQs

1. Was ist Nanochat?

2. Welche Hardwareanforderungen sind erforderlich, um Nanochat auszuführen?

3. Wie lange dauert das Training von Nanochat?

4. Wurde der Code von Hand oder KI-gestützt geschrieben?

5. Was ist der Zweck und die Philosophie hinter Nanochat?

Beliebte Artikel

Neueste KI-Tools ähnlich wie nanochat

Beliebte KI-Tools wie nanochat