nanochat 是一個開源的、全堆疊的 ChatGPT 類語言模型實現,只需在 8XH100 GPU 節點上花費 100 美元在 4 小時內進行訓練,提供一個乾淨、最小且可駭客的程式碼庫,其中包含從 Token 化到部署的完整管道。
https://github.com/karpathy/nanochat?ref=producthunt&utm_source=aipure
nanochat

產品資訊

更新時間:2025年10月17日

什麼是 nanochat

nanochat 由前 Tesla AI 總監兼 OpenAI 聯合創始人 Andrej Karpathy 創建,是一個基於他早期 nanoGPT 工作的綜合專案。它被設計為一個完整的端到端訓練和推理管道,用於創建 ChatGPT 風格的語言模型,封裝在大約 8,000 行乾淨的程式碼中。該專案是 Karpathy 在 Eureka Labs 的 LLM101n 課程的頂峰,旨在使大型語言模型的開發對於研究人員、學生和開發人員來說更易於訪問且更具教育意義。

nanochat 的主要功能

Nanochat是由Andrej Karpathy創建的類似ChatGPT模型的完整堆疊、開源實現,只需在8XH100 GPU節點上花費100美元,4小時即可完成訓練。它提供了一個完整的流程,包括分詞、預訓練、微調、評估、推理和Web服務,程式碼庫簡潔明瞭,約8,000行。該專案旨在通過使其易於訪問和理解,同時保持效率和功能,來普及LLM開發。
端到端訓練流程: 從分詞到Web服務的完整實現,所有元件都集成到一個可以通過簡單腳本運行的程式碼庫中
經濟高效的訓練: 只需100美元的計算時間(在8XH100 GPU上4小時)即可實現基本的類似ChatGPT的功能,使個人研究人員和小型團隊都可以訪問
最小依賴性: 簡潔、可修改的程式碼庫,具有最小的外部依賴性,使其易於理解和修改
可擴展的架構: 支援使用不同的計算預算訓練更大的模型,從100美元的基本模型到1000美元功能更強大的版本

nanochat 的使用案例

教育工具: 作為學生和研究人員通過LLM101n課程學習LLM開發的實用學習資源
研究平臺: 為AI研究人員提供一個基礎,用於實驗和改進LLM架構和訓練方法
原型開發: 能夠以最小的投資快速開發和測試用於特定應用程式的自定義聊天機器人

優點

對於入門級LLM開發來說,非常容易訪問且經濟高效
簡潔、可讀的程式碼庫,易於理解和修改
具有最小依賴性的完整端到端實現

缺點

與大型商業模型相比,功能有限
需要特定的硬體設置(H100 GPU)才能獲得最佳性能
尚未完全優化或調整以實現最大性能

如何使用 nanochat

設定計算環境: 從雲端供應商(例如 Lambda GPU Cloud)啟動一個新的 8XH100 GPU 節點。這將花費大約 24 美元/小時。
克隆儲存庫: 執行 'git clone [email protected]:karpathy/nanochat.git' 和 'cd nanochat' 以獲取程式碼並進入專案目錄
執行 speedrun 腳本: 執行 'screen -L -Logfile speedrun.log -S speedrun bash speedrun.sh' 以開始訓練。這將運行約 4 小時,並將輸出記錄到 speedrun.log
監控訓練進度: 您可以在螢幕會話中觀看進度,或使用 'Ctrl-a d' 分離,並使用 'tail speedrun.log' 查看進度
啟動虛擬環境: 訓練完成後,使用 'source .venv/bin/activate' 啟動本地 uv 虛擬環境
啟動 Web 介面: 執行 'python -m scripts.chat_web' 以啟動類似 ChatGPT 的 Web 介面
訪問介面: 訪問顯示的 URL,使用節點的公共 IP,後跟埠(例如 http://209.20.xxx.xxx:8000/)
查看模型效能: 檢查專案目錄中生成的 'report.md' 檔案,以查看已訓練模型的評估和指標
與模型互動: 使用 Web 介面與您訓練的 LLM 互動 - 提出問題、請求故事/詩歌或測試其功能

nanochat 常見問題

Nanochat 是一個完整的堆疊實現,類似於 ChatGPT 的 LLM,它位於一個單一、乾淨、最小、可駭、輕依賴的程式碼庫中。它的設計目的是創建一個類似 ChatGPT 的模型,計算成本約為 100 美元。

与 nanochat 类似的最新 AI 工具

Folderr
Folderr
Folderr 是一個全面的 AI 平台,通過上傳無限制的文件、集成多個語言模型和通過用戶友好的界面自動化工作流程,使用戶能夠創建自定義的 AI 助手。
Peache.ai
Peache.ai
Peache.ai 是一個 AI 角色聊天遊樂場,使用戶能夠通過實時互動與多樣的 AI 個性進行調情、機智和大膽的對話。
TalkPersona
TalkPersona
TalkPersona是一個由AI驅動的視頻聊天機器人,通過具有自然語音和唇形同步功能的虛擬對話臉提供實時類人對話。
Thaly AI
Thaly AI
Thaly AI 是一個由 AI 驅動的銷售助手,通過自動化客戶對話和潛在客戶資格審查,幫助企業擴大銷售運營並節省時間。