Quais requisitos de hardware são necessários para executar o nanochat?

O Nanochat foi projetado para ser executado em um único nó 8XH100, mas também pode ser executado em nós de GPU 8XA100 (embora um pouco mais lento). Ele pode ser executado em uma única GPU, mas levará 8 vezes mais tempo. Para GPUs com menos de 80 GB de memória, você precisará ajustar os parâmetros de tamanho do lote.

Quanto tempo leva para treinar o nanochat?

O nível básico de US$ 100 do nanochat leva cerca de 4 horas para treinar em um nó 8XH100 a US$ 24/hora. Também existem modelos maiores disponíveis: um nível de US$ 300 que treina em ~12 horas e supera o GPT-2, e um nível de US$ 1000 que leva ~41,6 horas.

O código foi escrito à mão ou com assistência de IA?

De acordo com Karpathy, o código é basicamente todo escrito à mão (com preenchimento automático de tabulação). Ele tentou usar agentes Claude/Codex, mas os achou inúteis para este projeto.

Qual é o propósito e a filosofia por trás do nanochat?

O Nanochat visa melhorar o estado da arte em micro modelos que são acessíveis em orçamentos abaixo de US$ 1000. Ele se concentra tanto na acessibilidade de custos quanto na simplicidade cognitiva, evitando configurações complexas e mantendo uma base de código legível e hackeável.

nanochat

WebsiteFreeAI Chatbot Large Language Models (LLMs)

O nanochat é uma implementação de pilha completa de código aberto de um modelo de linguagem semelhante ao ChatGPT que pode ser treinado por apenas US$ 100 em 4 horas em um nó de GPU 8XH100, fornecendo uma base de código limpa, mínima e hackeável com pipeline completo desde a tokenização até a implantação.

Visitar Site

Anunciar Esta Ferramenta

https://github.com/karpathy/nanochat?ref=producthunt&utm_source=aipure

Visão Geral
Alternativas

Informações do Produto

Atualizado:Nov 16, 2025

O que é nanochat

Criado por Andrej Karpathy, ex-diretor de IA da Tesla e cofundador da OpenAI, o nanochat é um projeto abrangente que se baseia em seu trabalho anterior nanoGPT. Ele foi projetado como um pipeline completo de treinamento e inferência de ponta a ponta para criar modelos de linguagem no estilo ChatGPT, embalado em aproximadamente 8.000 linhas de código limpo. O projeto serve como a culminação do curso LLM101n de Karpathy no Eureka Labs e visa tornar o desenvolvimento de modelos de linguagem grandes mais acessível e educacional para pesquisadores, estudantes e desenvolvedores.

Principais Recursos do nanochat

Nanochat é uma implementação full-stack de código aberto de um modelo semelhante ao ChatGPT criado por Andrej Karpathy que pode ser treinado por apenas US$ 100 em 4 horas em um nó de GPU 8XH100. Ele fornece um pipeline completo, incluindo tokenização, pré-treinamento, ajuste fino, avaliação, inferência e serviço web em uma base de código limpa e mínima de cerca de 8.000 linhas. O projeto visa democratizar o desenvolvimento de LLM, tornando-o acessível e compreensível, mantendo a eficiência e a funcionalidade.

Pipeline de Treinamento de Ponta a Ponta: Implementação completa desde a tokenização até o serviço web, com todos os componentes integrados em uma única base de código que pode ser executada por meio de scripts simples

Treinamento Econômico: Alcança a funcionalidade básica semelhante ao ChatGPT com apenas US$ 100 em tempo de computação (4 horas em GPUs 8XH100), tornando-o acessível a pesquisadores individuais e pequenas equipes

Dependências Mínimas: Base de código limpa e hackeável com dependências externas mínimas, tornando-o fácil de entender e modificar

Arquitetura Escalável: Suporta o treinamento de modelos maiores com diferentes orçamentos computacionais, desde modelos básicos de US$ 100 até versões mais capazes de US$ 1000

Casos de Uso do nanochat

Ferramenta Educacional: Serve como um recurso de aprendizado prático para estudantes e pesquisadores que estudam o desenvolvimento de LLM por meio do curso LLM101n

Plataforma de Pesquisa: Fornece uma base para pesquisadores de IA experimentarem e aprimorarem as arquiteturas de LLM e os métodos de treinamento

Desenvolvimento de Protótipo: Permite o desenvolvimento e teste rápidos de chatbots personalizados para aplicações específicas com investimento mínimo

Vantagens

Altamente acessível e econômico para desenvolvimento de LLM de nível básico

Base de código limpa e legível, fácil de entender e modificar

Implementação completa de ponta a ponta com dependências mínimas

Desvantagens

Capacidades limitadas em comparação com grandes modelos comerciais

Requer configuração de hardware específica (GPUs H100) para desempenho ideal

Ainda não totalmente otimizado ou ajustado para desempenho máximo

Como Usar o nanochat

Configurar o ambiente de computação: Inicialize um novo nó de GPU 8XH100 de um provedor de nuvem (por exemplo, Lambda GPU Cloud). Isso custará aproximadamente US$ 24/hora.

Clonar o repositório: Execute 'git clone [email protected]:karpathy/nanochat.git' e 'cd nanochat' para obter o código e entrar no diretório do projeto

Executar o script de speedrun: Execute 'screen -L -Logfile speedrun.log -S speedrun bash speedrun.sh' para iniciar o treinamento. Isso será executado por cerca de 4 horas e registrará a saída em speedrun.log

Monitorar o progresso do treinamento: Você pode observar o progresso dentro da sessão da tela ou desconectar com 'Ctrl-a d' e usar 'tail speedrun.log' para visualizar o progresso

Ativar ambiente virtual: Após a conclusão do treinamento, ative o ambiente virtual uv local com 'source .venv/bin/activate'

Iniciar interface web: Execute 'python -m scripts.chat_web' para iniciar a interface web semelhante ao ChatGPT

Acessar a interface: Visite o URL mostrado, usando o IP público do seu nó seguido pela porta (por exemplo, http://209.20.xxx.xxx:8000/)

Visualizar o desempenho do modelo: Verifique o arquivo 'report.md' gerado no diretório do projeto para ver avaliações e métricas do seu modelo treinado

Interagir com o modelo: Use a interface web para interagir com seu LLM treinado - faça perguntas, solicite histórias/poemas ou teste suas capacidades

Perguntas Frequentes do nanochat

Nanochat é uma implementação full-stack de um LLM como o ChatGPT em uma única base de código limpa, mínima, hackeável e com poucas dependências. Ele é projetado para criar um modelo semelhante ao ChatGPT por cerca de US$ 100 em custos de computação.

Artigos Populares

Guia de Implantação do OpenClaw: Como Auto-Hospedar um Agente de IA Real (Atualização de 2026)

Mar 10, 2026

Tutorial Atoms 2026: Crie um Painel SaaS Completo em 20 Minutos (AIPURE Prático)

Mar 2, 2026

Ferramentas de IA Mais Populares de 2025 | Atualização de 2026 da AIPURE

Feb 10, 2026

Moltbook AI: A Primeira Rede Social de Agentes de IA Pura de 2026

Feb 5, 2026

Ferramentas de IA Mais Recentes Semelhantes a nanochat

Folderr

Free TrialAI Chatbot AI Documents Assistant

Folderr é uma plataforma abrangente de IA que permite aos usuários criar assistentes de IA personalizados carregando arquivos ilimitados, integrando-se a vários modelos de linguagem e automatizando fluxos de trabalho através de uma interface amigável.

Peache.ai

Free TrialAI Chatbot AI Character

Peache.ai é um playground de chat com personagens de IA que permite aos usuários participar de conversas flertantes, espirituosas e ousadas com diversas personalidades de IA através de interações em tempo real.

TalkPersona

FreemiumAI Chatbot AI Lip Sync Generator

TalkPersona é um chatbot de vídeo alimentado por IA que fornece conversa em tempo real semelhante à humana por meio de um rosto falante virtual com voz natural e capacidades de sincronização labial.

Thaly AI

Free TrialSales Assistant AI Chatbot

Thaly AI é um assistente de vendas impulsionado por IA que automatiza conversas com clientes e qualificação de leads para ajudar as empresas a escalar suas operações de vendas enquanto economizam tempo.

Ferramentas de IA Populares Como nanochat

GPT-5.4 Thinking (ChatGPT 5.4) | Official

Large Language Models (LLMs)AI Chatbot

GPT-5.4 Thinking é o mais recente modelo de fronteira da OpenAI que combina raciocínio avançado, recursos de codificação e operação de computador, fornecendo planejamento inicial e ajustes no meio da resposta para tarefas profissionais complexas.

DuckDuckGo AI Chat

FreeAI Chatbot AI Search Engine

DuckDuckGo AI Chat é uma maneira gratuita e anônima de acessar chatbots de IA populares como GPT-3.5, Claude e outros, enquanto preserva a privacidade do usuário.

Arch

Contact for PricingAI Chatbot Prompts

Arch é um gateway inteligente de Camada 7 construído sobre o Envoy Proxy que fornece manuseio seguro, observabilidade robusta e integração perfeita de prompts com APIs para construir agentes de IA rápidos, robustos e personalizados.

Off-grid LLM over Radio

FreeAI Chatbot Multi-purpose Tools

Uma plataforma que integra Modelos de Linguagem Grande (LLMs) com redes de comunicação mesh Meshtastic para permitir interações de IA fora da rede e execução automatizada de tarefas através da comunicação por rádio.

Classificação

Enviar & PromoverNew