MiMo

MiMo

MiMo é uma série de modelos de linguagem de 7B parâmetros desenvolvida pela Xiaomi que se especializa em capacidades de raciocínio matemático e de código, alcançando um desempenho comparável a modelos maiores através de estratégias inovadoras de pré-treinamento e pós-treinamento.
https://github.com/XiaomiMiMo/MiMo?ref=aipure&utm_source=aipure
MiMo

Informações do Produto

Atualizado:May 16, 2025

O que é MiMo

MiMo é uma série de modelos de linguagem desenvolvidos pela LLM-Core Team da Xiaomi que se concentra em aprimorar as capacidades de raciocínio em matemática e código. A série inclui MiMo-7B-Base (modelo base), MiMo-7B-RL (modelo de aprendizado por reforço), MiMo-7B-SFT (modelo ajustado com supervisão) e MiMo-7B-RL-Zero. Apesar de seu tamanho relativamente pequeno de 7B parâmetros, o MiMo demonstra habilidades de raciocínio excepcionais que podem igualar ou exceder o desempenho de modelos 32B muito maiores e até mesmo competir com o modelo o1-mini da OpenAI.

Principais Recursos do MiMo

MiMo é uma série de modelos de linguagem de 7B parâmetros desenvolvida pela Xiaomi, especificamente projetada para capacidades de raciocínio aprimoradas tanto em matemática quanto em código. Inclui diferentes versões (Base, SFT, RL-Zero e RL) treinadas por meio de uma combinação de estratégias de pré-treinamento e pós-treinamento, apresentando Predição de Múltiplos Tokens e técnicas especializadas de processamento de dados. O modelo demonstra um desempenho excepcional, equiparando-se a modelos maiores de 32B e ao o1-mini da OpenAI, particularmente em tarefas matemáticas e de codificação.
Predição de Múltiplos Tokens: Objetivo de treinamento aprimorado que melhora o desempenho do modelo e acelera a velocidade de inferência
Pipeline de Pré-treinamento Otimizado: Usa filtragem de dados multidimensional e geração de dados de raciocínio sintético para aumentar a densidade de padrões de raciocínio
Sistema Avançado de Treinamento RL: Apresenta um Motor de Rollout Contínuo que proporciona um treinamento 2,29× mais rápido e uma validação 1,96× mais rápida através de rollout contínuo e computação assíncrona de recompensas
Recompensa de Código Orientada à Dificuldade do Teste: Implementa um sistema de pontuação refinado para casos de teste com diferentes níveis de dificuldade para fornecer uma otimização de política mais eficaz

Casos de Uso do MiMo

Resolução de Problemas Matemáticos: Excelente na resolução de problemas matemáticos complexos, incluindo competições de nível AIME e avaliações matemáticas gerais
Desenvolvimento e Teste de Código: Lida com várias tarefas de codificação com alta precisão, particularmente demonstrado através do desempenho no LiveCodeBench
Tarefas de Raciocínio Geral: Tem bom desempenho em benchmarks de raciocínio geral como GPQA Diamond e SuperGPQA, tornando-o adequado para tarefas de análise lógica

Vantagens

Equipara-se ao desempenho de modelos maiores, apesar do tamanho menor (7B parâmetros)
Desempenho superior tanto em matemática quanto em tarefas de codificação
Inferência eficiente através da Predição de Múltiplos Tokens
Disponibilidade de código aberto com múltiplas variantes de modelo

Desvantagens

Requer um fork específico do vLLM para um desempenho ideal
Desempenho inferior em tarefas de linguagem geral em comparação com tarefas de raciocínio especializadas
Verificação limitada com outros motores de inferência

Como Usar o MiMo

Baixar o Modelo: Baixe um dos modelos MiMo do Hugging Face (https://huggingface.co/XiaomiMiMo). Os modelos disponíveis são: MiMo-7B-Base, MiMo-7B-RL-Zero, MiMo-7B-SFT e MiMo-7B-RL
Configurar Ambiente: Instale as dependências necessárias. Recomenda-se usar o fork do vLLM da Xiaomi, que é baseado no vLLM 0.7.3 (https://github.com/XiaomiMiMo/vllm/tree/feat_mimo_mtp)
Escolher Método de Inferência: Você pode usar vLLM (recomendado) ou HuggingFace para inferência. vLLM suporta o recurso de Predição de Vários Tokens (MTP) do MiMo
Para Inferência vLLM: Importe as bibliotecas necessárias (vllm), inicialize o LLM com o caminho do modelo e parâmetros (temperatura=0,6 recomendada), crie o formato de conversa com prompt de sistema vazio e use llm.chat() para gerar respostas
Para Inferência HuggingFace: Importe AutoModel e AutoTokenizer de transformers, carregue o modelo e o tokenizer com trust_remote_code=True, tokenizar entradas e use model.generate() para criar saídas
Configurar Parâmetros: Use temperatura=0,6 para melhores resultados. Recomenda-se usar um prompt de sistema vazio para um desempenho ideal
Executar Inferência: Insira seu prompt/consulta e o modelo gerará respostas. O modelo é particularmente forte em tarefas de raciocínio, incluindo matemática e código
Lidar com Saídas: Processe o texto gerado da saída do modelo. Para vLLM, acesse o texto através de output.outputs[0].text. Para HuggingFace, use tokenizer.decode() na saída

Perguntas Frequentes do MiMo

MiMo é uma série de modelos de linguagem de 7B parâmetros desenvolvidos pela Xiaomi, especificamente projetados e treinados para tarefas de raciocínio. A série inclui MiMo-7B-Base, MiMo-7B-RL-Zero, MiMo-7B-SFT e modelos MiMo-7B-RL.

Ferramentas de IA Mais Recentes Semelhantes a MiMo

Gait
Gait
O Gait é uma ferramenta de colaboração que integra a geração de código assistida por IA com controle de versão, permitindo que as equipes rastreiem, entendam e compartilhem o contexto do código gerado por IA de forma eficiente.
invoices.dev
invoices.dev
invoices.dev é uma plataforma de faturamento automatizada que gera faturas diretamente dos commits do Git dos desenvolvedores, com capacidades de integração para GitHub, Slack, Linear e serviços do Google.
EasyRFP
EasyRFP
EasyRFP é um kit de ferramentas de computação de borda alimentado por IA que agiliza as respostas a RFP (Pedido de Proposta) e possibilita fenotipagem de campo em tempo real por meio de tecnologia de aprendizado profundo.
Cart.ai
Cart.ai
O Cart.ai é uma plataforma de serviços impulsionada por IA que fornece soluções abrangentes de automação de negócios, incluindo codificação, gerenciamento de relações com clientes, edição de vídeo, configuração de e-commerce e desenvolvimento de IA personalizado com suporte 24/7.