SlimSnap é uma ferramenta macOS que permite capturar e anotar capturas de tela, e depois copiá-las como JSON estruturado (com OCR e caixas delimitadoras determinísticas) para colar em agentes de codificação de IA baseados em terminal, onde quer que o texto seja aceito.
https://slimsnap.ai/?ref=producthunt&utm_source=aipure
SlimSnap

Informações do Produto

Atualizado:Jun 12, 2026

O que é SlimSnap

SlimSnap é um utilitário exclusivo para Mac, construído para preencher uma lacuna comum no desenvolvimento assistido por IA: terminais e agentes de codificação CLI (por exemplo, Claude Code, Aider, Codex CLI) podem ler texto, mas muitas vezes não conseguem aceitar imagens. Em vez de escrever longas explicações sobre o que está na sua tela, o SlimSnap transforma uma captura de tela em uma representação JSON compacta e legível por máquina da interface do usuário, incluindo texto reconhecido e coordenadas de layout. Ele é executado localmente, não requer conta e foi projetado para compartilhar rapidamente o contexto preciso da interface do usuário em locais que suportam apenas texto – como terminais, sessões SSH, logs de CI ou "commits" do Git.

Principais Recursos do SlimSnap

SlimSnap é uma ferramenta macOS que transforma capturas de tela anotadas em JSON estruturado e copiável, para que ambientes somente de texto (terminais, agentes de codificação CLI, SSH, logs CI) possam "ver" layouts de UI. Ele suporta captura e anotação rápidas, realiza OCR local para extrair texto na tela e gera um mapa de elementos determinístico (IDs + caixas delimitadoras normalizadas) para reduzir a ambiguidade e o uso de tokens em comparação com a colagem de imagens brutas em modelos de visão. O formato é aberto (esquema MIT) e projetado para funcionar com agentes como Claude Code, Aider, Codex CLI, Cursor e Continue.dev—sem fazer upload de capturas de tela para um servidor.
Captura de tela → exportação JSON: Capture uma região da tela e exporte uma representação JSON estruturada (metadados da tela, tamanho da imagem, elementos e anotações) que pode ser colada em qualquer lugar onde o texto é aceito.
Mapeamento determinístico de elementos de UI: Cada elemento detectado recebe um ID e uma caixa delimitadora normalizada de 0 a 1, deixando claro exatamente a qual botão/rótulo/entrada uma anotação se refere—reduzindo a "adivinhação" por ferramentas de IA.
OCR local integrado: Lê rótulos, botões e mensagens de erro diretamente da captura de tela para que as ferramentas downstream possam raciocinar sobre o mesmo texto que o usuário vê.
Ferramentas de anotação (setas/balões/destaques): Marque a área da UI específica quebrada ou importante e vincule a anotação a um elemento de destino para comunicar a intenção com precisão.
Eficiente em tokens para fluxos de trabalho de IA: Produz algumas centenas de tokens JSON em vez de tokens de visão de alto custo ao colar imagens em modelos, deixando mais orçamento de contexto para código e logs.
Privacidade em primeiro lugar + esquema aberto: A captura e o OCR são executados localmente no Mac sem upload para o servidor; o esquema JSON é publicado sob MIT para que as equipes possam validar, gerar ou construir exportadores.

Casos de Uso do SlimSnap

Depuração de UI baseada em CLI para desenvolvedores: Cole o JSON do SlimSnap no Claude Code/Aider/Codex CLI ao diagnosticar bugs de UI (componentes desalinhados, rótulos errados, botões desabilitados) em ambientes que não aceitam imagens.
QA e relatório de bugs em escala: Substitua capturas de tela ambíguas em tickets por coordenadas de elementos estruturadas + texto OCR, permitindo relatórios de bugs reproduzíveis e triagem mais fácil em equipes distribuídas.
Suporte ao cliente e resposta a incidentes: Agentes de suporte podem converter a captura de tela da UI de um usuário em dados de texto para solução de problemas mais rápida, logs pesquisáveis e notas de escalonamento mais claras.
CI/CD e solução de problemas remota (SSH/terminais): Anexe o estado da UI a logs CI, sessões de terminal ou commits git como JSON, tornando os problemas de UI revisáveis em pipelines somente de texto e revisões de código.
Revisão de UX e ciclos de feedback de design: Designers e PMs podem anotar problemas de UI e compartilhar feedback preciso e legível por máquina (qual elemento, onde e por quê) para acelerar a iteração.

Vantagens

Funciona onde as imagens não podem: gera JSON de texto simples utilizável em terminais, SSH, logs CI e agentes de IA somente de texto.
Referência de UI mais confiável: IDs de elementos + caixas delimitadoras reduzem a ambiguidade em comparação com descrições de captura de tela em linguagem natural.
Menor custo de modelo/uso de contexto: geralmente menos tokens do que colagens de visão, especialmente em sessões iterativas longas.
Orientado à privacidade: captura e OCR são executados localmente; as capturas de tela não precisam sair do Mac.

Desvantagens

Limitação da plataforma: Somente Mac hoje (Windows/Linux exigem exportadores alternativos ou JSON escrito à mão).
Depende da qualidade da detecção de OCR/elementos: UIs complexas ou incomuns podem resultar em extração imperfeita e exigir esclarecimento manual.
Otimizado principalmente para fluxos de trabalho de agentes: menos benefício se o seu fluxo de trabalho já suporta entrada direta de imagem de ponta a ponta.

Como Usar o SlimSnap

1. Baixe o SlimSnap (Mac): Vá para https://slimsnap.ai/download e instale o aplicativo SlimSnap para Mac. É gratuito e não requer registro.
2. Abra a tela que você deseja compartilhar com um agente: Navegue até a interface do usuário com a qual você precisa de ajuda (por exemplo, uma página da web, janela de aplicativo, caixa de diálogo de erro).
3. Capture uma região da sua tela: Pressione ⌘⇧S e, em seguida, clique e arraste para selecionar a área que deseja capturar. Solte para criar a captura no SlimSnap.
4. Anote o que importa: No editor SlimSnap, adicione setas, balões e destaques para apontar para os elementos de interface do usuário quebrados/importantes.
5. Copie a captura como JSON estruturado: Use a ação "Copiar JSON". O SlimSnap exporta uma representação JSON (elementos com texto OCR + caixas delimitadoras normalizadas, além de suas anotações).
6. Cole o JSON em sua ferramenta: Cole o JSON em qualquer lugar onde o texto seja aceito – agentes de terminal como Claude Code, Aider, Codex CLI, ou outras ferramentas como Cursor/Continue.dev, bem como em "issues", logs de CI ou "commits" do Git.
7. Peça uma correção específica da interface do usuário usando referências de elementos: Em seu "prompt", faça referência aos elementos/anotações do JSON (por exemplo, os IDs de botão/entrada e seus valores) para que o agente possa raciocinar deterministicamente sobre o que você está apontando.
8. Itere: recapture e cole novamente conforme necessário: Após fazer as alterações, faça outra captura do SlimSnap e cole o novo JSON para continuar o ciclo de depuração com o estado da interface do usuário atualizado.
9. (Opcional) Use o fluxo de trabalho de habilidade do Claude Code: Se estiver usando a habilidade SlimSnap Claude Code, o SlimSnap cria um arquivo de configuração em ~/.slimsnap/config.json contendo sua pasta de salvamento padrão e padrão de nome de arquivo. A habilidade lê essa configuração, carrega o JSON mais recente do SlimSnap da pasta e o injeta no contexto do agente.
10. (Opcional) Produza JSON do SlimSnap sem o aplicativo Mac: Se você não puder usar o aplicativo Mac, gere qualquer JSON válido do SlimSnap usando o esquema MIT publicado (https://github.com/bickov/slimsnap-schema). O fluxo de trabalho ainda funciona desde que o JSON corresponda ao esquema.

Perguntas Frequentes do SlimSnap

SlimSnap é uma ferramenta para macOS que permite capturar uma "screenshot", anotá-la e copiar uma representação JSON estruturada e com suporte OCR que pode ser colada em qualquer lugar onde o texto seja aceito (como terminais e agentes de codificação CLI).

Ferramentas de IA Mais Recentes Semelhantes a SlimSnap

altcheckerai
altcheckerai
O AltCheckerAI é uma ferramenta impulsionada por IA que otimiza automaticamente o texto alternativo de imagens para melhorar o SEO do site e a acessibilidade por meio de recomendações inteligentes.
IMG Processing
IMG Processing
O IMG Processing é um serviço de API poderoso que permite capacidades rápidas e confiáveis de processamento de imagens, incluindo upload, transformação e marca d'água através de uma integração simples.
ImageKit.io
ImageKit.io
O ImageKit.io é uma plataforma abrangente de gestão e entrega de mídia que fornece otimização de imagem e vídeo em tempo real, APIs de processamento e soluções de Gestão de Ativos Digitais (DAM) para entregar experiências visuais de alta qualidade em sites e aplicativos.
FLORA
FLORA
FLORA é uma ferramenta criativa inovadora, alimentada por IA, que combina múltiplas capacidades de IA em uma tela infinita para permitir identificação personalizada de plantas, design criativo e assistência botânica interativa.