
Agent Browser
Agent Browser é uma ferramenta de automação de navegador com uso eficiente de tokens que permite que agentes de IA controlem navegadores reais por meio de comandos de linguagem natural, oferecendo recursos como navegação, interação e visualização de wireframe ASCII para tarefas de automação web.
https://github.com/agent-browser-io/browser?ref=producthunt&utm_source=aipure

Informações do Produto
Atualizado:Mar 13, 2026
O que é Agent Browser
Agent Browser é um pacote de código aberto que preenche a lacuna entre agentes de IA e navegadores web, permitindo o controle automatizado de atividades do navegador por meio de comandos simples. Ele suporta múltiplas interfaces, incluindo MCP (Model Context Protocol), Vercel AI SDK e uma CLI, tornando-o versátil para diferentes casos de uso. A ferramenta é projetada para tornar os sites acessíveis para agentes de IA, mantendo a eficiência no uso de tokens, o que é crucial para tarefas de automação orientadas por IA. Ele pode ser integrado com várias plataformas de IA, como Cursor, Claude Desktop e outros clientes compatíveis com MCP.
Principais Recursos do Agent Browser
O Agent Browser é uma ferramenta de automação de navegador de código aberto que permite que agentes de IA controlem navegadores reais por meio de comandos de linguagem natural e wireframes ASCII com uso eficiente de tokens. Ele oferece suporte a várias interfaces, incluindo MCP (Model Context Protocol), Vercel AI SDK e CLI, permitindo que agentes de IA executem tarefas de navegação, interação e automação na web, mantendo a privacidade e a segurança por meio da execução local.
Controle de Navegador com Uso Eficiente de Tokens: Usa wireframes ASCII para representar páginas da web e fornece interação baseada em referência (@e1, @e2) para comunicação eficiente entre IA e navegador
Integração Multiplataforma: Suporta vários métodos de integração, incluindo MCP para assistentes de IA, Vercel AI SDK para desenvolvedores e CLI para testes manuais
Ações Abrangentes do Navegador: Fornece uma ampla gama de recursos de automação do navegador, incluindo navegação, cliques, digitação, rolagem, capturas de tela e preenchimento de formulários
Arquitetura com Prioridade na Privacidade: É executado localmente na máquina do usuário com a opção de usar perfis Chrome existentes e modelos LLM locais por meio do Ollama
Casos de Uso do Agent Browser
Automação de Testes Web: Automatize os processos de teste de sites, fazendo com que os agentes de IA naveguem pelas páginas, preencham formulários e verifiquem a funcionalidade
Pesquisa e Extração de Conteúdo: Permita que os agentes de IA realizem pesquisas aprofundadas navegando automaticamente em sites, extraindo conteúdo e salvando informações em formatos estruturados
Automação de Formulários: Automatize tarefas repetitivas de preenchimento de formulários em diferentes sites, mantendo a segurança das informações confidenciais
Automação de Comércio Eletrônico: Automatize pesquisas de produtos, comparações de preços e processos de pedidos em várias plataformas de comércio eletrônico
Vantagens
Focado na privacidade com execução local e armazenamento de credenciais criptografadas
Opções de integração flexíveis para diferentes casos de uso
Comunicação com uso eficiente de tokens por meio de wireframes ASCII
Desvantagens
Requer configuração local e dependências
Limitado a navegadores e plataformas suportados
Pode ser menos confiável quando executado no modo visual
Como Usar o Agent Browser
Instalar o Agent Browser: Execute 'npm install @agent-browser-io/browser' para instalar o pacote. Para o primeiro uso, execute também 'npx agent-browser install' para baixar o Chromium.
Uso Básico - Fluxo de Trabalho Principal: 1. Navegue para a página: 'agent-browser open <url>' 2. Obtenha elementos interativos: 'agent-browser snapshot -i' (retorna elementos com refs @e1, @e2 etc) 3. Interaja usando refs: 'agent-browser click @e1' ou 'agent-browser fill @e2 \"text\"' 4. Re-snapshot após as alterações da página
Configurar o Gerenciamento de Sessão (Opcional): Use a flag --session-name para salvar/restaurar o estado do navegador: 'agent-browser --session-name twitter open twitter.com'. Os dados da sessão são armazenados em ~/.agent-browser/sessions/. Também pode ser definido via variável de ambiente AGENT_BROWSER_SESSION_NAME.
Configurar o MCP para Assistentes de IA: 1. Abra as configurações do Cursor → MCP (ou edite ~/.cursor/mcp.json) 2. Adicione a configuração: {\"mcpServers\": {\"agent-browser\": {\"command\": \"npx\", \"args\": [\"-y\", \"@agent-browser-io/browser\", \"mcp\"]}}} 3. Reinicie o Cursor/recarregue o MCP
Usar com o Vercel AI SDK: 1. Importe as ferramentas: 'import { createBrowserTools, AgentBrowser, PlaywrightBrowserBackend } from \'@agent-browser-io/browser\'' 2. Crie a instância do navegador 3. Crie ferramentas com createBrowserTools(browser) 4. Use ferramentas com a função generateText()
Habilitar a Segurança de Conteúdo (Opcional): Use a flag --content-boundaries para envolver a saída da página em delimitadores, ajudando os LLMs a distinguir entre a saída da ferramenta e o conteúdo não confiável
Lidar com a Autenticação (Opcional): Salve as credenciais: 'echo \"pass\" | agent-browser auth save github --url https://github.com/login --username user --password-stdin' então use 'agent-browser auth login github' para fazer login
Perguntas Frequentes do Agent Browser
O Agent Browser é um pacote que permite que agentes de IA controlem um navegador real de forma eficiente em termos de tokens. Ele permite navegação, cliques, digitação e interação por meio de wireframes ASCII e pode ser usado por meio de clientes MCP ou com o Vercel AI SDK.
Vídeo do Agent Browser
Artigos Populares

Guia de Implantação do OpenClaw: Como Auto-Hospedar um Agente de IA Real (Atualização de 2026)
Mar 10, 2026

Tutorial Atoms 2026: Crie um Painel SaaS Completo em 20 Minutos (AIPURE Prático)
Mar 2, 2026

Ferramentas de IA Mais Populares de 2025 | Atualização de 2026 da AIPURE
Feb 10, 2026

Moltbook AI: A Primeira Rede Social de Agentes de IA Pura de 2026
Feb 5, 2026







