Agent Browser é uma ferramenta de automação de navegador com uso eficiente de tokens que permite que agentes de IA controlem navegadores reais por meio de comandos de linguagem natural, oferecendo recursos como navegação, interação e visualização de wireframe ASCII para tarefas de automação web.
https://github.com/agent-browser-io/browser?ref=producthunt&utm_source=aipure
Agent Browser

Informações do Produto

Atualizado:Mar 13, 2026

O que é Agent Browser

Agent Browser é um pacote de código aberto que preenche a lacuna entre agentes de IA e navegadores web, permitindo o controle automatizado de atividades do navegador por meio de comandos simples. Ele suporta múltiplas interfaces, incluindo MCP (Model Context Protocol), Vercel AI SDK e uma CLI, tornando-o versátil para diferentes casos de uso. A ferramenta é projetada para tornar os sites acessíveis para agentes de IA, mantendo a eficiência no uso de tokens, o que é crucial para tarefas de automação orientadas por IA. Ele pode ser integrado com várias plataformas de IA, como Cursor, Claude Desktop e outros clientes compatíveis com MCP.

Principais Recursos do Agent Browser

O Agent Browser é uma ferramenta de automação de navegador de código aberto que permite que agentes de IA controlem navegadores reais por meio de comandos de linguagem natural e wireframes ASCII com uso eficiente de tokens. Ele oferece suporte a várias interfaces, incluindo MCP (Model Context Protocol), Vercel AI SDK e CLI, permitindo que agentes de IA executem tarefas de navegação, interação e automação na web, mantendo a privacidade e a segurança por meio da execução local.
Controle de Navegador com Uso Eficiente de Tokens: Usa wireframes ASCII para representar páginas da web e fornece interação baseada em referência (@e1, @e2) para comunicação eficiente entre IA e navegador
Integração Multiplataforma: Suporta vários métodos de integração, incluindo MCP para assistentes de IA, Vercel AI SDK para desenvolvedores e CLI para testes manuais
Ações Abrangentes do Navegador: Fornece uma ampla gama de recursos de automação do navegador, incluindo navegação, cliques, digitação, rolagem, capturas de tela e preenchimento de formulários
Arquitetura com Prioridade na Privacidade: É executado localmente na máquina do usuário com a opção de usar perfis Chrome existentes e modelos LLM locais por meio do Ollama

Casos de Uso do Agent Browser

Automação de Testes Web: Automatize os processos de teste de sites, fazendo com que os agentes de IA naveguem pelas páginas, preencham formulários e verifiquem a funcionalidade
Pesquisa e Extração de Conteúdo: Permita que os agentes de IA realizem pesquisas aprofundadas navegando automaticamente em sites, extraindo conteúdo e salvando informações em formatos estruturados
Automação de Formulários: Automatize tarefas repetitivas de preenchimento de formulários em diferentes sites, mantendo a segurança das informações confidenciais
Automação de Comércio Eletrônico: Automatize pesquisas de produtos, comparações de preços e processos de pedidos em várias plataformas de comércio eletrônico

Vantagens

Focado na privacidade com execução local e armazenamento de credenciais criptografadas
Opções de integração flexíveis para diferentes casos de uso
Comunicação com uso eficiente de tokens por meio de wireframes ASCII

Desvantagens

Requer configuração local e dependências
Limitado a navegadores e plataformas suportados
Pode ser menos confiável quando executado no modo visual

Como Usar o Agent Browser

Instalar o Agent Browser: Execute 'npm install @agent-browser-io/browser' para instalar o pacote. Para o primeiro uso, execute também 'npx agent-browser install' para baixar o Chromium.
Uso Básico - Fluxo de Trabalho Principal: 1. Navegue para a página: 'agent-browser open <url>' 2. Obtenha elementos interativos: 'agent-browser snapshot -i' (retorna elementos com refs @e1, @e2 etc) 3. Interaja usando refs: 'agent-browser click @e1' ou 'agent-browser fill @e2 \"text\"' 4. Re-snapshot após as alterações da página
Configurar o Gerenciamento de Sessão (Opcional): Use a flag --session-name para salvar/restaurar o estado do navegador: 'agent-browser --session-name twitter open twitter.com'. Os dados da sessão são armazenados em ~/.agent-browser/sessions/. Também pode ser definido via variável de ambiente AGENT_BROWSER_SESSION_NAME.
Configurar o MCP para Assistentes de IA: 1. Abra as configurações do Cursor → MCP (ou edite ~/.cursor/mcp.json) 2. Adicione a configuração: {\"mcpServers\": {\"agent-browser\": {\"command\": \"npx\", \"args\": [\"-y\", \"@agent-browser-io/browser\", \"mcp\"]}}} 3. Reinicie o Cursor/recarregue o MCP
Usar com o Vercel AI SDK: 1. Importe as ferramentas: 'import { createBrowserTools, AgentBrowser, PlaywrightBrowserBackend } from \'@agent-browser-io/browser\'' 2. Crie a instância do navegador 3. Crie ferramentas com createBrowserTools(browser) 4. Use ferramentas com a função generateText()
Habilitar a Segurança de Conteúdo (Opcional): Use a flag --content-boundaries para envolver a saída da página em delimitadores, ajudando os LLMs a distinguir entre a saída da ferramenta e o conteúdo não confiável
Lidar com a Autenticação (Opcional): Salve as credenciais: 'echo \"pass\" | agent-browser auth save github --url https://github.com/login --username user --password-stdin' então use 'agent-browser auth login github' para fazer login

Perguntas Frequentes do Agent Browser

O Agent Browser é um pacote que permite que agentes de IA controlem um navegador real de forma eficiente em termos de tokens. Ele permite navegação, cliques, digitação e interação por meio de wireframes ASCII e pode ser usado por meio de clientes MCP ou com o Vercel AI SDK.

Ferramentas de IA Mais Recentes Semelhantes a Agent Browser

Cursor Search
Cursor Search
O Cursor Search é uma extensão de navegador impulsionada por IA que fornece acesso instantâneo ao conhecimento mundial e recuperação de informações diretamente do seu cursor.
PixieBrix
PixieBrix
O PixieBrix é uma plataforma de extensão de navegador de baixo código que permite aos usuários personalizar, automatizar e aprimorar aplicações web com IA, integrações e recursos de colaboração.
AI Form Fill
AI Form Fill
AI Form Fill é uma extensão de navegador alimentada por IA que completa automaticamente formulários online com um único clique, economizando tempo e aumentando a produtividade.
Duang AI Tab
Duang AI Tab
Duang AI Tab é uma extensão popular de navegador que embeleza sua página inicial, melhora a produtividade e fornece acesso com um clique a ferramentas de IA em qualquer lugar.