Open Browser Use

Open Browser Use

WebsiteBrowser ExtensionFreeAI DevOps AssistantAI Web Scraper
Open Browser Use é uma camada de automação de navegador de código aberto e neutra em relação ao tempo de execução do agente que combina uma extensão do Chrome com um CLI/SDK/MCP para permitir controle de guias, navegação e ações cientes do DOM e alimentadas por CDP em diferentes ferramentas de agente de IA.
https://github.com/iFurySt/open-codex-browser-use?ref=producthunt&utm_source=aipure
Open Browser Use

Informações do Produto

Atualizado:May 18, 2026

O que é Open Browser Use

Open Browser Use (open-browser-use) é uma alternativa de código aberto à capacidade "Browser Use" popularizada pelo Codex, projetada para permitir que agentes de IA operem de forma confiável um navegador Chrome real com controle mais rico e estruturado do que a automação baseada em captura de tela. Ele fornece uma superfície de integração entre tempos de execução – via CLI, SDKs JavaScript/Python/Go e um servidor MCP – para que diferentes ambientes de agente possam invocar as mesmas capacidades do navegador. O projeto se concentra em fluxos de trabalho práticos do navegador, como abrir e reivindicar guias, navegar, inspecionar páginas através do Chrome DevTools Protocol (CDP) e executar planos de ação, mantendo a integração modular e portátil.

Principais Recursos do Open Browser Use

Open Browser Use (open-browser-use) é uma camada de automação de navegador de código aberto, neutra em tempo de execução de agente, projetada como uma alternativa ao Chrome Browser Use do Codex. Ela combina uma extensão do Chrome com um CLI local (mensagens nativas) e pode ser consumida via um SDK (JS/Python/Go), uma "habilidade" empacotada para tempos de execução de agente (por exemplo, Codex, Claude Code), ou um servidor MCP. Ela fornece primitivos práticos de controle de navegador—descoberta/reivindicação de abas, navegação, acesso CDP, planejamento de ações e limpeza—para que agentes e ferramentas de desenvolvedor possam automatizar sessões reais do Chrome de forma estruturada e reutilizável.
Extensão + ponte nativa CLI: Combina uma extensão do Chrome com o CLI open-browser-use para registrar um host nativo e permitir automação local confiável através das mensagens nativas do Chrome (em vez de automação frágil apenas por captura de tela).
SDKs multilíngues: Oferece SDKs JavaScript/TypeScript, Python e Go (open-browser-use-sdk no npm/PyPI; pacote Go disponível) para que as equipes possam incorporar a automação do navegador em aplicativos, agentes e ferramentas internas.
Servidor MCP para cadeias de ferramentas de agente: Expõe um servidor MCP (por exemplo, `obu mcp`) que fornece ferramentas de navegador para listar/abrir/reivindicar abas, navegação, operações CDP, planos de ação e limpeza—facilitando a conexão com agentes compatíveis com MCP.
Empacotamento de "habilidade" de agente: Distribui um pacote de habilidades pronto para instalar (via `npx skills add ...`) para tempos de execução de agente populares como Codex e Claude Code, permitindo uma rápida adoção sem trabalho de integração personalizado.
Acesso ao Chrome DevTools Protocol (CDP): Suporta inspeção baseada em CDP e fluxos de trabalho de automação (por exemplo, interações cientes do DOM, controle estilo depuração) adequados para automação web mais robusta do que simples macros de clique/digitação.
Flexibilidade de configuração e distribuição: Fornece configuração guiada (`open-browser-use setup`) e um caminho alternativo para instalação manual da extensão (ZIP beta via `chrome://extensions/`) quando a disponibilidade da loja é limitada.

Casos de Uso do Open Browser Use

Fluxos de trabalho web de negócios autenticados: Automatize tarefas em contextos do Chrome logados (por exemplo, painéis internos, portais CRM/ERP) onde as integrações de API estão indisponíveis ou incompletas, mantendo as ações reproduzíveis via CLI/SDK.
Verificações de QA e regressão para aplicativos web: Execute fluxos de navegação e interação roteirizados em aplicativos web de teste/produção usando ferramentas CDP, adequados para testes de fumaça, validação de lançamento e verificações de sanidade da UI.
Automação de suporte ao cliente e operações: Auxilie equipes de suporte/operações automatizando etapas repetitivas do navegador (triagem de tickets em consoles web, obtenção de detalhes de pedidos/status, atualização de registros) por meio de rotinas orientadas por agentes.
Pesquisa web e pipelines de extração de conteúdo: Dirija o Chrome para abrir páginas, percorrer fluxos de várias etapas e coletar artefatos estruturados para sumarização ou análise posterior em pesquisa, inteligência competitiva ou gerenciamento de conhecimento.
Ferramentas de produtividade do desenvolvedor: Incorpore o controle do navegador em ferramentas de desenvolvimento (ajudantes CLI, bots internos) para automatizar tarefas comuns baseadas na web, como verificar painéis de compilação, verificar páginas de documentação ou reproduzir problemas de UI.
Automação tipo RPA para escritórios de pequenas e médias empresas: Forneça recursos leves de automação de processos robóticos para processos web orientados por planilhas ou com muitos formulários (portais de faturamento, sites de fornecedores) sem construir integrações personalizadas completas.

Vantagens

Alternativa de código aberto ao Codex Browser Use com um design neutro em tempo de execução (utilizável via SDK, habilidade ou MCP).
A abordagem baseada em CDP permite uma automação mais robusta e ciente do DOM do que métodos puramente visuais/baseados em captura de tela.
Múltiplas superfícies de integração (CLI, SDKs, MCP, habilidade) a tornam adaptável a diferentes pilhas e ecossistemas de agentes.

Desvantagens

Requer configuração e manutenção local (registro de host nativo, instalação/habilitação de extensão, reinícios do Chrome).
A automação baseada em Chrome/extensão pode ser sensível a mudanças na política do navegador, disponibilidade da loja de extensões e restrições empresariais.
A postura de segurança depende de como é implantado—automatizar sessões reais logadas aumenta o risco se as aprovações, escopo e controles de acesso não forem tratados com cuidado.

Como Usar o Open Browser Use

1) Instale o CLI do Open Browser Use (OBU): Instale o CLI usando um dos métodos suportados: - Homebrew (macOS): `brew tap iFurySt/open-browser-use && brew install open-browser-use` - npm (multiplataforma): `npm i -g open-browser-use` Se você usou o Homebrew e deseja atualizar posteriormente: `brew upgrade open-browser-use`.
2) Execute a configuração para registrar o host nativo e instalar/habilitar a extensão do Chrome: Execute: `open-browser-use setup` Isso registra o host de mensagens nativo usado pela extensão do Chrome e abre a página da Chrome Web Store para que você possa instalar/habilitar a extensão correspondente. Reinicie o Chrome se solicitado. Se o item da Chrome Web Store estiver temporariamente indisponível, execute: `open-browser-use setup beta` e, em seguida, carregue manualmente o ZIP gerado de `chrome://extensions/` (modo de desenvolvedor).
3) Verifique se o Chrome está pronto para OBU: Certifique-se de que: - A extensão esteja instalada e habilitada no Chrome. - O Chrome tenha sido reiniciado após a configuração (se necessário). - Você possa ver a extensão na barra de ferramentas ou no menu de extensões.
4) Use o Open Browser Use via CLI (uso direto): Com o CLI instalado e o Chrome configurado, você pode executar comandos OBU para impulsionar a automação do navegador (listagem/abertura/reivindicação/navegação de guias/ações CDP). Os comandos exatos dependem do seu fluxo de trabalho; o requisito principal é que o Chrome + a extensão estejam em execução e o host nativo esteja registrado via `open-browser-use setup`.
5) Use o Open Browser Use via um SDK (JavaScript/TypeScript, Python ou Go): Instale o SDK para sua linguagem: - JavaScript/TypeScript: `npm install open-browser-use-sdk` - Python: `pip install open-browser-use-sdk` (importar como `open_browser_use`) - Go: `go get github.com/ifuryst/open-codex-browser-use/packages/open-browser-use-go` (importar como `obu`) Em seguida, chame o SDK do seu código para se conectar ao tempo de execução do OBU e automatizar o Chrome através da extensão.
6) Use o Open Browser Use como uma Skill do Codex/agente (recomendado para fluxos de trabalho de agente): Instale a skill globalmente para o Codex: - `npx skills add iFurySt/open-codex-browser-use -g -a codex --skill open-browser-use --copy -y` - Verifique a instalação: `npx skills ls -g -a codex | rg 'open-browser-use'` Em seguida, execute uma tarefa do Codex que a invoque, por exemplo: - `codex exec --skip-git-repo-check "Use open-browser-use para verificar as notícias de hoje do Hacker News e resumir as postagens mais valiosas."` Para atualizar posteriormente: `npx skills update open-browser-use -g -y` (ou `npx skills upgrade open-browser-use -g -y`).
7) Use o Open Browser Use via ferramentas MCP (Model Context Protocol): Instale o servidor MCP em configurações de agente globais suportadas: - `npx add-mcp "obu mcp" --name open_browser_use --all -g -y` - Confirme: `npx add-mcp list -g` Ou configure manualmente (stdio MCP) na sua configuração de agente: - `[mcp_servers.open_browser_use]` `command = "obu"` `args = ["mcp"]` Isso expõe ferramentas do navegador para listagem/abertura/reivindicação de guias, navegação, CDP, planos de ação e limpeza.
8) Execute seu primeiro fluxo de automação de ponta a ponta: Inicie o Chrome (com a extensão OBU habilitada), então: - Se estiver usando a Skill do Codex: peça ao Codex para realizar uma tarefa do navegador usando a skill open-browser-use. - Se estiver usando o MCP: chame as ferramentas do MCP para listar/abrir/reivindicar uma guia, navegar para um URL e executar ações. - Se estiver usando um SDK: execute seu script para conectar e automatizar a navegação e as interações. Mantenha o Chrome aberto durante a execução para que a extensão possa receber comandos.

Perguntas Frequentes do Open Browser Use

Open Browser Use (open-browser-use) é uma camada de automação de navegador de código aberto projetada para permanecer neutra entre os tempos de execução do agente. Ele é posicionado como uma alternativa de código aberto à capacidade "Browser Use" do Chrome enviada no Codex.app.

Ferramentas de IA Mais Recentes Semelhantes a Open Browser Use

Hapticlabs
Hapticlabs
O Hapticlabs é um kit de ferramentas sem código que permite que designers, desenvolvedores e pesquisadores projetem, prototipem e implantem facilmente interações táteis imersivas em dispositivos sem codificação.
Deployo.ai
Deployo.ai
Deployo.ai é uma plataforma abrangente de implantação de IA que permite a implantação, monitoramento e escalonamento sem costura de modelos com estruturas de IA ética integradas e compatibilidade entre nuvens.
CloudSoul
CloudSoul
CloudSoul é uma plataforma SaaS impulsionada por IA que permite aos usuários implantar e gerenciar instantaneamente a infraestrutura de nuvem por meio de conversas em linguagem natural, tornando o gerenciamento de recursos da AWS mais acessível e eficiente.
Devozy.ai
Devozy.ai
Devozy.ai é uma plataforma de autoatendimento para desenvolvedores impulsionada por IA que combina gerenciamento de projetos ágeis, DevSecOps, gerenciamento de infraestrutura multi-nuvem e gerenciamento de serviços de TI em uma solução unificada para acelerar a entrega de software.