Open Browser Use

Open Browser Use

WebsiteBrowser ExtensionFreeAI DevOps AssistantAI Web Scraper
Open Browser Use 是一个开源、代理运行时中立的浏览器自动化层,它将 Chrome 扩展程序与 CLI/SDK/MCP 配对,以实现跨不同 AI 代理工具的 DOM 感知、CDP 驱动的选项卡控制、导航和操作。
https://github.com/iFurySt/open-codex-browser-use?ref=producthunt&utm_source=aipure
Open Browser Use

产品信息

更新于:2026年05月18日

什么是 Open Browser Use

Open Browser Use (open-browser-use) 是 “Browser Use” 功能的开源替代品,该功能由 Codex 推广,旨在让 AI 代理能够可靠地操作真实的 Chrome 浏览器,并提供比屏幕截图驱动的自动化更丰富、更结构化的控制。它通过 CLI、JavaScript/Python/Go SDK 和 MCP 服务器提供跨运行时集成界面,因此不同的代理环境可以调用相同的浏览器功能。该项目专注于实用的浏览器工作流程,例如打开和声明选项卡、导航、通过 Chrome DevTools Protocol (CDP) 检查页面以及执行操作计划,同时保持集成模块化和可移植。

Open Browser Use 的主要功能

Open Browser Use (open-browser-use) 是一个开源的、与代理运行时无关的浏览器自动化层,旨在替代 Codex 的 Chrome Browser Use。它将 Chrome 扩展程序与本地 CLI(原生消息传递)配对,可以通过 SDK(JS/Python/Go)、代理运行时(例如 Codex、Claude Code)的打包“技能”或 MCP 服务器来使用。它提供实用的浏览器控制原语——标签发现/声明、导航、CDP 访问、动作规划和清理——以便代理和开发工具能够以结构化、可重用的方式自动化真实的 Chrome 会话。
扩展程序 + CLI 原生桥接: 将 Chrome 扩展程序与 open-browser-use CLI 结合,注册原生主机,并通过 Chrome 的原生消息传递实现可靠的本地自动化(而不是脆弱的仅截图自动化)。
多语言 SDK: 提供 JavaScript/TypeScript、Python 和 Go SDK(npm/PyPI 上的 open-browser-use-sdk;Go 包可用),以便团队可以将浏览器自动化嵌入到应用程序、代理和内部工具中。
用于代理工具链的 MCP 服务器: 公开一个 MCP 服务器(例如,`obu mcp`),提供用于列出/打开/声明标签页、导航、CDP 操作、动作计划和清理的浏览器工具——使其易于插入到支持 MCP 的代理中。
代理“技能”打包: 为流行的代理运行时(如 Codex 和 Claude Code)分发一个即时安装的技能包(通过 `npx skills add ...`),无需自定义集成工作即可快速采用。
Chrome DevTools Protocol (CDP) 访问: 支持基于 CDP 的检查和自动化工作流程(例如,DOM 感知交互、调试式控制),适用于比简单的点击/输入宏更强大的 Web 自动化。
设置和分发灵活性: 提供引导式设置(`open-browser-use setup`)和手动扩展程序安装的备用路径(通过 `chrome://extensions/` 的测试版 ZIP),以应对商店可用性有限的情况。

Open Browser Use 的使用场景

经过身份验证的业务网络工作流程: 在已登录的 Chrome 环境中自动化任务(例如,内部仪表板、CRM/ERP 门户),在 API 集成不可用或不完整的情况下,同时通过 CLI/SDK 保持操作的可重现性。
Web 应用程序的质量保证和回归检查: 使用 CDP 工具对暂存/生产 Web 应用程序运行脚本化的导航和交互流程,适用于冒烟测试、发布验证和 UI 健全性检查。
客户支持和运营自动化: 通过代理驱动的例程,协助支持/运营团队自动化重复的浏览器步骤(在 Web 控制台中分类工单、拉取订单/状态详细信息、更新记录)。
网络研究和内容提取管道: 驱动 Chrome 打开页面、遍历多步骤流程,并收集结构化工件,用于研究、竞争情报或知识管理中的下游摘要或分析。
开发人员生产力工具: 将浏览器控制嵌入到开发工具中(CLI 助手、内部机器人),以自动化常见的基于 Web 的任务,例如检查构建仪表板、验证文档页面或重现 UI 问题。
SMB 后台的 RPA 式自动化: 为电子表格驱动或表单繁重的 Web 流程(发票门户、供应商网站)提供轻量级机器人流程自动化功能,而无需构建完整的自定义集成。

优点

Codex Browser Use 的开源替代品,采用运行时中立设计(可通过 SDK、技能或 MCP 使用)。
基于 CDP 的方法比纯粹的视觉/截图驱动方法实现更强大、DOM 感知的自动化。
多个集成界面(CLI、SDK、MCP、技能)使其适用于不同的技术栈和代理生态系统。

缺点

需要本地设置和维护(原生主机注册、扩展程序安装/启用、Chrome 重启)。
基于 Chrome/扩展程序的自动化可能对浏览器策略更改、扩展程序商店可用性和企业限制敏感。
安全态势取决于其部署方式——如果审批、范围界定和访问控制处理不当,自动化真实的已登录会话会增加风险。

如何使用 Open Browser Use

1) 安装 Open Browser Use (OBU) CLI: 使用以下支持的方法之一安装 CLI: - Homebrew (macOS): `brew tap iFurySt/open-browser-use && brew install open-browser-use` - npm (跨平台): `npm i -g open-browser-use` 如果您使用 Homebrew 并在以后升级:`brew upgrade open-browser-use`。
2) 运行设置以注册原生主机并安装/启用 Chrome 扩展程序: 运行: `open-browser-use setup` 这将注册 Chrome 扩展程序使用的原生消息传递主机,并打开 Chrome 网上应用店页面,以便您可以安装/启用匹配的扩展程序。如果出现提示,请重新启动 Chrome。 如果 Chrome 网上应用店项目暂时不可用,请运行: `open-browser-use setup beta`,然后从 `chrome://extensions/` (开发者模式) 手动加载生成的 ZIP。
3) 验证 Chrome 是否已为 OBU 做好准备: 确保: - 扩展程序已安装并在 Chrome 中启用。 - 设置后 Chrome 已重新启动(如果需要)。 - 您可以在工具栏或扩展程序菜单中看到该扩展程序。
4) 通过 CLI 使用 Open Browser Use(直接使用): 安装 CLI 并设置 Chrome 后,您可以运行 OBU 命令来驱动浏览器自动化(选项卡列表/打开/声明/导航/CDP 操作)。具体命令取决于您的工作流程;关键要求是 Chrome + 扩展程序正在运行,并且原生主机已通过 `open-browser-use setup` 注册。
5) 通过 SDK 使用 Open Browser Use(JavaScript/TypeScript、Python 或 Go): 安装您语言的 SDK: - JavaScript/TypeScript: `npm install open-browser-use-sdk` - Python: `pip install open-browser-use-sdk` (导入为 `open_browser_use`) - Go: `go get github.com/ifuryst/open-codex-browser-use/packages/open-browser-use-go` (导入为 `obu`) 然后从您的代码中调用 SDK 以连接到 OBU 运行时并通过扩展程序自动化 Chrome。
6) 将 Open Browser Use 用作 Codex/代理技能(推荐用于代理工作流程): 为 Codex 全局安装技能: - `npx skills add iFurySt/open-codex-browser-use -g -a codex --skill open-browser-use --copy -y` - 验证安装: `npx skills ls -g -a codex | rg 'open-browser-use'` 然后运行调用它的 Codex 任务,例如: - `codex exec --skip-git-repo-check "使用 open-browser-use 检查今天的 Hacker News 并总结最值得阅读的帖子。"` 稍后更新: `npx skills update open-browser-use -g -y` (或 `npx skills upgrade open-browser-use -g -y`)。
7) 通过 MCP(模型上下文协议)工具使用 Open Browser Use: 将 MCP 服务器安装到支持的全局代理配置中: - `npx add-mcp "obu mcp" --name open_browser_use --all -g -y` - 确认: `npx add-mcp list -g` 或者在您的代理配置中手动配置(stdio MCP): - `[mcp_servers.open_browser_use]` `command = "obu"` `args = ["mcp"]` 这暴露了用于选项卡列表、打开、声明、导航、CDP、操作计划和清理的浏览器工具。
8) 运行您的第一个端到端自动化流程: 启动 Chrome(并启用 OBU 扩展程序),然后: - 如果使用 Codex 技能:要求 Codex 使用 open-browser-use 技能执行浏览器任务。 - 如果使用 MCP:调用 MCP 工具来列出/打开/声明选项卡、导航到 URL 并执行操作。 - 如果使用 SDK:运行您的脚本以连接并自动化导航和交互。 在运行期间保持 Chrome 打开,以便扩展程序可以接收命令。

Open Browser Use 常见问题

Open Browser Use (open-browser-use) 是一个开源的浏览器自动化层,旨在保持代理运行时中立。它被定位为 Codex.app 中 Chrome "Browser Use" 功能的开源替代品。

与 Open Browser Use 类似的最新 AI 工具

Hapticlabs
Hapticlabs
Hapticlabs是一个无代码工具包,使设计师、开发者和研究人员能够轻松地在设备上设计、原型设计和部署沉浸式触觉交互,无需编码。
Deployo.ai
Deployo.ai
Deployo.ai 是一个全面的 AI 部署平台,支持无缝模型部署、监控和扩展,并内置了道德 AI 框架和跨云兼容性。
CloudSoul
CloudSoul
CloudSoul 是一个 AI 驱动的 SaaS 平台,通过自然语言对话使用户能够即时部署和管理云基础设施,使 AWS 资源管理更加便捷和高效。
Devozy.ai
Devozy.ai
Devozy.ai是一个AI驱动的开发者自助服务平台,将敏捷项目管理、DevSecOps、多云基础设施管理和IT服务管理结合到一个统一的解决方案中,以加速软件交付。