
Open Browser Use
Open Browser Use 是一個開源、代理執行時間中立的瀏覽器自動化層,它將 Chrome 擴充功能與 CLI/SDK/MCP 配對,以實現跨不同 AI 代理工具的 DOM 感知、CDP 驅動的分頁控制、導航和動作。
https://github.com/iFurySt/open-codex-browser-use?ref=producthunt&utm_source=aipure

產品資訊
更新時間:2026年05月18日
什麼是 Open Browser Use
Open Browser Use (open-browser-use) 是 "Browser Use" 功能的開源替代方案,由 Codex 推廣,旨在讓 AI 代理能夠以比螢幕截圖驅動的自動化更豐富、更結構化的控制方式可靠地操作真實的 Chrome 瀏覽器。它透過 CLI、JavaScript/Python/Go SDK 和 MCP 伺服器提供跨執行時間的整合介面,因此不同的代理環境可以調用相同的瀏覽器功能。該專案專注於實用的瀏覽器工作流程,例如開啟和聲明分頁、導航、透過 Chrome 開發者工具協定 (CDP) 檢查頁面以及執行動作計畫,同時保持整合的模組化和可移植性。
Open Browser Use 的主要功能
Open Browser Use (open-browser-use) 是一個開源、代理執行時中立的瀏覽器自動化層,旨在作為 Codex Chrome Browser Use 的替代方案。它將 Chrome 擴充功能與本地 CLI(原生訊息傳遞)配對,可以透過 SDK(JS/Python/Go)、代理執行時的打包「技能」(例如 Codex、Claude Code)或 MCP 伺服器來使用。它提供實用的瀏覽器控制原語——標籤發現/聲明、導航、CDP 存取、動作規劃和清理——因此代理和開發人員工具可以以結構化、可重複使用的方式自動化真實的 Chrome 會話。
擴充功能 + CLI 原生橋接: 將 Chrome 擴充功能與 open-browser-use CLI 結合,註冊原生主機,並透過 Chrome 的原生訊息傳遞實現可靠的本地自動化(而不是脆弱的僅螢幕截圖自動化)。
多語言 SDK: 提供 JavaScript/TypeScript、Python 和 Go SDK(npm/PyPI 上的 open-browser-use-sdk;提供 Go 套件),以便團隊可以將瀏覽器自動化嵌入到應用程式、代理和內部工具中。
用於代理工具鏈的 MCP 伺服器: 公開一個 MCP 伺服器(例如 `obu mcp`),提供瀏覽器工具,用於列出/開啟/聲明標籤、導航、CDP 操作、動作計劃和清理——使其易於插入到支援 MCP 的代理中。
代理「技能」打包: 透過 `npx skills add ...` 為流行的代理執行時(如 Codex 和 Claude Code)分發即時安裝的技能包,無需自訂整合工作即可快速採用。
Chrome 開發者工具協議 (CDP) 存取: 支援基於 CDP 的檢查和自動化工作流程(例如,DOM 感知互動、調試式控制),適用於比簡單點擊/輸入宏更強大的網路自動化。
設定和分發靈活性: 提供引導式設定(`open-browser-use setup`)和手動擴充功能安裝的備用路徑(透過 `chrome://extensions/` 的測試版 ZIP),以應對商店可用性有限的情況。
Open Browser Use 的使用案例
經過身份驗證的企業網路工作流程: 在無法使用或不完整的 API 整合的登入 Chrome 環境(例如內部儀表板、CRM/ERP 入口網站)中自動化任務,同時透過 CLI/SDK 保持動作可重現。
網路應用程式的 QA 和回歸檢查: 使用 CDP 工具對預生產/生產網路應用程式執行腳本導航和互動流程,適用於冒煙測試、發布驗證和 UI 健全性檢查。
客戶支援和營運自動化: 透過代理驅動的例程自動化重複的瀏覽器步驟(在網路控制台中分類工單、提取訂單/狀態詳細資訊、更新記錄),協助支援/營運團隊。
網路研究和內容提取管道: 驅動 Chrome 開啟頁面、遍歷多步驟流程,並收集結構化資料以用於研究、競爭情報或知識管理中的下游摘要或分析。
開發人員生產力工具: 將瀏覽器控制嵌入到開發工具(CLI 助手、內部機器人)中,以自動化常見的基於網路的任務,例如檢查建置儀表板、驗證文件頁面或重現 UI 問題。
適用於中小型企業後台的 RPA 類自動化: 為電子表格驅動或表單繁重的網路流程(發票入口網站、供應商網站)提供輕量級機器人流程自動化功能,而無需建立完整的自訂整合。
優點
Codex Browser Use 的開源替代方案,採用執行時中立設計(可透過 SDK、技能或 MCP 使用)。
基於 CDP 的方法比純粹的視覺/螢幕截圖驅動方法實現更強大、DOM 感知的自動化。
多個整合介面(CLI、SDK、MCP、技能)使其適用於不同的堆疊和代理生態系統。
缺點
需要本地設定和維護(原生主機註冊、擴充功能安裝/啟用、Chrome 重啟)。
基於 Chrome/擴充功能的自動化可能對瀏覽器策略變更、擴充功能商店可用性和企業限制敏感。
安全態勢取決於其部署方式——如果未仔細處理批准、範圍界定和存取控制,自動化真實登入會話會增加風險。
如何使用 Open Browser Use
1) 安裝 Open Browser Use (OBU) CLI: 使用以下支援的方法之一安裝 CLI:
- Homebrew (macOS):`brew tap iFurySt/open-browser-use && brew install open-browser-use`
- npm (跨平台):`npm i -g open-browser-use`
如果您使用 Homebrew 並想稍後升級:`brew upgrade open-browser-use`。
2) 執行設定以註冊原生主機並安裝/啟用 Chrome 擴充功能: 執行:`open-browser-use setup`
這會註冊 Chrome 擴充功能使用的原生訊息主機,並開啟 Chrome 線上應用程式商店頁面,以便您可以安裝/啟用匹配的擴充功能。如果提示,請重新啟動 Chrome。
如果 Chrome 線上應用程式商店項目暫時不可用,請執行:`open-browser-use setup beta`,然後從 `chrome://extensions/` (開發人員模式) 手動載入生成的 ZIP。
3) 驗證 Chrome 已準備好用於 OBU: 確保:
- 擴充功能已安裝並在 Chrome 中啟用。
- 設定後 Chrome 已重新啟動 (如果需要)。
- 您可以在工具列或擴充功能選單中看到該擴充功能。
4) 透過 CLI 使用 Open Browser Use (直接使用): 安裝 CLI 並設定 Chrome 後,您可以執行 OBU 命令來驅動瀏覽器自動化 (分頁列表/開啟/聲明/導航/CDP 動作)。確切的命令取決於您的工作流程;關鍵要求是 Chrome + 擴充功能正在運行,並且原生主機已透過 `open-browser-use setup` 註冊。
5) 透過 SDK 使用 Open Browser Use (JavaScript/TypeScript、Python 或 Go): 為您的語言安裝 SDK:
- JavaScript/TypeScript:`npm install open-browser-use-sdk`
- Python:`pip install open-browser-use-sdk` (匯入為 `open_browser_use`)
- Go:`go get github.com/ifuryst/open-codex-browser-use/packages/open-browser-use-go` (匯入為 `obu`)
然後從您的程式碼呼叫 SDK 以連接到 OBU 執行時間並透過擴充功能自動化 Chrome。
6) 將 Open Browser Use 作為 Codex/代理技能使用 (推薦用於代理工作流程): 為 Codex 全域安裝技能:
- `npx skills add iFurySt/open-codex-browser-use -g -a codex --skill open-browser-use --copy -y`
- 驗證安裝:`npx skills ls -g -a codex | rg 'open-browser-use'`
然後運行一個調用它的 Codex 任務,例如:
- `codex exec --skip-git-repo-check "Use open-browser-use to check today’s Hacker News and summarize the most worth-reading posts."`
稍後更新:`npx skills update open-browser-use -g -y` (或 `npx skills upgrade open-browser-use -g -y`)。
7) 透過 MCP (模型上下文協定) 工具使用 Open Browser Use: 將 MCP 伺服器安裝到支援的全域代理配置中:
- `npx add-mcp "obu mcp" --name open_browser_use --all -g -y`
- 確認:`npx add-mcp list -g`
或在您的代理配置中手動配置 (stdio MCP):
- `[mcp_servers.open_browser_use]`
`command = "obu"`
`args = ["mcp"]`
這會公開瀏覽器工具,用於分頁列表、開啟、聲明、導航、CDP、動作計畫和清理。
8) 運行您的第一個端到端自動化流程: 啟動 Chrome (啟用 OBU 擴充功能),然後:
- 如果使用 Codex 技能:要求 Codex 使用 open-browser-use 技能執行瀏覽器任務。
- 如果使用 MCP:呼叫 MCP 工具以列出/開啟/聲明分頁、導航到 URL 並執行動作。
- 如果使用 SDK:運行您的腳本以連接並自動化導航和互動。
在運行期間保持 Chrome 開啟,以便擴充功能可以接收命令。
Open Browser Use 常見問題
Open Browser Use (open-browser-use) 是一個開源的瀏覽器自動化層,旨在保持代理運行時的中立性。它被定位為 Codex.app 中 Chrome「瀏覽器使用」功能的開源替代方案。











