
Open Browser Use
Open Browser Use là một lớp tự động hóa trình duyệt mã nguồn mở, trung lập với môi trường chạy tác nhân, kết hợp tiện ích mở rộng Chrome với CLI/SDK/MCP để cho phép kiểm soát tab, điều hướng và hành động dựa trên DOM, được hỗ trợ bởi CDP trên các công cụ tác nhân AI khác nhau.
https://github.com/iFurySt/open-codex-browser-use?ref=producthunt&utm_source=aipure

Thông tin Sản phẩm
Đã cập nhật:May 18, 2026
Open Browser Use là gì
Open Browser Use (open-browser-use) là một giải pháp mã nguồn mở thay thế cho khả năng “Browser Use” được phổ biến bởi Codex, được thiết kế để cho phép các tác nhân AI vận hành đáng tin cậy một trình duyệt Chrome thực với khả năng kiểm soát phong phú hơn, có cấu trúc hơn so với tự động hóa dựa trên ảnh chụp màn hình. Nó cung cấp một bề mặt tích hợp đa môi trường chạy—thông qua CLI, SDK JavaScript/Python/Go và một máy chủ MCP—để các môi trường tác nhân khác nhau có thể gọi các khả năng trình duyệt tương tự. Dự án tập trung vào các quy trình làm việc trình duyệt thực tế như mở và yêu cầu tab, điều hướng, kiểm tra trang thông qua Chrome DevTools Protocol (CDP) và thực thi các kế hoạch hành động, đồng thời giữ cho việc tích hợp theo mô-đun và có thể di động.
Các Tính năng Chính của Open Browser Use
Open Browser Use (open-browser-use) là một lớp tự động hóa trình duyệt mã nguồn mở, trung lập với thời gian chạy tác nhân, được thiết kế như một giải pháp thay thế cho Chrome Browser Use của Codex. Nó kết hợp một tiện ích mở rộng Chrome với một CLI cục bộ (nhắn tin gốc) và có thể được sử dụng thông qua SDK (JS/Python/Go), một "kỹ năng" đóng gói cho các thời gian chạy tác nhân (ví dụ: Codex, Claude Code), hoặc một máy chủ MCP. Nó cung cấp các nguyên tắc kiểm soát trình duyệt thực tế—khám phá/yêu cầu tab, điều hướng, truy cập CDP, lập kế hoạch hành động và dọn dẹp—để các tác nhân và công cụ phát triển có thể tự động hóa các phiên Chrome thực theo một cách có cấu trúc, có thể tái sử dụng.
Cầu nối gốc tiện ích mở rộng + CLI: Kết hợp tiện ích mở rộng Chrome với CLI open-browser-use để đăng ký máy chủ gốc và cho phép tự động hóa cục bộ đáng tin cậy thông qua nhắn tin gốc của Chrome (thay vì tự động hóa chỉ chụp màn hình dễ vỡ).
SDK đa ngôn ngữ: Cung cấp SDK JavaScript/TypeScript, Python và Go (open-browser-use-sdk trên npm/PyPI; gói Go có sẵn) để các nhóm có thể nhúng tự động hóa trình duyệt vào các ứng dụng, tác nhân và công cụ nội bộ.
Máy chủ MCP cho chuỗi công cụ tác nhân: Hiển thị máy chủ MCP (ví dụ: `obu mcp`) cung cấp các công cụ trình duyệt để liệt kê/mở/yêu cầu tab, điều hướng, hoạt động CDP, kế hoạch hành động và dọn dẹp—giúp dễ dàng cắm vào các tác nhân có khả năng MCP.
Đóng gói "kỹ năng" tác nhân: Phân phối gói kỹ năng sẵn sàng cài đặt (thông qua `npx skills add ...`) cho các thời gian chạy tác nhân phổ biến như Codex và Claude Code, cho phép áp dụng nhanh chóng mà không cần công việc tích hợp tùy chỉnh.
Truy cập Giao thức Công cụ dành cho nhà phát triển Chrome (CDP): Hỗ trợ kiểm tra dựa trên CDP và quy trình làm việc tự động hóa (ví dụ: tương tác nhận biết DOM, kiểm soát kiểu gỡ lỗi) phù hợp cho tự động hóa web mạnh mẽ hơn so với các macro nhấp/gõ đơn giản.
Tính linh hoạt trong thiết lập và phân phối: Cung cấp thiết lập có hướng dẫn (`open-browser-use setup`) và đường dẫn dự phòng để cài đặt tiện ích mở rộng thủ công (ZIP beta qua `chrome://extensions/`) khi tính khả dụng của cửa hàng bị hạn chế.
Các Trường hợp Sử dụng của Open Browser Use
Quy trình làm việc web kinh doanh được xác thực: Tự động hóa các tác vụ trong ngữ cảnh Chrome đã đăng nhập (ví dụ: bảng điều khiển nội bộ, cổng CRM/ERP) nơi tích hợp API không khả dụng hoặc không đầy đủ, đồng thời giữ cho các hành động có thể tái tạo thông qua CLI/SDK.
Kiểm tra QA và hồi quy cho các ứng dụng web: Chạy các luồng điều hướng và tương tác được viết kịch bản đối với các ứng dụng web thử nghiệm/sản xuất bằng cách sử dụng công cụ CDP, phù hợp cho kiểm tra khói, xác thực bản phát hành và kiểm tra tính hợp lệ của giao diện người dùng.
Tự động hóa hỗ trợ khách hàng và vận hành: Hỗ trợ các nhóm hỗ trợ/vận hành bằng cách tự động hóa các bước trình duyệt lặp đi lặp lại (phân loại vé trong bảng điều khiển web, lấy chi tiết đơn hàng/trạng thái, cập nhật hồ sơ) thông qua các quy trình do tác nhân điều khiển.
Nghiên cứu web và các quy trình trích xuất nội dung: Điều khiển Chrome để mở trang, điều hướng các luồng nhiều bước và thu thập các tạo phẩm có cấu trúc để tóm tắt hoặc phân tích tiếp theo trong nghiên cứu, thông tin tình báo cạnh tranh hoặc quản lý tri thức.
Công cụ năng suất của nhà phát triển: Nhúng kiểm soát trình duyệt vào các công cụ phát triển (trợ giúp CLI, bot nội bộ) để tự động hóa các tác vụ dựa trên web phổ biến như kiểm tra bảng điều khiển xây dựng, xác minh các trang tài liệu hoặc tái tạo các vấn đề UI.
Tự động hóa kiểu RPA cho các văn phòng SMB: Cung cấp khả năng tự động hóa quy trình robot nhẹ cho các quy trình web dựa trên bảng tính hoặc nhiều biểu mẫu (cổng hóa đơn, trang web nhà cung cấp) mà không cần xây dựng các tích hợp tùy chỉnh hoàn chỉnh.
Ưu điểm
Giải pháp thay thế mã nguồn mở cho Codex Browser Use với thiết kế trung lập với thời gian chạy (có thể sử dụng qua SDK, kỹ năng hoặc MCP).
Cách tiếp cận dựa trên CDP cho phép tự động hóa mạnh mẽ hơn, nhận biết DOM hơn so với các phương pháp chỉ dựa trên hình ảnh/chụp màn hình.
Nhiều bề mặt tích hợp (CLI, SDK, MCP, kỹ năng) làm cho nó có thể thích ứng với các ngăn xếp và hệ sinh thái tác nhân khác nhau.
Nhược điểm
Yêu cầu thiết lập và bảo trì cục bộ (đăng ký máy chủ gốc, cài đặt/kích hoạt tiện ích mở rộng, khởi động lại Chrome).
Tự động hóa dựa trên Chrome/tiện ích mở rộng có thể nhạy cảm với các thay đổi chính sách của trình duyệt, tính khả dụng của cửa hàng tiện ích mở rộng và các hạn chế của doanh nghiệp.
Tư thế bảo mật phụ thuộc vào cách nó được triển khai—tự động hóa các phiên đã đăng nhập thực tế làm tăng rủi ro nếu các phê duyệt, phạm vi và kiểm soát truy cập không được xử lý cẩn thận.
Cách Sử dụng Open Browser Use
1) Cài đặt CLI Open Browser Use (OBU): Cài đặt CLI bằng một trong các phương pháp được hỗ trợ:
- Homebrew (macOS): `brew tap iFurySt/open-browser-use && brew install open-browser-use`
- npm (đa nền tảng): `npm i -g open-browser-use`
Nếu bạn đã sử dụng Homebrew và muốn nâng cấp sau này: `brew upgrade open-browser-use`.
2) Chạy thiết lập để đăng ký máy chủ gốc và cài đặt/bật tiện ích mở rộng Chrome: Chạy: `open-browser-use setup`
Thao tác này sẽ đăng ký máy chủ nhắn tin gốc được sử dụng bởi tiện ích mở rộng Chrome và mở trang Cửa hàng Chrome trực tuyến để bạn có thể cài đặt/bật tiện ích mở rộng phù hợp. Khởi động lại Chrome nếu được nhắc.
Nếu mục Cửa hàng Chrome trực tuyến tạm thời không khả dụng, hãy chạy: `open-browser-use setup beta` và sau đó tải thủ công ZIP đã tạo từ `chrome://extensions/` (Chế độ nhà phát triển).
3) Xác minh Chrome đã sẵn sàng cho OBU: Đảm bảo:
- Tiện ích mở rộng đã được cài đặt và bật trong Chrome.
- Chrome đã được khởi động lại sau khi thiết lập (nếu cần).
- Bạn có thể thấy tiện ích mở rộng trong thanh công cụ hoặc menu tiện ích mở rộng.
4) Sử dụng Open Browser Use thông qua CLI (sử dụng trực tiếp): Với CLI đã được cài đặt và Chrome đã được thiết lập, bạn có thể chạy các lệnh OBU để điều khiển tự động hóa trình duyệt (liệt kê/mở/yêu cầu/điều hướng/hành động CDP tab). Các lệnh chính xác phụ thuộc vào quy trình làm việc của bạn; yêu cầu chính là Chrome + tiện ích mở rộng đang chạy và máy chủ gốc đã được đăng ký thông qua `open-browser-use setup`.
5) Sử dụng Open Browser Use thông qua SDK (JavaScript/TypeScript, Python hoặc Go): Cài đặt SDK cho ngôn ngữ của bạn:
- JavaScript/TypeScript: `npm install open-browser-use-sdk`
- Python: `pip install open-browser-use-sdk` (nhập dưới dạng `open_browser_use`)
- Go: `go get github.com/ifuryst/open-codex-browser-use/packages/open-browser-use-go` (nhập dưới dạng `obu`)
Sau đó gọi SDK từ mã của bạn để kết nối với môi trường chạy OBU và tự động hóa Chrome thông qua tiện ích mở rộng.
6) Sử dụng Open Browser Use như một Kỹ năng Codex/tác nhân (được khuyến nghị cho các quy trình làm việc của tác nhân): Cài đặt kỹ năng toàn cầu cho Codex:
- `npx skills add iFurySt/open-codex-browser-use -g -a codex --skill open-browser-use --copy -y`
- Xác minh cài đặt: `npx skills ls -g -a codex | rg 'open-browser-use'`
Sau đó chạy một tác vụ Codex gọi nó, ví dụ:
- `codex exec --skip-git-repo-check "Sử dụng open-browser-use để kiểm tra Hacker News hôm nay và tóm tắt các bài đăng đáng đọc nhất."`
Để cập nhật sau này: `npx skills update open-browser-use -g -y` (hoặc `npx skills upgrade open-browser-use -g -y`).
7) Sử dụng Open Browser Use thông qua các công cụ MCP (Model Context Protocol): Cài đặt máy chủ MCP vào các cấu hình tác nhân toàn cầu được hỗ trợ:
- `npx add-mcp "obu mcp" --name open_browser_use --all -g -y`
- Xác nhận: `npx add-mcp list -g`
Hoặc cấu hình thủ công (stdio MCP) trong cấu hình tác nhân của bạn:
- `[mcp_servers.open_browser_use]`
`command = "obu"`
`args = ["mcp"]`
Điều này hiển thị các công cụ trình duyệt để liệt kê/mở/yêu cầu tab, điều hướng, CDP, kế hoạch hành động và dọn dẹp.
8) Chạy luồng tự động hóa đầu cuối đầu tiên của bạn: Khởi động Chrome (với tiện ích mở rộng OBU được bật), sau đó:
- Nếu sử dụng Kỹ năng Codex: yêu cầu Codex thực hiện một tác vụ trình duyệt bằng kỹ năng open-browser-use.
- Nếu sử dụng MCP: gọi các công cụ MCP để liệt kê/mở/yêu cầu một tab, điều hướng đến một URL và thực hiện các hành động.
- Nếu sử dụng SDK: chạy tập lệnh của bạn để kết nối và tự động hóa điều hướng và tương tác.
Giữ Chrome mở trong suốt quá trình chạy để tiện ích mở rộng có thể nhận lệnh.
Câu hỏi Thường gặp về Open Browser Use
Open Browser Use (open-browser-use) là một lớp tự động hóa trình duyệt mã nguồn mở được thiết kế để duy trì tính trung lập trên các thời gian chạy của tác nhân. Nó được định vị là một giải pháp thay thế mã nguồn mở cho khả năng "Browser Use" của Chrome được tích hợp trong Codex.app.
Bài viết phổ biến

Nano Banana SBTI: Nó là gì, Cách thức hoạt động và Cách sử dụng nó vào năm 2026
Apr 15, 2026

Đánh giá Atoms — Trình tạo sản phẩm AI định nghĩa lại việc tạo nội dung số vào năm 2026
Apr 10, 2026

Kilo Claw: Cách Triển Khai và Sử Dụng AI Agent "Làm-Thay-Bạn" Thực Sự (Cập Nhật 2026)
Apr 3, 2026

OpenAI Đóng Cửa Ứng Dụng Sora: Tương Lai Của Công Nghệ Tạo Video AI Năm 2026 Sẽ Ra Sao?
Mar 25, 2026







