
Open Browser Use
Open Browser Use — это открытый, нейтральный к среде выполнения агентов уровень автоматизации браузера, который сочетает расширение Chrome с CLI/SDK/MCP для обеспечения DOM-ориентированного, CDP-управляемого контроля вкладок, навигации и действий в различных инструментах агентов ИИ.
https://github.com/iFurySt/open-codex-browser-use?ref=producthunt&utm_source=aipure

Информация о продукте
Обновлено:18/05/2026
Что такое Open Browser Use
Open Browser Use (open-browser-use) — это альтернатива с открытым исходным кодом для функции «Browser Use», популяризированной Codex, разработанная для того, чтобы позволить агентам ИИ надежно управлять реальным браузером Chrome с более богатым, структурированным контролем, чем автоматизация, управляемая скриншотами. Она предоставляет кросс-платформенную поверхность интеграции — через CLI, SDK для JavaScript/Python/Go и сервер MCP — чтобы различные среды агентов могли вызывать одни и те же возможности браузера. Проект фокусируется на практических рабочих процессах браузера, таких как открытие и захват вкладок, навигация, инспектирование страниц через Chrome DevTools Protocol (CDP) и выполнение планов действий, сохраняя при этом модульность и переносимость интеграции.
Ключевые особенности Open Browser Use
Open Browser Use (open-browser-use) – это слой автоматизации браузера с открытым исходным кодом, не зависящий от среды выполнения агента, разработанный как альтернатива Chrome Browser Use от Codex. Он сочетает расширение Chrome с локальным CLI (собственные сообщения) и может использоваться через SDK (JS/Python/Go), упакованный "навык" для сред выполнения агентов (например, Codex, Claude Code) или сервер MCP. Он предоставляет практические примитивы управления браузером – обнаружение/захват вкладок, навигацию, доступ к CDP, планирование действий и очистку – чтобы агенты и инструменты разработчика могли автоматизировать реальные сеансы Chrome структурированным, многократно используемым способом.
Нативный мост расширения + CLI: Сочетает расширение Chrome с CLI open-browser-use для регистрации нативного хоста и обеспечения надежной локальной автоматизации через собственные сообщения Chrome (вместо хрупкой автоматизации только по скриншотам).
Многоязычные SDK: Предлагает SDK для JavaScript/TypeScript, Python и Go (open-browser-use-sdk на npm/PyPI; доступен пакет Go), чтобы команды могли встраивать автоматизацию браузера в приложения, агенты и внутренние инструменты.
Сервер MCP для цепочек инструментов агентов: Предоставляет сервер MCP (например, `obu mcp`), который предоставляет инструменты браузера для перечисления/открытия/захвата вкладок, навигации, операций CDP, планов действий и очистки, что упрощает подключение к агентам, поддерживающим MCP.
Упаковка "навыка" агента: Распространяет готовый к установке пакет навыков (через `npx skills add ...`) для популярных сред выполнения агентов, таких как Codex и Claude Code, что обеспечивает быстрое внедрение без пользовательской интеграции.
Доступ к протоколу Chrome DevTools (CDP): Поддерживает рабочие процессы инспекции и автоматизации на основе CDP (например, взаимодействия с учетом DOM, управление в стиле отладки), подходящие для более надежной веб-автоматизации, чем простые макросы кликов/набора текста.
Гибкость настройки и распространения: Предоставляет пошаговую настройку (`open-browser-use setup`) и запасной путь для ручной установки расширения (бета-версия ZIP через `chrome://extensions/`), когда доступность в магазине ограничена.
Варианты использования Open Browser Use
Авторизованные бизнес-процессы в вебе: Автоматизация задач в контекстах Chrome с выполненным входом (например, внутренние панели управления, порталы CRM/ERP), где интеграции API недоступны или неполны, при этом сохраняя воспроизводимость действий через CLI/SDK.
Проверки качества и регрессии для веб-приложений: Запуск скриптовых потоков навигации и взаимодействия с промежуточными/производственными веб-приложениями с использованием инструментов CDP, подходящих для дымовых тестов, проверки релизов и проверок работоспособности пользовательского интерфейса.
Автоматизация поддержки клиентов и операций: Помощь командам поддержки/операций путем автоматизации повторяющихся шагов в браузере (сортировка тикетов в веб-консолях, получение сведений о заказах/статусах, обновление записей) с помощью процедур, управляемых агентами.
Веб-исследования и конвейеры извлечения контента: Управление Chrome для открытия страниц, прохождения многошаговых потоков и сбора структурированных артефактов для последующего суммирования или анализа в исследованиях, конкурентной разведке или управлении знаниями.
Инструменты повышения производительности разработчиков: Встраивание управления браузером в инструменты разработки (помощники CLI, внутренние боты) для автоматизации общих веб-задач, таких как проверка панелей управления сборками, проверка страниц документации или воспроизведение проблем пользовательского интерфейса.
Автоматизация, подобная RPA, для бэк-офисов малого и среднего бизнеса: Предоставление легких возможностей роботизированной автоматизации процессов для веб-процессов, управляемых электронными таблицами или формами (порталы выставления счетов, сайты поставщиков) без создания полных пользовательских интеграций.
Преимущества
Альтернатива с открытым исходным кодом для Codex Browser Use с нейтральным дизайном среды выполнения (используется через SDK, навык или MCP).
Подход на основе CDP обеспечивает более надежную автоматизацию с учетом DOM, чем чисто визуальные методы/методы на основе скриншотов.
Множество поверхностей интеграции (CLI, SDK, MCP, навык) делают его адаптируемым к различным стекам и экосистемам агентов.
Недостатки
Требует локальной настройки и обслуживания (регистрация нативного хоста, установка/включение расширения, перезапуски Chrome).
Автоматизация на основе Chrome/расширений может быть чувствительна к изменениям политики браузера, доступности магазина расширений и корпоративным ограничениям.
Позиция безопасности зависит от того, как она развернута – автоматизация реальных сеансов с выполненным входом увеличивает риск, если утверждения, определение области действия и контроль доступа не обрабатываются тщательно.
Как использовать Open Browser Use
1) Установите CLI Open Browser Use (OBU): Установите CLI одним из поддерживаемых методов:
- Homebrew (macOS): `brew tap iFurySt/open-browser-use && brew install open-browser-use`
- npm (кроссплатформенный): `npm i -g open-browser-use`
Если вы использовали Homebrew и хотите обновиться позже: `brew upgrade open-browser-use`.
2) Запустите настройку для регистрации нативного хоста и установки/включения расширения Chrome: Запустите: `open-browser-use setup`
Это регистрирует хост нативных сообщений, используемый расширением Chrome, и открывает страницу Chrome Web Store, чтобы вы могли установить/включить соответствующее расширение. Перезапустите Chrome, если потребуется.
Если элемент Chrome Web Store временно недоступен, запустите: `open-browser-use setup beta`, а затем вручную загрузите сгенерированный ZIP-архив из `chrome://extensions/` (режим разработчика).
3) Убедитесь, что Chrome готов к OBU: Убедитесь, что:
- Расширение установлено и включено в Chrome.
- Chrome был перезапущен после установки (если требуется).
- Вы видите расширение на панели инструментов или в меню расширений.
4) Используйте Open Browser Use через CLI (прямое использование): После установки CLI и настройки Chrome вы можете запускать команды OBU для автоматизации браузера (список вкладок/открытие/захват/навигация/действия CDP). Точные команды зависят от вашего рабочего процесса; ключевое требование — это запущенный Chrome + расширение и зарегистрированный нативный хост через `open-browser-use setup`.
5) Используйте Open Browser Use через SDK (JavaScript/TypeScript, Python или Go): Установите SDK для вашего языка:
- JavaScript/TypeScript: `npm install open-browser-use-sdk`
- Python: `pip install open-browser-use-sdk` (импортировать как `open_browser_use`)
- Go: `go get github.com/ifuryst/open-codex-browser-use/packages/open-browser-use-go` (импортировать как `obu`)
Затем вызовите SDK из вашего кода для подключения к среде выполнения OBU и автоматизации Chrome через расширение.
6) Используйте Open Browser Use как навык Codex/агента (рекомендуется для рабочих процессов агентов): Установите навык глобально для Codex:
- `npx skills add iFurySt/open-codex-browser-use -g -a codex --skill open-browser-use --copy -y`
- Проверьте установку: `npx skills ls -g -a codex | rg 'open-browser-use'`
Затем запустите задачу Codex, которая его вызывает, например:
- `codex exec --skip-git-repo-check "Используйте open-browser-use, чтобы проверить сегодняшние новости Hacker News и резюмировать самые читаемые посты."`
Для обновления позже: `npx skills update open-browser-use -g -y` (или `npx skills upgrade open-browser-use -g -y`).
7) Используйте Open Browser Use через инструменты MCP (Model Context Protocol): Установите сервер MCP в поддерживаемые глобальные конфигурации агентов:
- `npx add-mcp "obu mcp" --name open_browser_use --all -g -y`
- Подтвердите: `npx add-mcp list -g`
Или настройте вручную (stdio MCP) в конфигурации вашего агента:
- `[mcp_servers.open_browser_use]`
`command = "obu"`
`args = ["mcp"]`
Это предоставляет инструменты браузера для списка вкладок, открытия, захвата, навигации, CDP, планов действий и очистки.
8) Запустите свой первый сквозной поток автоматизации: Запустите Chrome (с включенным расширением OBU), затем:
- Если используете Codex Skill: попросите Codex выполнить задачу браузера, используя навык open-browser-use.
- Если используете MCP: вызовите инструменты MCP для списка/открытия/захвата вкладки, перехода по URL и выполнения действий.
- Если используете SDK: запустите свой скрипт для подключения и автоматизации навигации и взаимодействий.
Держите Chrome открытым во время выполнения, чтобы расширение могло получать команды.
Часто задаваемые вопросы о Open Browser Use
Open Browser Use (open-browser-use) — это слой автоматизации браузера с открытым исходным кодом, разработанный для сохранения нейтралитета между средами выполнения агентов. Он позиционируется как альтернатива с открытым исходным кодом функции Chrome "Browser Use", поставляемой в Codex.app.
Популярные статьи

Nano Banana SBTI: Что это такое, как это работает и как это использовать в 2026 году
Apr 15, 2026

Обзор Atoms — AI Product Builder, переопределяющий цифровое творчество в 2026 году
Apr 10, 2026

Kilo Claw: Как развернуть и использовать настоящего AI-агента "Сделай-Это-За-Вас" (Обновление 2026)
Apr 3, 2026

OpenAI закрывает приложение Sora: что ждет будущее генерации AI-видео в 2026 году
Mar 25, 2026







