Open Browser Use

Open Browser Use

WebsiteBrowser ExtensionFreeAI DevOps AssistantAI Web Scraper
Open Browser Use는 Chrome 확장 프로그램을 CLI/SDK/MCP와 결합하여 다양한 AI 에이전트 도구에서 DOM 인식, CDP 기반 탭 제어, 탐색 및 작업을 가능하게 하는 오픈 소스, 에이전트 런타임 중립 브라우저 자동화 계층입니다.
https://github.com/iFurySt/open-codex-browser-use?ref=producthunt&utm_source=aipure
Open Browser Use

제품 정보

업데이트됨:May 18, 2026

Open Browser Use이란?

Open Browser Use(open-browser-use)는 Codex에 의해 대중화된 'Browser Use' 기능의 오픈 소스 대안으로, AI 에이전트가 스크린샷 기반 자동화보다 더 풍부하고 구조화된 제어를 통해 실제 Chrome 브라우저를 안정적으로 작동할 수 있도록 설계되었습니다. CLI, JavaScript/Python/Go SDK 및 MCP 서버를 통해 교차 런타임 통합 표면을 제공하므로 다양한 에이전트 환경에서 동일한 브라우저 기능을 호출할 수 있습니다. 이 프로젝트는 탭 열기 및 확보, 탐색, Chrome DevTools Protocol(CDP)을 통한 페이지 검사, 작업 계획 실행과 같은 실용적인 브라우저 워크플로우에 중점을 두며, 통합을 모듈식으로 이식 가능하게 유지합니다.

Open Browser Use의 주요 기능

Open Browser Use (open-browser-use)는 Codex의 Chrome Browser Use를 대체하기 위해 설계된 오픈 소스 에이전트 런타임 중립적인 브라우저 자동화 레이어입니다. Chrome 확장 프로그램과 로컬 CLI(네이티브 메시징)를 페어링하며, SDK(JS/Python/Go), 에이전트 런타임용 패키지화된 "기술"(예: Codex, Claude Code) 또는 MCP 서버를 통해 사용할 수 있습니다. 이는 탭 검색/요청, 탐색, CDP 액세스, 작업 계획 및 정리와 같은 실용적인 브라우저 제어 기본 요소를 제공하여 에이전트 및 개발자 도구가 실제 Chrome 세션을 구조화되고 재사용 가능한 방식으로 자동화할 수 있도록 합니다.
확장 프로그램 + CLI 네이티브 브릿지: Chrome 확장 프로그램과 open-browser-use CLI를 결합하여 네이티브 호스트를 등록하고 Chrome의 네이티브 메시징(취약한 스크린샷 전용 자동화 대신)을 통해 안정적인 로컬 자동화를 가능하게 합니다.
다국어 SDK: JavaScript/TypeScript, Python 및 Go SDK(npm/PyPI의 open-browser-use-sdk; Go 패키지 사용 가능)를 제공하여 팀이 브라우저 자동화를 앱, 에이전트 및 내부 도구에 내장할 수 있도록 합니다.
에이전트 툴체인을 위한 MCP 서버: 탭 나열/열기/요청, 탐색, CDP 작업, 작업 계획 및 정리를 위한 브라우저 도구를 제공하는 MCP 서버(예: `obu mcp`)를 노출하여 MCP 지원 에이전트에 쉽게 연결할 수 있도록 합니다.
에이전트 "기술" 패키징: Codex 및 Claude Code와 같은 인기 있는 에이전트 런타임용으로 즉시 설치 가능한 기술 번들(`npx skills add ...`를 통해)을 배포하여 사용자 지정 통합 작업 없이 빠른 채택을 가능하게 합니다.
Chrome DevTools Protocol (CDP) 액세스: 단순한 클릭/타이핑 매크로보다 더 강력한 웹 자동화에 적합한 CDP 기반 검사 및 자동화 워크플로우(예: DOM 인식 상호 작용, 디버깅 스타일 제어)를 지원합니다.
설정 및 배포 유연성: 스토어 가용성이 제한될 때 수동 확장 프로그램 설치(베타 ZIP via `chrome://extensions/`)를 위한 안내 설정(`open-browser-use setup`) 및 대체 경로를 제공합니다.

Open Browser Use의 사용 사례

인증된 비즈니스 웹 워크플로우: API 통합이 불가능하거나 불완전한 로그인된 Chrome 컨텍스트(예: 내부 대시보드, CRM/ERP 포털)에서 작업을 자동화하는 동시에 CLI/SDK를 통해 작업을 재현 가능하게 유지합니다.
웹 앱을 위한 QA 및 회귀 검사: CDP 도구를 사용하여 스테이징/프로덕션 웹 앱에 대해 스크립트화된 탐색 및 상호 작용 흐름을 실행하여 스모크 테스트, 릴리스 유효성 검사 및 UI 건전성 검사에 적합합니다.
고객 지원 및 운영 자동화: 에이전트 기반 루틴을 통해 반복적인 브라우저 단계(웹 콘솔에서 티켓 분류, 주문/상태 세부 정보 가져오기, 기록 업데이트)를 자동화하여 지원/운영 팀을 지원합니다.
웹 연구 및 콘텐츠 추출 파이프라인: Chrome을 구동하여 페이지를 열고, 다단계 흐름을 탐색하고, 연구, 경쟁 정보 또는 지식 관리에서 다운스트림 요약 또는 분석을 위한 구조화된 아티팩트를 수집합니다.
개발자 생산성 도구: 빌드 대시보드 확인, 문서 페이지 확인 또는 UI 문제 재현과 같은 일반적인 웹 기반 작업을 자동화하기 위해 브라우저 제어를 개발 도구(CLI 도우미, 내부 봇)에 내장합니다.
SMB 백 오피스를 위한 RPA와 유사한 자동화: 완전한 사용자 지정 통합을 구축하지 않고도 스프레드시트 기반 또는 양식 중심 웹 프로세스(송장 포털, 공급업체 사이트)를 위한 경량 로봇 프로세스 자동화 기능을 제공합니다.

장점

런타임 중립적인 설계(SDK, 기술 또는 MCP를 통해 사용 가능)를 갖춘 Codex Browser Use의 오픈 소스 대안입니다.
CDP 기반 접근 방식은 순전히 시각적/스크린샷 기반 방법보다 더 강력하고 DOM 인식 자동화를 가능하게 합니다.
여러 통합 표면(CLI, SDK, MCP, 기술)을 통해 다양한 스택 및 에이전트 생태계에 적응할 수 있습니다.

단점

로컬 설정 및 유지 관리 필요(네이티브 호스트 등록, 확장 프로그램 설치/활성화, Chrome 재시작).
Chrome/확장 프로그램 기반 자동화는 브라우저 정책 변경, 확장 프로그램 스토어 가용성 및 기업 제한에 민감할 수 있습니다.
보안 상태는 배포 방식에 따라 달라집니다. 승인, 범위 지정 및 액세스 제어가 신중하게 처리되지 않으면 실제 로그인된 세션을 자동화하는 것은 위험을 증가시킵니다.

Open Browser Use 사용 방법

1) Open Browser Use(OBU) CLI 설치: 지원되는 방법 중 하나를 사용하여 CLI를 설치합니다: - Homebrew (macOS): `brew tap iFurySt/open-browser-use && brew install open-browser-use` - npm (크로스 플랫폼): `npm i -g open-browser-use` Homebrew를 사용했고 나중에 업그레이드하려면: `brew upgrade open-browser-use`.
2) 네이티브 호스트를 등록하고 Chrome 확장 프로그램을 설치/활성화하기 위해 설정을 실행합니다.: 실행: `open-browser-use setup` 이것은 Chrome 확장 프로그램에서 사용하는 네이티브 메시징 호스트를 등록하고 Chrome 웹 스토어 페이지를 열어 일치하는 확장 프로그램을 설치/활성화할 수 있도록 합니다. 메시지가 표시되면 Chrome을 다시 시작하십시오. Chrome 웹 스토어 항목을 일시적으로 사용할 수 없는 경우: `open-browser-use setup beta`를 실행한 다음 `chrome://extensions/` (개발자 모드)에서 생성된 ZIP을 수동으로 로드하십시오.
3) Chrome이 OBU를 사용할 준비가 되었는지 확인합니다.: 다음을 확인하십시오: - 확장 프로그램이 Chrome에 설치되어 있고 활성화되어 있습니다. - 설정 후 Chrome이 다시 시작되었습니다(필요한 경우). - 툴바 또는 확장 프로그램 메뉴에서 확장 프로그램을 볼 수 있습니다.
4) CLI를 통해 Open Browser Use 사용 (직접 사용): CLI가 설치되고 Chrome이 설정되면 OBU 명령을 실행하여 브라우저 자동화(탭 목록/열기/확보/탐색/CDP 작업)를 구동할 수 있습니다. 정확한 명령은 워크플로우에 따라 다르며, 핵심 요구 사항은 Chrome + 확장 프로그램이 실행 중이고 `open-browser-use setup`을 통해 네이티브 호스트가 등록되어 있어야 한다는 것입니다.
5) SDK를 통해 Open Browser Use 사용 (JavaScript/TypeScript, Python 또는 Go): 해당 언어의 SDK를 설치합니다: - JavaScript/TypeScript: `npm install open-browser-use-sdk` - Python: `pip install open-browser-use-sdk` (as `open_browser_use`로 가져오기) - Go: `go get github.com/ifuryst/open-codex-browser-use/packages/open-browser-use-go` (as `obu`로 가져오기) 그런 다음 코드에서 SDK를 호출하여 OBU 런타임에 연결하고 확장 프로그램을 통해 Chrome을 자동화합니다.
6) Codex/에이전트 스킬로 Open Browser Use 사용 (에이전트 워크플로우에 권장): Codex용 스킬을 전역으로 설치합니다: - `npx skills add iFurySt/open-codex-browser-use -g -a codex --skill open-browser-use --copy -y` - 설치 확인: `npx skills ls -g -a codex | rg 'open-browser-use'` 그런 다음 이를 호출하는 Codex 작업을 실행합니다. 예: - `codex exec --skip-git-repo-check "Use open-browser-use to check today’s Hacker News and summarize the most worth-reading posts."` 나중에 업데이트하려면: `npx skills update open-browser-use -g -y` (또는 `npx skills upgrade open-browser-use -g -y`).
7) MCP(Model Context Protocol) 도구를 통해 Open Browser Use 사용: 지원되는 전역 에이전트 구성에 MCP 서버를 설치합니다: - `npx add-mcp "obu mcp" --name open_browser_use --all -g -y` - 확인: `npx add-mcp list -g` 또는 에이전트 구성에서 수동으로 구성 (stdio MCP): - `[mcp_servers.open_browser_use]` `command = "obu"` `args = ["mcp"]` 이는 탭 목록, 열기, 확보, 탐색, CDP, 작업 계획 및 정리를 위한 브라우저 도구를 노출합니다.
8) 첫 번째 엔드투엔드 자동화 흐름 실행: Chrome을 시작하고(OBU 확장 프로그램 활성화), 다음을 수행합니다: - Codex 스킬을 사용하는 경우: open-browser-use 스킬을 사용하여 브라우저 작업을 수행하도록 Codex에 요청합니다. - MCP를 사용하는 경우: MCP 도구를 호출하여 탭을 나열/열기/확보하고, URL로 이동하고, 작업을 수행합니다. - SDK를 사용하는 경우: 스크립트를 실행하여 연결하고 탐색 및 상호 작용을 자동화합니다. 확장 프로그램이 명령을 받을 수 있도록 실행하는 동안 Chrome을 열어 두십시오.

Open Browser Use 자주 묻는 질문

Open Browser Use(open-browser-use)는 에이전트 런타임 전반에서 중립성을 유지하도록 설계된 오픈 소스 브라우저 자동화 계층입니다. Codex.app에 포함된 Chrome "Browser Use" 기능에 대한 오픈 소스 대안으로 자리매김하고 있습니다.

Open Browser Use와(과) 유사한 최신 AI 도구

Hapticlabs
Hapticlabs
Hapticlabs는 디자이너, 개발자 및 연구자가 코딩 없이 장치 간 몰입형 촉각 상호작용을 쉽게 설계, 프로토타입 및 배포할 수 있도록 하는 코드 없는 툴킷입니다
Deployo.ai
Deployo.ai
Deployo.ai는 내장된 윤리적 AI 프레임워크와 크로스 클라우드 호환성을 통해 원활한 모델 배포, 모니터링 및 확장을 가능하게 하는 포괄적인 AI 배포 플랫폼입니다.
CloudSoul
CloudSoul
CloudSoul은 사용자가 자연어 대화를 통해 클라우드 인프라를 즉시 배포하고 관리할 수 있도록 하는 AI 기반 SaaS 플랫폼으로, AWS 리소스 관리의 접근성과 효율성을 높입니다.
Devozy.ai
Devozy.ai
Devozy.ai는 Agile 프로젝트 관리, DevSecOps, 멀티 클라우드 인프라 관리 및 IT 서비스 관리를 통합하여 소프트웨어 배포를 가속화하는 AI 기반 개발자 셀프 서비스 플랫폼입니다.