
Agent Browser
Agent Browser는 AI 에이전트가 자연어 명령을 통해 실제 브라우저를 제어할 수 있도록 하는 토큰 효율적인 브라우저 자동화 도구로, 웹 자동화 작업을 위한 탐색, 상호 작용 및 ASCII 와이어프레임 시각화와 같은 기능을 제공합니다.
https://github.com/agent-browser-io/browser?ref=producthunt&utm_source=aipure

제품 정보
업데이트됨:Mar 13, 2026
Agent Browser이란?
Agent Browser는 AI 에이전트와 웹 브라우저 간의 격차를 해소하는 오픈 소스 패키지로, 간단한 명령을 통해 브라우저 활동을 자동 제어할 수 있습니다. MCP(모델 컨텍스트 프로토콜), Vercel AI SDK 및 CLI를 포함한 여러 인터페이스를 지원하므로 다양한 사용 사례에 다용도로 사용할 수 있습니다. 이 도구는 AI 에이전트가 웹사이트에 액세스할 수 있도록 설계되었으며 AI 기반 자동화 작업에 중요한 토큰 사용량의 효율성을 유지합니다. Cursor, Claude Desktop 및 기타 MCP 호환 클라이언트와 같은 다양한 AI 플랫폼과 통합할 수 있습니다.
Agent Browser의 주요 기능
Agent Browser는 AI 에이전트가 자연어 명령과 토큰 효율적인 ASCII 와이어프레임을 통해 실제 브라우저를 제어할 수 있도록 하는 오픈 소스 브라우저 자동화 도구입니다. MCP(모델 컨텍스트 프로토콜), Vercel AI SDK 및 CLI를 포함한 여러 인터페이스를 지원하여 AI 에이전트가 웹 탐색, 상호 작용 및 자동화 작업을 수행하는 동시에 로컬 실행을 통해 개인 정보 보호 및 보안을 유지할 수 있습니다.
토큰 효율적인 브라우저 제어: ASCII 와이어프레임을 사용하여 웹 페이지를 나타내고 AI와 브라우저 간의 효율적인 통신을 위해 참조 기반 상호 작용(@e1, @e2)을 제공합니다.
다중 플랫폼 통합: AI 어시스턴트를 위한 MCP, 개발자를 위한 Vercel AI SDK, 수동 테스트를 위한 CLI를 포함한 여러 통합 방법을 지원합니다.
포괄적인 브라우저 작업: 탐색, 클릭, 입력, 스크롤, 스크린샷 및 양식 작성을 포함한 광범위한 브라우저 자동화 기능을 제공합니다.
개인 정보 우선 아키텍처: Ollama를 통해 기존 Chrome 프로필 및 로컬 LLM 모델을 사용할 수 있는 옵션과 함께 사용자의 컴퓨터에서 로컬로 실행됩니다.
Agent Browser의 사용 사례
웹 테스트 자동화: AI 에이전트가 페이지를 탐색하고, 양식을 작성하고, 기능을 검증하도록 하여 웹사이트 테스트 프로세스를 자동화합니다.
콘텐츠 연구 및 추출: AI 에이전트가 웹사이트를 자동으로 탐색하고, 콘텐츠를 추출하고, 정보를 구조화된 형식으로 저장하여 심층적인 연구를 수행할 수 있도록 합니다.
양식 자동화: 민감한 정보의 보안을 유지하면서 다양한 웹사이트에서 반복적인 양식 작성 작업을 자동화합니다.
전자 상거래 자동화: 다양한 전자 상거래 플랫폼에서 제품 검색, 가격 비교 및 주문 프로세스를 자동화합니다.
장점
로컬 실행 및 암호화된 자격 증명 스토리지를 통해 개인 정보 보호에 중점을 둡니다.
다양한 사용 사례에 대한 유연한 통합 옵션
ASCII 와이어프레임을 통한 토큰 효율적인 통신
단점
로컬 설정 및 종속성이 필요합니다.
지원되는 브라우저 및 플랫폼으로 제한됩니다.
시각적 모드에서 실행할 때 신뢰성이 떨어질 수 있습니다.
Agent Browser 사용 방법
Agent Browser 설치: 'npm install @agent-browser-io/browser'를 실행하여 패키지를 설치합니다. 처음 사용하는 경우 'npx agent-browser install'을 실행하여 Chromium을 다운로드합니다.
기본 사용법 - 핵심 워크플로: 1. 페이지로 이동: 'agent-browser open <url>' 2. 대화형 요소 가져오기: 'agent-browser snapshot -i'(@e1, @e2 등 참조와 함께 요소 반환) 3. 참조를 사용하여 상호 작용: 'agent-browser click @e1' 또는 'agent-browser fill @e2 \"text\"' 4. 페이지 변경 후 다시 스냅샷
세션 관리 설정(선택 사항): --session-name 플래그를 사용하여 브라우저 상태를 저장/복원합니다. 'agent-browser --session-name twitter open twitter.com'. 세션 데이터는 ~/.agent-browser/sessions/에 저장됩니다. AGENT_BROWSER_SESSION_NAME 환경 변수를 통해 설정할 수도 있습니다.
AI 어시스턴트를 위한 MCP 구성: 1. Cursor 설정 → MCP 열기(또는 ~/.cursor/mcp.json 편집) 2. 구성 추가: {\"mcpServers\": {\"agent-browser\": {\"command\": \"npx\", \"args\": [\"-y\", \"@agent-browser-io/browser\", \"mcp\"]}}} 3. Cursor 다시 시작/MCP 다시 로드
Vercel AI SDK와 함께 사용: 1. 도구 가져오기: 'import { createBrowserTools, AgentBrowser, PlaywrightBrowserBackend } from '@agent-browser-io/browser'' 2. 브라우저 인스턴스 만들기 3. createBrowserTools(browser)로 도구 만들기 4. generateText() 함수로 도구 사용
콘텐츠 보안 활성화(선택 사항): --content-boundaries 플래그를 사용하여 페이지 출력을 구분 기호로 래핑하여 LLM이 도구 출력과 신뢰할 수 없는 콘텐츠를 구별하는 데 도움을 줍니다.
인증 처리(선택 사항): 자격 증명 저장: 'echo \"pass\" | agent-browser auth save github --url https://github.com/login --username user --password-stdin' 그런 다음 'agent-browser auth login github'를 사용하여 로그인합니다.
Agent Browser 자주 묻는 질문
Agent Browser는 AI 에이전트가 토큰 효율적인 방식으로 실제 브라우저를 제어할 수 있도록 하는 패키지입니다. ASCII 와이어프레임을 통해 탐색, 클릭, 타이핑 및 상호 작용을 가능하게 하며, MCP 클라이언트를 통해 또는 Vercel AI SDK와 함께 사용할 수 있습니다.











