Agent Browser는 AI 에이전트가 자연어 명령을 통해 실제 브라우저를 제어할 수 있도록 하는 토큰 효율적인 브라우저 자동화 도구로, 웹 자동화 작업을 위한 탐색, 상호 작용 및 ASCII 와이어프레임 시각화와 같은 기능을 제공합니다.
https://github.com/agent-browser-io/browser?ref=producthunt&utm_source=aipure
Agent Browser

제품 정보

업데이트됨:Mar 13, 2026

Agent Browser이란?

Agent Browser는 AI 에이전트와 웹 브라우저 간의 격차를 해소하는 오픈 소스 패키지로, 간단한 명령을 통해 브라우저 활동을 자동 제어할 수 있습니다. MCP(모델 컨텍스트 프로토콜), Vercel AI SDK 및 CLI를 포함한 여러 인터페이스를 지원하므로 다양한 사용 사례에 다용도로 사용할 수 있습니다. 이 도구는 AI 에이전트가 웹사이트에 액세스할 수 있도록 설계되었으며 AI 기반 자동화 작업에 중요한 토큰 사용량의 효율성을 유지합니다. Cursor, Claude Desktop 및 기타 MCP 호환 클라이언트와 같은 다양한 AI 플랫폼과 통합할 수 있습니다.

Agent Browser의 주요 기능

Agent Browser는 AI 에이전트가 자연어 명령과 토큰 효율적인 ASCII 와이어프레임을 통해 실제 브라우저를 제어할 수 있도록 하는 오픈 소스 브라우저 자동화 도구입니다. MCP(모델 컨텍스트 프로토콜), Vercel AI SDK 및 CLI를 포함한 여러 인터페이스를 지원하여 AI 에이전트가 웹 탐색, 상호 작용 및 자동화 작업을 수행하는 동시에 로컬 실행을 통해 개인 정보 보호 및 보안을 유지할 수 있습니다.
토큰 효율적인 브라우저 제어: ASCII 와이어프레임을 사용하여 웹 페이지를 나타내고 AI와 브라우저 간의 효율적인 통신을 위해 참조 기반 상호 작용(@e1, @e2)을 제공합니다.
다중 플랫폼 통합: AI 어시스턴트를 위한 MCP, 개발자를 위한 Vercel AI SDK, 수동 테스트를 위한 CLI를 포함한 여러 통합 방법을 지원합니다.
포괄적인 브라우저 작업: 탐색, 클릭, 입력, 스크롤, 스크린샷 및 양식 작성을 포함한 광범위한 브라우저 자동화 기능을 제공합니다.
개인 정보 우선 아키텍처: Ollama를 통해 기존 Chrome 프로필 및 로컬 LLM 모델을 사용할 수 있는 옵션과 함께 사용자의 컴퓨터에서 로컬로 실행됩니다.

Agent Browser의 사용 사례

웹 테스트 자동화: AI 에이전트가 페이지를 탐색하고, 양식을 작성하고, 기능을 검증하도록 하여 웹사이트 테스트 프로세스를 자동화합니다.
콘텐츠 연구 및 추출: AI 에이전트가 웹사이트를 자동으로 탐색하고, 콘텐츠를 추출하고, 정보를 구조화된 형식으로 저장하여 심층적인 연구를 수행할 수 있도록 합니다.
양식 자동화: 민감한 정보의 보안을 유지하면서 다양한 웹사이트에서 반복적인 양식 작성 작업을 자동화합니다.
전자 상거래 자동화: 다양한 전자 상거래 플랫폼에서 제품 검색, 가격 비교 및 주문 프로세스를 자동화합니다.

장점

로컬 실행 및 암호화된 자격 증명 스토리지를 통해 개인 정보 보호에 중점을 둡니다.
다양한 사용 사례에 대한 유연한 통합 옵션
ASCII 와이어프레임을 통한 토큰 효율적인 통신

단점

로컬 설정 및 종속성이 필요합니다.
지원되는 브라우저 및 플랫폼으로 제한됩니다.
시각적 모드에서 실행할 때 신뢰성이 떨어질 수 있습니다.

Agent Browser 사용 방법

Agent Browser 설치: 'npm install @agent-browser-io/browser'를 실행하여 패키지를 설치합니다. 처음 사용하는 경우 'npx agent-browser install'을 실행하여 Chromium을 다운로드합니다.
기본 사용법 - 핵심 워크플로: 1. 페이지로 이동: 'agent-browser open <url>' 2. 대화형 요소 가져오기: 'agent-browser snapshot -i'(@e1, @e2 등 참조와 함께 요소 반환) 3. 참조를 사용하여 상호 작용: 'agent-browser click @e1' 또는 'agent-browser fill @e2 \"text\"' 4. 페이지 변경 후 다시 스냅샷
세션 관리 설정(선택 사항): --session-name 플래그를 사용하여 브라우저 상태를 저장/복원합니다. 'agent-browser --session-name twitter open twitter.com'. 세션 데이터는 ~/.agent-browser/sessions/에 저장됩니다. AGENT_BROWSER_SESSION_NAME 환경 변수를 통해 설정할 수도 있습니다.
AI 어시스턴트를 위한 MCP 구성: 1. Cursor 설정 → MCP 열기(또는 ~/.cursor/mcp.json 편집) 2. 구성 추가: {\"mcpServers\": {\"agent-browser\": {\"command\": \"npx\", \"args\": [\"-y\", \"@agent-browser-io/browser\", \"mcp\"]}}} 3. Cursor 다시 시작/MCP 다시 로드
Vercel AI SDK와 함께 사용: 1. 도구 가져오기: 'import { createBrowserTools, AgentBrowser, PlaywrightBrowserBackend } from '@agent-browser-io/browser'' 2. 브라우저 인스턴스 만들기 3. createBrowserTools(browser)로 도구 만들기 4. generateText() 함수로 도구 사용
콘텐츠 보안 활성화(선택 사항): --content-boundaries 플래그를 사용하여 페이지 출력을 구분 기호로 래핑하여 LLM이 도구 출력과 신뢰할 수 없는 콘텐츠를 구별하는 데 도움을 줍니다.
인증 처리(선택 사항): 자격 증명 저장: 'echo \"pass\" | agent-browser auth save github --url https://github.com/login --username user --password-stdin' 그런 다음 'agent-browser auth login github'를 사용하여 로그인합니다.

Agent Browser 자주 묻는 질문

Agent Browser는 AI 에이전트가 토큰 효율적인 방식으로 실제 브라우저를 제어할 수 있도록 하는 패키지입니다. ASCII 와이어프레임을 통해 탐색, 클릭, 타이핑 및 상호 작용을 가능하게 하며, MCP 클라이언트를 통해 또는 Vercel AI SDK와 함께 사용할 수 있습니다.

Agent Browser와(과) 유사한 최신 AI 도구

Cursor Search
Cursor Search
Cursor Search는 커서에서 직접 세계 지식과 정보 검색에 즉시 접근할 수 있는 AI 기반 브라우저 확장입니다.
PixieBrix
PixieBrix
PixieBrix는 사용자가 AI, 통합 및 협업 기능으로 웹 애플리케이션을 사용자 지정, 자동화 및 향상시킬 수 있는 로우코드 브라우저 확장 플랫폼입니다.
AI Form Fill
AI Form Fill
AI Form Fill은 단일 클릭으로 온라인 양식을 자동으로 작성하여 시간을 절약하고 생산성을 높이는 AI 기반 브라우저 확장 프로그램입니다.
Duang AI Tab
Duang AI Tab
Duang AI Tab은 홈페이지를 아름답게 꾸미고 생산성을 향상시키며 어디서든 AI 도구에 원클릭으로 접근할 수 있는 인기 있는 브라우저 확장 프로그램입니다.