Agent Browser를 어떻게 설치합니까?

npm을 사용하여 Agent Browser를 설치할 수 있습니다: 'npm install @agent-browser-io/browser'. 전역으로 설치하지 않고 사용해 보려면 'npx agent-browser install'을 사용할 수 있습니다.

Agent Browser를 사용하는 주요 방법은 무엇입니까?

Agent Browser를 사용하는 세 가지 주요 방법이 있습니다: 1) MCP - AI 브라우저 제어를 위해 Cursor 또는 다른 MCP 클라이언트에 추가, 2) Vercel AI SDK - 앱에서 generateText와 함께 createBrowserTools(browser) 사용, 3) CLI - 수동 테스트를 위해 대화형 CLI 실행

Agent Browser에서 사용할 수 있는 주요 도구/명령은 무엇입니까?

주요 도구에는 launch, navigate, getWireframe, click, type, fill, dblclick, hover, press, select, check, uncheck, scroll, screenshot 및 close가 있습니다. 이러한 도구는 MCP 서버 및 Vercel AI SDK 사용 모두에서 일관성을 유지합니다.

Agent Browser의 시스템 요구 사항은 무엇입니까?

Agent Browser는 Node.js 버전 18 이상이 필요합니다. 브라우저 자동화를 위해 Playwright를 사용하며, 이는 개발 종속성으로 포함되어 있습니다.

Agent Browser가 모바일 장치에서 작동합니까?

예, Agent Browser는 USB를 통해 연결된 iOS 시뮬레이터와 실제 iOS 장치를 모두 지원합니다. 'agent-browser -p ios'와 같은 명령을 사용하여 실제 모바일 웹 테스트를 위해 Mobile Safari를 제어할 수 있습니다.

Agent Browser

WebsiteFreeAI Browsers Builder AI Developer Tools

Agent Browser는 AI 에이전트가 자연어 명령을 통해 실제 브라우저를 제어할 수 있도록 하는 토큰 효율적인 브라우저 자동화 도구로, 웹 자동화 작업을 위한 탐색, 상호 작용 및 ASCII 와이어프레임 시각화와 같은 기능을 제공합니다.

웹사이트 방문

이 도구 광고하기

https://github.com/agent-browser-io/browser?ref=producthunt&utm_source=aipure

개요
동영상
대안

제품 정보

업데이트됨:Mar 15, 2026

Agent Browser이란?

Agent Browser는 AI 에이전트와 웹 브라우저 간의 격차를 해소하는 오픈 소스 패키지로, 간단한 명령을 통해 브라우저 활동을 자동 제어할 수 있습니다. MCP(모델 컨텍스트 프로토콜), Vercel AI SDK 및 CLI를 포함한 여러 인터페이스를 지원하므로 다양한 사용 사례에 다용도로 사용할 수 있습니다. 이 도구는 AI 에이전트가 웹사이트에 액세스할 수 있도록 설계되었으며 AI 기반 자동화 작업에 중요한 토큰 사용량의 효율성을 유지합니다. Cursor, Claude Desktop 및 기타 MCP 호환 클라이언트와 같은 다양한 AI 플랫폼과 통합할 수 있습니다.

Agent Browser의 주요 기능

Agent Browser는 AI 에이전트가 자연어 명령과 토큰 효율적인 ASCII 와이어프레임을 통해 실제 브라우저를 제어할 수 있도록 하는 오픈 소스 브라우저 자동화 도구입니다. MCP(모델 컨텍스트 프로토콜), Vercel AI SDK 및 CLI를 포함한 여러 인터페이스를 지원하여 AI 에이전트가 웹 탐색, 상호 작용 및 자동화 작업을 수행하는 동시에 로컬 실행을 통해 개인 정보 보호 및 보안을 유지할 수 있습니다.

토큰 효율적인 브라우저 제어: ASCII 와이어프레임을 사용하여 웹 페이지를 나타내고 AI와 브라우저 간의 효율적인 통신을 위해 참조 기반 상호 작용(@e1, @e2)을 제공합니다.

다중 플랫폼 통합: AI 어시스턴트를 위한 MCP, 개발자를 위한 Vercel AI SDK, 수동 테스트를 위한 CLI를 포함한 여러 통합 방법을 지원합니다.

포괄적인 브라우저 작업: 탐색, 클릭, 입력, 스크롤, 스크린샷 및 양식 작성을 포함한 광범위한 브라우저 자동화 기능을 제공합니다.

개인 정보 우선 아키텍처: Ollama를 통해 기존 Chrome 프로필 및 로컬 LLM 모델을 사용할 수 있는 옵션과 함께 사용자의 컴퓨터에서 로컬로 실행됩니다.

Agent Browser의 사용 사례

웹 테스트 자동화: AI 에이전트가 페이지를 탐색하고, 양식을 작성하고, 기능을 검증하도록 하여 웹사이트 테스트 프로세스를 자동화합니다.

콘텐츠 연구 및 추출: AI 에이전트가 웹사이트를 자동으로 탐색하고, 콘텐츠를 추출하고, 정보를 구조화된 형식으로 저장하여 심층적인 연구를 수행할 수 있도록 합니다.

양식 자동화: 민감한 정보의 보안을 유지하면서 다양한 웹사이트에서 반복적인 양식 작성 작업을 자동화합니다.

전자 상거래 자동화: 다양한 전자 상거래 플랫폼에서 제품 검색, 가격 비교 및 주문 프로세스를 자동화합니다.

장점

로컬 실행 및 암호화된 자격 증명 스토리지를 통해 개인 정보 보호에 중점을 둡니다.

다양한 사용 사례에 대한 유연한 통합 옵션

ASCII 와이어프레임을 통한 토큰 효율적인 통신

단점

로컬 설정 및 종속성이 필요합니다.

지원되는 브라우저 및 플랫폼으로 제한됩니다.

시각적 모드에서 실행할 때 신뢰성이 떨어질 수 있습니다.

Agent Browser 사용 방법

Agent Browser 설치: 'npm install @agent-browser-io/browser'를 실행하여 패키지를 설치합니다. 처음 사용하는 경우 'npx agent-browser install'을 실행하여 Chromium을 다운로드합니다.

기본 사용법 - 핵심 워크플로: 1. 페이지로 이동: 'agent-browser open <url>' 2. 대화형 요소 가져오기: 'agent-browser snapshot -i'(@e1, @e2 등 참조와 함께 요소 반환) 3. 참조를 사용하여 상호 작용: 'agent-browser click @e1' 또는 'agent-browser fill @e2 \"text\"' 4. 페이지 변경 후 다시 스냅샷

세션 관리 설정(선택 사항): --session-name 플래그를 사용하여 브라우저 상태를 저장/복원합니다. 'agent-browser --session-name twitter open twitter.com'. 세션 데이터는 ~/.agent-browser/sessions/에 저장됩니다. AGENT_BROWSER_SESSION_NAME 환경 변수를 통해 설정할 수도 있습니다.

AI 어시스턴트를 위한 MCP 구성: 1. Cursor 설정 → MCP 열기(또는 ~/.cursor/mcp.json 편집) 2. 구성 추가: {\"mcpServers\": {\"agent-browser\": {\"command\": \"npx\", \"args\": [\"-y\", \"@agent-browser-io/browser\", \"mcp\"]}}} 3. Cursor 다시 시작/MCP 다시 로드

Vercel AI SDK와 함께 사용: 1. 도구 가져오기: 'import { createBrowserTools, AgentBrowser, PlaywrightBrowserBackend } from '@agent-browser-io/browser'' 2. 브라우저 인스턴스 만들기 3. createBrowserTools(browser)로 도구 만들기 4. generateText() 함수로 도구 사용

콘텐츠 보안 활성화(선택 사항): --content-boundaries 플래그를 사용하여 페이지 출력을 구분 기호로 래핑하여 LLM이 도구 출력과 신뢰할 수 없는 콘텐츠를 구별하는 데 도움을 줍니다.

인증 처리(선택 사항): 자격 증명 저장: 'echo \"pass\" | agent-browser auth save github --url https://github.com/login --username user --password-stdin' 그런 다음 'agent-browser auth login github'를 사용하여 로그인합니다.

Agent Browser 자주 묻는 질문

Agent Browser는 AI 에이전트가 토큰 효율적인 방식으로 실제 브라우저를 제어할 수 있도록 하는 패키지입니다. ASCII 와이어프레임을 통해 탐색, 클릭, 타이핑 및 상호 작용을 가능하게 하며, MCP 클라이언트를 통해 또는 Vercel AI SDK와 함께 사용할 수 있습니다.