
Agent Browser
Agent Browser ist ein token-effizientes Browserautomatisierungstool, das es KI-Agenten ermöglicht, echte Browser über Befehle in natürlicher Sprache zu steuern und Funktionen wie Navigation, Interaktion und ASCII-Drahtgittervisualisierung für Webautomatisierungsaufgaben bietet.
https://github.com/agent-browser-io/browser?ref=producthunt&utm_source=aipure

Produktinformationen
Aktualisiert:Mar 13, 2026
Was ist Agent Browser
Agent Browser ist ein Open-Source-Paket, das die Lücke zwischen KI-Agenten und Webbrowsern schließt und die automatisierte Steuerung von Browseraktivitäten durch einfache Befehle ermöglicht. Es unterstützt mehrere Schnittstellen, darunter MCP (Model Context Protocol), Vercel AI SDK und eine CLI, was es vielseitig für verschiedene Anwendungsfälle macht. Das Tool wurde entwickelt, um Webseiten für KI-Agenten zugänglich zu machen und gleichzeitig die Effizienz bei der Token-Nutzung zu gewährleisten, was für KI-gesteuerte Automatisierungsaufgaben entscheidend ist. Es kann in verschiedene KI-Plattformen wie Cursor, Claude Desktop und andere MCP-kompatible Clients integriert werden.
Hauptfunktionen von Agent Browser
Agent Browser ist ein Open-Source-Tool zur Browserautomatisierung, das es KI-Agenten ermöglicht, echte Browser über natürliche Sprachbefehle und token-effiziente ASCII-Wireframes zu steuern. Es unterstützt mehrere Schnittstellen, darunter MCP (Model Context Protocol), Vercel AI SDK und CLI, wodurch KI-Agenten Webnavigation, Interaktion und Automatisierungsaufgaben durchführen können, während Privatsphäre und Sicherheit durch lokale Ausführung gewahrt bleiben.
Token-effiziente Browsersteuerung: Verwendet ASCII-Wireframes zur Darstellung von Webseiten und bietet referenzbasierte Interaktion (@e1, @e2) für eine effiziente Kommunikation zwischen KI und Browser
Multi-Plattform-Integration: Unterstützt mehrere Integrationsmethoden, darunter MCP für KI-Assistenten, Vercel AI SDK für Entwickler und CLI für manuelle Tests
Umfassende Browseraktionen: Bietet eine breite Palette von Browserautomatisierungsfunktionen, darunter Navigation, Klicken, Tippen, Scrollen, Screenshots und Ausfüllen von Formularen
Privacy-First-Architektur: Läuft lokal auf dem Rechner des Benutzers mit der Option, vorhandene Chrome-Profile und lokale LLM-Modelle über Ollama zu verwenden
Anwendungsfälle von Agent Browser
Web Testing Automatisierung: Automatisieren Sie Website-Testprozesse, indem Sie KI-Agenten durch Seiten navigieren, Formulare ausfüllen und die Funktionalität überprüfen lassen
Inhaltsrecherche & Extraktion: Ermöglichen Sie KI-Agenten, tiefe Recherchen durchzuführen, indem sie automatisch Websites navigieren, Inhalte extrahieren und Informationen in strukturierten Formaten speichern
Formularautomatisierung: Automatisieren Sie sich wiederholende Aufgaben zum Ausfüllen von Formularen auf verschiedenen Websites und gewährleisten Sie gleichzeitig die Sicherheit sensibler Informationen
E-Commerce-Automatisierung: Automatisieren Sie Produktsuchen, Preisvergleiche und Bestellprozesse auf verschiedenen E-Commerce-Plattformen
Vorteile
Datenschutzorientiert mit lokaler Ausführung und verschlüsselter Speicherung von Anmeldeinformationen
Flexible Integrationsmöglichkeiten für verschiedene Anwendungsfälle
Token-effiziente Kommunikation durch ASCII-Wireframes
Nachteile
Erfordert lokale Einrichtung und Abhängigkeiten
Beschränkt auf unterstützte Browser und Plattformen
Kann im visuellen Modus weniger zuverlässig sein
Wie verwendet man Agent Browser
Agent Browser installieren: Führen Sie \'npm install @agent-browser-io/browser\' aus, um das Paket zu installieren. Bei der ersten Verwendung führen Sie auch \'npx agent-browser install\' aus, um Chromium herunterzuladen.
Grundlegende Verwendung - Kern-Workflow: 1. Zur Seite navigieren: \'agent-browser open <url>\' 2. Interaktive Elemente abrufen: \'agent-browser snapshot -i\' (gibt Elemente mit Referenzen @e1, @e2 usw. zurück) 3. Interaktion über Referenzen: \'agent-browser click @e1\' oder \'agent-browser fill @e2 \"text\"\' 4. Nach Seitenänderungen erneut Snapshot erstellen
Sitzungsverwaltung einrichten (optional): Verwenden Sie das --session-name-Flag, um den Browserstatus zu speichern/wiederherzustellen: \'agent-browser --session-name twitter open twitter.com\'. Sitzungsdaten werden in ~/.agent-browser/sessions/ gespeichert. Kann auch über die Umgebungsvariable AGENT_BROWSER_SESSION_NAME festgelegt werden.
MCP für KI-Assistenten konfigurieren: 1. Cursor-Einstellungen öffnen → MCP (oder ~/.cursor/mcp.json bearbeiten) 2. Konfiguration hinzufügen: {\"mcpServers\": {\"agent-browser\": {\"command\": \"npx\", \"args\": [\"-y\", \"@agent-browser-io/browser\", \"mcp\"]}}} 3. Cursor neu starten/MCP neu laden
Mit Vercel AI SDK verwenden: 1. Tools importieren: \'import { createBrowserTools, AgentBrowser, PlaywrightBrowserBackend } from \'@agent-browser-io/browser\' 2. Browserinstanz erstellen 3. Tools mit createBrowserTools(browser) erstellen 4. Tools mit der Funktion generateText() verwenden
Content Security aktivieren (optional): Verwenden Sie das --content-boundaries-Flag, um die Seitenausgabe in Begrenzer einzuschließen, wodurch LLMs zwischen Tool-Ausgabe und nicht vertrauenswürdigen Inhalten unterscheiden können.
Authentifizierung handhaben (optional): Anmeldeinformationen speichern: \'echo \"pass\" | agent-browser auth save github --url https://github.com/login --username user --password-stdin\' und dann \'agent-browser auth login github\' verwenden, um sich anzumelden
Agent Browser FAQs
Agent Browser ist ein Paket, das es KI-Agenten ermöglicht, einen echten Browser auf token-effiziente Weise zu steuern. Es ermöglicht Navigation, Klicken, Tippen und Interaktion über ASCII-Wireframes und kann über MCP-Clients oder mit dem Vercel AI SDK verwendet werden.
Agent Browser Video
Beliebte Artikel

OpenClaw Bereitstellungsanleitung: So hosten Sie einen echten KI-Agenten selbst (2026 Update)
Mar 10, 2026

Atoms Tutorial 2026: Erstellen Sie ein vollständiges SaaS-Dashboard in 20 Minuten (AIPURE Hands-On)
Mar 2, 2026

Die beliebtesten KI-Tools von 2025 | 2026 Update von AIPURE
Feb 10, 2026

Moltbook AI: Das erste reine KI-Agenten-Netzwerk von 2026
Feb 5, 2026







