
Agent Browser
Agent Browser est un outil d'automatisation de navigateur économe en jetons qui permet aux agents d'IA de contrôler de vrais navigateurs via des commandes en langage naturel, offrant des fonctionnalités telles que la navigation, l'interaction et la visualisation fil de fer ASCII pour les tâches d'automatisation web.
https://github.com/agent-browser-io/browser?ref=producthunt&utm_source=aipure

Informations sur le produit
Mis à jour:Mar 13, 2026
Qu'est-ce que Agent Browser
Agent Browser est un package open source qui comble le fossé entre les agents d'IA et les navigateurs web, permettant le contrôle automatisé des activités du navigateur via des commandes simples. Il prend en charge plusieurs interfaces, notamment MCP (Model Context Protocol), Vercel AI SDK et une CLI, ce qui le rend polyvalent pour différents cas d'utilisation. L'outil est conçu pour rendre les sites web accessibles aux agents d'IA tout en maintenant l'efficacité de l'utilisation des jetons, ce qui est crucial pour les tâches d'automatisation pilotées par l'IA. Il peut être intégré à diverses plateformes d'IA telles que Cursor, Claude Desktop et d'autres clients compatibles MCP.
Caractéristiques principales de Agent Browser
Agent Browser est un outil d'automatisation de navigateur open source qui permet aux agents d'IA de contrôler de vrais navigateurs via des commandes en langage naturel et des wireframes ASCII à jetons efficaces. Il prend en charge plusieurs interfaces, notamment MCP (Model Context Protocol), Vercel AI SDK et CLI, permettant aux agents d'IA d'effectuer des tâches de navigation Web, d'interaction et d'automatisation tout en maintenant la confidentialité et la sécurité grâce à l'exécution locale.
Contrôle du navigateur à jetons efficaces: Utilise des wireframes ASCII pour représenter les pages Web et fournit une interaction basée sur des références (@e1, @e2) pour une communication efficace entre l'IA et le navigateur
Intégration multiplateforme: Prend en charge plusieurs méthodes d'intégration, notamment MCP pour les assistants d'IA, Vercel AI SDK pour les développeurs et CLI pour les tests manuels
Actions complètes du navigateur: Fournit un large éventail de fonctionnalités d'automatisation du navigateur, notamment la navigation, le clic, la saisie, le défilement, les captures d'écran et le remplissage de formulaires
Architecture axée sur la confidentialité: S'exécute localement sur la machine de l'utilisateur avec la possibilité d'utiliser les profils Chrome existants et les modèles LLM locaux via Ollama
Cas d'utilisation de Agent Browser
Automatisation des tests Web: Automatisez les processus de test de sites Web en demandant aux agents d'IA de naviguer dans les pages, de remplir des formulaires et de vérifier les fonctionnalités
Recherche et extraction de contenu: Permettez aux agents d'IA d'effectuer des recherches approfondies en naviguant automatiquement sur des sites Web, en extrayant du contenu et en enregistrant des informations dans des formats structurés
Automatisation des formulaires: Automatisez les tâches répétitives de remplissage de formulaires sur différents sites Web tout en maintenant la sécurité des informations sensibles
Automatisation du commerce électronique: Automatisez les recherches de produits, les comparaisons de prix et les processus de commande sur diverses plateformes de commerce électronique
Avantages
Axé sur la confidentialité avec l'exécution locale et le stockage des informations d'identification chiffrées
Options d'intégration flexibles pour différents cas d'utilisation
Communication à jetons efficaces via des wireframes ASCII
Inconvénients
Nécessite une configuration locale et des dépendances
Limité aux navigateurs et plateformes pris en charge
Peut être moins fiable lors de l'exécution en mode visuel
Comment utiliser Agent Browser
Installer Agent Browser: Exécutez 'npm install @agent-browser-io/browser' pour installer le package. Pour la première utilisation, exécutez également 'npx agent-browser install' pour télécharger Chromium.
Utilisation de base - Flux de travail principal: 1. Naviguer vers la page : 'agent-browser open <url>' 2. Obtenir les éléments interactifs : 'agent-browser snapshot -i' (renvoie les éléments avec les références @e1, @e2, etc.) 3. Interagir à l'aide des références : 'agent-browser click @e1' ou 'agent-browser fill @e2 \"text\"' 4. Refaire une capture après les modifications de la page
Configurer la gestion de session (facultatif): Utilisez l'indicateur --session-name pour enregistrer/restaurer l'état du navigateur : 'agent-browser --session-name twitter open twitter.com'. Les données de session sont stockées dans ~/.agent-browser/sessions/. Peut également être défini via la variable d'environnement AGENT_BROWSER_SESSION_NAME.
Configurer MCP pour les assistants d'IA: 1. Ouvrez les paramètres de Cursor → MCP (ou modifiez ~/.cursor/mcp.json) 2. Ajoutez la configuration : {\"mcpServers\": {\"agent-browser\": {\"command\": \"npx\", \"args\": [\"-y\", \"@agent-browser-io/browser\", \"mcp\"]}}} 3. Redémarrez Cursor/rechargez MCP
Utiliser avec Vercel AI SDK: 1. Importer les outils : 'import { createBrowserTools, AgentBrowser, PlaywrightBrowserBackend } from '@agent-browser-io/browser' 2. Créer une instance de navigateur 3. Créer des outils avec createBrowserTools(browser) 4. Utiliser les outils avec la fonction generateText()
Activer la sécurité du contenu (facultatif): Utilisez l'indicateur --content-boundaries pour encapsuler la sortie de la page dans des délimiteurs, ce qui aide les LLM à faire la distinction entre la sortie de l'outil et le contenu non fiable.
Gérer l'authentification (facultatif): Enregistrez les informations d'identification : 'echo \"pass\" | agent-browser auth save github --url https://github.com/login --username user --password-stdin' puis utilisez 'agent-browser auth login github' pour vous connecter
FAQ de Agent Browser
Agent Browser est un package qui permet aux agents d'IA de contrôler un navigateur réel de manière efficace en termes de tokens. Il permet la navigation, le clic, la saisie et l'interaction via des wireframes ASCII, et peut être utilisé via des clients MCP ou avec le SDK Vercel AI.
Vidéo de Agent Browser
Articles populaires

Guide de déploiement d'OpenClaw : Comment auto-héberger un véritable agent d'IA (Mise à jour 2026)
Mar 10, 2026

Tutoriel Atoms 2026 : Créez un tableau de bord SaaS complet en 20 minutes (AIPURE Prise en main)
Mar 2, 2026

Outils d'IA les plus populaires de 2025 | Mise à jour 2026 par AIPURE
Feb 10, 2026

Moltbook AI : Le premier réseau social d'agents d'IA pure de 2026
Feb 5, 2026







