¿Qué puede hacer mi asistente de IA con Web Researcher MCP?

Expone herramientas como web_search, scrape_page (lee páginas completas, PDFs, DOCX/PPTX, transcripciones de YouTube), search_and_scrape, image_search, news_search, academic_search, patent_search, filing_search (SEC EDGAR), legal_search (CourtListener), econ_search (Banco Mundial/FRED), clinical_search (ClinicalTrials.gov), verify_citation, audit_bibliography, archive_source (Wayback “Guardar página ahora”), sequential_search (investigación de varios pasos con persistencia de sesión) y herramientas de formato/exportación de bibliografía.

¿Cómo reduce las fuentes malas y los errores de citación?

Admite “lentes de búsqueda”, que restringen los resultados de búsqueda a dominios curados y confiables por campo (por ejemplo, médico, legal, académico). También incluye verificación de citas (verify_citation) y auditoría de bibliografía (audit_bibliography) para marcar enlaces rotos, elementos no verificables o trabajos retractados.

¿Requiere una clave API para funcionar?

No. Tiene un respaldo de DuckDuckGo sin configuración que funciona sin ninguna clave API. Agregar una clave de proveedor (por ejemplo, Google Programmable Search Engine, Brave, Serper, SearchAPI.io, SearXNG, Tavily, Exa) puede mejorar la calidad y desbloquear capacidades adicionales como la búsqueda de imágenes/noticias, dependiendo del proveedor.

¿Qué proveedores de búsqueda son compatibles?

Los proveedores compatibles incluyen DuckDuckGo (sin clave), Google Programmable Search Engine, Brave Search, Serper.dev, SearchAPI.io, SearXNG (autoalojado), Tavily, Exa y una búsqueda integrada de Hacker News (HN Algolia). También se puede configurar con enrutamiento multiproveedor para una conmutación por error automática.

¿Cómo lo instalo y lo conecto a mi aplicación de IA?

Las opciones de instalación comunes incluyen la ejecución a través de uvx (Python/uv), Homebrew (macOS/Linux), scripts de instalación de un solo comando (macOS/Linux/Windows), WinGet/Scoop (Windows), Docker o la compilación desde el código fuente. Luego, lo agrega como un servidor MCP en su cliente (por ejemplo, Claude Code, Claude Desktop, Cursor) configurando el comando y (opcionalmente) las variables de entorno para las claves de su proveedor elegido.

¿Puede leer más que solo fragmentos web?

Sí. Está diseñado para extraer y leer contenido completo de URL, incluidas páginas web estándar, PDF, documentos de Word, presentaciones de diapositivas y transcripciones de YouTube. Para sitios con mucho JavaScript, puede usar un navegador real (Chromium) para renderizar y extraer contenido.

¿Qué pasa con la privacidad? ¿A dónde van mis consultas?

Las consultas van directamente desde su máquina al proveedor de búsqueda que configure; el proyecto establece que no tiene servidores alojados y se ejecuta localmente. También describe medidas de seguridad como protecciones SSRF, sanitización de contenido y (en modo HTTP/equipo) soporte OAuth 2.1 con limitación de velocidad y registro de auditoría.

Web Researcher MCP

WebsiteFreeAI Web Scraper Research Tools

Web Researcher MCP es un servidor MCP local de nivel de producción que permite a los asistentes de IA buscar en la web (opcionalmente restringido a "lentes de búsqueda" confiables), leer fuentes completas (incluidas páginas renderizadas con JS, PDF y transcripciones de YouTube) y devolver citas verificables con conmutación por error multiproveedor. [Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]

Visitar Sitio Web

Anunciar Esta Herramienta

https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt&utm_source=aipure

Resumen
Video
Alternativas

Información del Producto

Actualizado:16/06/2026

¿Qué es Web Researcher MCP?

Web Researcher MCP es un servidor de Protocolo de Contexto de Modelo (MCP) de código abierto diseñado para proporcionar a los asistentes de IA (por ejemplo, Claude, Cursor y otros clientes compatibles con MCP) capacidades de investigación web fiables y basadas en fuentes. Se centra en "fuentes reales en las que puedes confiar" al permitirte buscar en toda la web o solo en dominios específicos y seleccionados, para luego extraer y analizar el contenido completo en lugar de fragmentos, produciendo enlaces funcionales y citas formateadas. El proyecto se distribuye como un único binario Go con múltiples opciones de instalación (por ejemplo, Homebrew, scripts de instalación, Docker o uvx compatible con Python) y puede ejecutarse en modo STDIO local o como un servicio HTTP para configuraciones compartidas/de equipo. [Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]

Características Principales de Web Researcher MCP

Web Researcher MCP es un servidor MCP de grado de producción que conecta asistentes de IA (por ejemplo, Claude, Cursor, VS Code) a la investigación web en vivo y basada en fuentes. Puede buscar en la web (con "lentes de búsqueda" opcionales que restringen los resultados a dominios confiables), leer y extraer contenido completo de URLs (incluidas páginas con mucho JavaScript a través de una tubería de navegador automatizada), y manejar muchos flujos de trabajo específicos de investigación como la búsqueda académica y de patentes, la búsqueda de noticias, la verificación/auditoría de citas y la exportación de sesiones de investigación reproducibles con procedencia. Está diseñado para priorizar fuentes verificables y citas confiables, admite múltiples proveedores de búsqueda intercambiables con conmutación por error automática, y se ejecuta localmente para una investigación centrada en la privacidad.

Lentes de búsqueda (enrutamiento de fuentes confiables): Restringe las búsquedas a listas de dominios seleccionadas (integradas o personalizadas) para que los resultados provengan solo de fuentes en las que confía (por ejemplo, PubMed, SEC, tribunales, documentos oficiales) en lugar del spam y el contenido de baja calidad de la web abierta.

Búsqueda multiproveedor con conmutación por error: Funciona con múltiples proveedores de búsqueda (por ejemplo, DuckDuckGo sin configuración, Google PSE, Brave, Serper, SearXNG, Tavily, Exa) y puede recurrir automáticamente cuando un proveedor tiene un límite de velocidad o no está disponible.

Extracción de página completa (incluidos sitios renderizados con JS): Lee páginas web y documentos completos, no solo fragmentos, utilizando una tubería de scraping por niveles y renderizado opcional de Chromium para páginas con mucho JavaScript; también admite la extracción de PDF/documentos de Office y transcripciones de YouTube.

Flujos de trabajo de citas de grado de investigación: Proporciona herramientas para verificar citas, auditar bibliografías completas en busca de enlaces rotos/retractaciones/entradas no verificables, y formatear bibliografías (APA/MLA/BibTeX/RIS/CSL-JSON) para uso académico o profesional posterior.

Sesiones de investigación profundas y reproducibles: Admite investigación secuencial de varios pasos con persistencia y exportación de sesiones (markdown/JSON), incluida la procedencia por paso; incluye diagnósticos y recursos de estado para herramientas, sesiones, proveedores y límites de velocidad.

Herramientas de búsqueda vertical especializadas: Incluye herramientas creadas específicamente para artículos académicos (DOIs, autores, citas), patentes (USPTO/EPO/Lens con alternativas), archivos de la SEC (EDGAR), opiniones/expedientes legales (CourtListener), economía (Banco Mundial/FRED) y ensayos clínicos (ClinicalTrials.gov).

Casos de Uso de Web Researcher MCP

Revisión de literatura académica y de I+D: Los investigadores pueden realizar búsquedas de literatura estructuradas, recopilar fuentes respaldadas por DOI, recorrer vecindarios de citas y exportar bibliografías formateadas correctamente para artículos, subvenciones o revisiones técnicas internas.

Investigación jurídica y apoyo a litigios: Los bufetes de abogados y los equipos de cumplimiento pueden buscar opiniones/expedientes judiciales reales, verificar citas de casos y archivar fuentes para garantizar que las referencias sigan siendo verificables para presentaciones y entregables a clientes.

Finanzas y diligencia debida: Los analistas pueden extraer los archivos EDGAR de la SEC, triangular noticias y fuentes primarias, y producir informes de investigación auditables con enlaces en los que los clientes pueden hacer clic y verificar.

Atención médica e inteligencia clínica: Los investigadores médicos y los equipos de políticas pueden centrar las búsquedas en fuentes clínicas y biomédicas, recuperar evidencia de texto completo cuando esté disponible y rastrear los registros y estados de los ensayos clínicos (orientado al descubrimiento, no a consejos médicos).

Inteligencia competitiva y de mercado: Los equipos de producto y estrategia pueden monitorear noticias, escanear patentes y sintetizar análisis competitivos de múltiples fuentes, manteniendo un registro reproducible de cómo se llegaron a las conclusiones.

Documentación de ingeniería e investigación de incidentes: Los desarrolladores y los equipos de SRE pueden usar lentes enfocadas en la documentación para buscar referencias oficiales, extraer páginas completas (incluidos documentos con mucho JS) y compilar resúmenes fundamentados para la resolución de problemas y las decisiones de diseño.

Ventajas

Control de fuentes a través de lentes: Puede restringir la investigación a dominios verificados, mejorando la confiabilidad y reduciendo el spam/ruido de SEO.

Herramientas de investigación de extremo a extremo: Combina búsqueda, extracción de contenido completo, verificación/auditoría de citas y exportación de sesiones con procedencia en un solo servidor MCP.

Flexibilidad y resiliencia del proveedor: Múltiples backends de búsqueda con conmutación por error automática opcional; también ofrece una alternativa de DuckDuckGo sin configuración.

Ejecución local centrada en la privacidad: Las consultas van desde su máquina a los proveedores elegidos en lugar de a través de los propios servidores de la herramienta.

Desventajas

Las mejores capacidades a menudo requieren claves de API: La búsqueda de mayor calidad, noticias/imágenes y algunas herramientas avanzadas dependen de la configuración de proveedores y credenciales de terceros.

El scraping más pesado puede descargar/ejecutar Chromium: La renderización de JavaScript puede requerir una descarga grande del navegador (~200MB) y puede ser más lenta que la extracción simple.

Límites y variabilidad ascendentes: Los límites de velocidad, la cobertura y la frescura dependen de los proveedores de búsqueda seleccionados y sus niveles gratuitos/de pago.

Cómo Usar Web Researcher MCP

1) Instalar Web Researcher MCP (el más rápido: uvx): Instala uv (una sola vez), luego ejecuta el servidor MCP a través de uvx. macOS/Linux: - curl -LsSf https://astral.sh/uv/install.sh | sh Luego: - claude mcp add --scope user web-researcher -- uvx web-researcher-mcp Esto obtiene el binario precompilado correcto para tu sistema operativo y lo ejecuta (no se necesita la cadena de herramientas de Go). Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

2) Instalaciones alternativas (elige una): macOS (Homebrew): - brew install zoharbabin/tap/web-researcher-mcp - claude mcp add --scope user web-researcher -- web-researcher-mcp macOS/Linux (instalador curl): - curl -fsSL https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.sh | sh Windows (instalador PowerShell): - powershell -ExecutionPolicy Bypass -c "irm https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.ps1 | iex" Otras opciones: - winget install zoharbabin.web-researcher-mcp - scoop bucket add zoharbabin https://github.com/zoharbabin/scoop-bucket && scoop install web-researcher-mcp - brew install --cask zoharbabin/tap/web-researcher-mcp - go install github.com/zoharbabin/web-researcher-mcp/cmd/web-researcher-mcp@latest - docker run -i --rm -e GOOGLE_CUSTOM_SEARCH_API_KEY=YOUR_KEY -e GOOGLE_CUSTOM_SEARCH_ID=YOUR_CX docker.io/zoharbabin/web-researcher-mcp:latest Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

3) Conéctalo a tu cliente MCP (configuración JSON genérica): Si tu aplicación no es el flujo CLI de Claude Code, agrega una entrada de servidor MCP a la configuración de tu cliente. Ejemplo (Google PSE): { "mcpServers": { "web-researcher": { "command": "web-researcher-mcp", "env": { "SEARCH_PROVIDER": "google", "GOOGLE_CUSTOM_SEARCH_API_KEY": "YOUR_GOOGLE_API_KEY", "GOOGLE_CUSTOM_SEARCH_ID": "YOUR_SEARCH_ENGINE_ID" } } } } Ejemplo (Brave): { "mcpServers": { "web-researcher": { "command": "web-researcher-mcp", "env": { "SEARCH_PROVIDER": "brave", "BRAVE_API_KEY": "YOUR_BRAVE_API_KEY" } } } } Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

4) Ejecutar sin configuración (alternativa DuckDuckGo): Si no configuras SEARCH_PROVIDER ni ninguna clave API, Web Researcher MCP seguirá funcionando de forma predeterminada utilizando DuckDuckGo como alternativa incorporada (no se requiere clave API). Esto es útil para validar tu configuración antes de agregar claves de proveedor. Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

5) (Recomendado) Agrega una clave de proveedor de búsqueda para mejorar la calidad y desbloquear más funciones: Configura SEARCH_PROVIDER y las claves correspondientes. Los proveedores compatibles incluyen DuckDuckGo (sin clave), Google PSE, Brave, Serper, SearchAPI.io, SearXNG, Tavily, Exa y Hacker News. Ejemplo de variables de entorno: - SEARCH_PROVIDER=brave - BRAVE_API_KEY=... O Google PSE: - SEARCH_PROVIDER=google - GOOGLE_CUSTOM_SEARCH_API_KEY=... - GOOGLE_CUSTOM_SEARCH_ID=... Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

6) (Opcional) Configurar la conmutación por error multiproveedor: Para evitar tiempos de inactividad/límites de velocidad, configura varios proveedores para que el servidor recurra automáticamente a ellos. Ejemplo: - SEARCH_ROUTING=brave,google,serper - BRAVE_API_KEY=... - GOOGLE_CUSTOM_SEARCH_API_KEY=... - GOOGLE_CUSTOM_SEARCH_ID=... - SERPER_API_KEY=... Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

7) Usa "lentes de búsqueda" para restringir los resultados a fuentes confiables: Cuando desees mayor confianza y menos spam, usa una lente incorporada (por ejemplo, médica, legal, académica, noticias) para que las búsquedas se restrinjan a dominios seleccionados. Ejemplo de instrucción para tu cliente de IA: - "Busca hallazgos recientes sobre inhibidores de SGLT2 usando la lente clínica." También puedes crear lentes personalizadas agregando un archivo JSON en lenses/ con una lista de dominios permitidos. Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

8) Pide a tu IA que use las herramientas principales (flujos de trabajo comunes): Una vez conectado, tu IA puede llamar a herramientas como: - web_search: buscar en la web (opcionalmente con lentes) - scrape_page: leer una URL completa (páginas web, PDF, DOCX, PPTX, transcripciones de YouTube) - search_and_scrape: buscar y luego leer automáticamente los principales resultados - news_search / image_search: cuando sea compatible con tu proveedor - academic_search / patent_search / legal_search / filing_search / econ_search / clinical_search: bases de datos especializadas - verify_citation / audit_bibliography / format_bibliography: flujos de trabajo de citas - sequential_search: investigación profunda de varios pasos Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

9) Usa plantillas de avisos guiados para una investigación repetible: Usa las plantillas de avisos incorporadas (donde tu cliente admita la selección de avisos) para ejecutar flujos de trabajo estructurados: - comprehensive-research - fact-check - competitive-analysis - literature-review Estas plantillas guían la investigación de varios pasos para que no tengas que especificar cada instrucción. Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

10) Solucionar problemas comunes (soluciones rápidas): Si las herramientas fallan con errores de "clave API": configura las claves en el bloque de entorno de configuración de tu cliente MCP (no solo en los perfiles de shell). Si las páginas aparecen vacías: los sitios con mucho JavaScript requieren Chromium; el binario descarga automáticamente Chromium en el primer uso (~200MB). Puedes configurar CHROME_PATH a una instalación de Chrome existente. La imagen de Docker incluye Chromium. Si la caché está obsoleta después de una actualización: elimina el directorio de caché (por ejemplo, ~/Library/Caches/web-researcher-mcp/ en macOS) o configura CACHE_DIR. Si alcanzas los límites de velocidad del proveedor (429): cambia de proveedor o configura SEARCH_ROUTING para la conmutación por error. Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

11) (Equipos) Ejecutar en modo HTTP y conectar clientes a un punto final compartido: Para configuraciones compartidas/de equipo, ejecuta el servidor como un servicio HTTP y conecta los clientes MCP a http://localhost:3000/mcp/. Ejemplo: - PORT=3000 OAUTH_ISSUER_URL=https://auth.example.com OAUTH_AUDIENCE=https://api.example.com ./web-researcher-mcp Ejemplo de Docker Compose: services: web-researcher: image: zoharbabin/web-researcher-mcp ports: - "3000:3000" environment: PORT: "3000" SEARCH_PROVIDER: brave BRAVE_API_KEY: ${BRAVE_API_KEY} Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

Preguntas Frecuentes de Web Researcher MCP

Web Researcher MCP es un servidor de Protocolo de Contexto de Modelo (MCP) de código abierto que proporciona a los asistentes de IA capacidades de investigación web (búsqueda web, extracción de página completa y búsquedas especializadas como académicas/patentes/legales), con énfasis en respuestas fundamentadas y citas reales y verificables. Se ejecuta localmente en su máquina en lugar de como un servicio alojado.

Video de Web Researcher MCP

Artículos Populares

Atoms: Una Plataforma de IA Multiagente Que Transforma Ideas en Productos Listos para Lanzar

May 22, 2026

Nano Banana SBTI: Qué es, cómo funciona y cómo usarlo en 2026

Apr 15, 2026

Reseña de Atoms: El Constructor de Productos de IA que Redefine la Creación Digital en 2026

Apr 10, 2026

Kilo Claw: Cómo implementar y usar un verdadero agente de IA "Hágalo por usted" (Actualización 2026)

Apr 3, 2026

Últimas herramientas de IA similares a Web Researcher MCP

Jorpex

FreemiumAI Web Scraper Monitor & Log Management

Jorpex es una plataforma integral de notificación de licitaciones que agrega y entrega alertas instantáneas de licitaciones de países europeos directamente a Slack, ayudando a las empresas a no perder oportunidades.

Leadsmrt

Free TrialAI Web Scraper AI Lead Assistant

Leadsmrt es una herramienta de generación de leads que ayuda a las empresas a hacer scraping, verificar y personalizar leads comerciales dirigidos de Google Maps con capacidades de personalización impulsadas por IA.

Omnial AI

Free TrialAI Data Mining AI Web Scraper

Omnial AI es una plataforma de inteligencia de datos que aprovecha agentes de IA para transformar avisos web en percepciones de datos estructurados y accionables respaldadas por Afore Capital.

SERPrecon

PaidAI SEO Tools AI Analytics Assistant AI Web Scraper

SERPrecon es una herramienta avanzada de SEO que aprovecha vectores, aprendizaje automático y procesamiento de lenguaje natural para ayudar a los usuarios a analizar y superar a los competidores utilizando los mismos métodos que los motores de búsqueda modernos.

Herramientas de IA populares como Web Researcher MCP

Magentic-UI

FreeAI Task Management AI Web Scraper

Magentic-UI es un prototipo de agente web de código abierto y centrado en el ser humano de Microsoft Research que permite la planificación y ejecución colaborativa de tareas complejas basadas en la web a través de la interacción transparente entre humanos y agentes de IA.

Web Accessibility Testing MCP

FreeAI Testing & QA AI Web Scraper

A11y MCP es un servidor Model Context Protocol que permite a los modelos de lenguaje de IA realizar pruebas automatizadas de accesibilidad web integrándose con la API Axe-core de Deque y Puppeteer para analizar el contenido web en busca de cumplimiento de WCAG.

Open Browser Use

FreeAI DevOps Assistant AI Web Scraper

Open Browser Use es una capa de automatización de navegador de código abierto y neutral para el tiempo de ejecución del agente que combina una extensión de Chrome con una CLI/SDK/MCP para permitir el control de pestañas, la navegación y las acciones conscientes del DOM y con tecnología CDP en diferentes herramientas de agente de IA.

MyLensAI Chrome

Free TrialSummarizer AI YouTube Assistant AI Web Scraper

MyLensAI Chrome es una extensión de navegador que transforma instantáneamente cualquier página web o video de YouTube en resúmenes visuales como mapas mentales, líneas de tiempo, tablas y diagramas de flujo con solo un clic.

Clasificación

Enviar y PromoverNew

Web Researcher MCP

Información del Producto

¿Qué es Web Researcher MCP?

Características Principales de Web Researcher MCP

Casos de Uso de Web Researcher MCP

Ventajas

Desventajas

Cómo Usar Web Researcher MCP

Preguntas Frecuentes de Web Researcher MCP

1. ¿Qué es Web Researcher MCP?

2. ¿Qué puede hacer mi asistente de IA con Web Researcher MCP?

3. ¿Cómo reduce las fuentes malas y los errores de citación?

4. ¿Requiere una clave API para funcionar?

5. ¿Qué proveedores de búsqueda son compatibles?

6. ¿Cómo lo instalo y lo conecto a mi aplicación de IA?

7. ¿Puede leer más que solo fragmentos web?

8. ¿Qué pasa con la privacidad? ¿A dónde van mis consultas?

Video de Web Researcher MCP

Artículos Populares

Últimas herramientas de IA similares a Web Researcher MCP

Herramientas de IA populares como Web Researcher MCP