Web Researcher MCP

Web Researcher MCP

Web Researcher MCP es un servidor MCP local de nivel de producción que permite a los asistentes de IA buscar en la web (opcionalmente restringido a "lentes de búsqueda" confiables), leer fuentes completas (incluidas páginas renderizadas con JS, PDF y transcripciones de YouTube) y devolver citas verificables con conmutación por error multiproveedor. [Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]
https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt&utm_source=aipure
Web Researcher MCP

Información del Producto

Actualizado:16/06/2026

¿Qué es Web Researcher MCP?

Web Researcher MCP es un servidor de Protocolo de Contexto de Modelo (MCP) de código abierto diseñado para proporcionar a los asistentes de IA (por ejemplo, Claude, Cursor y otros clientes compatibles con MCP) capacidades de investigación web fiables y basadas en fuentes. Se centra en "fuentes reales en las que puedes confiar" al permitirte buscar en toda la web o solo en dominios específicos y seleccionados, para luego extraer y analizar el contenido completo en lugar de fragmentos, produciendo enlaces funcionales y citas formateadas. El proyecto se distribuye como un único binario Go con múltiples opciones de instalación (por ejemplo, Homebrew, scripts de instalación, Docker o uvx compatible con Python) y puede ejecutarse en modo STDIO local o como un servicio HTTP para configuraciones compartidas/de equipo. [Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]

Características Principales de Web Researcher MCP

Web Researcher MCP es un servidor MCP de grado de producción que conecta asistentes de IA (por ejemplo, Claude, Cursor, VS Code) a la investigación web en vivo y basada en fuentes. Puede buscar en la web (con "lentes de búsqueda" opcionales que restringen los resultados a dominios confiables), leer y extraer contenido completo de URLs (incluidas páginas con mucho JavaScript a través de una tubería de navegador automatizada), y manejar muchos flujos de trabajo específicos de investigación como la búsqueda académica y de patentes, la búsqueda de noticias, la verificación/auditoría de citas y la exportación de sesiones de investigación reproducibles con procedencia. Está diseñado para priorizar fuentes verificables y citas confiables, admite múltiples proveedores de búsqueda intercambiables con conmutación por error automática, y se ejecuta localmente para una investigación centrada en la privacidad.
Lentes de búsqueda (enrutamiento de fuentes confiables): Restringe las búsquedas a listas de dominios seleccionadas (integradas o personalizadas) para que los resultados provengan solo de fuentes en las que confía (por ejemplo, PubMed, SEC, tribunales, documentos oficiales) en lugar del spam y el contenido de baja calidad de la web abierta.
Búsqueda multiproveedor con conmutación por error: Funciona con múltiples proveedores de búsqueda (por ejemplo, DuckDuckGo sin configuración, Google PSE, Brave, Serper, SearXNG, Tavily, Exa) y puede recurrir automáticamente cuando un proveedor tiene un límite de velocidad o no está disponible.
Extracción de página completa (incluidos sitios renderizados con JS): Lee páginas web y documentos completos, no solo fragmentos, utilizando una tubería de scraping por niveles y renderizado opcional de Chromium para páginas con mucho JavaScript; también admite la extracción de PDF/documentos de Office y transcripciones de YouTube.
Flujos de trabajo de citas de grado de investigación: Proporciona herramientas para verificar citas, auditar bibliografías completas en busca de enlaces rotos/retractaciones/entradas no verificables, y formatear bibliografías (APA/MLA/BibTeX/RIS/CSL-JSON) para uso académico o profesional posterior.
Sesiones de investigación profundas y reproducibles: Admite investigación secuencial de varios pasos con persistencia y exportación de sesiones (markdown/JSON), incluida la procedencia por paso; incluye diagnósticos y recursos de estado para herramientas, sesiones, proveedores y límites de velocidad.
Herramientas de búsqueda vertical especializadas: Incluye herramientas creadas específicamente para artículos académicos (DOIs, autores, citas), patentes (USPTO/EPO/Lens con alternativas), archivos de la SEC (EDGAR), opiniones/expedientes legales (CourtListener), economía (Banco Mundial/FRED) y ensayos clínicos (ClinicalTrials.gov).

Casos de Uso de Web Researcher MCP

Revisión de literatura académica y de I+D: Los investigadores pueden realizar búsquedas de literatura estructuradas, recopilar fuentes respaldadas por DOI, recorrer vecindarios de citas y exportar bibliografías formateadas correctamente para artículos, subvenciones o revisiones técnicas internas.
Investigación jurídica y apoyo a litigios: Los bufetes de abogados y los equipos de cumplimiento pueden buscar opiniones/expedientes judiciales reales, verificar citas de casos y archivar fuentes para garantizar que las referencias sigan siendo verificables para presentaciones y entregables a clientes.
Finanzas y diligencia debida: Los analistas pueden extraer los archivos EDGAR de la SEC, triangular noticias y fuentes primarias, y producir informes de investigación auditables con enlaces en los que los clientes pueden hacer clic y verificar.
Atención médica e inteligencia clínica: Los investigadores médicos y los equipos de políticas pueden centrar las búsquedas en fuentes clínicas y biomédicas, recuperar evidencia de texto completo cuando esté disponible y rastrear los registros y estados de los ensayos clínicos (orientado al descubrimiento, no a consejos médicos).
Inteligencia competitiva y de mercado: Los equipos de producto y estrategia pueden monitorear noticias, escanear patentes y sintetizar análisis competitivos de múltiples fuentes, manteniendo un registro reproducible de cómo se llegaron a las conclusiones.
Documentación de ingeniería e investigación de incidentes: Los desarrolladores y los equipos de SRE pueden usar lentes enfocadas en la documentación para buscar referencias oficiales, extraer páginas completas (incluidos documentos con mucho JS) y compilar resúmenes fundamentados para la resolución de problemas y las decisiones de diseño.

Ventajas

Control de fuentes a través de lentes: Puede restringir la investigación a dominios verificados, mejorando la confiabilidad y reduciendo el spam/ruido de SEO.
Herramientas de investigación de extremo a extremo: Combina búsqueda, extracción de contenido completo, verificación/auditoría de citas y exportación de sesiones con procedencia en un solo servidor MCP.
Flexibilidad y resiliencia del proveedor: Múltiples backends de búsqueda con conmutación por error automática opcional; también ofrece una alternativa de DuckDuckGo sin configuración.
Ejecución local centrada en la privacidad: Las consultas van desde su máquina a los proveedores elegidos en lugar de a través de los propios servidores de la herramienta.

Desventajas

Las mejores capacidades a menudo requieren claves de API: La búsqueda de mayor calidad, noticias/imágenes y algunas herramientas avanzadas dependen de la configuración de proveedores y credenciales de terceros.
El scraping más pesado puede descargar/ejecutar Chromium: La renderización de JavaScript puede requerir una descarga grande del navegador (~200MB) y puede ser más lenta que la extracción simple.
Límites y variabilidad ascendentes: Los límites de velocidad, la cobertura y la frescura dependen de los proveedores de búsqueda seleccionados y sus niveles gratuitos/de pago.

Cómo Usar Web Researcher MCP

1) Instalar Web Researcher MCP (el más rápido: uvx): Instala uv (una sola vez), luego ejecuta el servidor MCP a través de uvx. macOS/Linux: - curl -LsSf https://astral.sh/uv/install.sh | sh Luego: - claude mcp add --scope user web-researcher -- uvx web-researcher-mcp Esto obtiene el binario precompilado correcto para tu sistema operativo y lo ejecuta (no se necesita la cadena de herramientas de Go). Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
2) Instalaciones alternativas (elige una): macOS (Homebrew): - brew install zoharbabin/tap/web-researcher-mcp - claude mcp add --scope user web-researcher -- web-researcher-mcp macOS/Linux (instalador curl): - curl -fsSL https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.sh | sh Windows (instalador PowerShell): - powershell -ExecutionPolicy Bypass -c "irm https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.ps1 | iex" Otras opciones: - winget install zoharbabin.web-researcher-mcp - scoop bucket add zoharbabin https://github.com/zoharbabin/scoop-bucket && scoop install web-researcher-mcp - brew install --cask zoharbabin/tap/web-researcher-mcp - go install github.com/zoharbabin/web-researcher-mcp/cmd/web-researcher-mcp@latest - docker run -i --rm -e GOOGLE_CUSTOM_SEARCH_API_KEY=YOUR_KEY -e GOOGLE_CUSTOM_SEARCH_ID=YOUR_CX docker.io/zoharbabin/web-researcher-mcp:latest Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
3) Conéctalo a tu cliente MCP (configuración JSON genérica): Si tu aplicación no es el flujo CLI de Claude Code, agrega una entrada de servidor MCP a la configuración de tu cliente. Ejemplo (Google PSE): { "mcpServers": { "web-researcher": { "command": "web-researcher-mcp", "env": { "SEARCH_PROVIDER": "google", "GOOGLE_CUSTOM_SEARCH_API_KEY": "YOUR_GOOGLE_API_KEY", "GOOGLE_CUSTOM_SEARCH_ID": "YOUR_SEARCH_ENGINE_ID" } } } } Ejemplo (Brave): { "mcpServers": { "web-researcher": { "command": "web-researcher-mcp", "env": { "SEARCH_PROVIDER": "brave", "BRAVE_API_KEY": "YOUR_BRAVE_API_KEY" } } } } Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
4) Ejecutar sin configuración (alternativa DuckDuckGo): Si no configuras SEARCH_PROVIDER ni ninguna clave API, Web Researcher MCP seguirá funcionando de forma predeterminada utilizando DuckDuckGo como alternativa incorporada (no se requiere clave API). Esto es útil para validar tu configuración antes de agregar claves de proveedor. Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
5) (Recomendado) Agrega una clave de proveedor de búsqueda para mejorar la calidad y desbloquear más funciones: Configura SEARCH_PROVIDER y las claves correspondientes. Los proveedores compatibles incluyen DuckDuckGo (sin clave), Google PSE, Brave, Serper, SearchAPI.io, SearXNG, Tavily, Exa y Hacker News. Ejemplo de variables de entorno: - SEARCH_PROVIDER=brave - BRAVE_API_KEY=... O Google PSE: - SEARCH_PROVIDER=google - GOOGLE_CUSTOM_SEARCH_API_KEY=... - GOOGLE_CUSTOM_SEARCH_ID=... Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
6) (Opcional) Configurar la conmutación por error multiproveedor: Para evitar tiempos de inactividad/límites de velocidad, configura varios proveedores para que el servidor recurra automáticamente a ellos. Ejemplo: - SEARCH_ROUTING=brave,google,serper - BRAVE_API_KEY=... - GOOGLE_CUSTOM_SEARCH_API_KEY=... - GOOGLE_CUSTOM_SEARCH_ID=... - SERPER_API_KEY=... Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
7) Usa "lentes de búsqueda" para restringir los resultados a fuentes confiables: Cuando desees mayor confianza y menos spam, usa una lente incorporada (por ejemplo, médica, legal, académica, noticias) para que las búsquedas se restrinjan a dominios seleccionados. Ejemplo de instrucción para tu cliente de IA: - "Busca hallazgos recientes sobre inhibidores de SGLT2 usando la lente clínica." También puedes crear lentes personalizadas agregando un archivo JSON en lenses/ con una lista de dominios permitidos. Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
8) Pide a tu IA que use las herramientas principales (flujos de trabajo comunes): Una vez conectado, tu IA puede llamar a herramientas como: - web_search: buscar en la web (opcionalmente con lentes) - scrape_page: leer una URL completa (páginas web, PDF, DOCX, PPTX, transcripciones de YouTube) - search_and_scrape: buscar y luego leer automáticamente los principales resultados - news_search / image_search: cuando sea compatible con tu proveedor - academic_search / patent_search / legal_search / filing_search / econ_search / clinical_search: bases de datos especializadas - verify_citation / audit_bibliography / format_bibliography: flujos de trabajo de citas - sequential_search: investigación profunda de varios pasos Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
9) Usa plantillas de avisos guiados para una investigación repetible: Usa las plantillas de avisos incorporadas (donde tu cliente admita la selección de avisos) para ejecutar flujos de trabajo estructurados: - comprehensive-research - fact-check - competitive-analysis - literature-review Estas plantillas guían la investigación de varios pasos para que no tengas que especificar cada instrucción. Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
10) Solucionar problemas comunes (soluciones rápidas): Si las herramientas fallan con errores de "clave API": configura las claves en el bloque de entorno de configuración de tu cliente MCP (no solo en los perfiles de shell). Si las páginas aparecen vacías: los sitios con mucho JavaScript requieren Chromium; el binario descarga automáticamente Chromium en el primer uso (~200MB). Puedes configurar CHROME_PATH a una instalación de Chrome existente. La imagen de Docker incluye Chromium. Si la caché está obsoleta después de una actualización: elimina el directorio de caché (por ejemplo, ~/Library/Caches/web-researcher-mcp/ en macOS) o configura CACHE_DIR. Si alcanzas los límites de velocidad del proveedor (429): cambia de proveedor o configura SEARCH_ROUTING para la conmutación por error. Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
11) (Equipos) Ejecutar en modo HTTP y conectar clientes a un punto final compartido: Para configuraciones compartidas/de equipo, ejecuta el servidor como un servicio HTTP y conecta los clientes MCP a http://localhost:3000/mcp/. Ejemplo: - PORT=3000 OAUTH_ISSUER_URL=https://auth.example.com OAUTH_AUDIENCE=https://api.example.com ./web-researcher-mcp Ejemplo de Docker Compose: services: web-researcher: image: zoharbabin/web-researcher-mcp ports: - "3000:3000" environment: PORT: "3000" SEARCH_PROVIDER: brave BRAVE_API_KEY: ${BRAVE_API_KEY} Fuente: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

Preguntas Frecuentes de Web Researcher MCP

Web Researcher MCP es un servidor de Protocolo de Contexto de Modelo (MCP) de código abierto que proporciona a los asistentes de IA capacidades de investigación web (búsqueda web, extracción de página completa y búsquedas especializadas como académicas/patentes/legales), con énfasis en respuestas fundamentadas y citas reales y verificables. Se ejecuta localmente en su máquina en lugar de como un servicio alojado.

Últimas herramientas de IA similares a Web Researcher MCP

Jorpex
Jorpex
Jorpex es una plataforma integral de notificación de licitaciones que agrega y entrega alertas instantáneas de licitaciones de países europeos directamente a Slack, ayudando a las empresas a no perder oportunidades.
Leadsmrt
Leadsmrt
Leadsmrt es una herramienta de generación de leads que ayuda a las empresas a hacer scraping, verificar y personalizar leads comerciales dirigidos de Google Maps con capacidades de personalización impulsadas por IA.
Omnial AI
Omnial AI
Omnial AI es una plataforma de inteligencia de datos que aprovecha agentes de IA para transformar avisos web en percepciones de datos estructurados y accionables respaldadas por Afore Capital.
SERPrecon
SERPrecon
SERPrecon es una herramienta avanzada de SEO que aprovecha vectores, aprendizaje automático y procesamiento de lenguaje natural para ayudar a los usuarios a analizar y superar a los competidores utilizando los mismos métodos que los motores de búsqueda modernos.