Web Researcher MCP

Web Researcher MCP

Web Researcher MCP é um servidor MCP local e de nível de produção que permite que assistentes de IA pesquisem na web (opcionalmente restrito a “lentes de pesquisa” confiáveis), leiam fontes completas (incluindo páginas renderizadas em JS, PDFs e transcrições do YouTube) e retornem citações verificáveis com failover multiprovedor. [Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]
https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt&utm_source=aipure
Web Researcher MCP

Informações do Produto

Atualizado:Jun 16, 2026

O que é Web Researcher MCP

Web Researcher MCP é um servidor de Protocolo de Contexto de Modelo (MCP) de código aberto projetado para fornecer aos assistentes de IA (por exemplo, Claude, Cursor e outros clientes compatíveis com MCP) recursos de pesquisa web confiáveis e baseados em fontes. Ele se concentra em "fontes reais em que você pode confiar", permitindo que você pesquise toda a web ou apenas domínios específicos e selecionados, e então extraia e analise o conteúdo completo em vez de trechos – produzindo links funcionais e citações formatadas. O projeto é fornecido como um único binário Go com várias opções de instalação (por exemplo, Homebrew, scripts de instalação, Docker ou uvx compatível com Python) e pode ser executado no modo STDIO local ou como um serviço HTTP para configurações compartilhadas/em equipe. [Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]

Principais Recursos do Web Researcher MCP

Web Researcher MCP é um servidor MCP de nível de produção que conecta assistentes de IA (por exemplo, Claude, Cursor, VS Code) a pesquisas web ao vivo e baseadas em fontes. Ele pode pesquisar na web (com "lentes de pesquisa" opcionais que restringem os resultados a domínios confiáveis), ler e extrair conteúdo completo de URLs (incluindo páginas com muito JavaScript através de um pipeline de navegador automatizado) e lidar com muitos fluxos de trabalho específicos de pesquisa, como pesquisa acadêmica e de patentes, pesquisa de notícias, verificação/auditoria de citações e exportação de sessões de pesquisa reproduzíveis com proveniência. Ele foi projetado para priorizar fontes verificáveis e citações confiáveis, suporta vários provedores de pesquisa intercambiáveis com failover automático e é executado localmente para pesquisa focada na privacidade.
Lentes de pesquisa (roteamento de fonte confiável): Restringe as buscas a listas de domínios selecionados (integrados ou personalizados) para que os resultados venham apenas de fontes em que você confia (por exemplo, PubMed, SEC, tribunais, documentos oficiais), em vez do spam e conteúdo de baixa qualidade da web aberta.
Pesquisa multi-provedor com failover: Funciona com vários provedores de pesquisa (por exemplo, DuckDuckGo zero-config, Google PSE, Brave, Serper, SearXNG, Tavily, Exa) e pode retornar automaticamente quando um provedor está com limite de taxa ou indisponível.
Extração de página completa (incluindo sites renderizados em JS): Lê páginas web e documentos completos – não apenas trechos – usando um pipeline de raspagem em camadas e renderização Chromium opcional para páginas com muito JavaScript; também suporta PDFs/documentos do Office e extração de transcrições do YouTube.
Fluxos de trabalho de citação de nível de pesquisa: Fornece ferramentas para verificar citações, auditar bibliografias inteiras em busca de links quebrados/retratações/entradas não verificáveis e formatar bibliografias (APA/MLA/BibTeX/RIS/CSL-JSON) para uso acadêmico ou profissional posterior.
Sessões de pesquisa profundas e reproduzíveis: Suporta pesquisa sequencial de várias etapas com persistência e exportação de sessão (markdown/JSON), incluindo proveniência por etapa; inclui diagnósticos e recursos de status para ferramentas, sessões, provedores e limites de taxa.
Ferramentas de pesquisa vertical especializadas: Inclui ferramentas construídas especificamente para artigos acadêmicos (DOIs, autores, citações), patentes (USPTO/EPO/Lens com alternativas), registros da SEC (EDGAR), opiniões/registros legais (CourtListener), economia (World Bank/FRED) e ensaios clínicos (ClinicalTrials.gov).

Casos de Uso do Web Researcher MCP

Revisão de literatura acadêmica e de P&D: Pesquisadores podem realizar buscas de literatura estruturadas, coletar fontes com DOI, percorrer redes de citações e exportar bibliografias formatadas corretamente para artigos, subsídios ou revisões técnicas internas.
Pesquisa jurídica e suporte a litígios: Escritórios de advocacia e equipes de conformidade podem pesquisar decisões/registros judiciais reais, verificar citações de casos e arquivar fontes para garantir que as referências permaneçam verificáveis para petições e entregas a clientes.
Finanças e due diligence: Analistas podem consultar registros SEC EDGAR, triangular notícias e fontes primárias, e produzir relatórios de pesquisa auditáveis com links que os clientes podem clicar e verificar.
Saúde e inteligência clínica: Pesquisadores médicos e equipes de políticas podem focar as buscas em fontes clínicas e biomédicas, recuperar evidências de texto completo quando disponíveis e acompanhar registros e status de ensaios clínicos (orientado para descoberta, não aconselhamento médico).
Inteligência competitiva e de mercado: Equipes de produto e estratégia podem monitorar notícias, escanear patentes e sintetizar análises competitivas de múltiplas fontes, mantendo um registro reproduzível de como as conclusões foram alcançadas.
Documentação de engenharia e pesquisa de incidentes: Desenvolvedores e equipes SRE podem usar lentes focadas em documentação para pesquisar referências oficiais, extrair páginas completas (incluindo documentos com muito JS) e compilar resumos fundamentados para solução de problemas e decisões de design.

Vantagens

Controle de fonte via lentes: Você pode restringir a pesquisa a domínios verificados, melhorando a confiabilidade e reduzindo o spam/ruído de SEO.
Ferramentas de pesquisa de ponta a ponta: Combina pesquisa, extração de conteúdo completo, verificação/auditoria de citações e exportação de sessão com proveniência em um único servidor MCP.
Flexibilidade e resiliência do provedor: Múltiplos backends de pesquisa com failover automático opcional; também oferece um fallback DuckDuckGo zero-config.
Execução local focada na privacidade: As consultas vão da sua máquina para os provedores escolhidos, em vez de passarem pelos servidores da própria ferramenta.

Desvantagens

As melhores capacidades geralmente exigem chaves de API: Pesquisas de maior qualidade, notícias/imagens e algumas ferramentas avançadas dependem da configuração de provedores e credenciais de terceiros.
A raspagem mais pesada pode baixar/executar o Chromium: A renderização de JavaScript pode exigir um grande download de navegador (~200MB) e pode ser mais lenta do que a extração simples.
Limites e variabilidade a montante: Os limites de taxa, cobertura e atualidade dependem dos provedores de pesquisa selecionados e de seus níveis gratuitos/pagos.

Como Usar o Web Researcher MCP

1) Instale o Web Researcher MCP (mais rápido: uvx): Instale o uv (uma vez), depois execute o servidor MCP via uvx. macOS/Linux: - curl -LsSf https://astral.sh/uv/install.sh | sh Então: - claude mcp add --scope user web-researcher -- uvx web-researcher-mcp Isso busca o binário pré-compilado correto para o seu sistema operacional e o executa (não é necessária a ferramenta Go). Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
2) Instalações alternativas (escolha uma): macOS (Homebrew): - brew install zoharbabin/tap/web-researcher-mcp - claude mcp add --scope user web-researcher -- web-researcher-mcp macOS/Linux (instalador curl): - curl -fsSL https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.sh | sh Windows (instalador PowerShell): - powershell -ExecutionPolicy Bypass -c "irm https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.ps1 | iex" Outras opções: - winget install zoharbabin.web-researcher-mcp - scoop bucket add zoharbabin https://github.com/zoharbabin/scoop-bucket && scoop install web-researcher-mcp - brew install --cask zoharbabin/tap/web-researcher-mcp - go install github.com/zoharbabin/web-researcher-mcp/cmd/web-researcher-mcp@latest - docker run -i --rm -e GOOGLE_CUSTOM_SEARCH_API_KEY=YOUR_KEY -e GOOGLE_CUSTOM_SEARCH_ID=YOUR_CX docker.io/zoharbabin/web-researcher-mcp:latest Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
3) Conecte-o ao seu cliente MCP (configuração JSON genérica): Se o seu aplicativo não for o fluxo CLI do Claude Code, adicione uma entrada de servidor MCP à configuração do seu cliente. Exemplo (Google PSE): { "mcpServers": { "web-researcher": { "command": "web-researcher-mcp", "env": { "SEARCH_PROVIDER": "google", "GOOGLE_CUSTOM_SEARCH_API_KEY": "YOUR_GOOGLE_API_KEY", "GOOGLE_CUSTOM_SEARCH_ID": "YOUR_SEARCH_ENGINE_ID" } } } } Exemplo (Brave): { "mcpServers": { "web-researcher": { "command": "web-researcher-mcp", "env": { "SEARCH_PROVIDER": "brave", "BRAVE_API_KEY": "YOUR_BRAVE_API_KEY" } } } } Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
4) Execute com configuração zero (fallback DuckDuckGo): Se você não definir SEARCH_PROVIDER ou quaisquer chaves de API, o Web Researcher MCP ainda funcionará imediatamente usando o DuckDuckGo como fallback integrado (nenhuma chave de API é necessária). Isso é útil para validar sua configuração antes de adicionar chaves de provedor. Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
5) (Recomendado) Adicione uma chave de provedor de pesquisa para melhorar a qualidade e desbloquear mais recursos: Defina SEARCH_PROVIDER e a(s) chave(s) correspondente(s). Os provedores suportados incluem DuckDuckGo (sem chave), Google PSE, Brave, Serper, SearchAPI.io, SearXNG, Tavily, Exa e Hacker News. Exemplo de variáveis de ambiente: - SEARCH_PROVIDER=brave - BRAVE_API_KEY=... Ou Google PSE: - SEARCH_PROVIDER=google - GOOGLE_CUSTOM_SEARCH_API_KEY=... - GOOGLE_CUSTOM_SEARCH_ID=... Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
6) (Opcional) Configure o failover multiprovedor: Para evitar tempo de inatividade/limites de taxa, configure vários provedores para que o servidor faça o fallback automaticamente. Exemplo: - SEARCH_ROUTING=brave,google,serper - BRAVE_API_KEY=... - GOOGLE_CUSTOM_SEARCH_API_KEY=... - GOOGLE_CUSTOM_SEARCH_ID=... - SERPER_API_KEY=... Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
7) Use “lentes de pesquisa” para restringir os resultados a fontes confiáveis: Quando você deseja maior confiança e menos spam, use uma lente integrada (por exemplo, médica, jurídica, acadêmica, notícias) para que as pesquisas sejam restritas a domínios selecionados. Exemplo de prompt para seu cliente de IA: - “Pesquise descobertas recentes sobre inibidores de SGLT2 usando a lente clínica.” Você também pode criar lentes personalizadas adicionando um arquivo JSON em lenses/ com uma lista de permissões de domínio. Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
8) Peça à sua IA para usar as ferramentas principais (fluxos de trabalho comuns): Uma vez conectado, sua IA pode chamar ferramentas como: - web_search: pesquisar na web (opcionalmente com lentes) - scrape_page: ler uma URL na íntegra (páginas da web, PDFs, DOCX, PPTX, transcrições do YouTube) - search_and_scrape: pesquisar e depois ler automaticamente os principais resultados - news_search / image_search: quando suportado pelo seu provedor - academic_search / patent_search / legal_search / filing_search / econ_search / clinical_search: bancos de dados especializados - verify_citation / audit_bibliography / format_bibliography: fluxos de trabalho de citação - sequential_search: pesquisa profunda em várias etapas Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
9) Use modelos de prompt guiados para pesquisa repetível: Use os modelos de prompt integrados (onde seu cliente suporta a seleção de prompt) para executar fluxos de trabalho estruturados: - comprehensive-research - fact-check - competitive-analysis - literature-review Esses modelos guiam a pesquisa em várias etapas para que você não precise especificar todas as instruções. Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
10) Solucione problemas comuns (correções rápidas): Se as ferramentas falharem com erros de “chave de API”: defina as chaves no bloco de ambiente de configuração do seu cliente MCP (não apenas nos perfis de shell). Se as páginas voltarem vazias: sites com muito JavaScript exigem Chromium; o binário baixa automaticamente o Chromium no primeiro uso (~200MB). Você pode definir CHROME_PATH para uma instalação existente do Chrome. A imagem Docker inclui Chromium. Se o cache estiver desatualizado após a atualização: exclua o diretório de cache (por exemplo, ~/Library/Caches/web-researcher-mcp/ no macOS) ou defina CACHE_DIR. Se você atingir os limites de taxa do provedor (429): troque de provedor ou configure SEARCH_ROUTING para failover. Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
11) (Equipes) Execute no modo HTTP e conecte clientes a um endpoint compartilhado: Para configurações compartilhadas/em equipe, execute o servidor como um serviço HTTP e conecte os clientes MCP a http://localhost:3000/mcp/. Exemplo: - PORT=3000 OAUTH_ISSUER_URL=https://auth.example.com OAUTH_AUDIENCE=https://api.example.com ./web-researcher-mcp Exemplo de Docker Compose: services: web-researcher: image: zoharbabin/web-researcher-mcp ports: - "3000:3000" environment: PORT: "3000" SEARCH_PROVIDER: brave BRAVE_API_KEY: ${BRAVE_API_KEY} Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

Perguntas Frequentes do Web Researcher MCP

Web Researcher MCP é um servidor de Protocolo de Contexto de Modelo (MCP) de código aberto que oferece aos assistentes de IA recursos de pesquisa na web (pesquisa na web, extração de página completa e pesquisas especializadas como acadêmica/patente/jurídica), com ênfase em respostas fundamentadas e citações reais e verificáveis. Ele é executado localmente em sua máquina, em vez de como um serviço hospedado.

Ferramentas de IA Mais Recentes Semelhantes a Web Researcher MCP

Jorpex
Jorpex
Jorpex é uma plataforma abrangente de notificação de licitações que agrega e entrega alertas instantâneos de licitações de países europeus diretamente ao Slack, ajudando as empresas a nunca perderem oportunidades.
Leadsmrt
Leadsmrt
Leadsmrt é uma ferramenta de geração de leads que ajuda as empresas a fazer scraping, verificar e personalizar leads de negócios direcionados do Google Maps com capacidades de personalização impulsionadas por IA.
Omnial AI
Omnial AI
Omnial AI é uma plataforma de inteligência de dados que aproveita agentes de IA para transformar prompts da web em percepções de dados estruturados e acionáveis, apoiadas pela Afore Capital.
SERPrecon
SERPrecon
O SERPrecon é uma ferramenta avançada de SEO que utiliza vetores, aprendizado de máquina e processamento de linguagem natural para ajudar os usuários a analisar e superar concorrentes usando os mesmos métodos que os motores de busca modernos.