Web Researcher MCP

Web Researcher MCP

Web Researcher MCP è un server MCP locale di livello produttivo che consente agli assistenti AI di cercare nel web (opzionalmente limitato a "lenti di ricerca" attendibili), leggere fonti complete (incluse pagine renderizzate in JS, PDF e trascrizioni di YouTube) e restituire citazioni verificabili con failover multi-provider. [Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]
https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt&utm_source=aipure
Web Researcher MCP

Informazioni sul Prodotto

Aggiornato:Jun 16, 2026

Cos'è Web Researcher MCP

Web Researcher MCP è un server open-source Model Context Protocol (MCP) progettato per fornire agli assistenti AI (ad esempio, Claude, Cursor e altri client compatibili con MCP) capacità di ricerca web affidabili e basate su fonti. Si concentra su "fonti reali di cui ci si può fidare" consentendo di cercare l'intero web o solo domini specifici e curati, quindi estrarre e analizzare il contenuto completo anziché frammenti, producendo link funzionanti e citazioni formattate. Il progetto viene fornito come un singolo binario Go con molteplici opzioni di installazione (ad esempio, Homebrew, script di installazione, Docker o uvx compatibile con Python) e può essere eseguito in modalità STDIO locale o come servizio HTTP per configurazioni condivise/di team. [Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]

Caratteristiche principali di Web Researcher MCP

Web Researcher MCP è un server MCP di livello produttivo che collega gli assistenti AI (ad esempio, Claude, Cursor, VS Code) a ricerche web in tempo reale e basate su fonti. Può cercare nel web (con "lenti di ricerca" opzionali che restringono i risultati a domini affidabili), leggere ed estrarre il contenuto completo dagli URL (incluse le pagine con molto JavaScript tramite una pipeline di browser automatizzata) e gestire molti flussi di lavoro specifici della ricerca come la ricerca accademica e di brevetti, la ricerca di notizie, la verifica/audit delle citazioni e l'esportazione di sessioni di ricerca riproducibili con provenienza. È progettato per dare priorità a fonti verificabili e citazioni affidabili, supporta più fornitori di ricerca intercambiabili con failover automatico e funziona localmente per una ricerca incentrata sulla privacy.
Lenti di ricerca (routing di fonti affidabili): Limita le ricerche a elenchi di domini curati (integrati o personalizzati) in modo che i risultati provengano solo da fonti di cui ti fidi (ad esempio, PubMed, SEC, tribunali, documenti ufficiali) piuttosto che dallo spam e dai contenuti di bassa qualità del web aperto.
Ricerca multi-provider con failover: Funziona con più fornitori di ricerca (ad esempio, DuckDuckGo zero-config, Google PSE, Brave, Serper, SearXNG, Tavily, Exa) e può automaticamente ripiegare quando un provider è limitato o non disponibile.
Estrazione di pagine complete (incl. siti renderizzati in JS): Legge pagine web e documenti completi – non solo frammenti – utilizzando una pipeline di scraping a più livelli e il rendering Chromium opzionale per le pagine con molto JavaScript; supporta anche PDF/documenti Office e l'estrazione di trascrizioni di YouTube.
Flussi di lavoro di citazione di livello di ricerca: Fornisce strumenti per verificare le citazioni, controllare intere bibliografie per collegamenti interrotti/ritrattazioni/voci non verificabili e formattare le bibliografie (APA/MLA/BibTeX/RIS/CSL-JSON) per un uso accademico o professionale successivo.
Sessioni di ricerca profonde e riproducibili: Supporta la ricerca sequenziale multi-step con persistenza ed esportazione della sessione (markdown/JSON) inclusa la provenienza per ogni passaggio; include diagnostica e risorse di stato per strumenti, sessioni, fornitori e limiti di velocità.
Strumenti di ricerca verticale specializzati: Include strumenti appositamente costruiti per articoli accademici (DOI, autori, citazioni), brevetti (USPTO/EPO/Lens con fallback), depositi SEC (EDGAR), pareri/fascicoli legali (CourtListener), economia (World Bank/FRED) e studi clinici (ClinicalTrials.gov).

Casi d'uso di Web Researcher MCP

Revisione della letteratura accademica e di ricerca e sviluppo: I ricercatori possono eseguire ricerche bibliografiche strutturate, raccogliere fonti supportate da DOI, attraversare reti di citazioni ed esportare bibliografie formattate correttamente per articoli, sovvenzioni o revisioni tecniche interne.
Ricerca legale e supporto al contenzioso: Gli studi legali e i team di conformità possono cercare sentenze/fascicoli giudiziari reali, verificare le citazioni di casi e archiviare le fonti per garantire che i riferimenti rimangano verificabili per i depositi e le consegne ai clienti.
Finanza e due diligence: Gli analisti possono estrarre i depositi SEC EDGAR, triangolare notizie e fonti primarie e produrre rapporti di ricerca verificabili con collegamenti che i clienti possono cliccare e verificare.
Sanità e intelligence clinica: I ricercatori medici e i team politici possono concentrare le ricerche su fonti cliniche e biomediche, recuperare prove a testo completo ove disponibili e tenere traccia delle registrazioni e degli stati degli studi clinici (orientato alla scoperta, non un consiglio medico).
Intelligence competitiva e di mercato: I team di prodotto e strategia possono monitorare le notizie, scansionare i brevetti e sintetizzare analisi competitive multi-fonte, mantenendo una traccia cartacea riproducibile di come sono state raggiunte le conclusioni.
Documentazione ingegneristica e ricerca di incidenti: Gli sviluppatori e i team SRE possono utilizzare lenti focalizzate sulla documentazione per cercare riferimenti ufficiali, "raschiare" pagine complete (incluse le documentazioni con molto JS) e compilare riassunti fondati per la risoluzione dei problemi e le decisioni di progettazione.

Vantaggi

Controllo delle fonti tramite lenti: puoi limitare la ricerca a domini verificati, migliorando l'affidabilità e riducendo lo spam/il rumore SEO.
Strumenti di ricerca end-to-end: combina ricerca, estrazione di contenuti completi, verifica/audit delle citazioni ed esportazione di sessioni con provenienza in un unico server MCP.
Flessibilità e resilienza del provider: più backend di ricerca con failover automatico opzionale; offre anche un fallback DuckDuckGo zero-config.
Esecuzione locale attenta alla privacy: le query vanno dalla tua macchina ai fornitori scelti piuttosto che attraverso i server dello strumento.

Svantaggi

Le migliori funzionalità spesso richiedono chiavi API: la ricerca di qualità superiore, notizie/immagini e alcuni strumenti avanzati dipendono dalla configurazione di fornitori e credenziali di terze parti.
Lo scraping più pesante può scaricare/eseguire Chromium: il rendering JavaScript può richiedere un download di browser di grandi dimensioni (~200 MB) e può essere più lento della semplice estrazione.
Limiti e variabilità a monte: i limiti di velocità, la copertura e la freschezza dipendono dal/i fornitore/i di ricerca selezionato/i e dai loro livelli gratuiti/a pagamento.

Come usare Web Researcher MCP

1) Installa Web Researcher MCP (il più veloce: uvx): Installa uv (una tantum), quindi esegui il server MCP tramite uvx. macOS/Linux: - curl -LsSf https://astral.sh/uv/install.sh | sh Quindi: - claude mcp add --scope user web-researcher -- uvx web-researcher-mcp Questo recupera il binario precompilato corretto per il tuo sistema operativo e lo esegue (non è necessaria la toolchain Go). Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
2) Installazioni alternative (scegli una): macOS (Homebrew): - brew install zoharbabin/tap/web-researcher-mcp - claude mcp add --scope user web-researcher -- web-researcher-mcp macOS/Linux (installer curl): - curl -fsSL https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.sh | sh Windows (installer PowerShell): - powershell -ExecutionPolicy Bypass -c "irm https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.ps1 | iex" Altre opzioni: - winget install zoharbabin.web-researcher-mcp - scoop bucket add zoharbabin https://github.com/zoharbabin/scoop-bucket && scoop install web-researcher-mcp - brew install --cask zoharbabin/tap/web-researcher-mcp - go install github.com/zoharbabin/web-researcher-mcp/cmd/web-researcher-mcp@latest - docker run -i --rm -e GOOGLE_CUSTOM_SEARCH_API_KEY=YOUR_KEY -e GOOGLE_CUSTOM_SEARCH_ID=YOUR_CX docker.io/zoharbabin/web-researcher-mcp:latest Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
3) Collegalo al tuo client MCP (configurazione JSON generica): Se la tua app non è il flusso CLI di Claude Code, aggiungi una voce del server MCP alla configurazione del tuo client. Esempio (Google PSE): { "mcpServers": { "web-researcher": { "command": "web-researcher-mcp", "env": { "SEARCH_PROVIDER": "google", "GOOGLE_CUSTOM_SEARCH_API_KEY": "YOUR_GOOGLE_API_KEY", "GOOGLE_CUSTOM_SEARCH_ID": "YOUR_SEARCH_ENGINE_ID" } } } } Esempio (Brave): { "mcpServers": { "web-researcher": { "command": "web-researcher-mcp", "env": { "SEARCH_PROVIDER": "brave", "BRAVE_API_KEY": "YOUR_BRAVE_API_KEY" } } } } Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
4) Esegui con configurazione zero (fallback DuckDuckGo): Se non imposti SEARCH_PROVIDER o alcuna chiave API, Web Researcher MCP funziona comunque immediatamente utilizzando DuckDuckGo come fallback integrato (nessuna chiave API richiesta). Questo è utile per convalidare la tua configurazione prima di aggiungere le chiavi del provider. Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
5) (Consigliato) Aggiungi una chiave del provider di ricerca per migliorare la qualità e sbloccare più funzionalità: Imposta SEARCH_PROVIDER e le chiavi corrispondenti. I provider supportati includono DuckDuckGo (nessuna chiave), Google PSE, Brave, Serper, SearchAPI.io, SearXNG, Tavily, Exa e Hacker News. Esempio di variabili d'ambiente: - SEARCH_PROVIDER=brave - BRAVE_API_KEY=... O Google PSE: - SEARCH_PROVIDER=google - GOOGLE_CUSTOM_SEARCH_API_KEY=... - GOOGLE_CUSTOM_SEARCH_ID=... Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
6) (Opzionale) Configura il failover multi-provider: Per evitare tempi di inattività/limiti di velocità, configura più provider in modo che il server esegua automaticamente il fallback. Esempio: - SEARCH_ROUTING=brave,google,serper - BRAVE_API_KEY=... - GOOGLE_CUSTOM_SEARCH_API_KEY=... - GOOGLE_CUSTOM_SEARCH_ID=... - SERPER_API_KEY=... Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
7) Usa le "lenti di ricerca" per limitare i risultati a fonti attendibili: Quando desideri maggiore fiducia e meno spam, usa una lente integrata (ad esempio, medica, legale, accademica, notizie) in modo che le ricerche siano limitate a domini curati. Esempio di prompt per il tuo client AI: - "Cerca i risultati recenti sugli inibitori SGLT2 usando la lente clinica." Puoi anche creare lenti personalizzate aggiungendo un file JSON sotto lenses/ con una lista bianca di domini. Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
8) Chiedi alla tua AI di usare gli strumenti principali (flussi di lavoro comuni): Una volta connesso, la tua AI può chiamare strumenti come: - web_search: cerca nel web (opzionalmente con lenti) - scrape_page: leggi un URL per intero (pagine web, PDF, DOCX, PPTX, trascrizioni di YouTube) - search_and_scrape: cerca e poi leggi automaticamente i risultati principali - news_search / image_search: quando supportato dal tuo provider - academic_search / patent_search / legal_search / filing_search / econ_search / clinical_search: database specializzati - verify_citation / audit_bibliography / format_bibliography: flussi di lavoro di citazione - sequential_search: ricerca approfondita in più passaggi Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
9) Usa modelli di prompt guidati per ricerche ripetibili: Usa i modelli di prompt integrati (dove il tuo client supporta la selezione del prompt) per eseguire flussi di lavoro strutturati: - comprehensive-research - fact-check - competitive-analysis - literature-review Questi modelli guidano la ricerca in più passaggi in modo da non dover specificare ogni istruzione. Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
10) Risolvi i problemi comuni (soluzioni rapide): Se gli strumenti falliscono con errori "API key": imposta le chiavi nel blocco env di configurazione del tuo client MCP (non solo nei profili shell). Se le pagine tornano vuote: i siti con molto JavaScript richiedono Chromium; il binario scarica automaticamente Chromium al primo utilizzo (~200MB). Puoi impostare CHROME_PATH su un'installazione di Chrome esistente. L'immagine Docker include Chromium. Se la cache è obsoleta dopo l'aggiornamento: elimina la directory della cache (ad esempio, ~/Library/Caches/web-researcher-mcp/ su macOS) o imposta CACHE_DIR. Se raggiungi i limiti di velocità del provider (429): cambia provider o configura SEARCH_ROUTING per il failover. Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
11) (Team) Esegui in modalità HTTP e collega i client a un endpoint condiviso: Per configurazioni condivise/di team, esegui il server come servizio HTTP e collega i client MCP a http://localhost:3000/mcp/. Esempio: - PORT=3000 OAUTH_ISSUER_URL=https://auth.example.com OAUTH_AUDIENCE=https://api.example.com ./web-researcher-mcp Esempio Docker Compose: services: web-researcher: image: zoharbabin/web-researcher-mcp ports: - "3000:3000" environment: PORT: "3000" SEARCH_PROVIDER: brave BRAVE_API_KEY: ${BRAVE_API_KEY} Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

FAQ di Web Researcher MCP

Web Researcher MCP è un server open-source Model Context Protocol (MCP) che fornisce agli assistenti AI capacità di ricerca web (ricerca web, estrazione di pagine complete e ricerche specializzate come quelle accademiche/brevettuali/legali), con un'enfasi su risposte fondate e citazioni reali e verificabili. Funziona localmente sulla tua macchina anziché come servizio ospitato.

Ultimi Strumenti AI Simili a Web Researcher MCP

Jorpex
Jorpex
Jorpex è una piattaforma completa di notifica delle gare che aggrega e consegna avvisi di gara istantanei da paesi europei direttamente a Slack, aiutando le aziende a non perdere mai opportunità.
Leadsmrt
Leadsmrt
Leadsmrt è uno strumento di generazione di contatti che aiuta le aziende a fare scraping, verificare e personalizzare contatti aziendali mirati da Google Maps con capacità di personalizzazione alimentate dall'IA.
Omnial AI
Omnial AI
Omnial AI è una piattaforma di intelligenza dei dati che sfrutta agenti AI per trasformare suggerimenti web in intuizioni di dati strutturati e attuabili sostenute da Afore Capital.
SERPrecon
SERPrecon
SERPrecon è uno strumento SEO avanzato che sfrutta vettori, apprendimento automatico e elaborazione del linguaggio naturale per aiutare gli utenti ad analizzare e superare i concorrenti utilizzando gli stessi metodi dei motori di ricerca moderni.