Web Researcher MCP
Web Researcher MCP è un server MCP locale di livello produttivo che consente agli assistenti AI di cercare nel web (opzionalmente limitato a "lenti di ricerca" attendibili), leggere fonti complete (incluse pagine renderizzate in JS, PDF e trascrizioni di YouTube) e restituire citazioni verificabili con failover multi-provider. [Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]
https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt&utm_source=aipure

Informazioni sul Prodotto
Aggiornato:Jun 16, 2026
Cos'è Web Researcher MCP
Web Researcher MCP è un server open-source Model Context Protocol (MCP) progettato per fornire agli assistenti AI (ad esempio, Claude, Cursor e altri client compatibili con MCP) capacità di ricerca web affidabili e basate su fonti. Si concentra su "fonti reali di cui ci si può fidare" consentendo di cercare l'intero web o solo domini specifici e curati, quindi estrarre e analizzare il contenuto completo anziché frammenti, producendo link funzionanti e citazioni formattate. Il progetto viene fornito come un singolo binario Go con molteplici opzioni di installazione (ad esempio, Homebrew, script di installazione, Docker o uvx compatibile con Python) e può essere eseguito in modalità STDIO locale o come servizio HTTP per configurazioni condivise/di team. [Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]
Caratteristiche principali di Web Researcher MCP
Web Researcher MCP è un server MCP di livello produttivo che collega gli assistenti AI (ad esempio, Claude, Cursor, VS Code) a ricerche web in tempo reale e basate su fonti. Può cercare nel web (con "lenti di ricerca" opzionali che restringono i risultati a domini affidabili), leggere ed estrarre il contenuto completo dagli URL (incluse le pagine con molto JavaScript tramite una pipeline di browser automatizzata) e gestire molti flussi di lavoro specifici della ricerca come la ricerca accademica e di brevetti, la ricerca di notizie, la verifica/audit delle citazioni e l'esportazione di sessioni di ricerca riproducibili con provenienza. È progettato per dare priorità a fonti verificabili e citazioni affidabili, supporta più fornitori di ricerca intercambiabili con failover automatico e funziona localmente per una ricerca incentrata sulla privacy.
Lenti di ricerca (routing di fonti affidabili): Limita le ricerche a elenchi di domini curati (integrati o personalizzati) in modo che i risultati provengano solo da fonti di cui ti fidi (ad esempio, PubMed, SEC, tribunali, documenti ufficiali) piuttosto che dallo spam e dai contenuti di bassa qualità del web aperto.
Ricerca multi-provider con failover: Funziona con più fornitori di ricerca (ad esempio, DuckDuckGo zero-config, Google PSE, Brave, Serper, SearXNG, Tavily, Exa) e può automaticamente ripiegare quando un provider è limitato o non disponibile.
Estrazione di pagine complete (incl. siti renderizzati in JS): Legge pagine web e documenti completi – non solo frammenti – utilizzando una pipeline di scraping a più livelli e il rendering Chromium opzionale per le pagine con molto JavaScript; supporta anche PDF/documenti Office e l'estrazione di trascrizioni di YouTube.
Flussi di lavoro di citazione di livello di ricerca: Fornisce strumenti per verificare le citazioni, controllare intere bibliografie per collegamenti interrotti/ritrattazioni/voci non verificabili e formattare le bibliografie (APA/MLA/BibTeX/RIS/CSL-JSON) per un uso accademico o professionale successivo.
Sessioni di ricerca profonde e riproducibili: Supporta la ricerca sequenziale multi-step con persistenza ed esportazione della sessione (markdown/JSON) inclusa la provenienza per ogni passaggio; include diagnostica e risorse di stato per strumenti, sessioni, fornitori e limiti di velocità.
Strumenti di ricerca verticale specializzati: Include strumenti appositamente costruiti per articoli accademici (DOI, autori, citazioni), brevetti (USPTO/EPO/Lens con fallback), depositi SEC (EDGAR), pareri/fascicoli legali (CourtListener), economia (World Bank/FRED) e studi clinici (ClinicalTrials.gov).
Casi d'uso di Web Researcher MCP
Revisione della letteratura accademica e di ricerca e sviluppo: I ricercatori possono eseguire ricerche bibliografiche strutturate, raccogliere fonti supportate da DOI, attraversare reti di citazioni ed esportare bibliografie formattate correttamente per articoli, sovvenzioni o revisioni tecniche interne.
Ricerca legale e supporto al contenzioso: Gli studi legali e i team di conformità possono cercare sentenze/fascicoli giudiziari reali, verificare le citazioni di casi e archiviare le fonti per garantire che i riferimenti rimangano verificabili per i depositi e le consegne ai clienti.
Finanza e due diligence: Gli analisti possono estrarre i depositi SEC EDGAR, triangolare notizie e fonti primarie e produrre rapporti di ricerca verificabili con collegamenti che i clienti possono cliccare e verificare.
Sanità e intelligence clinica: I ricercatori medici e i team politici possono concentrare le ricerche su fonti cliniche e biomediche, recuperare prove a testo completo ove disponibili e tenere traccia delle registrazioni e degli stati degli studi clinici (orientato alla scoperta, non un consiglio medico).
Intelligence competitiva e di mercato: I team di prodotto e strategia possono monitorare le notizie, scansionare i brevetti e sintetizzare analisi competitive multi-fonte, mantenendo una traccia cartacea riproducibile di come sono state raggiunte le conclusioni.
Documentazione ingegneristica e ricerca di incidenti: Gli sviluppatori e i team SRE possono utilizzare lenti focalizzate sulla documentazione per cercare riferimenti ufficiali, "raschiare" pagine complete (incluse le documentazioni con molto JS) e compilare riassunti fondati per la risoluzione dei problemi e le decisioni di progettazione.
Vantaggi
Controllo delle fonti tramite lenti: puoi limitare la ricerca a domini verificati, migliorando l'affidabilità e riducendo lo spam/il rumore SEO.
Strumenti di ricerca end-to-end: combina ricerca, estrazione di contenuti completi, verifica/audit delle citazioni ed esportazione di sessioni con provenienza in un unico server MCP.
Flessibilità e resilienza del provider: più backend di ricerca con failover automatico opzionale; offre anche un fallback DuckDuckGo zero-config.
Esecuzione locale attenta alla privacy: le query vanno dalla tua macchina ai fornitori scelti piuttosto che attraverso i server dello strumento.
Svantaggi
Le migliori funzionalità spesso richiedono chiavi API: la ricerca di qualità superiore, notizie/immagini e alcuni strumenti avanzati dipendono dalla configurazione di fornitori e credenziali di terze parti.
Lo scraping più pesante può scaricare/eseguire Chromium: il rendering JavaScript può richiedere un download di browser di grandi dimensioni (~200 MB) e può essere più lento della semplice estrazione.
Limiti e variabilità a monte: i limiti di velocità, la copertura e la freschezza dipendono dal/i fornitore/i di ricerca selezionato/i e dai loro livelli gratuiti/a pagamento.
Come usare Web Researcher MCP
1) Installa Web Researcher MCP (il più veloce: uvx): Installa uv (una tantum), quindi esegui il server MCP tramite uvx.
macOS/Linux:
- curl -LsSf https://astral.sh/uv/install.sh | sh
Quindi:
- claude mcp add --scope user web-researcher -- uvx web-researcher-mcp
Questo recupera il binario precompilato corretto per il tuo sistema operativo e lo esegue (non è necessaria la toolchain Go). Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
2) Installazioni alternative (scegli una): macOS (Homebrew):
- brew install zoharbabin/tap/web-researcher-mcp
- claude mcp add --scope user web-researcher -- web-researcher-mcp
macOS/Linux (installer curl):
- curl -fsSL https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.sh | sh
Windows (installer PowerShell):
- powershell -ExecutionPolicy Bypass -c "irm https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.ps1 | iex"
Altre opzioni:
- winget install zoharbabin.web-researcher-mcp
- scoop bucket add zoharbabin https://github.com/zoharbabin/scoop-bucket && scoop install web-researcher-mcp
- brew install --cask zoharbabin/tap/web-researcher-mcp
- go install github.com/zoharbabin/web-researcher-mcp/cmd/web-researcher-mcp@latest
- docker run -i --rm -e GOOGLE_CUSTOM_SEARCH_API_KEY=YOUR_KEY -e GOOGLE_CUSTOM_SEARCH_ID=YOUR_CX docker.io/zoharbabin/web-researcher-mcp:latest
Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
3) Collegalo al tuo client MCP (configurazione JSON generica): Se la tua app non è il flusso CLI di Claude Code, aggiungi una voce del server MCP alla configurazione del tuo client.
Esempio (Google PSE):
{
"mcpServers": {
"web-researcher": {
"command": "web-researcher-mcp",
"env": {
"SEARCH_PROVIDER": "google",
"GOOGLE_CUSTOM_SEARCH_API_KEY": "YOUR_GOOGLE_API_KEY",
"GOOGLE_CUSTOM_SEARCH_ID": "YOUR_SEARCH_ENGINE_ID"
}
}
}
}
Esempio (Brave):
{
"mcpServers": {
"web-researcher": {
"command": "web-researcher-mcp",
"env": {
"SEARCH_PROVIDER": "brave",
"BRAVE_API_KEY": "YOUR_BRAVE_API_KEY"
}
}
}
}
Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
4) Esegui con configurazione zero (fallback DuckDuckGo): Se non imposti SEARCH_PROVIDER o alcuna chiave API, Web Researcher MCP funziona comunque immediatamente utilizzando DuckDuckGo come fallback integrato (nessuna chiave API richiesta). Questo è utile per convalidare la tua configurazione prima di aggiungere le chiavi del provider.
Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
5) (Consigliato) Aggiungi una chiave del provider di ricerca per migliorare la qualità e sbloccare più funzionalità: Imposta SEARCH_PROVIDER e le chiavi corrispondenti. I provider supportati includono DuckDuckGo (nessuna chiave), Google PSE, Brave, Serper, SearchAPI.io, SearXNG, Tavily, Exa e Hacker News.
Esempio di variabili d'ambiente:
- SEARCH_PROVIDER=brave
- BRAVE_API_KEY=...
O Google PSE:
- SEARCH_PROVIDER=google
- GOOGLE_CUSTOM_SEARCH_API_KEY=...
- GOOGLE_CUSTOM_SEARCH_ID=...
Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
6) (Opzionale) Configura il failover multi-provider: Per evitare tempi di inattività/limiti di velocità, configura più provider in modo che il server esegua automaticamente il fallback.
Esempio:
- SEARCH_ROUTING=brave,google,serper
- BRAVE_API_KEY=...
- GOOGLE_CUSTOM_SEARCH_API_KEY=...
- GOOGLE_CUSTOM_SEARCH_ID=...
- SERPER_API_KEY=...
Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
7) Usa le "lenti di ricerca" per limitare i risultati a fonti attendibili: Quando desideri maggiore fiducia e meno spam, usa una lente integrata (ad esempio, medica, legale, accademica, notizie) in modo che le ricerche siano limitate a domini curati.
Esempio di prompt per il tuo client AI:
- "Cerca i risultati recenti sugli inibitori SGLT2 usando la lente clinica."
Puoi anche creare lenti personalizzate aggiungendo un file JSON sotto lenses/ con una lista bianca di domini.
Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
8) Chiedi alla tua AI di usare gli strumenti principali (flussi di lavoro comuni): Una volta connesso, la tua AI può chiamare strumenti come:
- web_search: cerca nel web (opzionalmente con lenti)
- scrape_page: leggi un URL per intero (pagine web, PDF, DOCX, PPTX, trascrizioni di YouTube)
- search_and_scrape: cerca e poi leggi automaticamente i risultati principali
- news_search / image_search: quando supportato dal tuo provider
- academic_search / patent_search / legal_search / filing_search / econ_search / clinical_search: database specializzati
- verify_citation / audit_bibliography / format_bibliography: flussi di lavoro di citazione
- sequential_search: ricerca approfondita in più passaggi
Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
9) Usa modelli di prompt guidati per ricerche ripetibili: Usa i modelli di prompt integrati (dove il tuo client supporta la selezione del prompt) per eseguire flussi di lavoro strutturati:
- comprehensive-research
- fact-check
- competitive-analysis
- literature-review
Questi modelli guidano la ricerca in più passaggi in modo da non dover specificare ogni istruzione.
Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
10) Risolvi i problemi comuni (soluzioni rapide): Se gli strumenti falliscono con errori "API key": imposta le chiavi nel blocco env di configurazione del tuo client MCP (non solo nei profili shell).
Se le pagine tornano vuote: i siti con molto JavaScript richiedono Chromium; il binario scarica automaticamente Chromium al primo utilizzo (~200MB). Puoi impostare CHROME_PATH su un'installazione di Chrome esistente. L'immagine Docker include Chromium.
Se la cache è obsoleta dopo l'aggiornamento: elimina la directory della cache (ad esempio, ~/Library/Caches/web-researcher-mcp/ su macOS) o imposta CACHE_DIR.
Se raggiungi i limiti di velocità del provider (429): cambia provider o configura SEARCH_ROUTING per il failover.
Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
11) (Team) Esegui in modalità HTTP e collega i client a un endpoint condiviso: Per configurazioni condivise/di team, esegui il server come servizio HTTP e collega i client MCP a http://localhost:3000/mcp/.
Esempio:
- PORT=3000 OAUTH_ISSUER_URL=https://auth.example.com OAUTH_AUDIENCE=https://api.example.com ./web-researcher-mcp
Esempio Docker Compose:
services:
web-researcher:
image: zoharbabin/web-researcher-mcp
ports:
- "3000:3000"
environment:
PORT: "3000"
SEARCH_PROVIDER: brave
BRAVE_API_KEY: ${BRAVE_API_KEY}
Fonte: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
FAQ di Web Researcher MCP
Web Researcher MCP è un server open-source Model Context Protocol (MCP) che fornisce agli assistenti AI capacità di ricerca web (ricerca web, estrazione di pagine complete e ricerche specializzate come quelle accademiche/brevettuali/legali), con un'enfasi su risposte fondate e citazioni reali e verificabili. Funziona localmente sulla tua macchina anziché come servizio ospitato.
Video di Web Researcher MCP
Articoli Popolari

Atoms: Una Piattaforma AI Multi-Agente Che Trasforma le Idee in Prodotti Pronti al Lancio
May 22, 2026

Nano Banana SBTI: Cos'è, come funziona e come usarlo nel 2026
Apr 15, 2026

Recensione di Atoms — Il builder di prodotti AI che ridefinisce la creazione digitale nel 2026
Apr 10, 2026

Kilo Claw: Come Distribuire e Utilizzare un Vero Agente AI "Fai-da-Te" (Aggiornamento 2026)
Apr 3, 2026







