Web Researcher MCP

Web Researcher MCP

Web Researcher MCP 是一個本地、生產級的 MCP 伺服器,它允許 AI 助手搜尋網路(可選限制在受信任的「搜尋鏡頭」)、讀取完整來源(包括 JS 渲染頁面、PDF 和 YouTube 轉錄稿),並返回帶有多供應商故障轉移的可驗證引文。 [來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]
https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt&utm_source=aipure
Web Researcher MCP

產品資訊

更新時間:2026年06月16日

什麼是 Web Researcher MCP

Web Researcher MCP 是一個開源模型上下文協議 (MCP) 伺服器,旨在為 AI 助手(例如 Claude、Cursor 和其他 MCP 相容客戶端)提供可靠、基於來源的網路研究功能。它專注於「您可以信任的真實來源」,讓您可以搜尋整個網路或僅限特定的精選網域,然後提取和分析完整內容而非片段——產生可用的連結和格式化的引文。該專案以單一 Go 二進位檔形式發布,具有多種安裝選項(例如 Homebrew、安裝腳本、Docker 或 Python 友好的 uvx),並且可以在本地 STDIO 模式下運行,或作為 HTTP 服務用於共享/團隊設置。 [來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]

Web Researcher MCP 的主要功能

Web Researcher MCP 是一個生產級的 MCP 伺服器,它將 AI 助理(例如 Claude、Cursor、VS Code)連接到即時、以來源為基礎的網路研究。它可以搜尋網路(可選用「搜尋透鏡」將結果限制在受信任的網域)、從 URL 讀取和提取完整內容(包括透過自動化瀏覽器管道處理大量 JavaScript 的頁面),並處理許多研究特定的工作流程,例如學術和專利查詢、新聞搜尋、引文驗證/審核,以及匯出具有出處的可重現研究會話。它旨在優先考慮可驗證的來源和可靠的引文,支援多個可互換的搜尋提供者並具有自動故障轉移功能,並在本地運行以進行注重隱私的研究。
搜尋透鏡(信任來源路由): 將搜尋限制在策劃的網域列表(內建或自訂),以便結果僅來自您信任的來源(例如 PubMed、SEC、法院、官方文件),而不是開放網路的垃圾郵件和低品質內容。
多提供者搜尋與故障轉移: 與多個搜尋提供者(例如 DuckDuckGo 零配置、Google PSE、Brave、Serper、SearXNG、Tavily、Exa)協同工作,並在一個提供者受到速率限制或不可用時自動回退。
全頁提取(包括 JS 渲染網站): 使用分層抓取管道和可選的 Chromium 渲染來讀取完整的網頁和文件——而不僅僅是片段——用於大量 JavaScript 的頁面;還支援 PDF/Office 文件和 YouTube 轉錄提取。
研究級引文工作流程: 提供工具來驗證引文,審核整個參考書目是否存在失效連結/撤回/不可驗證的條目,並格式化參考書目(APA/MLA/BibTeX/RIS/CSL-JSON),以供下游學術或專業使用。
深入、可重現的研究會話: 支援具有會話持久性和匯出(markdown/JSON)的順序多步驟研究,包括每一步的出處;包括工具、會話、提供者和速率限制的診斷和狀態資源。
專業垂直搜尋工具: 包括用於學術論文(DOI、作者、引文)、專利(USPTO/EPO/Lens 帶回退)、SEC 文件(EDGAR)、法律意見/案件記錄(CourtListener)、經濟學(世界銀行/FRED)和臨床試驗(ClinicalTrials.gov)的專用工具。

Web Researcher MCP 的使用案例

學術與研發文獻回顧: 研究人員可以進行結構化的文獻搜尋,收集由 DOI 支持的來源,遍歷引文鄰域,並為論文、補助金或內部技術審查匯出格式正確的參考書目。
法律研究與訴訟支援: 律師事務所和合規團隊可以搜尋真實的法院意見/案件記錄,驗證案件引文,並歸檔來源,以確保參考資料在提交文件和客戶交付物時保持可驗證性。
金融與盡職調查: 分析師可以提取 SEC EDGAR 文件,三角測量新聞和主要來源,並生成可審計的研究報告,其中包含客戶可以點擊和驗證的連結。
醫療保健與臨床情報: 醫學研究人員和政策團隊可以將搜尋重點放在臨床和生物醫學來源上,在可用時檢索全文證據,並追蹤臨床試驗註冊和狀態(以發現為導向,而非醫療建議)。
競爭和市場情報: 產品和策略團隊可以監控新聞、掃描專利,並綜合多來源的競爭分析,同時保留可重現的書面記錄,說明結論是如何得出的。
工程文件和事件研究: 開發人員和 SRE 團隊可以使用以文件為重點的透鏡來搜尋官方參考資料,抓取完整頁面(包括大量 JS 的文件),並編譯有根據的摘要,用於故障排除和設計決策。

優點

透過透鏡進行來源控制:您可以將研究限制在經過審查的網域,從而提高可靠性並減少垃圾郵件/SEO 噪音。
端到端研究工具:在一個 MCP 伺服器中結合了搜尋、完整內容提取、引文驗證/審核以及帶有出處的會話匯出。
提供者靈活性和彈性:多個搜尋後端,可選自動故障轉移;還提供零配置的 DuckDuckGo 回退。
隱私優先的本地執行:查詢從您的機器發送到您選擇的提供者,而不是透過工具自己的伺服器。

缺點

最佳功能通常需要 API 金鑰:更高品質的搜尋、新聞/圖片以及一些進階工具依賴於配置第三方提供者和憑證。
較重的抓取可能會下載/運行 Chromium:JavaScript 渲染可能需要大量瀏覽器下載(約 200MB),並且可能比簡單提取慢。
上游限制和變異性:速率限制、覆蓋範圍和新鮮度取決於所選的搜尋提供者及其免費/付費層級。

如何使用 Web Researcher MCP

1) 安裝 Web Researcher MCP (最快:uvx): 安裝 uv (一次性),然後透過 uvx 運行 MCP 伺服器。 macOS/Linux: - curl -LsSf https://astral.sh/uv/install.sh | sh 然後: - claude mcp add --scope user web-researcher -- uvx web-researcher-mcp 這會為您的作業系統獲取正確的預建二進位檔並運行它 (無需 Go 工具鏈)。來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
2) 其他安裝方式 (選擇一種): macOS (Homebrew): - brew install zoharbabin/tap/web-researcher-mcp - claude mcp add --scope user web-researcher -- web-researcher-mcp macOS/Linux (curl 安裝程式): - curl -fsSL https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.sh | sh Windows (PowerShell 安裝程式): - powershell -ExecutionPolicy Bypass -c "irm https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.ps1 | iex" 其他選項: - winget install zoharbabin.web-researcher-mcp - scoop bucket add zoharbabin https://github.com/zoharbabin/scoop-bucket && scoop install web-researcher-mcp - brew install --cask zoharbabin/tap/web-researcher-mcp - go install github.com/zoharbabin/web-researcher-mcp/cmd/web-researcher-mcp@latest - docker run -i --rm -e GOOGLE_CUSTOM_SEARCH_API_KEY=YOUR_KEY -e GOOGLE_CUSTOM_SEARCH_ID=YOUR_CX docker.io/zoharbabin/web-researcher-mcp:latest 來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
3) 將其連接到您的 MCP 客戶端 (通用 JSON 配置): 如果您的應用程式不是 Claude Code 的 CLI 流程,請在您的客戶端配置中添加一個 MCP 伺服器條目。 範例 (Google PSE): { "mcpServers": { "web-researcher": { "command": "web-researcher-mcp", "env": { "SEARCH_PROVIDER": "google", "GOOGLE_CUSTOM_SEARCH_API_KEY": "YOUR_GOOGLE_API_KEY", "GOOGLE_CUSTOM_SEARCH_ID": "YOUR_SEARCH_ENGINE_ID" } } } } 範例 (Brave): { "mcpServers": { "web-researcher": { "command": "web-researcher-mcp", "env": { "SEARCH_PROVIDER": "brave", "BRAVE_API_KEY": "YOUR_BRAVE_API_KEY" } } } } 來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
4) 零配置運行 (DuckDuckGo 備用): 如果您未設置 SEARCH_PROVIDER 或任何 API 金鑰,Web Researcher MCP 仍可開箱即用,使用 DuckDuckGo 作為內建備用 (無需 API 金鑰)。這對於在添加供應商金鑰之前驗證您的設置很有用。 來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
5) (推薦) 添加搜尋供應商金鑰以提高品質並解鎖更多功能: 設置 SEARCH_PROVIDER 和匹配的金鑰。支援的供應商包括 DuckDuckGo (無需金鑰)、Google PSE、Brave、Serper、SearchAPI.io、SearXNG、Tavily、Exa 和 Hacker News。 環境變數範例: - SEARCH_PROVIDER=brave - BRAVE_API_KEY=... 或 Google PSE: - SEARCH_PROVIDER=google - GOOGLE_CUSTOM_SEARCH_API_KEY=... - GOOGLE_CUSTOM_SEARCH_ID=... 來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
6) (可選) 配置多供應商故障轉移: 為避免停機/速率限制,請配置多個供應商,以便伺服器自動故障轉移。 範例: - SEARCH_ROUTING=brave,google,serper - BRAVE_API_KEY=... - GOOGLE_CUSTOM_SEARCH_API_KEY=... - GOOGLE_CUSTOM_SEARCH_ID=... - SERPER_API_KEY=... 來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
7) 使用「搜尋鏡頭」將結果限制在受信任的來源: 當您需要更高的信任度和更少的垃圾郵件時,請使用內建鏡頭 (例如醫療、法律、學術、新聞),以便搜尋僅限於精選網域。 給您的 AI 客戶端的範例提示: - 「使用臨床鏡頭搜尋 SGLT2 抑制劑的最新發現。」 您還可以透過在 lenses/ 下添加帶有網域允許列表的 JSON 文件來創建自定義鏡頭。 來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
8) 要求您的 AI 使用核心工具 (常見工作流程): 連接後,您的 AI 可以呼叫以下工具: - web_search: 搜尋網路 (可選帶有鏡頭) - scrape_page: 完整讀取 URL (網頁、PDF、DOCX、PPTX、YouTube 轉錄稿) - search_and_scrape: 搜尋然後自動讀取頂部結果 - news_search / image_search: 當您的供應商支援時 - academic_search / patent_search / legal_search / filing_search / econ_search / clinical_search: 專業資料庫 - verify_citation / audit_bibliography / format_bibliography: 引文工作流程 - sequential_search: 多步驟深度研究 來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
9) 使用引導式提示模板進行可重複的研究: 使用內建的提示模板 (如果您的客戶端支援提示選擇) 來運行結構化工作流程: - comprehensive-research (綜合研究) - fact-check (事實查核) - competitive-analysis (競爭分析) - literature-review (文獻回顧) 這些模板引導多步驟研究,因此您無需指定每個指令。 來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
10) 排除常見問題 (快速修復): 如果工具因「API 金鑰」錯誤而失敗:在您的 MCP 客戶端配置環境區塊中設置金鑰 (不僅在 shell 配置檔中)。 如果頁面返回為空:JavaScript 繁重的網站需要 Chromium;二進位檔會在首次使用時自動下載 Chromium (~200MB)。您可以將 CHROME_PATH 設置為現有的 Chrome 安裝。Docker 映像包含 Chromium。 如果升級後快取過時:刪除快取目錄 (例如 macOS 上的 ~/Library/Caches/web-researcher-mcp/) 或設置 CACHE_DIR。 如果您遇到供應商速率限制 (429):切換供應商或配置 SEARCH_ROUTING 進行故障轉移。 來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
11) (團隊) 在 HTTP 模式下運行並將客戶端連接到共享端點: 對於共享/團隊設置,將伺服器作為 HTTP 服務運行,並將 MCP 客戶端連接到 http://localhost:3000/mcp/。 範例: - PORT=3000 OAUTH_ISSUER_URL=https://auth.example.com OAUTH_AUDIENCE=https://api.example.com ./web-researcher-mcp Docker Compose 範例: services: web-researcher: image: zoharbabin/web-researcher-mcp ports: - "3000:3000" environment: PORT: "3000" SEARCH_PROVIDER: brave BRAVE_API_KEY: ${BRAVE_API_KEY} 來源:https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt

Web Researcher MCP 常見問題

Web Researcher MCP 是一個開源的模型上下文協議(MCP)伺服器,它賦予 AI 助理網路研究能力(網路搜尋、全頁提取,以及學術/專利/法律等專業搜尋),並著重於提供有根據的答案和真實、可驗證的引用。它在您的機器上本地運行,而非作為託管服務。

与 Web Researcher MCP 类似的最新 AI 工具

Jorpex
Jorpex
Jorpex 是一個全面的標案通知平台,從歐洲各國聚合並即時交付標案警報到 Slack,幫助企業永不錯過機會。
Leadsmrt
Leadsmrt
Leadsmrt 是一個潛在客戶獲取工具,幫助企業從 Google 地圖中抓取、驗證和個性化目標商業潛在客戶,具有 AI 驅動的個性化功能。
Omnial AI
Omnial AI
Omnial AI是一個數據智能平台,利用AI代理將網絡提示轉化為結構化、可操作的數據見解,並由Afore Capital支持。
SERPrecon
SERPrecon
SERPrecon 是一個先進的 SEO 工具,利用向量、機器學習和自然語言處理,幫助用戶通過使用現代搜索引擎的相同方法來分析和超越競爭對手。