Web Researcher MCP
Web Researcher MCP 是一个本地的、生产级的 MCP 服务器,它允许 AI 助手搜索网络(可选地限制在可信的“搜索镜头”内)、读取完整来源(包括 JS 渲染页面、PDF 和 YouTube 转录),并返回带有可验证引用的结果,支持多提供商故障转移。 [来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]
https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt&utm_source=aipure

产品信息
更新于:2026年06月16日
什么是 Web Researcher MCP
Web Researcher MCP 是一个开源的模型上下文协议(MCP)服务器,旨在为 AI 助手(例如 Claude、Cursor 和其他 MCP 兼容客户端)提供可靠的、基于来源的网络研究能力。它通过允许您搜索整个网络或仅搜索特定、精选的域,然后提取和分析完整内容而非片段,从而专注于“您可以信任的真实来源”——生成可用的链接和格式化的引用。该项目以单个 Go 二进制文件形式发布,具有多种安装选项(例如 Homebrew、安装脚本、Docker 或 Python 友好的 uvx),并且可以在本地 STDIO 模式下运行,也可以作为 HTTP 服务用于共享/团队设置。 [来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]
Web Researcher MCP 的主要功能
Web Researcher MCP 是一个生产级的 MCP 服务器,它将 AI 助手(例如 Claude、Cursor、VS Code)连接到实时的、以来源为基础的网络研究中。它可以搜索网络(可选“搜索透镜”将结果限制在受信任的域中),从 URL 读取和提取完整内容(包括通过自动化浏览器管道处理 JavaScript 繁重的页面),并处理许多研究特定的工作流程,例如学术和专利查询、新闻搜索、引用验证/审计,以及导出可重现的带有出处的研讨会。它旨在优先考虑可验证的来源和可靠的引用,支持多个可互换的搜索提供商并具有自动故障转移功能,并且在本地运行以进行注重隐私的研究。
搜索透镜(可信来源路由): 将搜索限制在精选的域列表(内置或自定义)中,以便结果仅来自您信任的来源(例如 PubMed、SEC、法院、官方文档),而不是开放网络的垃圾邮件和低质量内容。
多提供商搜索与故障转移: 与多个搜索提供商(例如 DuckDuckGo 零配置、Google PSE、Brave、Serper、SearXNG、Tavily、Exa)协同工作,并且在一个提供商受到速率限制或不可用时可以自动回退。
全页提取(包括 JS 渲染的网站): 使用分层抓取管道和可选的 Chromium 渲染(用于 JavaScript 繁重的页面)读取完整的网页和文档,而不仅仅是片段;还支持 PDF/Office 文档和 YouTube 字幕提取。
研究级引用工作流程: 提供工具来验证引用,审计整个参考文献中是否存在死链接/撤回/不可验证的条目,并格式化参考文献(APA/MLA/BibTeX/RIS/CSL-JSON),以供下游学术或专业使用。
深入、可重现的研究会话: 支持具有会话持久性和导出(markdown/JSON)的顺序多步骤研究,包括每一步的出处;包括用于工具、会话、提供商和速率限制的诊断和状态资源。
专业垂直搜索工具: 包括用于学术论文(DOI、作者、引用)、专利(USPTO/EPO/Lens 及其回退)、SEC 文件(EDGAR)、法律意见/案卷(CourtListener)、经济学(世界银行/FRED)和临床试验(ClinicalTrials.gov)的专用工具。
Web Researcher MCP 的使用场景
学术和研发文献综述: 研究人员可以运行结构化的文献搜索,收集 DOI 支持的来源,遍历引用邻域,并为论文、拨款或内部技术审查导出格式正确的参考文献。
法律研究和诉讼支持: 律师事务所和合规团队可以搜索真实的法院意见/案卷,验证案件引用,并存档来源,以确保参考文献在备案和客户交付物中保持可验证性。
金融和尽职调查: 分析师可以获取 SEC EDGAR 文件,三角验证新闻和主要来源,并生成可审计的研究报告,其中包含客户可以点击和验证的链接。
医疗保健和临床智能: 医学研究人员和政策团队可以将搜索重点放在临床和生物医学来源上,在可用时检索全文证据,并跟踪临床试验注册和状态(面向发现,非医疗建议)。
竞争和市场情报: 产品和战略团队可以监控新闻,扫描专利,并综合多来源的竞争分析,同时保留可重现的决策过程记录。
工程文档和事件研究: 开发人员和 SRE 团队可以使用以文档为中心的透镜来搜索官方参考资料,抓取完整页面(包括 JavaScript 繁重的文档),并编制有根据的摘要,用于故障排除和设计决策。
优点
通过透镜进行源控制:您可以将研究限制在经过审查的域中,从而提高可靠性并减少垃圾邮件/SEO 噪音。
端到端研究工具:在一个 MCP 服务器中结合了搜索、全内容提取、引用验证/审计和带有出处的会话导出。
提供商灵活性和弹性:多个搜索后端,可选自动故障转移;还提供零配置的 DuckDuckGo 回退。
注重隐私的本地执行:查询从您的机器发送到您选择的提供商,而不是通过工具自己的服务器。
缺点
最佳功能通常需要 API 密钥:更高质量的搜索、新闻/图像以及一些高级工具依赖于配置第三方提供商和凭据。
更繁重的抓取可能会下载/运行 Chromium:JavaScript 渲染可能需要大量浏览器下载(约 200MB),并且可能比简单提取慢。
上游限制和可变性:速率限制、覆盖范围和新鲜度取决于所选的搜索提供商及其免费/付费层级。
如何使用 Web Researcher MCP
1) 安装 Web Researcher MCP(最快:uvx): 安装 uv(一次性),然后通过 uvx 运行 MCP 服务器。
macOS/Linux:
- curl -LsSf https://astral.sh/uv/install.sh | sh
然后:
- claude mcp add --scope user web-researcher -- uvx web-researcher-mcp
这将为您的操作系统获取正确的预构建二进制文件并运行它(无需 Go 工具链)。来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
2) 替代安装(选择一个): macOS (Homebrew):
- brew install zoharbabin/tap/web-researcher-mcp
- claude mcp add --scope user web-researcher -- web-researcher-mcp
macOS/Linux (curl 安装程序):
- curl -fsSL https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.sh | sh
Windows (PowerShell 安装程序):
- powershell -ExecutionPolicy Bypass -c "irm https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.ps1 | iex"
其他选项:
- winget install zoharbabin.web-researcher-mcp
- scoop bucket add zoharbabin https://github.com/zoharbabin/scoop-bucket && scoop install web-researcher-mcp
- brew install --cask zoharbabin/tap/web-researcher-mcp
- go install github.com/zoharbabin/web-researcher-mcp/cmd/web-researcher-mcp@latest
- docker run -i --rm -e GOOGLE_CUSTOM_SEARCH_API_KEY=YOUR_KEY -e GOOGLE_CUSTOM_SEARCH_ID=YOUR_CX docker.io/zoharbabin/web-researcher-mcp:latest
来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
3) 将其连接到您的 MCP 客户端(通用 JSON 配置): 如果您的应用程序不是 Claude Code 的 CLI 流程,请在您的客户端配置中添加一个 MCP 服务器条目。
示例 (Google PSE):
{
"mcpServers": {
"web-researcher": {
"command": "web-researcher-mcp",
"env": {
"SEARCH_PROVIDER": "google",
"GOOGLE_CUSTOM_SEARCH_API_KEY": "YOUR_GOOGLE_API_KEY",
"GOOGLE_CUSTOM_SEARCH_ID": "YOUR_SEARCH_ENGINE_ID"
}
}
}
}
示例 (Brave):
{
"mcpServers": {
"web-researcher": {
"command": "web-researcher-mcp",
"env": {
"SEARCH_PROVIDER": "brave",
"BRAVE_API_KEY": "YOUR_BRAVE_API_KEY"
}
}
}
}
来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
4) 零配置运行 (DuckDuckGo 备用): 如果您不设置 SEARCH_PROVIDER 或任何 API 密钥,Web Researcher MCP 仍然可以使用 DuckDuckGo 作为内置备用(无需 API 密钥)开箱即用。这有助于在添加提供商密钥之前验证您的设置。
来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
5) (推荐)添加搜索提供商密钥以提高质量并解锁更多功能: 设置 SEARCH_PROVIDER 和匹配的密钥。支持的提供商包括 DuckDuckGo(无需密钥)、Google PSE、Brave、Serper、SearchAPI.io、SearXNG、Tavily、Exa 和 Hacker News。
环境变量示例:
- SEARCH_PROVIDER=brave
- BRAVE_API_KEY=...
或 Google PSE:
- SEARCH_PROVIDER=google
- GOOGLE_CUSTOM_SEARCH_API_KEY=...
- GOOGLE_CUSTOM_SEARCH_ID=...
来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
6) (可选)配置多提供商故障转移: 为避免停机/速率限制,请配置多个提供商,以便服务器自动回退。
示例:
- SEARCH_ROUTING=brave,google,serper
- BRAVE_API_KEY=...
- GOOGLE_CUSTOM_SEARCH_API_KEY=...
- GOOGLE_CUSTOM_SEARCH_ID=...
- SERPER_API_KEY=...
来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
7) 使用“搜索镜头”将结果限制在可信来源: 当您需要更高的信任度和更少的垃圾信息时,请使用内置镜头(例如,医疗、法律、学术、新闻),以便搜索仅限于精选域。
给您的 AI 客户端的提示示例:
- “使用临床镜头搜索 SGLT2 抑制剂的最新发现。”
您还可以通过在 lenses/ 下添加一个包含域白名单的 JSON 文件来创建自定义镜头。
来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
8) 要求您的 AI 使用核心工具(常见工作流程): 连接后,您的 AI 可以调用以下工具:
- web_search: 搜索网络(可选带镜头)
- scrape_page: 完整读取 URL(网页、PDF、DOCX、PPTX、YouTube 转录)
- search_and_scrape: 搜索然后自动读取热门结果
- news_search / image_search: 当您的提供商支持时
- academic_search / patent_search / legal_search / filing_search / econ_search / clinical_search: 专业数据库
- verify_citation / audit_bibliography / format_bibliography: 引用工作流程
- sequential_search: 多步骤深度研究
来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
9) 使用引导式提示模板进行可重复研究: 使用内置的提示模板(如果您的客户端支持提示选择)来运行结构化工作流程:
- comprehensive-research(综合研究)
- fact-check(事实核查)
- competitive-analysis(竞争分析)
- literature-review(文献综述)
这些模板指导多步骤研究,因此您无需指定每个指令。
来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
10) 排除常见问题(快速修复): 如果工具因“API 密钥”错误而失败:在您的 MCP 客户端配置 env 块中设置密钥(而不仅仅是在 shell 配置文件中)。
如果页面返回为空:JavaScript 密集型网站需要 Chromium;二进制文件在首次使用时会自动下载 Chromium(约 200MB)。您可以将 CHROME_PATH 设置为现有的 Chrome 安装。Docker 镜像包含 Chromium。
如果升级后缓存过期:删除缓存目录(例如,macOS 上的 ~/Library/Caches/web-researcher-mcp/)或设置 CACHE_DIR。
如果您遇到提供商速率限制(429):切换提供商或配置 SEARCH_ROUTING 进行故障转移。
来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
11) (团队)在 HTTP 模式下运行并将客户端连接到共享端点: 对于共享/团队设置,将服务器作为 HTTP 服务运行,并将 MCP 客户端连接到 http://localhost:3000/mcp/。
示例:
- PORT=3000 OAUTH_ISSUER_URL=https://auth.example.com OAUTH_AUDIENCE=https://api.example.com ./web-researcher-mcp
Docker Compose 示例:
services:
web-researcher:
image: zoharbabin/web-researcher-mcp
ports:
- "3000:3000"
environment:
PORT: "3000"
SEARCH_PROVIDER: brave
BRAVE_API_KEY: ${BRAVE_API_KEY}
来源: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
Web Researcher MCP 常见问题
Web Researcher MCP 是一个开源模型上下文协议 (MCP) 服务器,它赋予 AI 助手网络研究能力(网络搜索、整页提取以及学术/专利/法律等专业搜索),重点在于提供有根据的答案和真实、可验证的引用。它在您的机器上本地运行,而不是作为托管服务。











