Web Researcher MCP
Web Researcher MCP là một máy chủ MCP cục bộ, cấp sản xuất cho phép các trợ lý AI tìm kiếm web (tùy chọn giới hạn trong các “ống kính tìm kiếm” đáng tin cậy), đọc toàn bộ nguồn (bao gồm các trang được hiển thị bằng JS, PDF và bản ghi YouTube), và trả về các trích dẫn có thể xác minh với chuyển đổi dự phòng đa nhà cung cấp. [Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]
https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt&utm_source=aipure

Thông tin Sản phẩm
Đã cập nhật:Jun 16, 2026
Web Researcher MCP là gì
Web Researcher MCP là một máy chủ Giao thức Ngữ cảnh Mô hình (MCP) mã nguồn mở được thiết kế để cung cấp cho các trợ lý AI (ví dụ: Claude, Cursor và các máy khách tương thích MCP khác) khả năng nghiên cứu web đáng tin cậy, dựa trên nguồn. Nó tập trung vào “các nguồn thực tế bạn có thể tin cậy” bằng cách cho phép bạn tìm kiếm toàn bộ web hoặc chỉ các miền cụ thể, được quản lý, sau đó trích xuất và phân tích toàn bộ nội dung thay vì các đoạn trích—tạo ra các liên kết hoạt động và các trích dẫn được định dạng. Dự án được phát hành dưới dạng một tệp nhị phân Go duy nhất với nhiều tùy chọn cài đặt (ví dụ: Homebrew, tập lệnh cài đặt, Docker hoặc uvx thân thiện với Python) và có thể chạy ở chế độ STDIO cục bộ hoặc dưới dạng dịch vụ HTTP cho các thiết lập dùng chung/nhóm. [Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt]
Các Tính năng Chính của Web Researcher MCP
Web Researcher MCP là một máy chủ MCP cấp độ sản xuất tích hợp các trợ lý AI (ví dụ: Claude, Cursor, VS Code) vào nghiên cứu web trực tiếp, có nguồn gốc. Nó có thể tìm kiếm web (với "ống kính tìm kiếm" tùy chọn giới hạn kết quả trong các miền đáng tin cậy), đọc và trích xuất nội dung đầy đủ từ URL (bao gồm các trang nặng JavaScript thông qua quy trình trình duyệt tự động), và xử lý nhiều quy trình làm việc cụ thể cho nghiên cứu như tra cứu học thuật và bằng sáng chế, tìm kiếm tin tức, xác minh/kiểm tra trích dẫn và xuất các phiên nghiên cứu có thể tái tạo với nguồn gốc. Nó được thiết kế để ưu tiên các nguồn có thể kiểm chứng và trích dẫn đáng tin cậy, hỗ trợ nhiều nhà cung cấp tìm kiếm có thể hoán đổi cho nhau với tính năng chuyển đổi dự phòng tự động và chạy cục bộ để nghiên cứu tập trung vào quyền riêng tư.
Ống kính tìm kiếm (định tuyến nguồn đáng tin cậy): Hạn chế tìm kiếm trong các danh sách miền được tuyển chọn (có sẵn hoặc tùy chỉnh) để kết quả chỉ đến từ các nguồn bạn tin cậy (ví dụ: PubMed, SEC, tòa án, tài liệu chính thức) thay vì thư rác và nội dung chất lượng thấp của web mở.
Tìm kiếm đa nhà cung cấp với chuyển đổi dự phòng: Hoạt động với nhiều nhà cung cấp tìm kiếm (ví dụ: DuckDuckGo không cấu hình, Google PSE, Brave, Serper, SearXNG, Tavily, Exa) và có thể tự động chuyển đổi dự phòng khi một nhà cung cấp bị giới hạn tốc độ hoặc không khả dụng.
Trích xuất toàn trang (bao gồm các trang web được hiển thị bằng JS): Đọc toàn bộ trang web và tài liệu—không chỉ các đoạn trích—sử dụng quy trình cạo dữ liệu phân cấp và hiển thị Chromium tùy chọn cho các trang nặng JavaScript; cũng hỗ trợ trích xuất PDF/tài liệu Office và bản ghi YouTube.
Quy trình làm việc trích dẫn cấp độ nghiên cứu: Cung cấp các công cụ để xác minh trích dẫn, kiểm tra toàn bộ thư mục để tìm các liên kết chết/rút lại/mục không thể xác minh, và định dạng thư mục (APA/MLA/BibTeX/RIS/CSL-JSON) để sử dụng trong học thuật hoặc chuyên nghiệp.
Các phiên nghiên cứu sâu, có thể tái tạo: Hỗ trợ nghiên cứu đa bước tuần tự với tính năng duy trì và xuất phiên (markdown/JSON) bao gồm nguồn gốc từng bước; bao gồm các tài nguyên chẩn đoán và trạng thái cho các công cụ, phiên, nhà cung cấp và giới hạn tốc độ.
Các công cụ tìm kiếm chuyên biệt theo chiều dọc: Bao gồm các công cụ được xây dựng có mục đích cho các bài báo học thuật (DOI, tác giả, trích dẫn), bằng sáng chế (USPTO/EPO/Lens với các phương án dự phòng), hồ sơ SEC (EDGAR), ý kiến/hồ sơ pháp lý (CourtListener), kinh tế (Ngân hàng Thế giới/FRED) và thử nghiệm lâm sàng (ClinicalTrials.gov).
Các Trường hợp Sử dụng của Web Researcher MCP
Đánh giá tài liệu học thuật & R&D: Các nhà nghiên cứu có thể thực hiện tìm kiếm tài liệu có cấu trúc, thu thập các nguồn được hỗ trợ bởi DOI, duyệt qua các khu vực trích dẫn và xuất các thư mục được định dạng đúng cho các bài báo, tài trợ hoặc đánh giá kỹ thuật nội bộ.
Nghiên cứu pháp lý & hỗ trợ kiện tụng: Các công ty luật và nhóm tuân thủ có thể tìm kiếm các ý kiến/hồ sơ tòa án thực tế, xác minh các trích dẫn vụ án và lưu trữ các nguồn để đảm bảo các tham chiếu vẫn có thể kiểm chứng được cho các hồ sơ và sản phẩm bàn giao cho khách hàng.
Tài chính & thẩm định: Các nhà phân tích có thể lấy các hồ sơ SEC EDGAR, đối chiếu tin tức và các nguồn chính, và tạo ra các báo cáo nghiên cứu có thể kiểm toán với các liên kết mà khách hàng có thể nhấp và xác minh.
Chăm sóc sức khỏe & thông tin tình báo lâm sàng: Các nhà nghiên cứu y tế và nhóm chính sách có thể tập trung tìm kiếm vào các nguồn lâm sàng và y sinh, truy xuất bằng chứng toàn văn nếu có, và theo dõi đăng ký và tình trạng thử nghiệm lâm sàng (hướng đến khám phá, không phải lời khuyên y tế).
Thông tin tình báo cạnh tranh và thị trường: Các nhóm sản phẩm và chiến lược có thể theo dõi tin tức, quét bằng sáng chế và tổng hợp phân tích cạnh tranh đa nguồn trong khi vẫn giữ một dấu vết có thể tái tạo về cách các kết luận đã đạt được.
Tài liệu kỹ thuật và nghiên cứu sự cố: Các nhà phát triển và nhóm SRE có thể sử dụng các ống kính tập trung vào tài liệu để tìm kiếm các tài liệu tham khảo chính thức, cạo toàn bộ trang (bao gồm các tài liệu nặng JS) và biên soạn các bản tóm tắt có căn cứ để khắc phục sự cố và đưa ra các quyết định thiết kế.
Ưu điểm
Kiểm soát nguồn thông qua ống kính: Bạn có thể giới hạn nghiên cứu trong các miền đã được kiểm duyệt, cải thiện độ tin cậy và giảm thư rác/nhiễu SEO.
Công cụ nghiên cứu từ đầu đến cuối: Kết hợp tìm kiếm, trích xuất nội dung đầy đủ, xác minh/kiểm tra trích dẫn và xuất phiên với nguồn gốc trong một máy chủ MCP.
Tính linh hoạt và khả năng phục hồi của nhà cung cấp: Nhiều công cụ tìm kiếm phụ trợ với tính năng chuyển đổi dự phòng tự động tùy chọn; cũng cung cấp tính năng chuyển đổi dự phòng DuckDuckGo không cấu hình.
Thực thi cục bộ ưu tiên quyền riêng tư: Các truy vấn đi từ máy của bạn đến các nhà cung cấp bạn đã chọn thay vì thông qua các máy chủ của công cụ.
Nhược điểm
Các khả năng tốt nhất thường yêu cầu khóa API: Tìm kiếm chất lượng cao hơn, tin tức/hình ảnh và một số công cụ nâng cao phụ thuộc vào việc cấu hình các nhà cung cấp và thông tin xác thực của bên thứ ba.
Cạo dữ liệu nặng hơn có thể tải xuống/chạy Chromium: Hiển thị JavaScript có thể yêu cầu tải xuống trình duyệt lớn (~200MB) và có thể chậm hơn so với trích xuất đơn giản.
Giới hạn và sự thay đổi của nguồn cấp: Giới hạn tốc độ, phạm vi phủ sóng và độ mới phụ thuộc vào (các) nhà cung cấp tìm kiếm được chọn và các gói miễn phí/trả phí của họ.
Cách Sử dụng Web Researcher MCP
1) Cài đặt Web Researcher MCP (nhanh nhất: uvx): Cài đặt uv (một lần), sau đó chạy máy chủ MCP thông qua uvx.
macOS/Linux:
- curl -LsSf https://astral.sh/uv/install.sh | sh
Sau đó:
- claude mcp add --scope user web-researcher -- uvx web-researcher-mcp
Thao tác này tìm nạp tệp nhị phân được xây dựng sẵn chính xác cho hệ điều hành của bạn và chạy nó (không cần bộ công cụ Go). Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
2) Các cách cài đặt thay thế (chọn một): macOS (Homebrew):
- brew install zoharbabin/tap/web-researcher-mcp
- claude mcp add --scope user web-researcher -- web-researcher-mcp
macOS/Linux (trình cài đặt curl):
- curl -fsSL https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.sh | sh
Windows (trình cài đặt PowerShell):
- powershell -ExecutionPolicy Bypass -c "irm https://raw.githubusercontent.com/zoharbabin/web-researcher-mcp/main/install.ps1 | iex"
Các tùy chọn khác:
- winget install zoharbabin.web-researcher-mcp
- scoop bucket add zoharbabin https://github.com/zoharbabin/scoop-bucket && scoop install web-researcher-mcp
- brew install --cask zoharbabin/tap/web-researcher-mcp
- go install github.com/zoharbabin/web-researcher-mcp/cmd/web-researcher-mcp@latest
- docker run -i --rm -e GOOGLE_CUSTOM_SEARCH_API_KEY=YOUR_KEY -e GOOGLE_CUSTOM_SEARCH_ID=YOUR_CX docker.io/zoharbabin/web-researcher-mcp:latest
Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
3) Kết nối nó với máy khách MCP của bạn (cấu hình JSON chung): Nếu ứng dụng của bạn không phải là luồng CLI của Claude Code, hãy thêm một mục máy chủ MCP vào cấu hình máy khách của bạn.
Ví dụ (Google PSE):
{
"mcpServers": {
"web-researcher": {
"command": "web-researcher-mcp",
"env": {
"SEARCH_PROVIDER": "google",
"GOOGLE_CUSTOM_SEARCH_API_KEY": "YOUR_GOOGLE_API_KEY",
"GOOGLE_CUSTOM_SEARCH_ID": "YOUR_SEARCH_ENGINE_ID"
}
}
}
}
Ví dụ (Brave):
{
"mcpServers": {
"web-researcher": {
"command": "web-researcher-mcp",
"env": {
"SEARCH_PROVIDER": "brave",
"BRAVE_API_KEY": "YOUR_BRAVE_API_KEY"
}
}
}
}
Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
4) Chạy không cần cấu hình (dự phòng DuckDuckGo): Nếu bạn không đặt SEARCH_PROVIDER hoặc bất kỳ khóa API nào, Web Researcher MCP vẫn hoạt động ngay lập tức bằng cách sử dụng DuckDuckGo làm dự phòng tích hợp (không yêu cầu khóa API). Điều này hữu ích để xác thực thiết lập của bạn trước khi thêm khóa nhà cung cấp.
Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
5) (Khuyến nghị) Thêm khóa nhà cung cấp tìm kiếm để cải thiện chất lượng và mở khóa nhiều tính năng hơn: Đặt SEARCH_PROVIDER và (các) khóa phù hợp. Các nhà cung cấp được hỗ trợ bao gồm DuckDuckGo (không có khóa), Google PSE, Brave, Serper, SearchAPI.io, SearXNG, Tavily, Exa và Hacker News.
Ví dụ biến môi trường:
- SEARCH_PROVIDER=brave
- BRAVE_API_KEY=...
Hoặc Google PSE:
- SEARCH_PROVIDER=google
- GOOGLE_CUSTOM_SEARCH_API_KEY=...
- GOOGLE_CUSTOM_SEARCH_ID=...
Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
6) (Tùy chọn) Cấu hình chuyển đổi dự phòng đa nhà cung cấp: Để tránh thời gian chết/giới hạn tốc độ, hãy cấu hình nhiều nhà cung cấp để máy chủ tự động chuyển đổi dự phòng.
Ví dụ:
- SEARCH_ROUTING=brave,google,serper
- BRAVE_API_KEY=...
- GOOGLE_CUSTOM_SEARCH_API_KEY=...
- GOOGLE_CUSTOM_SEARCH_ID=...
- SERPER_API_KEY=...
Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
7) Sử dụng “ống kính tìm kiếm” để giới hạn kết quả cho các nguồn đáng tin cậy: Khi bạn muốn độ tin cậy cao hơn và ít thư rác hơn, hãy sử dụng một ống kính tích hợp (ví dụ: y tế, pháp lý, học thuật, tin tức) để các tìm kiếm được giới hạn trong các miền được quản lý.
Ví dụ lời nhắc cho máy khách AI của bạn:
- “Tìm kiếm các phát hiện gần đây về thuốc ức chế SGLT2 bằng cách sử dụng ống kính lâm sàng.”
Bạn cũng có thể tạo các ống kính tùy chỉnh bằng cách thêm một tệp JSON trong thư mục lenses/ với danh sách cho phép miền.
Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
8) Yêu cầu AI của bạn sử dụng các công cụ cốt lõi (quy trình làm việc phổ biến): Sau khi được kết nối, AI của bạn có thể gọi các công cụ như:
- web_search: tìm kiếm web (tùy chọn với ống kính)
- scrape_page: đọc toàn bộ URL (trang web, PDF, DOCX, PPTX, bản ghi YouTube)
- search_and_scrape: tìm kiếm sau đó tự động đọc các kết quả hàng đầu
- news_search / image_search: khi được nhà cung cấp của bạn hỗ trợ
- academic_search / patent_search / legal_search / filing_search / econ_search / clinical_search: cơ sở dữ liệu chuyên biệt
- verify_citation / audit_bibliography / format_bibliography: quy trình làm việc trích dẫn
- sequential_search: nghiên cứu sâu nhiều bước
Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
9) Sử dụng các mẫu lời nhắc có hướng dẫn để nghiên cứu lặp lại: Sử dụng các mẫu lời nhắc tích hợp (nơi máy khách của bạn hỗ trợ lựa chọn lời nhắc) để chạy các quy trình làm việc có cấu trúc:
- comprehensive-research
- fact-check
- competitive-analysis
- literature-review
Các mẫu này hướng dẫn nghiên cứu nhiều bước để bạn không phải chỉ định mọi hướng dẫn.
Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
10) Khắc phục sự cố thường gặp (sửa lỗi nhanh): Nếu các công cụ bị lỗi với lỗi “khóa API”: đặt khóa trong khối env cấu hình máy khách MCP của bạn (không chỉ trong hồ sơ shell).
Nếu các trang trống rỗng: các trang web nặng JavaScript yêu cầu Chromium; tệp nhị phân tự động tải xuống Chromium khi sử dụng lần đầu (~200MB). Bạn có thể đặt CHROME_PATH thành một cài đặt Chrome hiện có. Hình ảnh Docker bao gồm Chromium.
Nếu bộ nhớ cache bị lỗi thời sau khi nâng cấp: xóa thư mục bộ nhớ cache (ví dụ: ~/Library/Caches/web-researcher-mcp/ trên macOS) hoặc đặt CACHE_DIR.
Nếu bạn gặp giới hạn tốc độ của nhà cung cấp (429): chuyển đổi nhà cung cấp hoặc cấu hình SEARCH_ROUTING để chuyển đổi dự phòng.
Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
11) (Nhóm) Chạy ở chế độ HTTP và kết nối máy khách với một điểm cuối dùng chung: Đối với các thiết lập dùng chung/nhóm, hãy chạy máy chủ dưới dạng dịch vụ HTTP và kết nối các máy khách MCP với http://localhost:3000/mcp/.
Ví dụ:
- PORT=3000 OAUTH_ISSUER_URL=https://auth.example.com OAUTH_AUDIENCE=https://api.example.com ./web-researcher-mcp
Ví dụ Docker Compose:
services:
web-researcher:
image: zoharbabin/web-researcher-mcp
ports:
- "3000:3000"
environment:
PORT: "3000"
SEARCH_PROVIDER: brave
BRAVE_API_KEY: ${BRAVE_API_KEY}
Nguồn: https://github.com/zoharbabin/web-researcher-mcp?ref=producthunt
Câu hỏi Thường gặp về Web Researcher MCP
Web Researcher MCP là một máy chủ Giao thức Ngữ cảnh Mô hình (MCP) mã nguồn mở, cung cấp cho các trợ lý AI khả năng nghiên cứu web (tìm kiếm web, trích xuất toàn trang và các tìm kiếm chuyên biệt như học thuật/bằng sáng chế/pháp lý), với trọng tâm là các câu trả lời có căn cứ và các trích dẫn thực tế, có thể kiểm chứng. Nó chạy cục bộ trên máy của bạn thay vì dưới dạng một dịch vụ được lưu trữ.
Video Web Researcher MCP
Bài viết phổ biến

Atoms: Nền tảng AI đa tác nhân biến ý tưởng thành sản phẩm sẵn sàng ra mắt
May 22, 2026

Nano Banana SBTI: Nó là gì, Cách thức hoạt động và Cách sử dụng nó vào năm 2026
Apr 15, 2026

Đánh giá Atoms — Trình tạo sản phẩm AI định nghĩa lại việc tạo nội dung số vào năm 2026
Apr 10, 2026

Kilo Claw: Cách Triển Khai và Sử Dụng AI Agent "Làm-Thay-Bạn" Thực Sự (Cập Nhật 2026)
Apr 3, 2026







