PandaProbe 能帮助我解决什么问题？

它通过提供一个统一的代理开发生命周期平台，包括跟踪（捕获代理运行的每个步骤）、评估和指标以及监控，帮助您将代理投入生产。

PandaProbe 中的跟踪如何工作？

PandaProbe 可以通过一次 instrument() 调用自动跟踪完整的代理运行，捕获跨链、代理、LLM 调用和工具调用的范围，同时跟踪模型参数、令牌使用和元数据。

有哪些部署选项可用？

您可以使用 PandaProbe Cloud（由 PandaProbe 托管）或自行托管开源版本。

自行托管 PandaProbe 是免费的吗？

是的。开源（自行托管）选项是免费的，包含 Apache 2.0 许可证下的所有核心平台功能和 API。

我需要信用卡才能开始使用 PandaProbe Cloud 吗？

不需要。Hobby 计划是 $0/永久，并且声明不需要信用卡。

PandaProbe Cloud 的定价层级有哪些？

云计划包括 Hobby（$0/永久）、Pro（$29/月）、Startup（$299/月）和 Enterprise（自定义定价）。

PandaProbe

Q: PandaProbe 支持哪些框架和提供商？

PandaProbe 的 Python SDK 提供了与流行的代理框架和提供商的集成，包括 LangGraph、LangChain、CrewAI、Google ADK、Claude Agent SDK、OpenAI Agents SDK、OpenAI、Gemini 和 Anthropic，并支持自定义检测。

WebsiteAI DevOps Assistant AI Code Assistant

PandaProbe 是一个开源、可自托管的代理工程平台，提供追踪、评估、指标和实时监控，以在生产规模上调试和改进 AI 代理。

访问网站

推广此工具

https://www.pandaprobe.com/?ref=producthunt&utm_source=aipure

概述
视频
替代方案

产品信息

更新于：2026年05月19日

什么是 PandaProbe

PandaProbe 是 Chirpz AI 推出的一个开源（Apache 2.0）代理工程平台，旨在帮助开发人员理解、调试和持续改进 AI 代理。它通过提供一个统一的平台来捕获详细的执行追踪、运行评估、跟踪指标和监控代理行为，从而专注于完整的代理开发生命周期——从早期实验到生产运营。PandaProbe 可以通过 PandaProbe Cloud 或自托管使用，具有相同的核心平台功能和 API，旨在减少供应商锁定，同时支持实际的可扩展性需求。

PandaProbe 的主要功能

PandaProbe 是一个开源的、可自托管的代理工程平台 (Apache 2.0)，通过提供端到端的可观测性和改进工具——追踪、评估、指标和实时监控，将 AI 代理投入生产。它通过 Python SDK 与流行的代理框架和 LLM 提供商集成，并提供即插即用的检测（例如，单个 instrument() 调用）来捕获详细的运行数据，如工具调用、LLM 跳数、令牌使用和元数据，使团队能够在不被供应商锁定的情况下，大规模调试、衡量和持续改进代理行为。

一键式端到端追踪: 通过单个 instrument() 设置自动捕获完整的代理运行（链、代理、LLM 调用、工具调用），包括令牌使用和关键元数据，以便快速调试。

持续改进的评估和指标: 支持评估运行和指标跟踪，以衡量代理随时间的质量，并在部署前后验证更改。

生产代理的实时监控: 提供监控功能，以观察实际使用中的代理行为，帮助检测回归、故障或性能问题。

广泛的生态系统集成: 与常见的代理框架和提供商（例如 LangGraph、LangChain、CrewAI、Google ADK、OpenAI、Anthropic、Gemini）配合使用，并支持自定义检测。

可自托管的开源核心: 所有核心平台功能和 API 都可以在您自己的环境中免费部署和运行，从而实现定制并避免供应商锁定。

云和可扩展的部署选项: 为团队提供基于使用量的扩展和更高限制的托管计划，同时与自托管核心保持一致，以实现灵活性。

PandaProbe 的使用场景

调试复杂的多工具代理: 工程团队可以追踪每个 LLM 跳数和工具调用，以查明代理工作流中的故障、幻觉触发器或脆弱的工具集成。

代理发布的质量门控: 产品团队可以运行评估/指标来比较不同版本的提示、工具或模型，并在发布到生产环境之前防止回归。

客户支持代理的生产监控: 支持组织可以监控真实的对话、延迟和故障模式，以提高可靠性并减少升级。

受监管行业中符合法规的部署: 金融/医疗保健/公共部门团队可以自托管，将追踪数据保存在受控环境中，同时仍能获得可观测性和评估工具。

性能优化和成本控制: 平台/ML 运维团队可以使用令牌使用和运行元数据来识别昂贵的步骤，优化模型选择，并降低推理成本。

优点

开源 (Apache 2.0) 且可自托管，无供应商锁定

强大的可观测性重点：追踪以及评估/指标和监控，涵盖整个生命周期

通过 Python SDK 和与流行框架/提供商的即插即用集成，易于采用

缺点

自托管时，完整功能可能需要操作工作（部署、扩展、维护）

生态系统广度意味着不同集成之间的深度/覆盖范围因框架特性而异

如何使用 PandaProbe

1) 选择您的部署方式（云端或自托管开源版）: 如果您希望 PandaProbe 为您托管，请通过 https://app.pandaprobe.com/ 使用 PandaProbe Cloud。如果您不希望供应商锁定并希望自行运行，请从 https://github.com/chirpz-ai/pandaprobe 部署开源（Apache 2.0）版本（该网站声明所有核心功能/API 均可用，并且自托管是免费的）。

2) 创建/访问 PandaProbe 工作区: 对于云端：请登录 https://app.pandaprobe.com/ 并为您的代理运行创建一个项目/工作区。对于开源版：完成仓库文档中的部署步骤，然后打开您的自托管 PandaProbe UI/API 端点并在那里创建一个项目/工作区。

3) 将 PandaProbe Python SDK 添加到您的代理代码库中: 使用 PandaProbe Python SDK（从网站链接为“Python SDK”，地址为 https://github.com/chirpz-ai/pandaprobe-sdk）。将其安装在您的代理运行的同一环境中，以便它可以发出追踪/指标/评估数据。

4) 选择与您的代理框架匹配的集成（或使用自定义检测）: PandaProbe 支持与常见堆栈（网站上显示）的即插即用集成：LangGraph、LangChain、CrewAI、Google ADK、Claude Agent SDK、OpenAI Agents SDK，以及 OpenAI、Gemini 和 Anthropic 的包装器。选择与您的框架匹配的集成以获得自动端到端追踪。

5) 检测您的代理运行（启动时单次调用）: 在应用程序启动时（在创建/运行代理之前）调用集成适配器的 instrument() 一次，以便 PandaProbe 可以自动追踪完整的运行（链/代理/LLM 调用/工具调用）。官方网站上的示例使用 Google ADK： from pandaprobe.integrations.google_adk import GoogleADKAdapter adapter = GoogleADKAdapter( session_id="session-abc", user_id="user-123", tags=["production"], ) adapter.instrument() 在此之后，ADK 运行器将被追踪（包括令牌使用和 TTFT，根据网站）。

6) 正常运行您的代理以生成追踪: 像往常一样执行您的代理工作流。启用检测后，PandaProbe 会捕获整个运行中的 span 并记录元数据，例如模型类型/参数、令牌使用和其他关键字段（如官方网站上“追踪”部分所述）。

7) 在 PandaProbe 中检查追踪以调试行为: 打开 PandaProbe（云端 UI 或您的自托管 UI）并查看会话的捕获追踪。使用 span 分解来查看每个跳跃——LLM 调用、工具调用、链/代理步骤——并识别错误、延迟或意外输出发生的位置。

8) 添加评估和指标以衡量随时间变化的质量: 使用 PandaProbe 的“评估和指标”功能（列为核心功能）来评估追踪/会话并跟踪性能。这有助于您通过比较运行和监控质量信号，从一次性调试转向持续改进。

9) 启用监控以实现持续的生产可见性: 使用 PandaProbe 的“监控”功能（列为核心功能）来保持对生产中代理运行的可见性——这样您就可以在部署后发现回归、故障或性能变化。

10) 迭代：修复提示/工具/逻辑，然后重新运行并比较: 更改您的代理（提示、工具选择、路由逻辑、模型选择），使用相同的检测重新运行，并将新的追踪/评估/指标与之前的运行进行比较，以验证改进。