Heron

Heron

Heron 是一款被動、零入侵的 AI 代理可觀察性工具,它通過內置儀表板、指標和 SFT 數據導出,從網絡流量 (pcap/live/eBPF) 中重建代理回合和 LLM/工具交互——無需 SDK、無需代理、無需代碼更改。
https://github.com/Netis/heron?ref=producthunt&utm_source=aipure
Heron

產品資訊

更新時間:2026年06月29日

什麼是 Heron

Heron (Netis/heron) 將自己定位為「AI 代理的 Wireshark」:一種可觀察性產品,它允許您通過直接從捕獲的流量重建 AI 代理的行為,而不是通過檢測代碼或通過代理路由請求來查看 AI 代理正在做什麼。它專注於代理工作流程(規劃器 → 工具調用 → 結果 → 下一步)和 LLM 交互,提供本地 Web 控制台 (http://localhost:3000) 以探索時間線、每次調用的詳細信息、錯誤以及性能/使用指標。它支持無需權限重播捕獲的 .pcap 文件,通過 libpcap 進行實時捕獲(具有適當的功能),從遠程探測器可選地進行 ZMQ 攝取,以及實驗性的 Linux eBPF 模式,以在主機上的 SSL 邊界觀察 TLS 流量。

Heron 的主要功能

Heron (Netis/heron) 是一個用於 AI 代理的被動可觀察性工具——定位為「AI 代理的 Wireshark」——它直接從網路流量 (pcap/即時捕獲) 或主機級別的 TLS 邊界重建代理的輪次、工具調用和 LLM 互動,無需任何 SDK、代理或程式碼更改,也無需位於請求路徑中。它解析純文字 HTTP/SSE (或透過可選的 Linux eBPF SSL uprobes 捕獲解密內容),識別常見的 LLM 線路 API (OpenAI/Anthropic/Gemini 和 OpenAI 相容伺服器),建立時間線和服務拓撲圖,計算延遲/令牌指標,並將結果 (預設為 DuckDB,可選 ClickHouse) 儲存在本地 Web 控制台和 REST API 後面,並能夠將真實流量匯出為 SFT 就緒的資料集。
零入侵被動捕獲: 在線路外 (pcap 重放或即時介面) 或在主機的 TLS 邊界觀察 LLM/代理流量,無需 SDK 檢測、無需代理、無需客戶端程式碼更改——同時保持在請求路徑之外。
代理輪次重建: 將多調用代理工作流程 (規劃器 → 工具 → 結果 → 下一步) 縫合到單個可尋址的「輪次」中,並為 Claude Code 和 Codex CLI 等工具提供命名配置文件以及通用模式。
線路 API 檢測與語義解碼: 自動檢測和解碼流行的 LLM API (OpenAI Chat Completions/Responses、Anthropic Messages、Gemini) 並透過檢查線路上的位元組支援 OpenAI 相容的後端 (vLLM、SGLang、Ollama、llama.cpp、LM Studio、LiteLLM)。
帶有深度鑽取的即時控制台: 嵌入式 Web UI (localhost:3000) 用於時間線、每次調用的請求/回應檢查、代理會話/輪次、原始 HTTP、管道健康狀況以及性能、使用情況和錯誤的儀表板。
運營級指標和拓撲視圖: 計算 TTFT/E2E 延遲/TPOT、令牌吞吐量、錯誤率、調用量、延遲百分位數,並將服務到服務的路徑 (客戶端 → 代理 → 推理後端) 可視化為有向圖。
從真實流量匯出 SFT 軌跡: 將重建的輪次/會話匯出為 OpenAI 風格的消息 JSONL (包括工具調用/結果和結構化參數),將捕獲的代理運行轉換為微調數據。

Heron 的使用案例

代理調試與品質保證: 開發人員可以透過檢查重建的輪次和完整的請求/回應主體來診斷停滯的工具調用、計畫循環、格式錯誤的提示和意外輸出——而無需修改代理。
推理平台可觀察性: AI 平台團隊可以繪製真實的服務拓撲 (客戶端 → LiteLLM → vLLM/SGLang 等),測量每個跳轉的延遲,並根據觀察到的流量檢測靜默的模型/端點替換。
財務運營/成本歸因: 工程經理和財務運營可以根據實際流量的證據,而不是定期 SDK 匯出,按代理類型、模型、端點和會話歸因使用情況和性能。
合規性、審計和事件響應: 安全/合規團隊可以維護代理發送/接收內容的捕獲一次證據鏈 (在流量解密的情況下),支援審計和調查,而不會影響生產路徑。
用於模型訓練的資料集生成: ML 團隊可以透過將輪次/會話匯出為結構化的 JSONL,將真實的代理互動轉換為 SFT 資料集,保留工具調用結構和提供商線路格式。

優點

無需 SDK/代理,也不在請求路徑中,減少了部署摩擦並避免了觀察者引起的故障。
高保真可見性:捕獲完整的請求/回應主體 (當純文字可用時) 並重建更高級別的代理輪次,而不僅僅是每次調用的日誌。
透過線路級別檢測,與多個 LLM 提供商和 OpenAI 相容的推理伺服器具有廣泛的相容性。
可攜式分發:帶有嵌入式控制台的單個二進位文件;支援 pcap 重放以進行離線/CI 分析。

缺點

需要純文字 HTTP 可見性;加密流量需要放置在 TLS 終止之後或使用帶有額外功能的實驗性 Linux eBPF SSL-urobe 捕獲。
與明確的追蹤/SDK 標記相比,被動捕獲可能會限制跨分散式客戶端集群的端到端關聯。
某些格式僅部分支援;不支援的線路格式會被跳過/報告而不是解碼。
即時介面捕獲可能需要提升的權限/功能 (例如,Linux 上的 CAP_NET_RAW/CAP_NET_ADMIN)。

如何使用 Heron

1) 安裝 Heron (Linux/macOS,用戶本地,無需 sudo): 運行單行安裝程序,將 `heron` 二進制文件放置在用戶本地目錄下。 命令: curl -fsSL https://raw.githubusercontent.com/Netis/heron/main/install.sh | INSTALL_DIR="$HOME/.local" sh
2) 驗證安裝: 確認二進制文件運行正常並在您的 PATH 中。 命令: heron --version heron --help
3) 使用 .pcap 重播運行無權限的冒煙測試: 重播包含 LLM 流量的現有數據包捕獲。這不需要實時捕獲,也不需要特殊權限。 命令: heron --pcap-file capture.pcap --no-retention 提示:如果您沒有 pcap 文件,請使用 `testdata/pcaps/` 中的倉庫夾具並重播其中任何一個。
4) 打開 Web 控制台: 啟動 Heron 後,在瀏覽器中打開嵌入式控制台,以檢查代理回合、時間線和指標。 URL: http://localhost:3000 注意:pcap 重播完成後,Heron 會保持 API/控制台可用,以便您瀏覽。按 Ctrl+C 退出,或傳遞 `--exit-after-drain` 以在管道排空後自動退出。
5) 檢查健康狀況並確認已重建追蹤 (API 驗證): 使用 REST API 確認服務健康,並且重建的追蹤可用。 命令: curl -s http://localhost:3000/api/health curl -s 'http://localhost:3000/api/traces?limit=5'
6) (可選) 從網絡接口運行實時捕獲 (Linux/macOS): 如果您有實時接口並希望進行實時捕獲,請針對接口運行 Heron。 命令: heron -i eth0 Linux 注意:實時捕獲需要 `CAP_NET_RAW`(以及相關功能)。安裝文檔建議授予功能一次,這樣您在運行時就不需要 sudo: sudo setcap cap_net_raw,cap_net_admin=eip ~/.local/bin/heron
7) 了解 TLS 要求 (Heron 的部署位置): Heron 從純文本 HTTP 重建 LLM 調用。將其安裝在流量已解密的位置:在推理主機上、TLS 終止器後面,或從受信任的數據包源提供流量。單獨的數據包捕獲無法查看加密的主體。
8) (可選,Linux 實驗性) 通過 eBPF SSL uprobes 以純文本捕獲 TLS 流量: 在 Linux 上,Heron 有一個可選的實驗性 eBPF 源,它掛鉤 `SSL_read`/`SSL_write` 以在主機上以純文本讀取 TLS 加密的 LLM 調用,並將調用歸因於進程 (pid/command/executable)。這是通過 `ebpf` cargo 功能構建的,需要 `CAP_BPF` 和內核 BTF。請遵循倉庫的 eBPF 捕獲文檔進行設置。
9) 使用控制台分析代理行為和服務拓撲: 在控制台 (`http://localhost:3000`) 中,使用「概覽/性能/使用情況/錯誤」等頁面和「服務」視圖,查看客戶端 → 代理 → 後端的有向圖。Heron 從網絡上的字節檢測端點(例如,vLLM、SGLang、Ollama、llama.cpp、LiteLLM)。
10) 檢查重建的代理回合 (多調用敘述): 導航到「代理回合」以查看多調用交互被縫合到單個回合中(規劃器 → 工具 → 結果 → 下一個工具)。這提供了一個敘述性視圖,而不是原始的每次請求日誌。
11) 從實際流量導出 SFT 軌跡 (微調數據): 從回合的詳細視圖(或從帶有過濾器的「代理回合」列表批量導出),導出 OpenAI 風格的 `messages` JSONL。Heron 保留工具調用/結果並將參數重新水合為對象。目前支持:Anthropic 和 OpenAI-chat 線程格式;不支持的格式會報告並跳過。
12) 配置存儲和保留 (DuckDB 默認;ClickHouse 可選): 默認情況下,Heron 將數據存儲在 DuckDB(嵌入式單文件)中,並具有每個表的保留控制。對於更高容量的分析,通過設置 `storage.backend = "clickhouse"`(根據配置文檔)來配置 ClickHouse。
13) (可選) 正確地從源代碼構建 (嵌入式控制台): 如果從源代碼開發/構建,請使用項目的 `just` 命令,以便嵌入 Web 控制台。倉庫警告說,一個普通的 `cargo build --release` 可以生成一個可用的 API,但控制台是空白的。 推薦: just build all just quality all just test all 如果直接調用 cargo,請先構建控制台(在 `console/` 中運行 `bun run build`),然後使用 `--features console` 編譯。

Heron 常見問題

Heron (Netis/heron) 是一個用於 AI 代理的被動可觀察性工具——被描述為「AI 代理的 Wireshark」。它從網路流量(脫離線路或在主機的 TLS 邊界)重建代理的輪次、工具呼叫和 LLM 互動,而無需在請求路徑中。

与 Heron 类似的最新 AI 工具

Hapticlabs
Hapticlabs
Hapticlabs 是一個無代碼工具包,使設計師、開發者和研究人員能夠輕鬆設計、原型設計和部署跨設備的沉浸式觸覺交互,無需編碼。
Deployo.ai
Deployo.ai
Deployo.ai 是一個全面的 AI 部署平台,支持無縫模型部署、監控和擴展,內置道德 AI 框架和跨雲兼容性。
CloudSoul
CloudSoul
CloudSoul 是一款 AI 驅動的 SaaS 平台,通過自然語言對話使用戶能夠即時部署和管理雲端基礎設施,使 AWS 資源管理更加易用和高效。
Devozy.ai
Devozy.ai
Devozy.ai 是一個由 AI 驅動的開發者自助服務平台,將敏捷項目管理、DevSecOps、多雲基礎設施管理和 IT 服務管理結合為一個統一的解決方案,以加速軟件交付。