Heron
Heron ist ein passives, intrusionsfreies Beobachtungstool für KI-Agenten, das Agenten-Turns und LLM-/Tool-Interaktionen aus dem Netzwerkverkehr (pcap/live/eBPF) mit einem integrierten Dashboard, Metriken und SFT-Datenexport rekonstruiert – kein SDK, kein Proxy, keine Codeänderungen.
https://github.com/Netis/heron?ref=producthunt&utm_source=aipure

Produktinformationen
Aktualisiert:Jun 29, 2026
Was ist Heron
Heron (Netis/heron) positioniert sich als „der Wireshark für KI-Agenten“: ein Beobachtungsprodukt, das Ihnen zeigt, was KI-Agenten tun, indem es ihr Verhalten direkt aus erfasstem Traffic rekonstruiert, anstatt Code zu instrumentieren oder Anfragen über einen Proxy zu leiten. Es konzentriert sich auf Agenten-Workflows (Planer → Tool-Aufrufe → Ergebnisse → nächster Schritt) und LLM-Interaktionen und bietet eine lokale Webkonsole (http://localhost:3000) zur Erkundung von Zeitachsen, Details pro Aufruf, Fehlern und Leistungs-/Nutzungsmetriken. Es unterstützt das Wiedergeben von erfassten .pcap-Dateien ohne Berechtigungen, Live-Erfassung über libpcap (mit entsprechenden Fähigkeiten), optionale ZMQ-Aufnahme von einer Remote-Sonde und einen experimentellen Linux eBPF-Modus zur Beobachtung von TLS-Traffic an der SSL-Grenze auf dem Host.
Hauptfunktionen von Heron
Heron (Netis/heron) ist ein passives Observability-Tool für KI-Agenten – positioniert als „der Wireshark für KI-Agenten“ –, das Agenten-Turns, Tool-Aufrufe und LLM-Interaktionen direkt aus dem Netzwerkverkehr (pcap/Live-Erfassung) oder von TLS-Grenzen auf Host-Ebene rekonstruiert, ohne dass ein SDK, Proxy oder Code-Änderungen erforderlich sind und ohne im Anforderungspfad zu sitzen. Es parst Klartext-HTTP/SSE (oder erfasst entschlüsselte Inhalte über optionale Linux eBPF SSL-Uprobes), identifiziert gängige LLM-Wire-APIs (OpenAI/Anthropic/Gemini und OpenAI-kompatible Server), erstellt Zeitachsen und Diensttopologie-Graphen, berechnet Latenz-/Token-Metriken und speichert Ergebnisse (standardmäßig DuckDB, optional ClickHouse) hinter einer lokalen Webkonsole und REST-API, mit der Möglichkeit, echten Traffic in SFT-fähige Datensätze zu exportieren.
Intrusionsfreie passive Erfassung: Beobachtet LLM-/Agenten-Traffic direkt am Kabel (pcap-Wiedergabe oder Live-Schnittstelle) oder an der TLS-Grenze des Hosts, ohne SDK-Instrumentierung, Proxying oder Änderungen am Client-Code – und bleibt dabei außerhalb des Anforderungspfads.
Rekonstruktion von Agenten-Turns: Fügt Multi-Call-Agenten-Workflows (Planer → Tool → Ergebnis → nächster Schritt) zu einzelnen, adressierbaren „Turns“ zusammen, mit benannten Profilen für Tools wie Claude Code und Codex CLI sowie einem generischen Modus.
Wire-API-Erkennung & semantische Dekodierung: Erkennt und dekodiert automatisch gängige LLM-APIs (OpenAI Chat Completions/Responses, Anthropic Messages, Gemini) und unterstützt OpenAI-kompatible Backends (vLLM, SGLang, Ollama, llama.cpp, LM Studio, LiteLLM) durch Inspektion der Bytes auf dem Kabel.
Live-Konsole mit detailliertem Drilldown: Eingebettete Web-UI (localhost:3000) für Zeitachsen, Anforderungs-/Antwort-Inspektion pro Aufruf, Agenten-Sitzungen/-Turns, Roh-HTTP, Pipeline-Zustand und Dashboards für Leistung, Nutzung und Fehler.
Ops-Grade-Metriken & Topologieansichten: Berechnet TTFT/E2E-Latenz/TPOT, Token-Durchsatz, Fehlerraten, Anrufvolumen, Latenz-Perzentile und visualisiert Service-to-Service-Pfade (Clients → Proxies → Inferenz-Backends) als gerichteten Graphen.
SFT-Trajektorienexport aus echtem Traffic: Exportiert rekonstruierte Turns/Sitzungen in OpenAI-ähnliche Nachrichten JSONL (einschließlich Tool-Aufrufe/-Ergebnisse und strukturierter Argumente), um erfasste Agentenläufe in Fine-Tuning-Daten umzuwandeln.
Anwendungsfälle von Heron
Agenten-Debugging & Qualitätssicherung: Entwickler können festgefahrene Tool-Aufrufe, Planungs-Loops, fehlerhafte Prompts und unerwartete Ausgaben diagnostizieren, indem sie rekonstruierte Turns und vollständige Anforderungs-/Antwort-Bodies überprüfen – ohne den Agenten zu modifizieren.
Observability der Inferenzplattform: KI-Plattformteams können die reale Diensttopologie (Client → LiteLLM → vLLM/SGLang usw.) abbilden, die Latenz jedes Hops messen und stille Modell-/Endpunkt-Substitutionen basierend auf dem beobachteten Traffic erkennen.
FinOps / Kostenattribution: Engineering Manager und FinOps können die Nutzung und Leistung nach Agententyp, Modell, Endpunkt und Sitzung anhand von Beweisen aus dem tatsächlichen Traffic und nicht anhand periodischer SDK-Exporte zuordnen.
Compliance, Audit und Incident Response: Sicherheits-/Compliance-Teams können eine einmalige Beweiskette darüber führen, was Agenten gesendet/empfangen haben (wo der Traffic entschlüsselt wird), um Audits und Untersuchungen zu unterstützen, ohne die Produktionspfade zu beeinträchtigen.
Datensatzgenerierung für das Modelltraining: ML-Teams können reale Agenteninteraktionen in SFT-Datensätze umwandeln, indem sie Turns/Sitzungen als strukturierte JSONL exportieren, wobei die Tool-Aufrufstruktur und die Wire-Formate des Anbieters erhalten bleiben.
Vorteile
Kein SDK/Proxy erforderlich und nicht im Anforderungspfad, was die Bereitstellungsreibung reduziert und beobachterinduzierte Ausfälle vermeidet.
Hohe Detailtreue: Erfasst vollständige Anforderungs-/Antwort-Bodies (wenn Klartext verfügbar ist) und rekonstruiert übergeordnete Agenten-Turns, nicht nur Protokolle pro Aufruf.
Breite Kompatibilität mit mehreren LLM-Anbietern und OpenAI-kompatiblen Inferenzservern über Wire-Level-Erkennung.
Portable Distribution: einzelne Binärdatei mit eingebetteter Konsole; unterstützt pcap-Wiedergabe für Offline-/CI-Analyse.
Nachteile
Erfordert Klartext-HTTP-Sichtbarkeit; verschlüsselter Traffic muss hinter der TLS-Terminierung platziert werden oder die Verwendung von experimenteller Linux eBPF SSL-Uprobe-Erfassung mit zusätzlichen Funktionen erfordern.
Passive Erfassung kann die End-to-End-Korrelation über verteilte Client-Cluster hinweg im Vergleich zu explizitem Tracing/SDK-Tagging einschränken.
Einige Formate werden nur teilweise unterstützt; nicht unterstützte Wire-Formate werden übersprungen/gemeldet, anstatt dekodiert zu werden.
Die Live-Schnittstellenerfassung kann erhöhte Berechtigungen/Fähigkeiten erfordern (z.B. CAP_NET_RAW/CAP_NET_ADMIN unter Linux).
Wie verwendet man Heron
1) Heron installieren (Linux/macOS, benutzerlokal, kein sudo): Führen Sie den Ein-Zeilen-Installer aus, um das `heron`-Binary in einem benutzerlokalen Verzeichnis zu platzieren.
Befehl:
curl -fsSL https://raw.githubusercontent.com/Netis/heron/main/install.sh | INSTALL_DIR="$HOME/.local" sh
2) Installation überprüfen: Bestätigen Sie, dass das Binary läuft und sich in Ihrem PATH befindet.
Befehle:
heron --version
heron --help
3) Einen Smoke-Test ohne Privilegien mit einer .pcap-Wiedergabe durchführen: Geben Sie eine vorhandene Paketerfassung mit LLM-Traffic wieder. Dies erfordert keine Live-Erfassung und keine besonderen Privilegien.
Befehl:
heron --pcap-file capture.pcap --no-retention
Tipp: Wenn Sie keine pcap-Datei haben, verwenden Sie die Repo-Fixtures in `testdata/pcaps/` und spielen Sie eine davon ab.
4) Die Webkonsole öffnen: Nach dem Start von Heron öffnen Sie die eingebettete Konsole in Ihrem Browser, um Agenten-Turns, Zeitachsen und Metriken zu überprüfen.
URL:
http://localhost:3000
Hinweis: Nachdem eine pcap-Wiedergabe abgeschlossen ist, hält Heron die API/Konsole verfügbar, damit Sie browsen können. Drücken Sie Strg+C zum Beenden, oder übergeben Sie `--exit-after-drain`, um automatisch zu beenden, sobald die Pipeline entleert ist.
5) Zustand prüfen und bestätigen, dass Spuren rekonstruiert wurden (API-Verifizierung): Verwenden Sie die REST-API, um zu bestätigen, dass der Dienst fehlerfrei ist und dass rekonstruierte Spuren verfügbar sind.
Befehle:
curl -s http://localhost:3000/api/health
curl -s 'http://localhost:3000/api/traces?limit=5'
6) (Optional) Live-Erfassung von einer Netzwerkschnittstelle ausführen (Linux/macOS): Wenn Sie eine Live-Schnittstelle haben und Echtzeit-Erfassung wünschen, führen Sie Heron gegen eine Schnittstelle aus.
Befehl:
heron -i eth0
Linux-Hinweis: Live-Erfassung benötigt `CAP_NET_RAW` (und verwandte Fähigkeiten). Die Installationsdokumentation empfiehlt, Fähigkeiten einmal zu gewähren, damit Sie zur Laufzeit kein sudo benötigen:
sudo setcap cap_net_raw,cap_net_admin=eip ~/.local/bin/heron
7) Die TLS-Anforderung verstehen (wo Heron eingesetzt werden soll): Heron rekonstruiert LLM-Aufrufe aus unverschlüsseltem HTTP. Installieren Sie es dort, wo der Traffic bereits entschlüsselt ist: auf dem Inferenz-Host, hinter einem TLS-Terminator oder speisen Sie es aus einer vertrauenswürdigen Paketquelle. Die Paketerfassung allein kann verschlüsselte Inhalte nicht sehen.
8) (Optional, Linux experimentell) TLS-Traffic als Klartext über eBPF SSL-Uprobes erfassen: Unter Linux verfügt Heron über eine optionale experimentelle eBPF-Quelle, die `SSL_read`/`SSL_write` hookt, um TLS-verschlüsselte LLM-Aufrufe als Klartext auf dem Host zu lesen und Aufrufe Prozessen (pid/Befehl/ausführbare Datei) zuzuordnen. Dies ist hinter dem `ebpf`-Cargo-Feature integriert und erfordert `CAP_BPF` und Kernel-BTF. Befolgen Sie die eBPF-Erfassungsdokumentation des Repositories für die Einrichtung.
9) Die Konsole verwenden, um Agentenverhalten und Diensttopologie zu analysieren: Verwenden Sie in der Konsole (`http://localhost:3000`) Seiten wie Übersicht/Leistung/Nutzung/Fehler und die Dienstansichten, um gerichtete Graphen von Clients → Proxys → Backends zu sehen. Heron erkennt Endpunkte (z. B. vLLM, SGLang, Ollama, llama.cpp, LiteLLM) aus Bytes im Netzwerk.
10) Rekonstruierte Agenten-Turns inspizieren (Multi-Call-Narrative): Navigieren Sie zu Agent Turns, um Multi-Call-Interaktionen zu sehen, die zu einzelnen Turns zusammengefügt wurden (Planer → Tool → Ergebnis → nächstes Tool). Dies bietet eine narrative Ansicht anstelle von rohen Anforderungsprotokollen.
11) SFT-Trajektorien aus realem Traffic exportieren (Fine-Tuning-Daten): Exportieren Sie OpenAI-ähnliche `messages` JSONL aus der Detailansicht eines Turns (oder als Batch-Export aus der Agent Turns-Liste mit Filtern). Heron bewahrt Tool-Aufrufe/Ergebnisse und rehydriert Argumente zu Objekten. Derzeit unterstützt: Anthropic- und OpenAI-Chat-Wire-Formate; nicht unterstützte Formate werden gemeldet und übersprungen.
12) Speicherung und Aufbewahrung konfigurieren (DuckDB Standard; ClickHouse optional): Standardmäßig speichert Heron Daten in DuckDB (eingebettet, einzelne Datei) mit tabellenspezifischen Aufbewahrungskontrollen. Für Analysen mit höherem Volumen konfigurieren Sie ClickHouse, indem Sie `storage.backend = "clickhouse"` einstellen (gemäß der Konfigurationsdokumentation).
13) (Optional) Korrekt aus dem Quellcode erstellen (Konsole eingebettet): Wenn Sie von der Quelle aus entwickeln/erstellen, verwenden Sie die `just`-Befehle des Projekts, damit die Webkonsole eingebettet ist. Das Repository warnt, dass ein einfaches `cargo build --release` eine funktionierende API, aber eine leere Konsole ergeben kann.
Empfohlen:
just build all
just quality all
just test all
Wenn Sie cargo direkt aufrufen, erstellen Sie zuerst die Konsole (`bun run build` in `console/`) und kompilieren Sie mit `--features console`.
Heron FAQs
Heron (Netis/heron) ist ein passives Beobachtungstool für KI-Agenten – beschrieben als „Der Wireshark für KI-Agenten“. Es rekonstruiert Agenten-Turns, Tool-Aufrufe und LLM-Interaktionen aus dem Netzwerkverkehr (direkt vom Kabel oder an der TLS-Grenze des Hosts), ohne sich im Anforderungspfad zu befinden.
Heron Video
Beliebte Artikel

Atoms: Eine Multi-Agenten-KI-Plattform, die Ideen in startbereite Produkte verwandelt
May 22, 2026

Nano Banana SBTI: Was es ist, wie es funktioniert und wie man es im Jahr 2026 einsetzt
Apr 15, 2026

Atoms Review – Der KI-Produkt-Builder, der die digitale Erstellung im Jahr 2026 neu definiert
Apr 10, 2026

Kilo Claw: Wie man einen echten "Do-It-For-You" KI-Agenten bereitstellt und verwendet (2026 Update)
Apr 3, 2026







