Heron

Heron

Heron è uno strumento di osservabilità passivo e a zero intrusione per agenti AI che ricostruisce i turni degli agenti e le interazioni LLM/strumenti dal traffico di rete (pcap/live/eBPF) con una dashboard integrata, metriche ed esportazione di dati SFT—nessun SDK, nessun proxy, nessuna modifica al codice.
https://github.com/Netis/heron?ref=producthunt&utm_source=aipure
Heron

Informazioni sul Prodotto

Aggiornato:Jun 29, 2026

Cos'è Heron

Heron (Netis/heron) si posiziona come "lo Wireshark per gli Agenti AI": un prodotto di osservabilità che ti permette di vedere cosa stanno facendo gli agenti AI ricostruendo il loro comportamento direttamente dal traffico catturato piuttosto che strumentando il codice o instradando le richieste tramite un proxy. Si concentra sui flussi di lavoro degli agenti (pianificatore → chiamate di strumenti → risultati → passo successivo) e sulle interazioni LLM, fornendo una console web locale (http://localhost:3000) per esplorare timeline, dettagli per chiamata, errori e metriche di performance/utilizzo. Supporta la riproduzione di file .pcap catturati senza privilegi, la cattura live tramite libpcap (con capacità appropriate), l'ingestione ZMQ opzionale da una sonda remota e una modalità sperimentale Linux eBPF per osservare il traffico TLS al confine SSL sull'host.

Caratteristiche principali di Heron

Heron (Netis/heron) è uno strumento di osservabilità passiva per agenti AI, posizionato come "lo Wireshark per agenti AI", che ricostruisce i turni degli agenti, le chiamate agli strumenti e le interazioni LLM direttamente dal traffico di rete (cattura pcap/live) o dai confini TLS a livello di host, senza richiedere SDK, proxy o modifiche al codice e senza inserirsi nel percorso della richiesta. Analizza HTTP/SSE in chiaro (o cattura contenuti decifrati tramite uprobe SSL eBPF Linux opzionale), identifica le API wire LLM comuni (OpenAI/Anthropic/Gemini e server compatibili con OpenAI), costruisce timeline e grafici della topologia del servizio, calcola metriche di latenza/token e memorizza i risultati (DuckDB per impostazione predefinita, ClickHouse opzionale) dietro una console web locale e un'API REST, con la possibilità di esportare il traffico reale in set di dati pronti per SFT.
Cattura passiva a intrusione zero: Osserva il traffico LLM/agente off-the-wire (replay pcap o interfaccia live) o al confine TLS dell'host, non richiedendo alcuna strumentazione SDK, nessun proxy e nessuna modifica al codice client, rimanendo fuori dal percorso della richiesta.
Ricostruzione del turno dell'agente: Collega i flussi di lavoro dell'agente a più chiamate (pianificatore → strumento → risultato → passo successivo) in "turni" singoli e indirizzabili, con profili nominati per strumenti come Claude Code e Codex CLI più una modalità generica.
Rilevamento API wire e decodifica semantica: Rileva e decodifica automaticamente le API LLM più diffuse (OpenAI Chat Completions/Responses, Anthropic Messages, Gemini) e supporta i backend compatibili con OpenAI (vLLM, SGLang, Ollama, llama.cpp, LM Studio, LiteLLM) ispezionando i byte sul wire.
Console live con approfondimento: Interfaccia utente web incorporata (localhost:3000) per timeline, ispezione richiesta/risposta per chiamata, sessioni/turni dell'agente, HTTP raw, stato della pipeline e dashboard per prestazioni, utilizzo ed errori.
Metriche di livello operativo e viste della topologia: Calcola TTFT/latenza E2E/TPOT, throughput dei token, tassi di errore, volume di chiamate, percentili di latenza e visualizza i percorsi da servizio a servizio (client → proxy → backend di inferenza) come un grafo diretto.
Esportazione della traiettoria SFT dal traffico reale: Esporta i turni/sessioni ricostruiti in JSONL di messaggi in stile OpenAI (incluse chiamate/risultati degli strumenti e argomenti strutturati) per trasformare le esecuzioni degli agenti catturate in dati di fine-tuning.

Casi d'uso di Heron

Debug e QA dell'agente: Gli sviluppatori possono diagnosticare chiamate a strumenti bloccate, cicli di pianificazione, prompt malformati e output imprevisti ispezionando i turni ricostruiti e i corpi completi delle richieste/risposte, senza modificare l'agente.
Osservabilità della piattaforma di inferenza: I team della piattaforma AI possono mappare la topologia del servizio reale (client → LiteLLM → vLLM/SGLang, ecc.), misurare la latenza di ogni hop e rilevare sostituzioni silenziose di modelli/endpoint basate sul traffico osservato.
FinOps / attribuzione dei costi: I responsabili dell'ingegneria e i FinOps possono attribuire l'utilizzo e le prestazioni per tipo di agente, modello, endpoint e sessione utilizzando prove dal traffico effettivo anziché esportazioni periodiche di SDK.
Conformità, audit e risposta agli incidenti: I team di sicurezza/conformità possono mantenere una catena di prove "cattura una volta" di ciò che gli agenti hanno inviato/ricevuto (dove il traffico è decifrato), supportando audit e indagini senza influire sui percorsi di produzione.
Generazione di set di dati per l'addestramento del modello: I team ML possono convertire le interazioni reali degli agenti in set di dati SFT esportando turni/sessioni come JSONL strutturato, preservando la struttura delle chiamate agli strumenti e i formati wire del provider.

Vantaggi

Nessun SDK/proxy richiesto e non nel percorso della richiesta, riducendo l'attrito di distribuzione ed evitando interruzioni indotte dall'osservatore.
Visibilità ad alta fedeltà: cattura i corpi completi delle richieste/risposte (quando il testo in chiaro è disponibile) e ricostruisce i turni dell'agente di livello superiore, non solo i log per chiamata.
Ampia compatibilità con più provider LLM e server di inferenza compatibili con OpenAI tramite rilevamento a livello di wire.
Distribuzione portatile: singolo binario con console incorporata; supporta il replay pcap per l'analisi offline/CI.

Svantaggi

Richiede visibilità HTTP in chiaro; il traffico crittografato necessita di essere posizionato dietro la terminazione TLS o l'uso della cattura sperimentale SSL-urobe eBPF Linux con capacità extra.
La cattura passiva può limitare la correlazione end-to-end tra cluster client distribuiti rispetto alla tracciatura esplicita/tagging SDK.
Alcuni formati sono supportati solo parzialmente; i formati wire non supportati vengono ignorati/segnalati anziché decodificati.
La cattura dell'interfaccia live può richiedere privilegi/capacità elevate (ad esempio, CAP_NET_RAW/CAP_NET_ADMIN su Linux).

Come usare Heron

1) Installa Heron (Linux/macOS, utente-locale, senza sudo): Esegui l'installer a riga singola per posizionare il binario `heron` in una directory utente-locale. Comando: curl -fsSL https://raw.githubusercontent.com/Netis/heron/main/install.sh | INSTALL_DIR="$HOME/.local" sh
2) Verifica l'installazione: Conferma che il binario sia eseguibile e nel tuo PATH. Comandi: heron --version heron --help
3) Esegui un test rapido senza privilegi usando una riproduzione .pcap: Riproduci una cattura di pacchetti esistente contenente traffico LLM. Questo non richiede cattura live e nessun privilegio speciale. Comando: heron --pcap-file capture.pcap --no-retention Suggerimento: Se non hai un pcap, usa i fixture del repository in `testdata/pcaps/` e riproduci uno qualsiasi di essi.
4) Apri la console web: Dopo aver avviato Heron, apri la console incorporata nel tuo browser per ispezionare i turni degli agenti, le timeline e le metriche. URL: http://localhost:3000 Nota: Dopo che un pcap ha terminato la riproduzione, Heron mantiene l'API/console disponibile in modo da poter navigare. Premi Ctrl+C per uscire, o passa `--exit-after-drain` per uscire automaticamente una volta che la pipeline si svuota.
5) Controlla lo stato di salute e conferma che le tracce siano state ricostruite (verifica API): Usa l'API REST per confermare che il servizio è sano e che le tracce ricostruite sono disponibili. Comandi: curl -s http://localhost:3000/api/health curl -s 'http://localhost:3000/api/traces?limit=5'
6) (Opzionale) Esegui la cattura live da un'interfaccia di rete (Linux/macOS): Se hai un'interfaccia live e desideri la cattura in tempo reale, esegui Heron contro un'interfaccia. Comando: heron -i eth0 Nota Linux: la cattura live necessita di `CAP_NET_RAW` (e capacità correlate). I documenti di installazione raccomandano di concedere le capacità una volta in modo da non aver bisogno di sudo in fase di esecuzione: sudo setcap cap_net_raw,cap_net_admin=eip ~/.local/bin/heron
7) Comprendi il requisito TLS (dove distribuire Heron): Heron ricostruisce le chiamate LLM da HTTP in chiaro. Installalo dove il traffico è già decifrato: sull'host di inferenza, dietro un terminatore TLS, o alimentalo da una fonte di pacchetti fidata. La sola cattura di pacchetti non può vedere i corpi crittografati.
8) (Opzionale, sperimentale Linux) Cattura il traffico TLS come testo in chiaro tramite uprobe eBPF SSL: Su Linux, Heron ha una sorgente eBPF sperimentale opt-in che aggancia `SSL_read`/`SSL_write` per leggere le chiamate LLM crittografate TLS come testo in chiaro sull'host e attribuire le chiamate ai processi (pid/comando/eseguibile). Questo è costruito dietro la funzionalità `ebpf` di cargo e richiede `CAP_BPF` e kernel BTF. Segui la documentazione di cattura eBPF del repository per la configurazione.
9) Usa la console per analizzare il comportamento dell'agente e la topologia del servizio: Nella console (`http://localhost:3000`), usa pagine come Panoramica/Performance/Utilizzo/Errori e le viste Servizi per vedere grafici diretti di client → proxy → backend. Heron rileva gli endpoint (ad esempio, vLLM, SGLang, Ollama, llama.cpp, LiteLLM) dai byte sul filo.
10) Ispeziona i turni dell'agente ricostruiti (narrazioni multi-chiamata): Naviga in Turni Agente per vedere le interazioni multi-chiamata unite in singoli turni (pianificatore → strumento → risultato → strumento successivo). Questo fornisce una vista narrativa piuttosto che log grezzi per richiesta.
11) Esporta traiettorie SFT dal traffico reale (dati di fine-tuning): Dalla vista dettagliata di un turno (o esportazione in batch dall'elenco Turni Agente con filtri), esporta `messages` JSONL in stile OpenAI. Heron conserva le chiamate/risultati degli strumenti e reidrata gli argomenti agli oggetti. Supportati oggi: formati wire Anthropic e OpenAI-chat; i formati non supportati vengono segnalati e saltati.
12) Configura l'archiviazione e la conservazione (DuckDB predefinito; ClickHouse opzionale): Per impostazione predefinita, Heron memorizza i dati in DuckDB (file singolo incorporato) con controlli di conservazione per tabella. Per analisi di volumi più elevati, configura ClickHouse impostando `storage.backend = "clickhouse"` (secondo i documenti di configurazione).
13) (Opzionale) Compila correttamente dal sorgente (console incorporata): Se si sviluppa/compila dal sorgente, usa i comandi `just` del progetto in modo che la console web sia incorporata. Il repository avverte che un semplice `cargo build --release` può produrre un'API funzionante ma una console vuota. Consigliato: just build all just quality all just test all Se si invoca cargo direttamente, compila prima la console (`bun run build` in `console/`) e compila con `--features console`.

FAQ di Heron

Heron (Netis/heron) è uno strumento di osservabilità passiva per agenti AI, descritto come "Il Wireshark per agenti AI". Ricostruisce i turni degli agenti, le chiamate agli strumenti e le interazioni LLM dal traffico di rete (fuori dal cavo o al confine TLS dell'host) senza essere nel percorso della richiesta.

Ultimi Strumenti AI Simili a Heron

Hapticlabs
Hapticlabs
Hapticlabs è un toolkit senza codice che consente a designer, sviluppatori e ricercatori di progettare, prototipare e distribuire facilmente interazioni tattili immersive su diversi dispositivi senza codifica.
Deployo.ai
Deployo.ai
Deployo.ai è una piattaforma completa per la distribuzione dell'IA che consente una distribuzione, un monitoraggio e una scalabilità senza soluzione di continuità dei modelli con framework etici dell'IA integrati e compatibilità cross-cloud.
CloudSoul
CloudSoul
CloudSoul è una piattaforma SaaS alimentata da intelligenza artificiale che consente agli utenti di distribuire e gestire istantaneamente l'infrastruttura cloud attraverso conversazioni in linguaggio naturale, rendendo la gestione delle risorse AWS più accessibile ed efficiente.
Devozy.ai
Devozy.ai
Devozy.ai è una piattaforma di self-service per sviluppatori alimentata da AI che combina gestione dei progetti Agile, DevSecOps, gestione dell'infrastruttura multi-cloud e gestione dei servizi IT in una soluzione unificata per accelerare la consegna del software.