Heron

Heron

Heron est un outil d'observabilité passif et sans intrusion pour les agents IA qui reconstruit les tours d'agents et les interactions LLM/outils à partir du trafic réseau (pcap/live/eBPF) avec un tableau de bord intégré, des métriques et l'exportation de données SFT, sans SDK, sans proxy, sans modification de code.
https://github.com/Netis/heron?ref=producthunt&utm_source=aipure
Heron

Informations sur le produit

Mis à jour:Jun 29, 2026

Qu'est-ce que Heron

Heron (Netis/heron) se positionne comme « le Wireshark pour les agents IA » : un produit d'observabilité qui permet de voir ce que font les agents IA en reconstruisant leur comportement directement à partir du trafic capturé plutôt que d'instrumenter le code ou de router les requêtes via un proxy. Il se concentre sur les flux de travail des agents (planificateur → appels d'outils → résultats → étape suivante) et les interactions LLM, fournissant une console web locale (http://localhost:3000) pour explorer les chronologies, les détails par appel, les erreurs et les métriques de performance/utilisation. Il prend en charge la relecture de fichiers .pcap capturés sans privilèges, la capture en direct via libpcap (avec les capacités appropriées), l'ingestion ZMQ optionnelle à partir d'une sonde distante, et un mode expérimental Linux eBPF pour observer le trafic TLS à la limite SSL sur l'hôte.

Caractéristiques principales de Heron

Heron (Netis/heron) est un outil d'observabilité passive pour les agents d'IA – positionné comme « le Wireshark pour les agents d'IA » – qui reconstitue les tours d'agent, les appels d'outils et les interactions LLM directement à partir du trafic réseau (capture pcap/live) ou des limites TLS au niveau de l'hôte, sans nécessiter de SDK, de proxy ou de modifications de code et sans se trouver dans le chemin de la requête. Il analyse le HTTP/SSE en texte clair (ou capture le contenu déchiffré via des uprobes SSL eBPF Linux optionnels), identifie les API filaires LLM courantes (OpenAI/Anthropic/Gemini et serveurs compatibles OpenAI), construit des chronologies et des graphes de topologie de service, calcule les métriques de latence/jetons, et stocke les résultats (DuckDB par défaut, ClickHouse en option) derrière une console web locale et une API REST, avec la possibilité d'exporter le trafic réel dans des ensembles de données prêts pour le SFT.
Capture passive sans intrusion: Observe le trafic LLM/agent hors du réseau (relecture pcap ou interface live) ou à la limite TLS de l'hôte, ne nécessitant aucune instrumentation SDK, aucun proxy et aucune modification du code client – tout en restant en dehors du chemin de la requête.
Reconstruction des tours d'agent: Assemble les workflows d'agent multi-appels (planificateur → outil → résultat → étape suivante) en des « tours » uniques et adressables, avec des profils nommés pour des outils comme Claude Code et Codex CLI, ainsi qu'un mode générique.
Détection d'API filaires et décodage sémantique: Détecte et décode automatiquement les API LLM populaires (OpenAI Chat Completions/Responses, Anthropic Messages, Gemini) et prend en charge les backends compatibles OpenAI (vLLM, SGLang, Ollama, llama.cpp, LM Studio, LiteLLM) en inspectant les octets sur le réseau.
Console en direct avec exploration approfondie: Interface utilisateur web intégrée (localhost:3000) pour les chronologies, l'inspection des requêtes/réponses par appel, les sessions/tours d'agent, le HTTP brut, la santé du pipeline et les tableaux de bord pour les performances, l'utilisation et les erreurs.
Métriques de qualité opérationnelle et vues topologiques: Calcule la latence TTFT/E2E/TPOT, le débit de jetons, les taux d'erreur, le volume d'appels, les percentiles de latence et visualise les chemins de service à service (clients → proxys → backends d'inférence) sous forme de graphe dirigé.
Exportation de trajectoires SFT à partir du trafic réel: Exporte les tours/sessions reconstitués au format JSONL de messages de style OpenAI (y compris les appels/résultats d'outils et les arguments structurés) pour transformer les exécutions d'agents capturées en données de réglage fin.

Cas d'utilisation de Heron

Débogage et QA d'agents: Les développeurs peuvent diagnostiquer les appels d'outils bloqués, les boucles de planification, les invites mal formées et les sorties inattendues en inspectant les tours reconstitués et les corps complets des requêtes/réponses, sans modifier l'agent.
Observabilité de la plateforme d'inférence: Les équipes de plateforme IA peuvent cartographier la topologie de service réelle (client → LiteLLM → vLLM/SGLang, etc.), mesurer la latence de chaque saut et détecter les substitutions silencieuses de modèles/points de terminaison basées sur le trafic observé.
FinOps / attribution des coûts: Les responsables d'ingénierie et les FinOps peuvent attribuer l'utilisation et les performances par type d'agent, modèle, point de terminaison et session en utilisant des preuves issues du trafic réel plutôt que des exportations SDK périodiques.
Conformité, audit et réponse aux incidents: Les équipes de sécurité/conformité peuvent maintenir une chaîne de preuves unique de ce que les agents ont envoyé/reçu (là où le trafic est déchiffré), prenant en charge les audits et les enquêtes sans impacter les chemins de production.
Génération de jeux de données pour l'entraînement de modèles: Les équipes ML peuvent convertir les interactions réelles des agents en jeux de données SFT en exportant les tours/sessions sous forme de JSONL structuré, en préservant la structure des appels d'outils et les formats filaires des fournisseurs.

Avantages

Aucun SDK/proxy requis et n'est pas dans le chemin de la requête, ce qui réduit les frictions de déploiement et évite les pannes induites par l'observateur.
Visibilité haute fidélité : capture les corps complets des requêtes/réponses (lorsque le texte clair est disponible) et reconstitue les tours d'agent de niveau supérieur, pas seulement les journaux par appel.
Large compatibilité avec plusieurs fournisseurs LLM et serveurs d'inférence compatibles OpenAI via la détection au niveau du fil.
Distribution portable : binaire unique avec console intégrée ; prend en charge la relecture pcap pour l'analyse hors ligne/CI.

Inconvénients

Nécessite une visibilité HTTP en texte clair ; le trafic chiffré doit être placé derrière une terminaison TLS ou utiliser la capture expérimentale eBPF SSL-urobe de Linux avec des capacités supplémentaires.
La capture passive peut limiter la corrélation de bout en bout entre les clusters clients distribués par rapport au traçage explicite/balisage SDK.
Certains formats ne sont que partiellement pris en charge ; les formats filaires non pris en charge sont ignorés/signalés plutôt que décodés.
La capture d'interface en direct peut nécessiter des privilèges/capacités élevés (par exemple, CAP_NET_RAW/CAP_NET_ADMIN sur Linux).

Comment utiliser Heron

1) Installer Heron (Linux/macOS, local utilisateur, pas de sudo): Exécutez l'installateur en une ligne pour placer le binaire `heron` dans un répertoire local de l'utilisateur. Commande : curl -fsSL https://raw.githubusercontent.com/Netis/heron/main/install.sh | INSTALL_DIR="$HOME/.local" sh
2) Vérifier l'installation: Confirmez que le binaire s'exécute et qu'il est dans votre PATH. Commandes : heron --version heron --help
3) Exécuter un test de fumée sans privilèges en utilisant une relecture .pcap: Rejouez une capture de paquets existante contenant du trafic LLM. Cela ne nécessite aucune capture en direct ni aucun privilège spécial. Commande : heron --pcap-file capture.pcap --no-retention Conseil : Si vous n'avez pas de pcap, utilisez les fixtures du dépôt dans `testdata/pcaps/` et rejouez n'importe laquelle d'entre elles.
4) Ouvrir la console web: Après avoir démarré Heron, ouvrez la console intégrée dans votre navigateur pour inspecter les tours d'agents, les chronologies et les métriques. URL : http://localhost:3000 Note : Une fois qu'un pcap a fini de rejouer, Heron maintient l'API/console disponible afin que vous puissiez naviguer. Appuyez sur Ctrl+C pour quitter, ou passez `--exit-after-drain` pour quitter automatiquement une fois que le pipeline est vidé.
5) Vérifier la santé et confirmer que les traces ont été reconstruites (vérification API): Utilisez l'API REST pour confirmer que le service est sain et que les traces reconstruites sont disponibles. Commandes : curl -s http://localhost:3000/api/health curl -s 'http://localhost:3000/api/traces?limit=5'
6) (Optionnel) Exécuter une capture en direct depuis une interface réseau (Linux/macOS): Si vous avez une interface active et que vous souhaitez une capture en temps réel, exécutez Heron sur une interface. Commande : heron -i eth0 Note Linux : la capture en direct nécessite `CAP_NET_RAW` (et les capacités associées). La documentation d'installation recommande d'accorder les capacités une fois pour ne pas avoir besoin de sudo au moment de l'exécution : sudo setcap cap_net_raw,cap_net_admin=eip ~/.local/bin/heron
7) Comprendre l'exigence TLS (où déployer Heron): Heron reconstruit les appels LLM à partir de HTTP en texte clair. Installez-le là où le trafic est déjà déchiffré : sur l'hôte d'inférence, derrière un terminateur TLS, ou alimentez-le à partir d'une source de paquets fiable. La capture de paquets seule ne peut pas voir les corps chiffrés.
8) (Optionnel, expérimental Linux) Capturer le trafic TLS en texte clair via les uprobes SSL eBPF: Sur Linux, Heron dispose d'une source eBPF expérimentale optionnelle qui intercepte `SSL_read`/`SSL_write` pour lire les appels LLM chiffrés TLS en texte clair sur l'hôte et attribuer les appels aux processus (pid/commande/exécutable). Ceci est construit derrière la fonctionnalité `ebpf` de cargo et nécessite `CAP_BPF` et le BTF du noyau. Suivez la documentation de capture eBPF du dépôt pour la configuration.
9) Utiliser la console pour analyser le comportement des agents et la topologie du service: Dans la console (`http://localhost:3000`), utilisez des pages comme Vue d'ensemble/Performance/Utilisation/Erreurs et les vues Services pour voir des graphes dirigés de clients → proxys → backends. Heron détecte les points de terminaison (par exemple, vLLM, SGLang, Ollama, llama.cpp, LiteLLM) à partir des octets sur le fil.
10) Inspecter les tours d'agents reconstruits (récits multi-appels): Naviguez vers les tours d'agents pour voir les interactions multi-appels assemblées en un seul tour (planificateur → outil → résultat → outil suivant). Cela fournit une vue narrative plutôt que des journaux bruts par requête.
11) Exporter les trajectoires SFT à partir du trafic réel (données de réglage fin): À partir de la vue détaillée d'un tour (ou de l'exportation par lots à partir de la liste des tours d'agents avec des filtres), exportez des `messages` JSONL de style OpenAI. Heron préserve les appels/résultats d'outils et réhydrate les arguments en objets. Pris en charge aujourd'hui : formats filaires Anthropic et OpenAI-chat ; les formats non pris en charge sont signalés et ignorés.
12) Configurer le stockage et la rétention (DuckDB par défaut ; ClickHouse optionnel): Par défaut, Heron stocke les données dans DuckDB (fichier unique intégré) avec des contrôles de rétention par table. Pour des analyses à volume plus élevé, configurez ClickHouse en définissant `storage.backend = "clickhouse"` (selon la documentation de configuration).
13) (Optionnel) Construire à partir de la source correctement (console intégrée): Si vous développez/construisez à partir de la source, utilisez les commandes `just` du projet afin que la console web soit intégrée. Le dépôt avertit qu'un simple `cargo build --release` peut produire une API fonctionnelle mais une console vide. Recommandé : just build all just quality all just test all Si vous invoquez cargo directement, construisez d'abord la console (`bun run build` dans `console/`) et compilez avec `--features console`.

FAQ de Heron

Heron (Netis/heron) est un outil d'observabilité passive pour les agents d'IA, décrit comme « Le Wireshark pour les agents d'IA ». Il reconstruit les tours d'agent, les appels d'outils et les interactions LLM à partir du trafic réseau (hors du fil ou à la limite TLS de l'hôte) sans être dans le chemin de la requête.

Derniers outils d'IA similaires à Heron

Hapticlabs
Hapticlabs
Hapticlabs est un kit d'outils sans code qui permet aux concepteurs, développeurs et chercheurs de concevoir, prototyper et déployer facilement des interactions haptiques immersives sur différents appareils sans codage.
Deployo.ai
Deployo.ai
Deployo.ai est une plateforme complète de déploiement d'IA qui permet un déploiement, une surveillance et une mise à l'échelle sans faille des modèles avec des cadres d'IA éthique intégrés et une compatibilité inter-cloud.
CloudSoul
CloudSoul
CloudSoul est une plateforme SaaS alimentée par l'IA qui permet aux utilisateurs de déployer et de gérer instantanément l'infrastructure cloud grâce à des conversations en langage naturel, rendant la gestion des ressources AWS plus accessible et efficace.
Devozy.ai
Devozy.ai
Devozy.ai est une plateforme de libre-service pour développeurs alimentée par l'IA qui combine la gestion de projet Agile, DevSecOps, la gestion d'infrastructure multi-cloud, et la gestion des services informatiques en une solution unifiée pour accélérer la livraison de logiciels.