Heron nécessite-t-il un SDK, un proxy ou des modifications de code dans mes agents/services ?

Non. Heron est conçu pour être « Zéro SDK. Zéro Proxy. Zéro Intrusion. » Il observe le trafic passivement et ne nécessite pas de modifications côté client ni de placement d'un proxy inverse dans le chemin de la requête.

À partir de quelles entrées/sources Heron peut-il capturer ?

Heron prend en charge plusieurs sources d'entrée : capture en direct via libpcap sur une interface réseau, relecture à partir de fichiers .pcap, entrée ZMQ depuis Netis/cloud-probe, et une source expérimentale opt-in Linux eBPF SSL-uprobe qui lit le texte en clair à la limite SSL_read/SSL_write en cours de processus.

Heron peut-il voir le trafic HTTPS/TLS chiffré ?

La capture de paquets ne voit que le HTTP en texte clair, donc Heron doit être placé là où le trafic est déjà déchiffré (par exemple, sur l'hôte d'inférence, derrière un terminateur TLS, ou alimenté par une source de paquets fiable). Sur Linux, Heron propose également un mode de capture expérimental opt-in eBPF SSL-uprobe pour lire les appels LLM chiffrés TLS en texte clair à la limite SSL_read/SSL_write sur l'hôte qui effectue les appels.

Quelles API filaires LLM et quels fournisseurs Heron décode-t-il ?

Heron inclut des décodeurs pour OpenAI Chat Completions (/v1/chat/completions), OpenAI Responses (/v1/responses), Anthropic Messages (/v1/messages) et Gemini AI Studio (generativelanguage.googleapis.com). Il est destiné à couvrir OpenAI direct et Azure OpenAI, Anthropic, AWS Bedrock/GCP Vertex (fil Anthropic), Google Gemini, et les serveurs compatibles OpenAI tels que vLLM, SGLang, Ollama, llama.cpp et LM Studio.

Que fournit Heron dans son interface utilisateur et ses métriques ?

Heron exécute une console web locale (http://localhost:3000) et expose des pages incluant Vue d'ensemble, Performance, Utilisation, Erreurs, Services (tableau/chemin/modèle), Tours d'agent, Sessions d'agent, Appels LLM (avec exploration des requêtes/réponses), HTTP brut et Santé du pipeline. Les métriques incluent des statistiques au niveau de l'agent (nombre/durée des tours, appels par tour, taux de succès des appels d'outils) et des statistiques au niveau des appels (TTFT, latence de bout en bout, débit de jetons, taux d'erreur, taux d'appels, appels actifs et taux de réussite du cache de prompt).

Heron peut-il exporter l'activité d'agent capturée en données de réglage fin ?

Oui. Heron peut exporter les tours ou sessions reconstruits sous forme de JSONL de messages de style OpenAI pour l'exportation de trajectoires SFT, en préservant les appels/résultats d'outils et en réhydratant les arguments en objets. Il prend en charge les formats filaires Anthropic et OpenAI-chat, et les formats non pris en charge sont signalés et ignorés.

Où Heron stocke-t-il les données et quels backends de stockage sont pris en charge ?

Par défaut, Heron stocke les données dans DuckDB (intégré, fichier unique) avec une rétention par table. Il prend également en charge ClickHouse pour l'analyse à grand volume via la configuration (storage.backend = "clickhouse"). Un backend PostgreSQL est mentionné comme conçu mais pas encore câblé.

Comment puis-je essayer rapidement Heron sans privilèges spéciaux ?

Vous pouvez l'installer avec l'installateur en une ligne et rejouer un fichier .pcap sans privilèges : exécutez `heron --pcap-file capture.pcap --no-retention`, puis ouvrez http://localhost:3000. Le dépôt inclut également des exemples de pcaps sous testdata/pcaps/.

Heron

WebsiteFreeAI DevOps Assistant

Heron est un outil d'observabilité passif et sans intrusion pour les agents IA qui reconstruit les tours d'agents et les interactions LLM/outils à partir du trafic réseau (pcap/live/eBPF) avec un tableau de bord intégré, des métriques et l'exportation de données SFT, sans SDK, sans proxy, sans modification de code.

Visiter le site web

Promouvoir cet outil

https://github.com/Netis/heron?ref=producthunt&utm_source=aipure

Aperçu
Vidéo
Alternatives

Informations sur le produit

Mis à jour:Jul 8, 2026

Qu'est-ce que Heron

Heron (Netis/heron) se positionne comme « le Wireshark pour les agents IA » : un produit d'observabilité qui permet de voir ce que font les agents IA en reconstruisant leur comportement directement à partir du trafic capturé plutôt que d'instrumenter le code ou de router les requêtes via un proxy. Il se concentre sur les flux de travail des agents (planificateur → appels d'outils → résultats → étape suivante) et les interactions LLM, fournissant une console web locale (http://localhost:3000) pour explorer les chronologies, les détails par appel, les erreurs et les métriques de performance/utilisation. Il prend en charge la relecture de fichiers .pcap capturés sans privilèges, la capture en direct via libpcap (avec les capacités appropriées), l'ingestion ZMQ optionnelle à partir d'une sonde distante, et un mode expérimental Linux eBPF pour observer le trafic TLS à la limite SSL sur l'hôte.

Caractéristiques principales de Heron

Heron (Netis/heron) est un outil d'observabilité passive pour les agents d'IA – positionné comme « le Wireshark pour les agents d'IA » – qui reconstitue les tours d'agent, les appels d'outils et les interactions LLM directement à partir du trafic réseau (capture pcap/live) ou des limites TLS au niveau de l'hôte, sans nécessiter de SDK, de proxy ou de modifications de code et sans se trouver dans le chemin de la requête. Il analyse le HTTP/SSE en texte clair (ou capture le contenu déchiffré via des uprobes SSL eBPF Linux optionnels), identifie les API filaires LLM courantes (OpenAI/Anthropic/Gemini et serveurs compatibles OpenAI), construit des chronologies et des graphes de topologie de service, calcule les métriques de latence/jetons, et stocke les résultats (DuckDB par défaut, ClickHouse en option) derrière une console web locale et une API REST, avec la possibilité d'exporter le trafic réel dans des ensembles de données prêts pour le SFT.

Capture passive sans intrusion: Observe le trafic LLM/agent hors du réseau (relecture pcap ou interface live) ou à la limite TLS de l'hôte, ne nécessitant aucune instrumentation SDK, aucun proxy et aucune modification du code client – tout en restant en dehors du chemin de la requête.

Reconstruction des tours d'agent: Assemble les workflows d'agent multi-appels (planificateur → outil → résultat → étape suivante) en des « tours » uniques et adressables, avec des profils nommés pour des outils comme Claude Code et Codex CLI, ainsi qu'un mode générique.

Détection d'API filaires et décodage sémantique: Détecte et décode automatiquement les API LLM populaires (OpenAI Chat Completions/Responses, Anthropic Messages, Gemini) et prend en charge les backends compatibles OpenAI (vLLM, SGLang, Ollama, llama.cpp, LM Studio, LiteLLM) en inspectant les octets sur le réseau.

Console en direct avec exploration approfondie: Interface utilisateur web intégrée (localhost:3000) pour les chronologies, l'inspection des requêtes/réponses par appel, les sessions/tours d'agent, le HTTP brut, la santé du pipeline et les tableaux de bord pour les performances, l'utilisation et les erreurs.

Métriques de qualité opérationnelle et vues topologiques: Calcule la latence TTFT/E2E/TPOT, le débit de jetons, les taux d'erreur, le volume d'appels, les percentiles de latence et visualise les chemins de service à service (clients → proxys → backends d'inférence) sous forme de graphe dirigé.

Exportation de trajectoires SFT à partir du trafic réel: Exporte les tours/sessions reconstitués au format JSONL de messages de style OpenAI (y compris les appels/résultats d'outils et les arguments structurés) pour transformer les exécutions d'agents capturées en données de réglage fin.

Cas d'utilisation de Heron

Débogage et QA d'agents: Les développeurs peuvent diagnostiquer les appels d'outils bloqués, les boucles de planification, les invites mal formées et les sorties inattendues en inspectant les tours reconstitués et les corps complets des requêtes/réponses, sans modifier l'agent.

Observabilité de la plateforme d'inférence: Les équipes de plateforme IA peuvent cartographier la topologie de service réelle (client → LiteLLM → vLLM/SGLang, etc.), mesurer la latence de chaque saut et détecter les substitutions silencieuses de modèles/points de terminaison basées sur le trafic observé.

FinOps / attribution des coûts: Les responsables d'ingénierie et les FinOps peuvent attribuer l'utilisation et les performances par type d'agent, modèle, point de terminaison et session en utilisant des preuves issues du trafic réel plutôt que des exportations SDK périodiques.

Conformité, audit et réponse aux incidents: Les équipes de sécurité/conformité peuvent maintenir une chaîne de preuves unique de ce que les agents ont envoyé/reçu (là où le trafic est déchiffré), prenant en charge les audits et les enquêtes sans impacter les chemins de production.

Génération de jeux de données pour l'entraînement de modèles: Les équipes ML peuvent convertir les interactions réelles des agents en jeux de données SFT en exportant les tours/sessions sous forme de JSONL structuré, en préservant la structure des appels d'outils et les formats filaires des fournisseurs.

Avantages

Aucun SDK/proxy requis et n'est pas dans le chemin de la requête, ce qui réduit les frictions de déploiement et évite les pannes induites par l'observateur.

Visibilité haute fidélité : capture les corps complets des requêtes/réponses (lorsque le texte clair est disponible) et reconstitue les tours d'agent de niveau supérieur, pas seulement les journaux par appel.

Large compatibilité avec plusieurs fournisseurs LLM et serveurs d'inférence compatibles OpenAI via la détection au niveau du fil.

Distribution portable : binaire unique avec console intégrée ; prend en charge la relecture pcap pour l'analyse hors ligne/CI.

Inconvénients

Nécessite une visibilité HTTP en texte clair ; le trafic chiffré doit être placé derrière une terminaison TLS ou utiliser la capture expérimentale eBPF SSL-urobe de Linux avec des capacités supplémentaires.

La capture passive peut limiter la corrélation de bout en bout entre les clusters clients distribués par rapport au traçage explicite/balisage SDK.

Certains formats ne sont que partiellement pris en charge ; les formats filaires non pris en charge sont ignorés/signalés plutôt que décodés.

La capture d'interface en direct peut nécessiter des privilèges/capacités élevés (par exemple, CAP_NET_RAW/CAP_NET_ADMIN sur Linux).

Comment utiliser Heron

1) Installer Heron (Linux/macOS, local utilisateur, pas de sudo): Exécutez l'installateur en une ligne pour placer le binaire `heron` dans un répertoire local de l'utilisateur. Commande : curl -fsSL https://raw.githubusercontent.com/Netis/heron/main/install.sh | INSTALL_DIR="$HOME/.local" sh

2) Vérifier l'installation: Confirmez que le binaire s'exécute et qu'il est dans votre PATH. Commandes : heron --version heron --help

3) Exécuter un test de fumée sans privilèges en utilisant une relecture .pcap: Rejouez une capture de paquets existante contenant du trafic LLM. Cela ne nécessite aucune capture en direct ni aucun privilège spécial. Commande : heron --pcap-file capture.pcap --no-retention Conseil : Si vous n'avez pas de pcap, utilisez les fixtures du dépôt dans `testdata/pcaps/` et rejouez n'importe laquelle d'entre elles.

4) Ouvrir la console web: Après avoir démarré Heron, ouvrez la console intégrée dans votre navigateur pour inspecter les tours d'agents, les chronologies et les métriques. URL : http://localhost:3000 Note : Une fois qu'un pcap a fini de rejouer, Heron maintient l'API/console disponible afin que vous puissiez naviguer. Appuyez sur Ctrl+C pour quitter, ou passez `--exit-after-drain` pour quitter automatiquement une fois que le pipeline est vidé.

5) Vérifier la santé et confirmer que les traces ont été reconstruites (vérification API): Utilisez l'API REST pour confirmer que le service est sain et que les traces reconstruites sont disponibles. Commandes : curl -s http://localhost:3000/api/health curl -s 'http://localhost:3000/api/traces?limit=5'

6) (Optionnel) Exécuter une capture en direct depuis une interface réseau (Linux/macOS): Si vous avez une interface active et que vous souhaitez une capture en temps réel, exécutez Heron sur une interface. Commande : heron -i eth0 Note Linux : la capture en direct nécessite `CAP_NET_RAW` (et les capacités associées). La documentation d'installation recommande d'accorder les capacités une fois pour ne pas avoir besoin de sudo au moment de l'exécution : sudo setcap cap_net_raw,cap_net_admin=eip ~/.local/bin/heron

7) Comprendre l'exigence TLS (où déployer Heron): Heron reconstruit les appels LLM à partir de HTTP en texte clair. Installez-le là où le trafic est déjà déchiffré : sur l'hôte d'inférence, derrière un terminateur TLS, ou alimentez-le à partir d'une source de paquets fiable. La capture de paquets seule ne peut pas voir les corps chiffrés.

8) (Optionnel, expérimental Linux) Capturer le trafic TLS en texte clair via les uprobes SSL eBPF: Sur Linux, Heron dispose d'une source eBPF expérimentale optionnelle qui intercepte `SSL_read`/`SSL_write` pour lire les appels LLM chiffrés TLS en texte clair sur l'hôte et attribuer les appels aux processus (pid/commande/exécutable). Ceci est construit derrière la fonctionnalité `ebpf` de cargo et nécessite `CAP_BPF` et le BTF du noyau. Suivez la documentation de capture eBPF du dépôt pour la configuration.

9) Utiliser la console pour analyser le comportement des agents et la topologie du service: Dans la console (`http://localhost:3000`), utilisez des pages comme Vue d'ensemble/Performance/Utilisation/Erreurs et les vues Services pour voir des graphes dirigés de clients → proxys → backends. Heron détecte les points de terminaison (par exemple, vLLM, SGLang, Ollama, llama.cpp, LiteLLM) à partir des octets sur le fil.

10) Inspecter les tours d'agents reconstruits (récits multi-appels): Naviguez vers les tours d'agents pour voir les interactions multi-appels assemblées en un seul tour (planificateur → outil → résultat → outil suivant). Cela fournit une vue narrative plutôt que des journaux bruts par requête.

11) Exporter les trajectoires SFT à partir du trafic réel (données de réglage fin): À partir de la vue détaillée d'un tour (ou de l'exportation par lots à partir de la liste des tours d'agents avec des filtres), exportez des `messages` JSONL de style OpenAI. Heron préserve les appels/résultats d'outils et réhydrate les arguments en objets. Pris en charge aujourd'hui : formats filaires Anthropic et OpenAI-chat ; les formats non pris en charge sont signalés et ignorés.

12) Configurer le stockage et la rétention (DuckDB par défaut ; ClickHouse optionnel): Par défaut, Heron stocke les données dans DuckDB (fichier unique intégré) avec des contrôles de rétention par table. Pour des analyses à volume plus élevé, configurez ClickHouse en définissant `storage.backend = "clickhouse"` (selon la documentation de configuration).

13) (Optionnel) Construire à partir de la source correctement (console intégrée): Si vous développez/construisez à partir de la source, utilisez les commandes `just` du projet afin que la console web soit intégrée. Le dépôt avertit qu'un simple `cargo build --release` peut produire une API fonctionnelle mais une console vide. Recommandé : just build all just quality all just test all Si vous invoquez cargo directement, construisez d'abord la console (`bun run build` dans `console/`) et compilez avec `--features console`.

FAQ de Heron

Heron (Netis/heron) est un outil d'observabilité passive pour les agents d'IA, décrit comme « Le Wireshark pour les agents d'IA ». Il reconstruit les tours d'agent, les appels d'outils et les interactions LLM à partir du trafic réseau (hors du fil ou à la limite TLS de l'hôte) sans être dans le chemin de la requête.

Vidéo de Heron

Articles populaires

Atoms : Une plateforme d'IA multi-agents qui transforme les idées en produits prêts à être lancés

May 22, 2026

Nano Banana SBTI : Qu'est-ce que c'est, comment ça marche et comment l'utiliser en 2026

Apr 15, 2026

Atoms : L'outil de création de produits IA qui redéfinit la création numérique en 2026

Apr 10, 2026

Kilo Claw : Comment déployer et utiliser un véritable agent d'IA "Faites-le pour vous" (Mise à jour 2026)

Apr 3, 2026

Derniers outils d'IA similaires à Heron

Hapticlabs

Free TrialAI DevOps Assistant No-Code & Low-Code

Hapticlabs est un kit d'outils sans code qui permet aux concepteurs, développeurs et chercheurs de concevoir, prototyper et déployer facilement des interactions haptiques immersives sur différents appareils sans codage.

Deployo.ai

Free TrialAI DevOps Assistant AI Code Assistant

Deployo.ai est une plateforme complète de déploiement d'IA qui permet un déploiement, une surveillance et une mise à l'échelle sans faille des modèles avec des cadres d'IA éthique intégrés et une compatibilité inter-cloud.

CloudSoul

Free TrialAI DevOps Assistant AI Code Assistant No-Code & Low-Code

CloudSoul est une plateforme SaaS alimentée par l'IA qui permet aux utilisateurs de déployer et de gérer instantanément l'infrastructure cloud grâce à des conversations en langage naturel, rendant la gestion des ressources AWS plus accessible et efficace.

Devozy.ai

Free TrialAI DevOps Assistant AI Developer Tools AI Project Management

Devozy.ai est une plateforme de libre-service pour développeurs alimentée par l'IA qui combine la gestion de projet Agile, DevSecOps, la gestion d'infrastructure multi-cloud, et la gestion des services informatiques en une solution unifiée pour accélérer la livraison de logiciels.

Outils d'IA populaires comme Heron

A2A Protocol

FreeAI DevOps Assistant AI API Design

Le protocole A2A (Agent2Agent) est un protocole d'interopérabilité ouvert développé par Google qui permet une communication et une collaboration transparentes entre les agents d'IA de différents frameworks et fournisseurs, quelle que soit leur architecture sous-jacente.

VoltOps

Free TrialMonitor & Log Management AI DevOps Assistant

VoltOps est une plateforme d\'observabilité LLM indépendante du framework qui fournit des outils de surveillance visuelle, de débogage et d\'optimisation en temps réel pour les agents d\'IA sur n\'importe quelle pile technologique.

Chaterm

FreemiumAI DevOps Assistant AI Code Assistant

Chaterm est un terminal natif de l\'IA open source et un copilote SRE qui permet aux ingénieurs de gérer une infrastructure complexe grâce au langage naturel, en automatisant le déploiement, le dépannage et les opérations sans mémoriser les commandes.

Open Browser Use

FreeAI DevOps Assistant AI Web Scraper

Open Browser Use est une couche d'automatisation de navigateur open-source, neutre vis-à-vis de l'environnement d'exécution des agents, qui associe une extension Chrome à une CLI/SDK/MCP pour permettre un contrôle des onglets, une navigation et des actions basés sur le DOM et alimentés par le CDP, à travers différents outils d'agents IA.

Classement

Soumettre & PromouvoirNew

Heron

Informations sur le produit

Qu'est-ce que Heron

Caractéristiques principales de Heron

Cas d'utilisation de Heron

Avantages

Inconvénients

Comment utiliser Heron

FAQ de Heron

1. Qu'est-ce que Heron ?

2. Heron nécessite-t-il un SDK, un proxy ou des modifications de code dans mes agents/services ?

3. À partir de quelles entrées/sources Heron peut-il capturer ?

4. Heron peut-il voir le trafic HTTPS/TLS chiffré ?

5. Quelles API filaires LLM et quels fournisseurs Heron décode-t-il ?

6. Que fournit Heron dans son interface utilisateur et ses métriques ?

7. Heron peut-il exporter l'activité d'agent capturée en données de réglage fin ?

8. Où Heron stocke-t-il les données et quels backends de stockage sont pris en charge ?

9. Comment puis-je essayer rapidement Heron sans privilèges spéciaux ?

Vidéo de Heron

Articles populaires

Derniers outils d'IA similaires à Heron

Outils d'IA populaires comme Heron