Heron

Heron

Heron é uma ferramenta de observabilidade passiva e sem intrusão para agentes de IA que reconstrói voltas de agentes e interações LLM/ferramentas a partir do tráfego de rede (pcap/live/eBPF) com um painel integrado, métricas e exportação de dados SFT - sem SDK, sem proxy, sem alterações de código.
https://github.com/Netis/heron?ref=producthunt&utm_source=aipure
Heron

Informações do Produto

Atualizado:Jun 29, 2026

O que é Heron

Heron (Netis/heron) se posiciona como "o Wireshark para Agentes de IA": um produto de observabilidade que permite ver o que os agentes de IA estão fazendo, reconstruindo seu comportamento diretamente do tráfego capturado, em vez de instrumentar código ou rotear solicitações através de um proxy. Ele se concentra em fluxos de trabalho de agentes (planejador → chamadas de ferramentas → resultados → próximo passo) e interações LLM, fornecendo um console web local (http://localhost:3000) para explorar linhas do tempo, detalhes por chamada, erros e métricas de desempenho/uso. Ele suporta a reprodução de arquivos .pcap capturados sem privilégios, captura ao vivo via libpcap (com capacidades apropriadas), ingestão ZMQ opcional de uma sonda remota e um modo experimental Linux eBPF para observar o tráfego TLS na fronteira SSL no host.

Principais Recursos do Heron

Heron (Netis/heron) é uma ferramenta de observabilidade passiva para agentes de IA—posicionada como “o Wireshark para Agentes de IA”—que reconstrói as "turns" do agente, chamadas de ferramentas e interações LLM diretamente do tráfego de rede (captura pcap/ao vivo) ou limites TLS em nível de host, sem exigir qualquer SDK, proxy ou alterações de código e sem estar no caminho da requisição. Ele analisa HTTP/SSE em texto simples (ou captura conteúdo descriptografado via uprobes SSL eBPF Linux opcionais), identifica APIs LLM comuns (OpenAI/Anthropic/Gemini e servidores compatíveis com OpenAI), constrói linhas do tempo e gráficos de topologia de serviço, calcula métricas de latência/token e armazena os resultados (DuckDB por padrão, ClickHouse opcional) por trás de um console web local e API REST, com a capacidade de exportar tráfego real para conjuntos de dados prontos para SFT.
Captura passiva de intrusão zero: Observa o tráfego LLM/agente "off the wire" (reprodução pcap ou interface ao vivo) ou no limite TLS do host, não exigindo instrumentação SDK, proxying e alterações no código do cliente—enquanto permanece fora do caminho da requisição.
Reconstrução de "turns" do agente: Une fluxos de trabalho de agente de múltiplas chamadas (planejador → ferramenta → resultado → próximo passo) em "turns" únicas e endereçáveis, com perfis nomeados para ferramentas como Claude Code e Codex CLI, além de um modo genérico.
Detecção de API "Wire" e decodificação semântica: Detecta e decodifica automaticamente APIs LLM populares (OpenAI Chat Completions/Responses, Anthropic Messages, Gemini) e suporta backends compatíveis com OpenAI (vLLM, SGLang, Ollama, llama.cpp, LM Studio, LiteLLM) inspecionando bytes na "wire".
Console ao vivo com "drill-down" profundo: UI web incorporada (localhost:3000) para linhas do tempo, inspeção de requisição/resposta por chamada, sessões/"turns" de agente, HTTP bruto, saúde do pipeline e painéis para desempenho, uso e erros.
Métricas de nível de operação e visualizações de topologia: Calcula latência TTFT/E2E/TPOT, taxa de transferência de tokens, taxas de erro, volume de chamadas, percentis de latência e visualiza caminhos de serviço a serviço (clientes → proxies → backends de inferência) como um grafo direcionado.
Exportação de trajetória SFT a partir de tráfego real: Exporta "turns"/sessões reconstruídas para JSONL de mensagens estilo OpenAI (incluindo chamadas/resultados de ferramentas e argumentos estruturados) para transformar execuções de agente capturadas em dados de "fine-tuning".

Casos de Uso do Heron

Depuração e QA de agentes: Os desenvolvedores podem diagnosticar chamadas de ferramentas travadas, loops de planejamento, prompts malformados e saídas inesperadas inspecionando as "turns" reconstruídas e os corpos completos de requisição/resposta—sem modificar o agente.
Observabilidade da plataforma de inferência: As equipes da plataforma de IA podem mapear a topologia de serviço real (cliente → LiteLLM → vLLM/SGLang, etc.), medir a latência de cada salto e detectar substituições silenciosas de modelo/endpoint com base no tráfego observado.
FinOps / atribuição de custos: Gerentes de engenharia e FinOps podem atribuir uso e desempenho por tipo de agente, modelo, endpoint e sessão usando evidências do tráfego real, em vez de exportações periódicas de SDK.
Conformidade, auditoria e resposta a incidentes: As equipes de segurança/conformidade podem manter uma cadeia de evidências de captura única do que os agentes enviaram/receberam (onde o tráfego é descriptografado), apoiando auditorias e investigações sem impactar os caminhos de produção.
Geração de conjunto de dados para treinamento de modelos: As equipes de ML podem converter interações reais de agentes em conjuntos de dados SFT exportando "turns"/sessões como JSONL estruturado, preservando a estrutura da chamada da ferramenta e os formatos de "wire" do provedor.

Vantagens

Nenhum SDK/proxy é necessário e não está no caminho da requisição, reduzindo o atrito de implantação e evitando interrupções induzidas pelo observador.
Visibilidade de alta fidelidade: captura corpos completos de requisição/resposta (quando o texto simples está disponível) e reconstrói "turns" de agente de nível superior, não apenas logs por chamada.
Ampla compatibilidade com vários provedores LLM e servidores de inferência compatíveis com OpenAI via detecção em nível de "wire".
Distribuição portátil: binário único com console incorporado; suporta reprodução pcap para análise offline/CI.

Desvantagens

Requer visibilidade HTTP em texto simples; o tráfego criptografado precisa ser colocado atrás da terminação TLS ou usar a captura experimental SSL-urobe eBPF do Linux com capacidades extras.
A captura passiva pode limitar a correlação de ponta a ponta em clusters de clientes distribuídos em comparação com o rastreamento explícito/tagging de SDK.
Alguns formatos são apenas parcialmente suportados; formatos de "wire" não suportados são ignorados/relatados em vez de decodificados.
A captura de interface ao vivo pode exigir privilégios/capacidades elevadas (por exemplo, CAP_NET_RAW/CAP_NET_ADMIN no Linux).

Como Usar o Heron

1) Instale o Heron (Linux/macOS, local do usuário, sem sudo): Execute o instalador de uma linha para colocar o binário `heron` em um diretório local do usuário. Comando: curl -fsSL https://raw.githubusercontent.com/Netis/heron/main/install.sh | INSTALL_DIR="$HOME/.local" sh
2) Verifique a instalação: Confirme se o binário é executado e está no seu PATH. Comandos: heron --version heron --help
3) Execute um teste de fumaça sem privilégios usando uma reprodução .pcap: Reproduza uma captura de pacote existente contendo tráfego LLM. Isso não requer captura ao vivo e nenhum privilégio especial. Comando: heron --pcap-file capture.pcap --no-retention Dica: Se você não tiver um pcap, use os acessórios do repositório em `testdata/pcaps/` e reproduza qualquer um deles.
4) Abra o console web: Depois de iniciar o Heron, abra o console incorporado em seu navegador para inspecionar as voltas do agente, linhas do tempo e métricas. URL: http://localhost:3000 Nota: Depois que um pcap termina de reproduzir, o Heron mantém a API/console disponível para que você possa navegar. Pressione Ctrl+C para sair, ou passe `--exit-after-drain` para sair automaticamente assim que o pipeline for drenado.
5) Verifique a saúde e confirme se os rastreamentos foram reconstruídos (verificação da API): Use a API REST para confirmar se o serviço está saudável e se os rastreamentos reconstruídos estão disponíveis. Comandos: curl -s http://localhost:3000/api/health curl -s 'http://localhost:3000/api/traces?limit=5'
6) (Opcional) Execute a captura ao vivo de uma interface de rede (Linux/macOS): Se você tiver uma interface ao vivo e quiser captura em tempo real, execute o Heron em uma interface. Comando: heron -i eth0 Nota do Linux: a captura ao vivo precisa de `CAP_NET_RAW` (e capacidades relacionadas). Os documentos de instalação recomendam conceder capacidades uma vez para que você não precise de sudo em tempo de execução: sudo setcap cap_net_raw,cap_net_admin=eip ~/.local/bin/heron
7) Entenda o requisito TLS (onde implantar o Heron): Heron reconstrói chamadas LLM de HTTP de texto simples. Instale-o onde o tráfego já está descriptografado: no host de inferência, atrás de um terminador TLS, ou alimente-o de uma fonte de pacote confiável. A captura de pacotes sozinha não pode ver corpos criptografados.
8) (Opcional, experimental Linux) Capture o tráfego TLS como texto simples via uprobes eBPF SSL: No Linux, o Heron possui uma fonte eBPF experimental opcional que conecta `SSL_read`/`SSL_write` para ler chamadas LLM criptografadas por TLS como texto simples no host e atribuir chamadas a processos (pid/comando/executável). Isso é construído por trás do recurso de carga `ebpf` e requer `CAP_BPF` e kernel BTF. Siga a documentação de captura eBPF do repositório para configuração.
9) Use o console para analisar o comportamento do agente e a topologia do serviço: No console (`http://localhost:3000`), use páginas como Visão Geral/Desempenho/Uso/Erros e as visualizações de Serviços para ver gráficos direcionados de clientes → proxies → backends. O Heron detecta endpoints (por exemplo, vLLM, SGLang, Ollama, llama.cpp, LiteLLM) a partir de bytes na rede.
10) Inspecione as voltas do agente reconstruídas (narrativas de múltiplas chamadas): Navegue até Agent Turns para ver interações de múltiplas chamadas unidas em uma única volta (planejador → ferramenta → resultado → próxima ferramenta). Isso fornece uma visão narrativa em vez de logs brutos por solicitação.
11) Exporte trajetórias SFT de tráfego real (dados de ajuste fino): Na visualização de detalhes de uma volta (ou exportação em lote da lista de Agent Turns com filtros), exporte `messages` JSONL no estilo OpenAI. O Heron preserva chamadas/resultados de ferramentas e reidrata argumentos para objetos. Suportado hoje: formatos de fio Anthropic e OpenAI-chat; formatos não suportados são relatados e ignorados.
12) Configure o armazenamento e a retenção (DuckDB padrão; ClickHouse opcional): Por padrão, o Heron armazena dados no DuckDB (arquivo único incorporado) com controles de retenção por tabela. Para análises de maior volume, configure o ClickHouse definindo `storage.backend = "clickhouse"` (conforme os documentos de Configuração).
13) (Opcional) Construa a partir do código-fonte corretamente (console incorporado): Se estiver desenvolvendo/construindo a partir do código-fonte, use os comandos `just` do projeto para que o console web seja incorporado. O repositório avisa que um `cargo build --release` simples pode produzir uma API funcional, mas um console em branco. Recomendado: just build all just quality all just test all Se invocar o cargo diretamente, construa o console primeiro (`bun run build` em `console/`) e compile com `--features console`.

Perguntas Frequentes do Heron

Heron (Netis/heron) é uma ferramenta de observabilidade passiva para agentes de IA—descrita como "O Wireshark para Agentes de IA". Ele reconstrói turnos de agentes, chamadas de ferramentas e interações LLM a partir do tráfego de rede (fora do fio ou na fronteira TLS do host) sem estar no caminho da requisição.

Ferramentas de IA Mais Recentes Semelhantes a Heron

Hapticlabs
Hapticlabs
O Hapticlabs é um kit de ferramentas sem código que permite que designers, desenvolvedores e pesquisadores projetem, prototipem e implantem facilmente interações táteis imersivas em dispositivos sem codificação.
Deployo.ai
Deployo.ai
Deployo.ai é uma plataforma abrangente de implantação de IA que permite a implantação, monitoramento e escalonamento sem costura de modelos com estruturas de IA ética integradas e compatibilidade entre nuvens.
CloudSoul
CloudSoul
CloudSoul é uma plataforma SaaS impulsionada por IA que permite aos usuários implantar e gerenciar instantaneamente a infraestrutura de nuvem por meio de conversas em linguagem natural, tornando o gerenciamento de recursos da AWS mais acessível e eficiente.
Devozy.ai
Devozy.ai
Devozy.ai é uma plataforma de autoatendimento para desenvolvedores impulsionada por IA que combina gerenciamento de projetos ágeis, DevSecOps, gerenciamento de infraestrutura multi-nuvem e gerenciamento de serviços de TI em uma solução unificada para acelerar a entrega de software.