Heron

Heron

Heron은 내장 대시보드, 메트릭 및 SFT 데이터 내보내기 기능을 통해 네트워크 트래픽(pcap/live/eBPF)에서 에이전트 턴 및 LLM/도구 상호 작용을 재구성하는 AI 에이전트용 수동적이고 침입 없는 관찰 도구입니다. SDK, 프록시, 코드 변경이 필요 없습니다.
https://github.com/Netis/heron?ref=producthunt&utm_source=aipure
Heron

제품 정보

업데이트됨:Jun 29, 2026

Heron이란?

Heron (Netis/heron)은 “AI 에이전트를 위한 Wireshark”로 자리매김하고 있습니다. 코드를 계측하거나 프록시를 통해 요청을 라우팅하는 대신 캡처된 트래픽에서 직접 동작을 재구성하여 AI 에이전트가 무엇을 하는지 볼 수 있게 해주는 관찰성 제품입니다. 에이전트 워크플로우(플래너 → 도구 호출 → 결과 → 다음 단계) 및 LLM 상호 작용에 중점을 두며, 타임라인, 호출별 세부 정보, 오류, 성능/사용량 메트릭을 탐색할 수 있는 로컬 웹 콘솔(http://localhost:3000)을 제공합니다. 권한 없이 캡처된 .pcap 파일 재생, libpcap을 통한 실시간 캡처(적절한 기능 포함), 원격 프로브에서 선택적 ZMQ 수집, 호스트에서 SSL 경계의 TLS 트래픽을 관찰하기 위한 실험적인 Linux eBPF 모드를 지원합니다.

Heron의 주요 기능

Heron (Netis/heron)은 AI 에이전트를 위한 수동 관찰 도구로, “AI 에이전트용 Wireshark”로 불립니다. 이 도구는 네트워크 트래픽(pcap/라이브 캡처) 또는 호스트 수준 TLS 경계에서 직접 에이전트 턴, 도구 호출 및 LLM 상호 작용을 재구성하며, SDK, 프록시 또는 코드 변경이 필요 없고 요청 경로에 개입하지 않습니다. Heron은 일반 텍스트 HTTP/SSE를 구문 분석하고(또는 선택적 Linux eBPF SSL uprobes를 통해 암호 해독된 콘텐츠 캡처), 일반적인 LLM 와이어 API(OpenAI/Anthropic/Gemini 및 OpenAI 호환 서버)를 식별하며, 타임라인 및 서비스 토폴로지 그래프를 구축하고, 지연 시간/토큰 메트릭을 계산합니다. 또한 로컬 웹 콘솔 및 REST API 뒤에 결과를 저장하고(기본적으로 DuckDB, 선택적으로 ClickHouse), 실제 트래픽을 SFT 준비 데이터셋으로 내보낼 수 있는 기능을 제공합니다.
제로 침입 수동 캡처: LLM/에이전트 트래픽을 와이어(pcap 재생 또는 라이브 인터페이스) 또는 호스트의 TLS 경계에서 관찰하며, SDK 계측, 프록시 또는 클라이언트 코드 변경이 필요 없고 요청 경로에 개입하지 않습니다.
에이전트 턴 재구성: 다중 호출 에이전트 워크플로우(플래너 → 도구 → 결과 → 다음 단계)를 단일의 주소 지정 가능한 “턴”으로 연결하며, Claude Code 및 Codex CLI와 같은 도구에 대한 명명된 프로필과 일반 모드를 제공합니다.
와이어-API 감지 및 의미론적 디코딩: 인기 있는 LLM API(OpenAI Chat Completions/Responses, Anthropic Messages, Gemini)를 자동으로 감지 및 디코딩하며, 와이어의 바이트를 검사하여 OpenAI 호환 백엔드(vLLM, SGLang, Ollama, llama.cpp, LM Studio, LiteLLM)를 지원합니다.
심층 드릴다운이 가능한 라이브 콘솔: 타임라인, 호출별 요청/응답 검사, 에이전트 세션/턴, 원시 HTTP, 파이프라인 상태 및 성능, 사용량, 오류 대시보드를 위한 임베디드 웹 UI(localhost:3000)를 제공합니다.
운영 등급 메트릭 및 토폴로지 뷰: TTFT/E2E 지연 시간/TPOT, 토큰 처리량, 오류율, 호출량, 지연 시간 백분위수를 계산하고, 서비스 간 경로(클라이언트 → 프록시 → 추론 백엔드)를 방향성 그래프로 시각화합니다.
실제 트래픽에서 SFT 궤적 내보내기: 재구성된 턴/세션을 OpenAI 스타일 메시지 JSONL(도구 호출/결과 및 구조화된 인수를 포함)로 내보내어 캡처된 에이전트 실행을 미세 조정 데이터로 변환합니다.

Heron의 사용 사례

에이전트 디버깅 및 QA: 개발자는 에이전트를 수정하지 않고도 재구성된 턴과 전체 요청/응답 본문을 검사하여 중단된 도구 호출, 계획 루프, 잘못된 프롬프트 및 예기치 않은 출력을 진단할 수 있습니다.
추론 플랫폼 관찰 가능성: AI 플랫폼 팀은 실제 서비스 토폴로지(클라이언트 → LiteLLM → vLLM/SGLang 등)를 매핑하고, 각 홉의 지연 시간을 측정하며, 관찰된 트래픽을 기반으로 자동 모델/엔드포인트 대체 현상을 감지할 수 있습니다.
FinOps / 비용 할당: 엔지니어링 관리자와 FinOps는 주기적인 SDK 내보내기 대신 실제 트래픽의 증거를 사용하여 에이전트 종류, 모델, 엔드포인트 및 세션별로 사용량 및 성능을 할당할 수 있습니다.
규정 준수, 감사 및 사고 대응: 보안/규정 준수 팀은 에이전트가 송수신한 내용(트래픽이 암호 해독된 경우)에 대한 '한 번 캡처' 증거 체인을 유지하여 프로덕션 경로에 영향을 미치지 않고 감사 및 조사를 지원할 수 있습니다.
모델 훈련을 위한 데이터셋 생성: ML 팀은 실제 에이전트 상호 작용을 구조화된 JSONL로 턴/세션을 내보내어 SFT 데이터셋으로 변환하고, 도구 호출 구조 및 공급자 와이어 형식을 보존할 수 있습니다.

장점

SDK/프록시가 필요 없고 요청 경로에 개입하지 않아 배포 마찰을 줄이고 관찰자 유발 중단을 방지합니다.
고충실도 가시성: 전체 요청/응답 본문을 캡처하고(일반 텍스트 사용 가능 시) 호출별 로그뿐만 아니라 상위 수준 에이전트 턴을 재구성합니다.
와이어 수준 감지를 통해 여러 LLM 공급자 및 OpenAI 호환 추론 서버와 광범위한 호환성을 제공합니다.
휴대용 배포: 임베디드 콘솔이 있는 단일 바이너리; 오프라인/CI 분석을 위한 pcap 재생을 지원합니다.

단점

일반 텍스트 HTTP 가시성이 필요합니다. 암호화된 트래픽은 TLS 종료 뒤에 배치하거나 추가 기능이 있는 실험적인 Linux eBPF SSL-urobe 캡처를 사용해야 합니다.
수동 캡처는 명시적인 추적/SDK 태깅에 비해 분산 클라이언트 클러스터 전반의 종단 간 상관 관계를 제한할 수 있습니다.
일부 형식은 부분적으로만 지원됩니다. 지원되지 않는 와이어 형식은 디코딩되지 않고 건너뛰거나 보고됩니다.
라이브 인터페이스 캡처는 높은 권한/기능(예: Linux의 CAP_NET_RAW/CAP_NET_ADMIN)을 요구할 수 있습니다.

Heron 사용 방법

1) Heron 설치 (Linux/macOS, 사용자 로컬, sudo 없음): 한 줄 설치 프로그램을 실행하여 `heron` 바이너리를 사용자 로컬 디렉토리에 배치합니다. 명령: curl -fsSL https://raw.githubusercontent.com/Netis/heron/main/install.sh | INSTALL_DIR="$HOME/.local" sh
2) 설치 확인: 바이너리가 실행되고 PATH에 있는지 확인합니다. 명령: heron --version heron --help
3) .pcap 재생을 사용하여 권한 없는 스모크 테스트 실행: LLM 트래픽이 포함된 기존 패킷 캡처를 재생합니다. 실시간 캡처나 특별한 권한이 필요하지 않습니다. 명령: heron --pcap-file capture.pcap --no-retention 팁: pcap이 없는 경우 `testdata/pcaps/`의 저장소 픽스처를 사용하고 그 중 하나를 재생하십시오.
4) 웹 콘솔 열기: Heron을 시작한 후 브라우저에서 내장 콘솔을 열어 에이전트 턴, 타임라인 및 메트릭을 검사합니다. URL: http://localhost:3000 참고: pcap 재생이 완료된 후 Heron은 API/콘솔을 계속 사용할 수 있도록 유지하므로 탐색할 수 있습니다. 종료하려면 Ctrl+C를 누르거나 파이프라인이 소진되면 자동으로 종료하려면 `--exit-after-drain`을 전달하십시오.
5) 상태 확인 및 추적 재구성 확인 (API 검증): REST API를 사용하여 서비스가 정상이고 재구성된 추적이 사용 가능한지 확인합니다. 명령: curl -s http://localhost:3000/api/health curl -s 'http://localhost:3000/api/traces?limit=5'
6) (선택 사항) 네트워크 인터페이스에서 실시간 캡처 실행 (Linux/macOS): 실시간 인터페이스가 있고 실시간 캡처를 원하는 경우 인터페이스에 대해 Heron을 실행합니다. 명령: heron -i eth0 Linux 참고: 실시간 캡처에는 `CAP_NET_RAW` (및 관련 기능)가 필요합니다. 설치 문서에서는 런타임에 sudo가 필요하지 않도록 기능을 한 번 부여할 것을 권장합니다: sudo setcap cap_net_raw,cap_net_admin=eip ~/.local/bin/heron
7) TLS 요구 사항 이해 (Heron 배포 위치): Heron은 일반 텍스트 HTTP에서 LLM 호출을 재구성합니다. 트래픽이 이미 암호 해독된 곳(추론 호스트, TLS 종단 장치 뒤, 또는 신뢰할 수 있는 패킷 소스에서)에 설치하십시오. 패킷 캡처만으로는 암호화된 본문을 볼 수 없습니다.
8) (선택 사항, Linux 실험적) eBPF SSL uprobe를 통해 TLS 트래픽을 일반 텍스트로 캡처: Linux에서 Heron은 `SSL_read`/`SSL_write`를 후킹하여 TLS 암호화된 LLM 호출을 호스트에서 일반 텍스트로 읽고 호출을 프로세스(pid/command/executable)에 할당하는 선택적 실험적 eBPF 소스를 가지고 있습니다. 이는 `ebpf` cargo 기능 뒤에 빌드되며 `CAP_BPF` 및 커널 BTF가 필요합니다. 설정에 대한 저장소의 eBPF 캡처 문서를 따르십시오.
9) 콘솔을 사용하여 에이전트 동작 및 서비스 토폴로지 분석: 콘솔(`http://localhost:3000`)에서 개요/성능/사용량/오류와 같은 페이지와 서비스 보기를 사용하여 클라이언트 → 프록시 → 백엔드의 방향 그래프를 확인합니다. Heron은 와이어의 바이트에서 엔드포인트(예: vLLM, SGLang, Ollama, llama.cpp, LiteLLM)를 감지합니다.
10) 재구성된 에이전트 턴 검사 (다중 호출 내러티브): 에이전트 턴으로 이동하여 여러 호출 상호 작용이 단일 턴(플래너 → 도구 → 결과 → 다음 도구)으로 연결된 것을 확인합니다. 이는 원시 요청별 로그가 아닌 내러티브 보기를 제공합니다.
11) 실제 트래픽에서 SFT 궤적 내보내기 (미세 조정 데이터): 턴의 세부 보기(또는 필터가 있는 에이전트 턴 목록에서 일괄 내보내기)에서 OpenAI 스타일 `messages` JSONL을 내보냅니다. Heron은 도구 호출/결과를 보존하고 인수를 객체로 재수화합니다. 현재 지원되는 형식: Anthropic 및 OpenAI-chat 와이어 형식; 지원되지 않는 형식은 보고되고 건너뜁니다.
12) 저장소 및 보존 구성 (DuckDB 기본값; ClickHouse 선택 사항): 기본적으로 Heron은 테이블별 보존 제어 기능을 사용하여 DuckDB(내장 단일 파일)에 데이터를 저장합니다. 더 많은 양의 분석을 위해 `storage.backend = "clickhouse"`를 설정하여 ClickHouse를 구성합니다 (구성 문서에 따름).
13) (선택 사항) 소스에서 올바르게 빌드 (콘솔 내장): 소스에서 개발/빌드하는 경우 프로젝트의 `just` 명령을 사용하여 웹 콘솔이 내장되도록 합니다. 저장소는 일반 `cargo build --release`가 작동하는 API를 생성할 수 있지만 빈 콘솔을 생성할 수 있다고 경고합니다. 권장: just build all just quality all just test all cargo를 직접 호출하는 경우 먼저 콘솔을 빌드(`console/`에서 `bun run build`)하고 `--features console`로 컴파일하십시오.

Heron 자주 묻는 질문

Heron(Netis/heron)은 AI 에이전트를 위한 수동 관찰 도구로, "AI 에이전트용 Wireshark"로 불립니다. 요청 경로에 있지 않으면서도 네트워크 트래픽(유선 또는 호스트의 TLS 경계에서)으로부터 에이전트 턴, 도구 호출 및 LLM 상호 작용을 재구성합니다.

Heron와(과) 유사한 최신 AI 도구

Hapticlabs
Hapticlabs
Hapticlabs는 디자이너, 개발자 및 연구자가 코딩 없이 장치 간 몰입형 촉각 상호작용을 쉽게 설계, 프로토타입 및 배포할 수 있도록 하는 코드 없는 툴킷입니다
Deployo.ai
Deployo.ai
Deployo.ai는 내장된 윤리적 AI 프레임워크와 크로스 클라우드 호환성을 통해 원활한 모델 배포, 모니터링 및 확장을 가능하게 하는 포괄적인 AI 배포 플랫폼입니다.
CloudSoul
CloudSoul
CloudSoul은 사용자가 자연어 대화를 통해 클라우드 인프라를 즉시 배포하고 관리할 수 있도록 하는 AI 기반 SaaS 플랫폼으로, AWS 리소스 관리의 접근성과 효율성을 높입니다.
Devozy.ai
Devozy.ai
Devozy.ai는 Agile 프로젝트 관리, DevSecOps, 멀티 클라우드 인프라 관리 및 IT 서비스 관리를 통합하여 소프트웨어 배포를 가속화하는 AI 기반 개발자 셀프 서비스 플랫폼입니다.