
Retrace
Retrace est un moteur de relecture d'exécution pour les agents d'IA qui enregistre chaque appel LLM/outil, vous permet de rejouer et de forker les échecs à partir de l'étape cassée exacte, et vérifie les corrections avec des portes d'évaluation, des garde-fous et une détection de qualité.
https://retraceai.tech/?ref=producthunt&utm_source=aipure

Informations sur le produit
Mis à jour:Jul 3, 2026
Qu'est-ce que Retrace
Retrace est une plateforme de fiabilité et de débogage pour les agents d'IA, positionnée comme "CI pour le comportement des agents d'IA". Elle capture les exécutions complètes d'agents de bout en bout (appels LLM, invocations d'outils, erreurs, latence et coût) afin que les équipes puissent inspecter ce qui s'est passé en production et transformer les échecs en tests de régression reproductibles. Conçu pour être indépendant du framework, Retrace fonctionne avec les piles d'agents courantes (par exemple, LangChain, CrewAI, LlamaIndex) et prend en charge Python et TypeScript, avec une auto-instrumentation pour les principaux fournisseurs de modèles (OpenAI, Anthropic et Google Gemini).
Caractéristiques principales de Retrace
Retrace est un moteur de relecture d'exécution et une plateforme de fiabilité pour les agents d'IA qui enregistre chaque appel LLM, invocation d'outil, coût, latence et erreur afin que les équipes puissent rejouer des exécutions exactes, bifurquer à l'étape où une défaillance est survenue et vérifier les correctifs avant le déploiement. Au-delà de l'observabilité, il ajoute un flux de travail en boucle fermée — enregistrer → rejouer/bifurquer → corriger → prouver — ainsi qu'une détection automatisée des défaillances (par exemple, lacunes de fondement, dérive, regroupement), une application en temps réel (budgets, limites de boucle/étape, portes d'approbation) et des portes d'évaluation CI qui transforment les défaillances de production réelles en tests de régression. Il fonctionne avec les fournisseurs LLM et les frameworks d'agents courants via une instrumentation légère en Python ou TypeScript.
Enregistrer les exécutions complètes des agents: Un décorateur/SDK léger capture chaque appel de modèle, appel d'outil, erreur, chronométrage et coût, transformant chaque exécution en une trace que vous pouvez inspecter et réutiliser comme artefact de régression.
Rejouer et bifurquer à partir de n'importe quelle étape échouée: Réexécutez une exécution enregistrée exacte ou bifurquez à partir de la période où les choses ont mal tourné, modifiez l'entrée du prompt/outil/modèle et rejouez en cascade pour voir comment la trajectoire change.
Vérification de la preuve du correctif: Après avoir apporté une modification, Retrace peut réexécuter par rapport à la trace d'échec originale et renvoyer un verdict (par exemple, corrigé/amélioré/régressé/inchangé) pour valider la correction avant la publication.
Détection et analyse automatisées des défaillances: Signale les modèles courants de défaillance des agents tels que les lacunes de fondation/fidélité, la dérive statistique, les clusters de défaillance et les types de défaillance multi-agents pour expliquer pourquoi une exécution a échoué — et pas seulement qu'elle a échoué.
Garde-fous et application en temps réel: Des politiques telles que les budgets de coûts, la détection de boucle, les limites d'étape, les plafonds de latence et les passerelles de pré-appel (attente d'approbation) peuvent arrêter ou bloquer les actions risquées pour éviter un comportement incontrôlé et des dépenses imprévues.
Portes d'évaluation CI pour le comportement des agents: Exécute des évaluations en CI/CD et échoue les builds lorsque le comportement régresse par rapport à une ligne de base, permettant des « tests de régression comportementale » pour les prompts, les outils et les mises à niveau de modèles.
Cas d'utilisation de Retrace
Débogage des incidents d'agents de production: Lorsqu'un agent échoue en production, les ingénieurs peuvent rejouer l'exécution exacte, bifurquer à l'étape de la cause première (pas le symptôme final) et valider un correctif avec la preuve du correctif avant de redéployer.
Déploiement d'agents utilisant des outils plus sûrs (DevOps/SRE): Pour les agents qui interrogent les journaux/métriques ou déclenchent des actions opérationnelles, les garde-fous (budgets, limites de boucle, portes d'approbation) réduisent le risque de défaillances en cascade ou d'exécutions incontrôlées coûteuses.
Tests de régression pour les changements de prompts/outils/modèles: Les équipes qui itèrent sur les prompts, échangent des outils ou mettent à niveau des modèles peuvent utiliser les défaillances enregistrées et les portes d'évaluation pour s'assurer que le comportement multi-étapes ne se dégrade pas silencieusement entre les versions.
Fiabilité du flux de travail multi-agents (pipelines de recherche → écriture): Dans les systèmes avec des agents planificateurs/chercheurs/rédacteurs, Retrace aide à visualiser la topologie des agents, à identifier les défaillances de transfert inter-agents et à rejouer/bifurquer pour tester une coordination améliorée.
Surveillance de la qualité et de la conformité pour les assistants d'entreprise: La détection de la fondation et la traçabilité soutiennent l'audit et le contrôle qualité pour les assistants dans des contextes réglementés ou à enjeux élevés (par exemple, finance, santé, juridique), où les hallucinations et les actions dangereuses doivent être détectées tôt.
Avantages
Débogage en boucle fermée : rejouez, bifurquez et vérifiez les correctifs au lieu de seulement inspecter les journaux/métriques.
Approche agnostique du framework et du fournisseur avec une instrumentation légère (Python/TypeScript) et un support pour les fournisseurs LLM courants.
Les garde-fous en temps réel peuvent empêcher un comportement coûteux ou dangereux des agents (budgets, détection de boucle, approbation).
Les portes d'évaluation CI convertissent les défaillances réelles en tests de régression comportementale, aidant les équipes à livrer avec plus de confiance.
Inconvénients
Certaines capacités dépendent du support du fournisseur/clé (par exemple, certains flux de relecture/évaluation peuvent être plus matures pour des fournisseurs spécifiques).
Des portes d'évaluation significatives nécessitent une conception et des seuils d'évaluation réfléchis ; la configuration peut être non triviale pour les agents complexes.
L'enregistrement de traces détaillées peut soulever des considérations de confidentialité/conformité, nécessitant une rédaction et une gouvernance des données minutieuses dans des environnements sensibles.
Comment utiliser Retrace
1) Créer un compte: Rendez-vous sur https://retraceai.tech/ et inscrivez-vous (la connexion GitHub est prise en charge). Aucune carte de crédit n'est requise pour commencer.
2) Installer le SDK Retrace: Ajoutez le SDK Retrace à votre projet d'agent (Python ou TypeScript). Retrace est indépendant du framework et fonctionne avec LangChain, CrewAI, LlamaIndex, Vercel AI SDK, AutoGen, etc.
3) Configurer votre clé API: Dans votre code, configurez Retrace avec la clé API de votre espace de travail (l'exemple montré sur le site utilise `retrace.configure(api_key="rt_...")`). Cela connecte votre application à Retrace afin que les traces puissent être diffusées vers le tableau de bord.
4) Ajouter le décorateur d'enregistrement à votre point d'entrée d'agent: Enveloppez votre fonction d'agent principale avec le décorateur montré dans la documentation : `@retrace.record(name="my-agent")`. Ce décorateur unique capture chaque appel LLM, invocation d'outil, coût, chronométrage et erreur.
5) Exécuter votre agent normalement: Exécutez votre agent comme vous le faites habituellement. Retrace capture automatiquement les appels à OpenAI, Anthropic et Gemini, et enregistre les appels d'outils et les échecs sous forme de spans dans une chronologie de trace.
6) Regarder les traces en direct (CLI tail optionnel): Utilisez la CLI pour suivre les traces en direct (exemple du site : `retrace traces tail`). Vous verrez des étapes comme la classification d'intention, la récupération de contexte et la génération de réponse avec les temps et les coûts.
7) Inspecter la trace dans le tableau de bord: Ouvrez l'interface utilisateur de Retrace pour parcourir la chronologie, ouvrir n'importe quelle span et voir la séquence complète des appels de modèle/outil. Cela vous aide à trouver où l'exécution a réellement échoué (souvent plus tôt que l'erreur finale).
8) Rejouer une exécution échouée: Réexécutez n'importe quelle trace enregistrée pour reproduire le comportement exact. Retrace est conçu pour qu'un échec de production devienne un test de régression permanent que vous pouvez réexécuter.
9) Forker à partir de la span exacte défaillante: Sélectionnez la span où l'exécution a divergé ou échoué, puis créez un fork pour brancher à partir de ce point (exemples de commandes affichées : `retrace forks create --trace <id> --span <id> --input "..."`).
10) Modifier l'étape cassée (invite/entrée d'outil/modèle) et rejouer en cascade: Dans le fork, modifiez ce qui a causé l'échec (par exemple, ajustez une invite, corrigez une entrée d'outil ou échangez le modèle), puis rejouez le fork (exemple : `retrace forks replay <id> --wait`). Retrace rejoue en cascade à partir du point de fork afin que les étapes en aval utilisent le contexte mis à jour.
11) Prouver la correction avec un verdict: Exécutez la vérification intégrée pour comparer le fork corrigé à l'exécution échouée d'origine et obtenir un verdict (exemple : `retrace traces verify-fix <id>`), signalé comme amélioré/régressé/inchangé (et affiché comme "fix verified" dans l'exemple du site).
12) Ajouter des garde-fous d'exécution (recommandé): Configurez des garde-fous/disjoncteurs pour arrêter les exécutions qui dépassent les budgets, bouclent trop longtemps, débordent de contexte ou dépassent les limites de latence. Retrace peut émettre un HALT pour arrêter un comportement incontrôlé avant qu'il n'entraîne des coûts ou ne déclenche de mauvaises actions.
13) Activer les signaux de détection (recommandé): Utilisez les fonctionnalités de détection de Retrace pour signaler automatiquement les lacunes de fondement, la dérive, les clusters d'échecs et les types d'échecs MAST afin de comprendre pourquoi une exécution a échoué (et pas seulement qu'elle a échoué).
14) (Facultatif) Ajoutez votre clé de fournisseur de modèle pour les relectures côté serveur et les portes d'évaluation: Dans les paramètres du tableau de bord Retrace, ajoutez votre clé de fournisseur (le site met en évidence Google/Gemini pour les portes d'évaluation + les relectures). Retrace valide la clé lors de l'enregistrement, la chiffre au repos, n'affiche que les 4 derniers caractères et l'utilise afin que les jetons de relecture/évaluation soient facturés à votre compte de fournisseur.
15) Créer une évaluation et un ensemble de données pour les tests de régression: Configurez des évaluations (et éventuellement des ensembles de données et des règles d'auto-évaluation) afin de pouvoir noter le comportement de l'agent sur les exécutions enregistrées et de le comparer à un comportement de référence ("golden").
16) Bloquer les PR avec une porte d'évaluation dans la CI: Ajoutez une étape CI qui exécute la porte d'évaluation de Retrace afin que les builds échouent lorsque le comportement régresse. Exemple d'étape GitHub Actions du site : `retrace eval gate --evaluation $EVAL_ID --trace $TRACE_ID --threshold 0.8` avec `RETRACE_API_KEY` dans les secrets ; la commande se termine avec le code 1 en cas d'échec.
17) Itérer en utilisant le flux de travail en boucle fermée: Répétez la boucle de fiabilité : Enregistrer un échec réel → Le rejouer → Forker à partir de l'étape défaillante → Corriger → Prouver la correction → L'ajouter aux portes d'évaluation afin que la même régression soit plus difficile à livrer à nouveau.
FAQ de Retrace
Retrace est un moteur de relecture d'exécution pour les agents d'IA qui enregistre chaque appel LLM, invocation d'outil et erreur, afin que vous puissiez rejouer les exécutions, bifurquer à partir d'une étape défaillante et vérifier les corrections avant le déploiement.
Articles populaires

Atoms : Une plateforme d'IA multi-agents qui transforme les idées en produits prêts à être lancés
May 22, 2026

Nano Banana SBTI : Qu'est-ce que c'est, comment ça marche et comment l'utiliser en 2026
Apr 15, 2026

Atoms : L'outil de création de produits IA qui redéfinit la création numérique en 2026
Apr 10, 2026

Kilo Claw : Comment déployer et utiliser un véritable agent d'IA "Faites-le pour vous" (Mise à jour 2026)
Apr 3, 2026







