
Retrace
Retrace — это механизм воспроизведения выполнения для агентов ИИ, который записывает каждый вызов LLM/инструмента, позволяет воспроизводить и создавать форки сбоев с точного сломанного шага и проверяет исправления с помощью ворот оценки, защитных ограждений и обнаружения качества.
https://retraceai.tech/?ref=producthunt&utm_source=aipure

Информация о продукте
Обновлено:03/07/2026
Что такое Retrace
Retrace — это платформа надежности и отладки для агентов ИИ, позиционируемая как «CI для поведения агентов ИИ». Она фиксирует полное сквозное выполнение агентов — вызовы LLM, вызовы инструментов, ошибки, задержки и стоимость — чтобы команды могли проверять, что произошло в производстве, и превращать сбои в повторяемые регрессионные тесты. Разработанная как агностическая к фреймворкам, Retrace работает с общими стеками агентов (например, LangChain, CrewAI, LlamaIndex) и поддерживает Python и TypeScript, с автоматической инструментацией для основных поставщиков моделей (OpenAI, Anthropic и Google Gemini).
Ключевые особенности Retrace
Retrace — это механизм воспроизведения выполнения и платформа надежности для агентов ИИ, которая записывает каждый вызов LLM, вызов инструмента, стоимость, задержку и ошибку, чтобы команды могли точно воспроизводить запуски, "отклоняться" от шага, на котором возникла ошибка, и проверять исправления перед выпуском. Помимо наблюдаемости, она добавляет замкнутый рабочий процесс — запись → воспроизведение/отклонение → исправление → доказательство — плюс автоматическое обнаружение сбоев (например, пробелы в обоснованности, дрейф, кластеризация), принудительное выполнение во время выполнения (бюджеты, ограничения циклов/шагов, шлюзы утверждения) и шлюзы оценки CI, которые превращают реальные производственные сбои в регрессионные тесты. Она работает со всеми распространенными поставщиками LLM и фреймворками агентов посредством легкой инструментации на Python или TypeScript.
Запись полных выполнений агентов: Легковесный декоратор/SDK фиксирует каждый вызов модели, вызов инструмента, ошибку, время и стоимость, превращая каждый запуск в трассировку, которую можно проверять и повторно использовать в качестве артефакта регрессии.
Воспроизведение и "отклонение" от любого неудачного шага: Повторно запустите точно записанное выполнение или "отклонитесь" от участка, где что-то пошло не так, отредактируйте подсказку/ввод инструмента/модель и каскадно воспроизведите вперед, чтобы увидеть, как изменится траектория.
Проверка "доказательства исправления": После внесения изменения Retrace может повторно запустить его по исходной неудачной трассировке и выдать вердикт (например, исправлено/улучшено/регрессировало/без изменений) для проверки исправления перед выпуском.
Автоматическое обнаружение и анализ сбоев: Отмечает общие шаблоны сбоев агентов, такие как пробелы в обоснованности/точности, статистический дрейф, кластеры сбоев и типы сбоев нескольких агентов, чтобы объяснить, почему запуск завершился неудачей, а не просто то, что он завершился неудачей.
Защитные ограждения и принудительное исполнение во время выполнения: Политики, такие как бюджеты затрат, обнаружение циклов, ограничения шагов, ограничения задержки и шлюзы перед вызовом (удержание для утверждения), могут останавливать или блокировать рискованные действия, чтобы предотвратить неконтролируемое поведение и непредвиденные расходы.
Шлюзы оценки CI для поведения агентов: Запускает оценки в CI/CD и прерывает сборки, когда поведение регрессирует по сравнению с базовым уровнем, что позволяет проводить "поведенческие регрессионные тесты" для подсказок, инструментов и обновлений моделей.
Варианты использования Retrace
Отладка инцидентов производственных агентов: Когда агент выходит из строя в производстве, инженеры могут воспроизвести точный запуск, "отклониться" на шаге истинной первопричины (а не конечного симптома) и проверить исправление с помощью "доказательства исправления" перед повторным развертыванием.
Выпуск более безопасных агентов, использующих инструменты (DevOps/SRE): Для агентов, которые запрашивают журналы/метрики или запускают операционные действия, "защитные ограждения" (бюджеты, ограничения циклов, шлюзы утверждения) снижают риск каскадных сбоев или дорогостоящих неконтролируемых выполнений.
Регрессионное тестирование для изменений подсказок/инструментов/моделей: Команды, итерирующие подсказки, меняющие инструменты или обновляющие модели, могут использовать записанные сбои и шлюзы оценки, чтобы гарантировать, что многошаговое поведение не ухудшается незаметно в разных выпусках.
Надежность многоагентного рабочего процесса (исследование → конвейеры записи): В системах с агентами-планировщиками/исследователями/писателями Retrace помогает визуализировать топологию агентов, выявлять сбои при передаче между агентами и воспроизводить/"отклоняться" для тестирования улучшенной координации.
Мониторинг качества и соответствия для корпоративных помощников: Обнаружение обоснованности и отслеживаемость поддерживают аудит и контроль качества для помощников в регулируемых или ответственных контекстах (например, финансы, здравоохранение, юриспруденция), где галлюцинации и небезопасные действия должны быть выявлены на ранней стадии.
Преимущества
Отладка с замкнутым циклом: воспроизведение, "отклонение" и проверка исправлений вместо простого просмотра журналов/метрик.
Независимый от фреймворка и поставщика подход с легкой инструментацией (Python/TypeScript) и поддержкой распространенных поставщиков LLM.
Защитные ограждения во время выполнения могут предотвратить дорогостоящее или небезопасное поведение агентов (бюджеты, обнаружение циклов, шлюзы утверждения).
Шлюзы оценки CI превращают реальные сбои в поведенческие регрессионные тесты, помогая командам выпускать продукты с большей уверенностью.
Недостатки
Некоторые возможности зависят от поддержки поставщика/ключа (например, некоторые потоки воспроизведения/оценки могут быть более зрелыми для конкретных поставщиков).
Значимые шлюзы оценки требуют продуманного дизайна оценки и пороговых значений; настройка может быть нетривиальной для сложных агентов.
Запись подробных трассировок может вызвать соображения конфиденциальности/соответствия, требующие тщательного редактирования и управления данными в чувствительных средах.
Как использовать Retrace
1) Создайте аккаунт: Перейдите на https://retraceai.tech/ и зарегистрируйтесь (поддерживается вход через GitHub). Для начала работы кредитная карта не требуется.
2) Установите Retrace SDK: Добавьте Retrace SDK в свой проект агента (Python или TypeScript). Retrace не зависит от фреймворков и работает с LangChain, CrewAI, LlamaIndex, Vercel AI SDK, AutoGen и т.д.
3) Настройте свой API-ключ: В своем коде настройте Retrace с помощью API-ключа вашего рабочего пространства (пример, показанный на сайте, использует `retrace.configure(api_key="rt_...")`). Это подключает ваше приложение к Retrace, чтобы трассировки могли передаваться на панель мониторинга.
4) Добавьте декоратор записи к точке входа вашего агента: Оберните основную функцию вашего агента декоратором, показанным в документации: `@retrace.record(name="my-agent")`. Этот единственный декоратор фиксирует каждый вызов LLM, вызов инструмента, стоимость, время и ошибку.
5) Запустите своего агента как обычно: Выполните своего агента как обычно. Retrace автоматически фиксирует вызовы OpenAI, Anthropic и Gemini, а также записывает вызовы инструментов и сбои в виде спанов на временной шкале трассировки.
6) Смотрите потоковую передачу трассировок в реальном времени (опционально CLI tail): Используйте CLI для просмотра живых трассировок (пример с сайта: `retrace traces tail`). Вы увидите такие шаги, как классификация намерений, получение контекста и генерация ответа с указанием времени и затрат.
7) Проверьте трассировку на панели мониторинга: Откройте пользовательский интерфейс Retrace, чтобы прокрутить временную шкалу, открыть любой спан и увидеть полную последовательность вызовов модели/инструмента. Это поможет вам найти, где на самом деле произошел сбой (часто раньше окончательной ошибки).
8) Повторите неудачный запуск: Повторно запустите любую записанную трассировку, чтобы воспроизвести точное поведение. Retrace разработан таким образом, что производственный сбой становится постоянным регрессионным тестом, который вы можете повторно запускать.
9) Создайте форк из точного сбойного спана: Выберите спан, где выполнение отклонилось или завершилось сбоем, затем создайте форк, чтобы разветвиться с этой точки (показаны примеры команд: `retrace forks create --trace <id> --span <id> --input "..."`).
10) Отредактируйте сломанный шаг (подсказка/ввод инструмента/модель) и каскадно-повторите: В форке измените то, что вызвало сбой (например, скорректируйте подсказку, исправьте ввод инструмента или замените модель), затем повторите форк (пример: `retrace forks replay <id> --wait`). Retrace каскадно-повторяет с точки форка вперед, чтобы последующие шаги использовали обновленный контекст.
11) Докажите исправление с помощью вердикта: Запустите встроенную проверку, чтобы сравнить исправленный форк с исходным неудачным запуском и получить вердикт (пример: `retrace traces verify-fix <id>`), сообщаемый как улучшенный/регрессировавший/неизмененный (и показанный как «исправление проверено» в примере на сайте).
12) Добавьте защитные ограждения во время выполнения (рекомендуется): Настройте защитные ограждения/автоматические выключатели для остановки выполнений, которые превышают бюджеты, слишком долго зацикливаются, переполняют контекст или превышают лимиты задержки. Retrace может выдать HALT, чтобы остановить неконтролируемое поведение, прежде чем оно приведет к увеличению затрат или вызовет нежелательные действия.
13) Включите сигналы обнаружения (рекомендуется): Используйте функции обнаружения Retrace для автоматической пометки пробелов в обоснованности, дрейфа, кластеров сбоев и типов сбоев MAST, чтобы вы могли понять, почему выполнение завершилось сбоем (а не просто то, что оно завершилось сбоем).
14) (Необязательно) Добавьте ключ поставщика вашей модели для серверных повторов и ворот оценки: На панели управления Retrace в разделе «Настройки» добавьте ключ вашего поставщика (сайт выделяет Google/Gemini для ворот оценки + повторов). Retrace проверяет ключ при сохранении, шифрует его в состоянии покоя, показывает только последние 4 символа и использует его, чтобы токены повтора/оценки выставлялись на счет вашего поставщика.
15) Создайте оценку и набор данных для регрессионного тестирования: Настройте оценки (и, при желании, наборы данных и правила автоматической оценки), чтобы вы могли оценивать поведение агента по записанным запускам и сравнивать с базовым («золотым») поведением.
16) Заблокируйте PR с помощью Eval Gate в CI: Добавьте шаг CI, который запускает ворота оценки Retrace, чтобы сборки завершались сбоем при регрессии поведения. Пример шага GitHub Actions с сайта: `retrace eval gate --evaluation $EVAL_ID --trace $TRACE_ID --threshold 0.8` с `RETRACE_API_KEY` в секретах; команда завершается с кодом 1 при сбое.
17) Итерируйте, используя замкнутый цикл рабочего процесса: Повторите цикл надежности: Запишите реальный сбой → Воспроизведите его → Создайте форк из сбойного шага → Исправьте → Докажите исправление → Добавьте его в ворота оценки, чтобы ту же регрессию было сложнее снова выпустить.
Часто задаваемые вопросы о Retrace
Retrace — это движок для воспроизведения выполнения для агентов ИИ, который записывает каждый вызов LLM, вызов инструмента и ошибку, так что вы можете воспроизводить запуски, "отклоняться" от ошибочного шага и проверять исправления перед выпуском.
Популярные статьи

Atoms: Мультиагентная ИИ-платформа, которая превращает идеи в готовые к запуску продукты
May 22, 2026

Nano Banana SBTI: Что это такое, как это работает и как это использовать в 2026 году
Apr 15, 2026

Обзор Atoms — AI Product Builder, переопределяющий цифровое творчество в 2026 году
Apr 10, 2026

Kilo Claw: Как развернуть и использовать настоящего AI-агента "Сделай-Это-За-Вас" (Обновление 2026)
Apr 3, 2026







