Agentmemory
Agentmemory es un tiempo de ejecución de memoria local-first, sin base de datos externa, para agentes de codificación que captura automáticamente sesiones a través de hooks, recupera contexto en milisegundos con recuperación BM25+vector+grafo de conocimiento, y consolida continuamente registros sin procesar en memorias semánticas duraderas, expuestas a través de MCP y HTTP con un visor incorporado.
https://agent-memory.dev/?ref=producthunt&utm_source=aipure

Información del Producto
Actualizado:18/05/2026
¿Qué es Agentmemory?
Agentmemory es una capa de memoria persistente diseñada para agentes de codificación de IA que de otro modo olvidarían todo entre sesiones. Se ejecuta localmente como un único proceso de Node (no se requiere Postgres/Redis/Kafka/base de datos vectorial) y captura lo que sucede durante el trabajo de su agente (prompts, llamadas a herramientas, eventos de sesión) para que las sesiones futuras puedan reutilizar ese contexto sin que usted vuelva a explicar la arquitectura, las preferencias o las decisiones pasadas. Admite MCP y una superficie de API HTTP-first (cada herramienta MCP tiene un gemelo REST), y se envía con un visor y una consola en tiempo real para que pueda inspeccionar sesiones, memorias y el estado del sistema mientras mantiene todos los datos en su máquina.
Características Principales de Agentmemory
Agentmemory es un tiempo de ejecución de memoria persistente local y de un solo proceso para agentes de codificación de IA que captura cada sesión a través de "auto-hooks", consolida las observaciones en bruto en memorias semánticas duraderas y recupera el contexto relevante en milisegundos utilizando recuperación híbrida de triple flujo (BM25 + vector + grafo de conocimiento) con reranking en el dispositivo. Expone una amplia superficie MCP (51 herramientas) con equivalentes REST (121 puntos finales), incluye interfaces de usuario de visor/consola incorporadas, admite la importación de transcripciones anteriores, la exportación a markdown/Obsidian y puede sincronizar memorias entre nodos a través de HTTPS autenticado, evitando bases de datos externas como Redis/Postgres/Neo4j y manteniendo los datos en disco como JSON.
Ganchos de autocaptura (12 ganchos): Registra automáticamente las indicaciones, las llamadas a herramientas, los eventos del ciclo de vida de la sesión (por ejemplo, PreToolUse/PostToolUse/Stop) y los comprime en observaciones sin requerir código de pegamento personalizado.
Recuperación híbrida en milisegundos: Utiliza recuperación de triple flujo (BM25 léxico + vectores semánticos + señales de grafo de conocimiento) y reranking en el dispositivo para mostrar el contexto anterior más relevante (se informó un 95.2% R@5 en LongMemEval-S; p50 < 20ms en una computadora portátil).
Pipeline de consolidación (bruto → semántico): Realiza barridos periódicos que comprimen las observaciones en memorias semánticas, fusionan duplicados, decaen filas obsoletas con puntuación de retención y emiten registros de auditoría sobre eliminaciones para la gobernanza.
API nativa de MCP + HTTP-first: Proporciona 51 herramientas MCP (guardar/recuperar/buscar/sesiones/gobernanza/auditoría/exportar/grafo) y replica cada herramienta con puntos finales REST bajo /agentmemory/* para una fácil integración y depuración.
UIs integradas y observabilidad: Incluye un visor en tiempo real (puerto 3113) para transmisiones en vivo, reproducción de sesiones, navegación de memoria y visualización de gráficos, además de una consola a nivel de motor y trazas/registros de OpenTelemetry para visibilidad operativa.
Almacenamiento local-first + federación/exportación: Se ejecuta como un único proceso de Node con estado JSON en disco (sin bases de datos externas), admite la importación de sesiones JSONL, la exportación de markdown lista para Obsidian y la sincronización autenticada de igual a igual entre nodos de agentmemory.
Casos de Uso de Agentmemory
Continuidad del desarrollo de software: Persiste las convenciones del proyecto, las decisiones arquitectónicas previas y los resultados de depuración anteriores en todas las sesiones de codificación para que agentes como Claude Code/Cursor/Codex puedan retomar el trabajo sin volver a explicar el contexto.
Captura de conocimiento del equipo para organizaciones de ingeniería: Registra y consolida los pasos de solución de problemas repetidos, los "runbooks" y los aprendizajes de incidentes en memorias semánticas buscables, reduciendo el tiempo de incorporación y el esfuerzo de investigación repetido.
Coordinación multiagente en construcciones complejas: Permite que múltiples agentes/herramientas compartan una capa de memoria consistente (a través de MCP/REST y federación opcional) para que las tareas paralelas puedan hacer referencia al mismo conocimiento del proyecto en evolución.
Entornos regulados o sensibles a la privacidad: Mantiene la memoria local en disco sin bases de datos externas y utiliza superficies de auditoría/gobernanza para rastrear eliminaciones y gestionar la retención, útil para empresas con requisitos de localidad de datos.
Productividad personal e hidratación de notas: Exporta markdown etiquetado con "frontmatter" a una bóveda de Obsidian para convertir las interacciones del agente en una base de conocimiento personal navegable con visualización de gráficos.
Integración de plataformas de agentes a través de APIs: Integra la función de guardar/recuperar memoria en herramientas de desarrollo personalizadas o plataformas internas utilizando los puntos finales REST (compatibles con curl/navegador/proxy) sin estar limitado a un marco de agente específico.
Ventajas
Diseño local-first y de un solo proceso con 0 bases de datos externas simplifica la implementación y mantiene los datos en la máquina del desarrollador.
Fuerte superficie de integración: 12 "auto-hooks", 51 herramientas MCP y equivalentes REST facilitan la conexión con muchos clientes y flujos de trabajo de agentes.
Recuperación rápida y robusta a través de BM25+vector+grafo híbrido con reranking en el dispositivo; incluye visor integrado y observabilidad OTEL.
Desventajas
Ejecutar todo en un solo proceso de Node puede requerir una gestión cuidadosa de los recursos en máquinas pequeñas a pesar de las mejoras de salud para procesos pequeños.
Algunas opciones y configuraciones de proveedor (por ejemplo, la opción de respaldo del SDK del agente Claude) pueden introducir riesgos operativos si se usan incorrectamente (riesgo de recursión notado).
Optimizado principalmente para flujos de trabajo de agentes de codificación; los dominios no relacionados con la codificación pueden necesitar una adaptación adicional de las estrategias de captura/consolidación.
Cómo Usar Agentmemory
1) Inicie el servidor local de Agentmemory: En una terminal separada, ejecute: npx @agentmemory/agentmemory. Esto inicia el tiempo de ejecución de la memoria en http://localhost:3111 y el visor en tiempo real en http://localhost:3113.
2) Verifique que el servidor esté en buen estado: Verifique el endpoint de salud: curl http://localhost:3111/agentmemory/health. Confirme que informa estar en buen estado antes de conectar cualquier cliente.
3) Abra el visor en tiempo real (opcional pero recomendado): Navegue a http://localhost:3113 para ver transmisiones de observación en vivo, explorar memorias, reproducir sesiones e inspeccionar el grafo de conocimiento.
4) Conecte un cliente compatible con MCP (configuración universal de MCP): Agregue una entrada de servidor MCP en la configuración MCP de su cliente usando: command=npx, args=["-y","@agentmemory/mcp"], y env AGENTMEMORY_URL=http://localhost:3111. Esto expone la superficie completa de la herramienta MCP de Agentmemory al cliente.
5) (Hermes) Configure Agentmemory como un servidor MCP: En ~/.hermes/config.yaml, agregue una entrada mcp_servers para agentmemory que ejecute npx con args ["-y","@agentmemory/mcp"], y configure AGENTMEMORY_URL en http://localhost:3111 para que Hermes pueda acceder al conjunto completo de herramientas de memoria.
6) (Hermes) Habilite Agentmemory como proveedor de memoria: En la misma configuración de Hermes, establezca memory.provider en agentmemory para que Hermes use Agentmemory para guardar/recordar entre sesiones.
7) Use herramientas de memoria durante el trabajo: Desde su cliente MCP, llame a las herramientas de Agentmemory para almacenar y recuperar información (por ejemplo, guardar decisiones/resultados clave, luego recordarlos más tarde). Agentmemory también admite la recuperación inteligente/híbrida y la navegación de sesiones a través de su superficie de herramientas MCP.
8) Use la API REST directamente (opcional): Si prefiere las llamadas HTTP, use los endpoints REST bajo /agentmemory/* en localhost:3111 (cada herramienta MCP tiene un gemelo REST). Esto es útil para scripting, depuración o proxy desde su propio agente.
9) Importar sesiones pasadas (opcional): Si tiene transcripciones de agentes de codificación existentes (por ejemplo, JSONL), use la capacidad de importación de sesiones de Agentmemory para rehidratar sesiones anteriores en el almacén para que sean buscables y reproducibles.
10) Mantenga el servidor en ejecución mientras usa su agente: Deje el servidor de Agentmemory ejecutándose en segundo plano. A medida que trabaja, captura sesiones (a través de hooks/plugins donde se admite) y las pone a disposición para una recuperación rápida en sesiones futuras.
11) (Integración más profunda de Hermes) Instale el plugin de Hermes (opcional): Para la captura basada en hooks y una integración más rica (inyección de pre-contexto, captura de turnos, duplicación de MEMORY.md, bloque de prompt del sistema), copie el plugin de integración de Hermes del repositorio de agentmemory en ~/.hermes/plugins/agentmemory.
12) Confirmar captura + recuperación de extremo a extremo: Ejecute una tarea corta en su agente, luego use el visor (3113) o una llamada a la herramienta de recuperación/búsqueda para confirmar que la sesión fue capturada y puede recuperarse en una sesión posterior sin volver a explicar el contexto anterior.
Preguntas Frecuentes de Agentmemory
agentmemory es un tiempo de ejecución de memoria persistente para agentes de codificación de IA que captura sesiones, recupera contexto relevante rápidamente y consolida observaciones crudas en memorias semánticas de mayor duración. Se posiciona como "la capa de memoria que tu agente de codificación debería haber tenido desde el primer día", y no es solo una biblioteca o un almacén de vectores.
Artículos Populares

Nano Banana SBTI: Qué es, cómo funciona y cómo usarlo en 2026
Apr 15, 2026

Reseña de Atoms: El Constructor de Productos de IA que Redefine la Creación Digital en 2026
Apr 10, 2026

Kilo Claw: Cómo implementar y usar un verdadero agente de IA "Hágalo por usted" (Actualización 2026)
Apr 3, 2026

OpenAI cierra la aplicación Sora: Qué le depara el futuro a la generación de video con IA en 2026
Mar 25, 2026







