Agentmemory
Agentmemory è un runtime di memoria local-first, senza database esterni, per agenti di codifica che cattura automaticamente le sessioni tramite hook, richiama il contesto in millisecondi con recupero BM25+vettore+grafo della conoscenza e consolida continuamente i log grezzi in memorie semantiche durevoli, esposte tramite MCP e HTTP con un visualizzatore integrato.
https://agent-memory.dev/?ref=producthunt&utm_source=aipure

Informazioni sul Prodotto
Aggiornato:May 18, 2026
Cos'è Agentmemory
Agentmemory è un livello di memoria persistente progettato per agenti di codifica AI che altrimenti dimenticherebbero tutto tra le sessioni. Funziona localmente come un singolo processo Node (non sono richiesti Postgres/Redis/Kafka/DB vettoriali) e cattura ciò che accade durante il lavoro del tuo agente – prompt, chiamate a strumenti, eventi di sessione – in modo che le sessioni future possano riutilizzare quel contesto senza che tu debba rispiegare architettura, preferenze o decisioni passate. Supporta MCP e una superficie API HTTP-first (ogni strumento MCP ha un gemello REST), e viene fornito con un visualizzatore e una console in tempo reale in modo da poter ispezionare sessioni, memorie e stato del sistema mantenendo tutti i dati sulla tua macchina.
Caratteristiche principali di Agentmemory
Agentmemory è un runtime di memoria persistente locale e a processo singolo per agenti di codifica AI che cattura ogni sessione tramite auto-hook, consolida le osservazioni grezze in memorie semantiche durature e richiama il contesto rilevante in millisecondi utilizzando il recupero ibrido a triplo flusso (BM25 + vettoriale + grafo della conoscenza) con reranking on-device. Espone un'ampia superficie MCP (51 strumenti) con equivalenti REST (121 endpoint), include interfacce utente viewer/console integrate, supporta l'importazione di trascrizioni passate, l'esportazione in markdown/Obsidian e può sincronizzare le memorie tra i nodi tramite HTTPS autenticato, evitando database esterni come Redis/Postgres/Neo4j e mantenendo i dati su disco come JSON.
Hook di acquisizione automatica (12 hook): Registra automaticamente prompt, chiamate a strumenti, eventi del ciclo di vita della sessione (ad esempio, PreToolUse/PostToolUse/Stop) e li comprime in osservazioni senza richiedere codice "colla" personalizzato.
Richiamo ibrido in millisecondi: Utilizza il recupero a triplo flusso (BM25 lessicale + vettori semantici + segnali del grafo della conoscenza) e il reranking on-device per far emergere il contesto precedente più rilevante (riportato 95,2% R@5 su LongMemEval-S; p50 < 20ms su un laptop).
Pipeline di consolidamento (grezzo → semantico): Esegue scansioni periodiche che comprimono le osservazioni in memorie semantiche, uniscono i duplicati, eliminano le righe obsolete con punteggio di conservazione ed emettono record di audit sulle eliminazioni per la governance.
API nativa MCP + HTTP-first: Fornisce 51 strumenti MCP (salvataggio/richiamo/ricerca/sessioni/governance/audit/esportazione/grafo) e rispecchia ogni strumento con endpoint REST sotto /agentmemory/* per una facile integrazione e debug.
Interfacce utente e osservabilità integrate: Fornisce un visualizzatore in tempo reale (porta 3113) per flussi live, riproduzione di sessioni, navigazione della memoria e visualizzazione grafica, oltre a console a livello di motore e tracce/log OpenTelemetry per la visibilità operativa.
Archiviazione locale-first + federazione/esportazione: Funziona come un singolo processo Node con stato JSON su disco (nessun DB esterno), supporta l'importazione di sessioni JSONL, l'esportazione markdown pronta per Obsidian e la sincronizzazione peer-to-peer autenticata tra i nodi agentmemory.
Casi d'uso di Agentmemory
Continuità dello sviluppo software: Mantenere le convenzioni di progetto, le precedenti decisioni architetturali e i risultati di debug passati tra le sessioni di codifica in modo che agenti come Claude Code/Cursor/Codex possano riprendere il lavoro senza dover rispiegare il contesto.
Acquisizione della conoscenza del team per le organizzazioni di ingegneria: Registrare e consolidare i passaggi di risoluzione dei problemi ripetuti, i runbook e gli apprendimenti degli incidenti in memorie semantiche ricercabili, riducendo il tempo di onboarding e lo sforzo di indagine ripetuto.
Coordinamento multi-agente in build complesse: Consentire a più agenti/strumenti di condividere un livello di memoria coerente (tramite MCP/REST e federazione opzionale) in modo che le attività parallele possano fare riferimento alla stessa conoscenza del progetto in evoluzione.
Ambienti regolamentati o sensibili alla privacy: Mantenere la memoria locale su disco senza database esterni e utilizzare le superfici di audit/governance per tracciare le eliminazioni e gestire la conservazione, utile per le aziende con requisiti di località dei dati.
Produttività personale e idratazione delle note: Esportare markdown con tag frontmatter in un vault Obsidian per trasformare le interazioni dell'agente in una base di conoscenza personale navigabile con visualizzazione grafica.
Integrazione della piattaforma agente tramite API: Incorporare il salvataggio/richiamo della memoria in strumenti di sviluppo personalizzati o piattaforme interne utilizzando gli endpoint REST (compatibili con curl/browser/proxy) senza essere vincolati a un framework agente specifico.
Vantaggi
Il design locale-first, a processo singolo con 0 database esterni semplifica la distribuzione e mantiene i dati sulla macchina dello sviluppatore.
Forte superficie di integrazione: 12 auto-hook, 51 strumenti MCP e "gemelli" REST facilitano il collegamento a molti client e flussi di lavoro degli agenti.
Recupero rapido e robusto tramite BM25+vettore+grafo ibrido con reranking on-device; include visualizzatore integrato e osservabilità OTEL.
Svantaggi
L'esecuzione di tutto in un unico processo Node potrebbe richiedere un'attenta gestione delle risorse su macchine piccole, nonostante i miglioramenti di salute per i processi minuscoli.
Alcune opzioni e configurazioni del provider (ad esempio, il fallback SDK dell'agente Claude opzionale) possono introdurre rischi operativi se utilizzate in modo improprio (rischio di ricorsione notato).
Principalmente ottimizzato per i flussi di lavoro degli agenti di codifica; i domini non di codifica potrebbero richiedere un'ulteriore personalizzazione delle strategie di acquisizione/consolidamento.
Come usare Agentmemory
1) Avvia il server locale di Agentmemory: In un terminale separato, esegui: npx @agentmemory/agentmemory. Questo avvia il runtime della memoria su http://localhost:3111 e il visualizzatore in tempo reale su http://localhost:3113.
2) Verifica che il server sia integro: Controlla l'endpoint di integrità: curl http://localhost:3111/agentmemory/health. Conferma che riporti 'healthy' prima di collegare qualsiasi client.
3) Apri il visualizzatore in tempo reale (opzionale ma consigliato): Naviga su http://localhost:3113 per guardare i flussi di osservazione in tempo reale, sfogliare le memorie, riprodurre le sessioni e ispezionare il grafo della conoscenza.
4) Collega un client compatibile con MCP (configurazione MCP universale): Aggiungi una voce del server MCP nella configurazione MCP del tuo client usando: command=npx, args=["-y","@agentmemory/mcp"], e env AGENTMEMORY_URL=http://localhost:3111. Questo espone l'intera superficie degli strumenti MCP di Agentmemory al client.
5) (Hermes) Configura Agentmemory come server MCP: In ~/.hermes/config.yaml, aggiungi una voce mcp_servers per agentmemory che esegue npx con args ["-y","@agentmemory/mcp"], e imposta AGENTMEMORY_URL su http://localhost:3111 in modo che Hermes possa accedere all'intero set di strumenti di memoria.
6) (Hermes) Abilita Agentmemory come provider di memoria: Nella stessa configurazione di Hermes, imposta memory.provider su agentmemory in modo che Hermes utilizzi Agentmemory per salvare/richiamare tra le sessioni.
7) Usa gli strumenti di memoria durante il lavoro: Dal tuo client MCP, chiama gli strumenti di Agentmemory per archiviare e recuperare informazioni (ad esempio, salva decisioni/risultati chiave, quindi richiamali in seguito). Agentmemory supporta anche il richiamo intelligente/ibrido e la navigazione delle sessioni tramite la sua superficie di strumenti MCP.
8) Usa direttamente l'API REST (opzionale): Se preferisci le chiamate HTTP, usa gli endpoint REST sotto /agentmemory/* su localhost:3111 (ogni strumento MCP ha un gemello REST). Questo è utile per lo scripting, il debug o il proxy dal tuo agente.
9) Importa sessioni passate (opzionale): Se hai trascrizioni di agenti di codifica esistenti (ad esempio, JSONL), usa la capacità di importazione sessioni di Agentmemory per reidratare le sessioni precedenti nello store in modo che diventino ricercabili e riproducibili.
10) Mantieni il server in esecuzione mentre usi il tuo agente: Lascia il server Agentmemory in esecuzione in background. Mentre lavori, cattura le sessioni (tramite hook/plugin dove supportato) e le rende disponibili per un richiamo rapido nelle sessioni future.
11) (Integrazione più profonda di Hermes) Installa il plugin Hermes (opzionale): Per la cattura guidata da hook e un'integrazione più ricca (iniezione pre-contesto, cattura turni, mirroring MEMORY.md, blocco prompt di sistema), copia il plugin di integrazione Hermes dal repository agentmemory in ~/.hermes/plugins/agentmemory.
12) Conferma la cattura + il richiamo end-to-end: Esegui una breve attività nel tuo agente, quindi usa il visualizzatore (3113) o una chiamata allo strumento di richiamo/ricerca per confermare che la sessione è stata catturata e può essere recuperata in una sessione successiva senza rispiegare il contesto precedente.
FAQ di Agentmemory
agentmemory è un runtime di memoria persistente per agenti di codifica AI che cattura sessioni, richiama rapidamente il contesto rilevante e consolida le osservazioni grezze in memorie semantiche a più lunga durata. È posizionato come "lo strato di memoria che il tuo agente di codifica avrebbe dovuto avere fin dal primo giorno" e non è solo una libreria o un archivio vettoriale.
Articoli Popolari

Nano Banana SBTI: Cos'è, come funziona e come usarlo nel 2026
Apr 15, 2026

Recensione di Atoms — Il builder di prodotti AI che ridefinisce la creazione digitale nel 2026
Apr 10, 2026

Kilo Claw: Come Distribuire e Utilizzare un Vero Agente AI "Fai-da-Te" (Aggiornamento 2026)
Apr 3, 2026

OpenAI chiude l'app Sora: cosa riserva il futuro per la generazione di video AI nel 2026
Mar 25, 2026







