
PMB | Local-first memory for AI
PMB è un livello di memoria persistente local-first, nativo MCP, Apache-2.0 che memorizza la conoscenza dell'agente in SQLite + LanceDB su disco e inietta automaticamente un richiamo ibrido veloce (BM25 + vettori + grafo di entità) in strumenti come Claude Code, Cursor, Codex e Zed—offline, senza chiavi API o cloud.
https://pmbai.dev/?ref=producthunt&utm_source=aipure

Informazioni sul Prodotto
Aggiornato:Jun 29, 2026
Cos'è PMB | Local-first memory for AI
PMB (Personal Memory Brain) è un sistema di memoria local-first progettato per risolvere il problema dell'"IA dimentica ogni sessione" per gli agenti di codifica. Invece di affidarsi alla cronologia delle chat o ai servizi cloud, PMB memorizza ricordi duraturi e riutilizzabili—come fatti del progetto, decisioni, lezioni e contesto del file—direttamente sulla tua macchina in un unico spazio di lavoro che controlli. Si integra con i client compatibili con MCP (inclusi Claude Code, Cursor, Codex, Zed, Windsurf, Gemini e le configurazioni Copilot MCP) in modo che il tuo agente possa portare il contesto tra le sessioni e persino tra diversi strumenti, mantenendo tutto privato e offline-first. PMB fornisce anche un'interfaccia utente dashboard locale per ispezionare, verificare ed esplorare ciò che è stato memorizzato.
Caratteristiche principali di PMB | Local-first memory for AI
PMB (Personal Memory Brain) è un livello di memoria persistente "local-first" Apache-2.0 per agenti di codifica AI che memorizza decisioni, lezioni, fatti di progetto e contesto del flusso di lavoro sulla tua macchina (SQLite + LanceDB) e mostra automaticamente le memorie più rilevanti agli strumenti compatibili con MCP (ad es. Claude Code, Cursor, Codex, Zed) prima che il modello risponda. Sottolinea il recupero veloce e offline (nessuna chiave API, nessun cloud, nessuna telemetria), la qualità della ricerca ibrida (BM25 + vettori densi + grafo di entità con reranking opzionale) e funzionalità di "igiene della memoria" come il punteggio di follow-rate che ti aiuta a potare regole inutili. Una dashboard locale fornisce visibilità e controllo tramite un grafo (Mappa) e un diario (Cronologia), mentre le opzioni di backup/sincronizzazione/esportazione supportano la portabilità tra macchine.
Archivio di memoria persistente "local-first": Mantiene la memoria a lungo termine dell'agente sul tuo disco in un database SQLite duraturo con vettori LanceDB accanto ad esso, copiabile, ispezionabile e utilizzabile offline con zero chiavi API.
Integrazione agente nativa MCP, con un solo comando: Si connette agli agenti di codifica più diffusi tramite MCP su stdio (server child-process) utilizzando semplici comandi come `pmb connect ...`, consentendo a più agenti di condividere uno spazio di lavoro.
Iniezione automatica della memoria pre-prompt: Richiama e inietta decisioni/lezioni/file rilevanti nel contesto dell'agente prima che ragioni, in modo che l'agente non debba ricordarsi di chiamare uno strumento di memoria.
Recupero ibrido con fusione classificata: Combina la ricerca lessicale BM25, gli embedding densi e un grafo di entità, fusi tramite Reciprocal Rank Fusion (con reranking opzionale) per migliorare la qualità e la rilevanza del richiamo.
Scritture veloci e non bloccanti e richiamo a bassa latenza: Le scritture vengono restituite immediatamente mentre gli inserimenti di embedding/vettori vengono eseguiti in modo asincrono; il richiamo è progettato per essere veloce sulla CPU locale (decine di millisecondi nell'uso tipico).
Dashboard verificabile: Mappa + Cronologia: Fornisce un'interfaccia utente web locale per esplorare la memoria come un grafo di entità e un diario simile a un grafo git di decisioni/lezioni/modifiche, migliorando la trasparenza e il controllo.
Casi d'uso di PMB | Local-first memory for AI
Continuità dell'ingegneria del software tra le sessioni: I team o gli sviluppatori individuali possono preservare le decisioni architettoniche, le convenzioni e le lezioni di debug precedenti, in modo che ogni nuova sessione di codifica inizi con un contesto stabile invece di dover rispiegare tutto.
Flussi di lavoro per sviluppatori multi-strumento (cambio IDE/agente): Gli sviluppatori che alternano tra Cursor, Claude Code, Codex CLI, Zed, ecc. possono mantenere uno spazio di lavoro di memoria condiviso in modo che il contesto li segua tra gli strumenti.
Ambienti di codifica offline/privati: Organizzazioni sensibili alla sicurezza (finanza, sanità, difesa) o configurazioni "air-gapped" possono utilizzare PMB per una memoria e un recupero duraturi senza inviare codice o note al cloud.
Sviluppo e manutenzione di prodotti a lungo termine: Per progetti con mesi/anni di evoluzione, PMB può memorizzare problemi ricorrenti, note di migrazione delle dipendenze e motivazioni storiche per ridurre le regressioni e gli incidenti ripetuti.
Ricerca e valutazione di sistemi di memoria/recupero: I ricercatori di AI applicata possono confrontare e iterare su pipeline di richiamo ibride (BM25 + vettori + grafo) utilizzando misurazioni locali riproducibili e artefatti di memoria visibili.
Base di conoscenza personale portatile per i creatori: I creatori indipendenti possono mantenere un "cervello ingegneristico" personale di decisioni e lezioni, quindi esportare/crittografare/sincronizzare lo spazio di lavoro su più dispositivi per la continuità.
Vantaggi
Forte postura sulla privacy: archiviazione "local-first", nessun cloud, nessuna telemetria, nessuna chiave API richiesta per il richiamo.
Approccio di recupero di alta qualità: ricerca ibrida (BM25 + vettori + grafo di entità) con fusione classificata e reranking opzionale.
Flusso di lavoro a basso attrito: l'iniezione automatica del richiamo e la registrazione riducono il prompting manuale e il sovraccarico di chiamata degli strumenti.
Trasparenza e controllo: la dashboard locale (Mappa/Cronologia) più la portabilità basata su file (SQLite/LanceDB) rendono la memoria verificabile.
Svantaggi
Richiede configurazione/manutenzione locale: gli utenti devono installare/configurare e gestire spazi di lavoro, backup e scelte di modelli per embedding/estrazione.
La rilevanza/sicurezza dipende da un gating corretto: gli agenti personalizzati devono replicare il comportamento di istruzione/gating di PMB per evitare di mostrare fatti personali irrilevanti.
La scelta del modello di embedding è importante: gli spazi di lavoro multilingue potrebbero richiedere una configurazione esplicita per evitare un recupero degradato con embedding solo in inglese.
Compromessi sulle risorse locali: l'indicizzazione, gli embedding e l'estrazione/riassunto opzionali possono consumare CPU/RAM e potrebbero richiedere una messa a punto per spazi di lavoro di grandi dimensioni.
Come usare PMB | Local-first memory for AI
1) Installa PMB: In un terminale, installa PMB con pip:
pip install pmb-ai
PMB è puro Python e funziona su macOS, Linux e Windows.
2) Collega PMB al tuo agente di codifica AI (MCP): Collega PMB al tuo agente tramite MCP (stdio). Esempio per Claude Code:
pmb connect claude-code
PMB viene eseguito come processo figlio del tuo agente (nessuna rete, nessuna porta). Inietterà la memoria pertinente prima che il modello risponda e registrerà il lavoro dopo.
3) Verifica la configurazione: Esegui la diagnostica integrata per confermare che il cablaggio e gli hook MCP siano attivi:
pmb doctor
4) Usa il tuo agente normalmente (la memoria è automatica): Inizia a lavorare come fai di solito nel tuo agente/editor. PMB automaticamente:
- Classifica rapidamente ogni messaggio
- Richiama le memorie corrispondenti prima che il modello risponda
- Scrive nuovi eventi in modo asincrono (le scritture tornano istantaneamente; l'embedding/l'inserimento vettoriale avviene in background)
Non sono necessarie chiamate speciali agli strumenti durante l'uso normale.
5) Testa manualmente il richiamo dalla CLI (opzionale): Puoi interrogare direttamente la tua memoria per vedere cosa PMB farebbe emergere:
pmb recall
Quindi digita una query (ad esempio, il nome di un bug o una decisione) e rivedi i risultati classificati (lezioni/decisioni/file/ecc.).
6) Apri la dashboard locale per esplorare la memoria: Avvia la dashboard:
pmb dashboard
Quindi apri l'interfaccia utente web locale (comunemente mostrata come http://127.0.0.1:8765). La dashboard ti consente di ispezionare la tua memoria come:
- Un grafico (entità e connessioni)
- Una timeline/diario (decisioni, lezioni, commit, fallimenti, ecc.)
È solo locale (nessuna autenticazione, nessun cloud).
7) Passa a un modello di embedding multilingue se il tuo spazio di lavoro non è prevalentemente testo latino (consigliato quando avvisato): Se vedi un avviso come "Lo spazio di lavoro ha l'81% di caratteri non latini ma usa all-MiniLM-L6-v2 (solo inglese)", cambia gli embedding con un modello multilingue:
pmb config set embedding.model paraphrase-multilingual-MiniLM-L12-v2
Questo migliora il recupero quando le tue memorie/query includono testo non inglese.
8) (Avanzato) Assicurati che il tuo agente personalizzato replichi il gate di sicurezza della memoria di PMB: Se costruisci la tua integrazione agente sopra PMB, replica lo stesso blocco di gating/istruzione che PMB inietta; altrimenti fatti personali irrilevanti potrebbero emergere su domande non correlate. Il riferimento canonico è in:
src/pmb/cli/connect.py
9) Esegui il backup / sincronizza il tuo spazio di lavoro PMB con Git (consigliato): Inizializza un remoto dello spazio di lavoro e spingi regolarmente:
pmb workspace init --remote [email protected]:you/my-memory.git
pmb workspace push
Su un'altra macchina:
pmb workspace pull
Oppure clona su un nuovo dispositivo:
pmb workspace clone <url> work-laptop
(Comportamento dei conflitti annotato nella documentazione: il remoto vince in caso di conflitto.)
10) Esporta un bundle di backup crittografato (ripristino portatile): Crea un bundle crittografato e autenticato:
pmb workspace export memory.enc
Ripristinalo ovunque in uno spazio di lavoro:
pmb workspace import memory.enc personal
Questo utilizza AES + HMAC con una chiave derivata da scrypt (secondo il frammento di codice sorgente fornito).
11) Se hai bisogno di ricominciare da capo, copia la directory dello spazio di lavoro (opzione di recupero): Nel peggiore dei casi, puoi copiare la directory del tuo spazio di lavoro e ricominciare da capo. Il frammento indica che lo spazio di lavoro si trova sotto:
~/.pmb/workspaces/<id>/
Copialo come backup manuale o per migrare lo stato.
FAQ di PMB | Local-first memory for AI
PMB (Personal Memory Brain) è un sistema di memoria persistente "local-first" per agenti di codifica AI. Archivia decisioni, lezioni, fatti di progetto e altri ricordi sulla tua macchina (principalmente in un file SQLite) e fornisce contesto pertinente agli agenti tramite MCP (Model Context Protocol).
Articoli Popolari

Atoms: Una Piattaforma AI Multi-Agente Che Trasforma le Idee in Prodotti Pronti al Lancio
May 22, 2026

Nano Banana SBTI: Cos'è, come funziona e come usarlo nel 2026
Apr 15, 2026

Recensione di Atoms — Il builder di prodotti AI che ridefinisce la creazione digitale nel 2026
Apr 10, 2026

Kilo Claw: Come Distribuire e Utilizzare un Vero Agente AI "Fai-da-Te" (Aggiornamento 2026)
Apr 3, 2026







