Agentmemory
Agentmemory는 후크를 통해 세션을 자동 캡처하고, BM25+벡터+지식 그래프 검색으로 밀리초 단위로 컨텍스트를 호출하며, 원시 로그를 내구성 있는 의미론적 메모리로 지속적으로 통합하는 코딩 에이전트용 로컬 우선, 외부 데이터베이스 없는 메모리 런타임입니다. 내장 뷰어와 함께 MCP 및 HTTP를 통해 노출됩니다.
https://agent-memory.dev/?ref=producthunt&utm_source=aipure

제품 정보
업데이트됨:May 18, 2026
Agentmemory이란?
Agentmemory는 세션 간에 모든 것을 잊어버리는 AI 코딩 에이전트를 위해 설계된 영구 메모리 계층입니다. 로컬에서 단일 Node 프로세스로 실행되며(Postgres/Redis/Kafka/벡터 DB 필요 없음) 에이전트 작업 중에 발생하는 일(프롬프트, 도구 호출, 세션 이벤트)을 캡처하여 향후 세션에서 아키텍처, 기본 설정 또는 과거 결정을 다시 설명할 필요 없이 해당 컨텍스트를 재사용할 수 있도록 합니다. MCP 및 HTTP 우선 API 표면(각 MCP 도구에는 REST 트윈이 있음)을 지원하며, 모든 데이터를 머신에 보관하면서 세션, 메모리 및 시스템 상태를 검사할 수 있는 실시간 뷰어 및 콘솔과 함께 제공됩니다.
Agentmemory의 주요 기능
Agentmemory는 AI 코딩 에이전트를 위한 로컬 우선 단일 프로세스 영구 메모리 런타임으로, 자동 후크를 통해 모든 세션을 캡처하고, 원시 관찰을 영구적인 의미 기억으로 통합하며, 하이브리드 삼중 스트림 검색(BM25 + 벡터 + 지식 그래프)과 온디바이스 재순위 지정을 사용하여 관련 컨텍스트를 밀리초 단위로 불러옵니다. 이는 REST 등가물(121개 엔드포인트)을 포함한 광범위한 MCP 표면(51개 도구)을 노출하고, 내장된 뷰어/콘솔 UI를 포함하며, 과거 스크립트 가져오기, 마크다운/옵시디언으로 내보내기를 지원하고, 인증된 HTTPS를 통해 노드 간에 메모리를 동기화할 수 있습니다. 이 모든 것은 Redis/Postgres/Neo4j와 같은 외부 데이터베이스를 피하고 데이터를 JSON으로 디스크에 유지하면서 이루어집니다.
자동 캡처 후크 (12개 후크): 프롬프트, 도구 호출, 세션 수명 주기 이벤트(예: PreToolUse/PostToolUse/Stop)를 자동으로 기록하고 사용자 지정 글루 코드가 필요 없이 관찰로 압축합니다.
밀리초 단위의 하이브리드 호출: 삼중 스트림 검색(어휘 BM25 + 의미 벡터 + 지식 그래프 신호)과 온디바이스 재순위 지정을 사용하여 가장 관련성 높은 이전 컨텍스트를 표면화합니다(LongMemEval-S에서 95.2% R@5 보고; 노트북에서 p50 < 20ms).
통합 파이프라인 (원시 → 의미): 관찰을 의미 기억으로 압축하고, 중복을 병합하고, 보존 점수를 사용하여 오래된 행을 소멸시키고, 거버넌스를 위한 삭제에 대한 감사 기록을 내보내는 주기적인 스윕을 실행합니다.
MCP-네이티브 + HTTP-우선 API: 51개의 MCP 도구(저장/호출/검색/세션/거버넌스/감사/내보내기/그래프)를 제공하고, 쉬운 통합 및 디버깅을 위해 각 도구를 /agentmemory/* 아래의 REST 엔드포인트로 미러링합니다.
내장 UI 및 관찰 가능성: 실시간 스트림, 세션 재생, 메모리 탐색 및 그래프 시각화를 위한 실시간 뷰어(포트 3113)와 운영 가시성을 위한 엔진 수준 콘솔 및 OpenTelemetry 추적/로그를 제공합니다.
로컬 우선 저장소 + 연동/내보내기: 단일 Node 프로세스로 실행되며 디스크에 JSON 상태를 저장하고(외부 DB 없음), JSONL 세션 가져오기, Obsidian 준비 마크다운 내보내기, agentmemory 노드 간의 인증된 P2P 동기화를 지원합니다.
Agentmemory의 사용 사례
소프트웨어 개발 연속성: 프로젝트 규칙, 이전 아키텍처 결정, 과거 디버깅 결과를 코딩 세션 전반에 걸쳐 유지하여 Claude Code/Cursor/Codex와 같은 에이전트가 컨텍스트를 다시 설명할 필요 없이 작업을 시작할 수 있도록 합니다.
엔지니어링 조직을 위한 팀 지식 캡처: 반복되는 문제 해결 단계, 런북, 사고 학습을 검색 가능한 의미 기억으로 기록하고 통합하여 온보딩 시간을 단축하고 반복적인 조사 노력을 줄입니다.
복잡한 빌드에서의 다중 에이전트 조정: 여러 에이전트/도구가 일관된 메모리 계층(MCP/REST 및 선택적 연동을 통해)을 공유할 수 있도록 하여 병렬 작업이 동일하게 진화하는 프로젝트 지식을 참조할 수 있도록 합니다.
규제 또는 개인 정보 보호에 민감한 환경: 외부 데이터베이스 없이 메모리를 디스크에 로컬로 유지하고 감사/거버넌스 표면을 사용하여 삭제를 추적하고 보존을 관리합니다. 이는 데이터 지역성 요구 사항이 있는 기업에 유용합니다.
개인 생산성 및 노트 활성화: 프론트매터 태그가 지정된 마크다운을 Obsidian 볼트로 내보내 에이전트 상호 작용을 그래프 시각화가 가능한 탐색 가능한 개인 지식 기반으로 전환합니다.
API를 통한 에이전트 플랫폼 통합: 특정 에이전트 프레임워크에 얽매이지 않고 REST 엔드포인트(curl/브라우저/프록시 친화적)를 사용하여 사용자 지정 개발자 도구 또는 내부 플랫폼에 메모리 저장/호출을 내장합니다.
장점
로컬 우선, 단일 프로세스 설계로 0개의 외부 데이터베이스를 사용하여 배포를 단순화하고 데이터를 개발자 머신에 유지합니다.
강력한 통합 표면: 12개의 자동 후크, 51개의 MCP 도구 및 REST 쌍은 많은 에이전트 클라이언트 및 워크플로우에 쉽게 연결할 수 있도록 합니다.
하이브리드 BM25+벡터+그래프와 온디바이스 재순위 지정을 통한 빠르고 강력한 검색; 내장 뷰어 및 OTEL 관찰 가능성을 포함합니다.
단점
작은 프로세스에 대한 상태 개선에도 불구하고, 모든 것을 하나의 Node 프로세스에서 실행하는 것은 작은 머신에서 신중한 리소스 관리가 필요할 수 있습니다.
일부 공급자 옵션 및 구성(예: 선택적 Claude 에이전트 SDK 대체)은 오용될 경우 운영 위험을 초래할 수 있습니다(재귀 위험 언급).
주로 코딩 에이전트 워크플로우에 최적화되어 있습니다. 비코딩 도메인은 캡처/통합 전략에 대한 추가적인 조정이 필요할 수 있습니다.
Agentmemory 사용 방법
1) 로컬 Agentmemory 서버 시작: 별도의 터미널에서 npx @agentmemory/agentmemory를 실행합니다. 그러면 http://localhost:3111에서 메모리 런타임이 시작되고 http://localhost:3113에서 실시간 뷰어가 시작됩니다.
2) 서버 상태 확인: 상태 엔드포인트를 확인합니다: curl http://localhost:3111/agentmemory/health. 클라이언트를 연결하기 전에 정상 상태를 보고하는지 확인합니다.
3) 실시간 뷰어 열기 (선택 사항이지만 권장): http://localhost:3113으로 이동하여 실시간 관찰 스트림을 보고, 메모리를 탐색하고, 세션을 재생하고, 지식 그래프를 검사합니다.
4) MCP 지원 클라이언트 연결 (범용 MCP 구성): 클라이언트의 MCP 구성에 MCP 서버 항목을 추가합니다: command=npx, args=["-y","@agentmemory/mcp"], 및 env AGENTMEMORY_URL=http://localhost:3111. 이렇게 하면 Agentmemory의 전체 MCP 도구 표면이 클라이언트에 노출됩니다.
5) (Hermes) Agentmemory를 MCP 서버로 구성: ~/.hermes/config.yaml에 npx를 args ["-y","@agentmemory/mcp"]와 함께 실행하는 agentmemory에 대한 mcp_servers 항목을 추가하고, Hermes가 전체 메모리 도구 세트에 액세스할 수 있도록 AGENTMEMORY_URL을 http://localhost:3111로 설정합니다.
6) (Hermes) Agentmemory를 메모리 공급자로 활성화: 동일한 Hermes 구성에서 memory.provider를 agentmemory로 설정하여 Hermes가 세션 간 저장/호출에 Agentmemory를 사용하도록 합니다.
7) 작업 중 메모리 도구 사용: MCP 클라이언트에서 Agentmemory 도구를 호출하여 정보를 저장하고 검색합니다(예: 주요 결정/결과를 저장한 다음 나중에 호출). Agentmemory는 또한 MCP 도구 표면을 통해 스마트/하이브리드 호출 및 세션 탐색을 지원합니다.
8) REST API 직접 사용 (선택 사항): HTTP 호출을 선호하는 경우 localhost:3111의 /agentmemory/* 아래에 있는 REST 엔드포인트를 사용합니다(각 MCP 도구에는 REST 트윈이 있음). 이는 스크립팅, 디버깅 또는 자체 에이전트에서 프록시하는 데 유용합니다.
9) 과거 세션 가져오기 (선택 사항): 기존 코딩 에이전트 기록(예: JSONL)이 있는 경우 Agentmemory의 세션 가져오기 기능을 사용하여 이전 세션을 저장소로 다시 가져와 검색 및 재생 가능하도록 합니다.
10) 에이전트를 사용하는 동안 서버를 계속 실행: Agentmemory 서버를 백그라운드에서 계속 실행합니다. 작업하는 동안 세션을 캡처하고(지원되는 경우 후크/플러그인을 통해) 향후 세션에서 빠른 호출을 위해 사용할 수 있도록 합니다.
11) (심층 Hermes 통합) Hermes 플러그인 설치 (선택 사항): 후크 기반 캡처 및 더 풍부한 통합(사전 컨텍스트 주입, 턴 캡처, MEMORY.md 미러링, 시스템 프롬프트 블록)을 위해 agentmemory 리포지토리에서 Hermes 통합 플러그인을 ~/.hermes/plugins/agentmemory로 복사합니다.
12) 캡처 + 호출 엔드투엔드 확인: 에이전트에서 짧은 작업을 실행한 다음 뷰어(3113) 또는 호출/검색 도구 호출을 사용하여 세션이 캡처되었고 이전 컨텍스트를 다시 설명할 필요 없이 나중에 세션에서 검색할 수 있는지 확인합니다.
Agentmemory 자주 묻는 질문
agentmemory는 AI 코딩 에이전트를 위한 영구 메모리 런타임으로, 세션을 캡처하고, 관련 컨텍스트를 빠르게 불러오며, 원시 관찰을 더 오래 지속되는 의미론적 메모리로 통합합니다. 이는 “코딩 에이전트가 처음부터 가지고 있었어야 할 메모리 계층”으로 자리매김하고 있으며, 단순한 라이브러리나 벡터 저장소가 아닙니다.











