Agentmemory
Agentmemory là một thời gian chạy bộ nhớ ưu tiên cục bộ, không cần cơ sở dữ liệu bên ngoài cho các tác nhân mã hóa tự động ghi lại các phiên thông qua các hook, gọi lại ngữ cảnh trong vài mili giây với truy xuất BM25+vector+knowledge-graph và liên tục hợp nhất các nhật ký thô thành các bộ nhớ ngữ nghĩa bền bỉ—được hiển thị thông qua MCP và HTTP với một trình xem tích hợp.
https://agent-memory.dev/?ref=producthunt&utm_source=aipure

Thông tin Sản phẩm
Đã cập nhật:May 18, 2026
Agentmemory là gì
Agentmemory là một lớp bộ nhớ bền bỉ được thiết kế cho các tác nhân mã hóa AI mà nếu không sẽ quên mọi thứ giữa các phiên. Nó chạy cục bộ dưới dạng một tiến trình Node duy nhất (không yêu cầu Postgres/Redis/Kafka/cơ sở dữ liệu vector) và ghi lại những gì xảy ra trong quá trình làm việc của tác nhân của bạn—lời nhắc, lệnh gọi công cụ, sự kiện phiên—để các phiên sau có thể sử dụng lại ngữ cảnh đó mà không cần bạn giải thích lại kiến trúc, tùy chọn hoặc các quyết định trong quá khứ. Nó hỗ trợ MCP và giao diện API ưu tiên HTTP (mỗi công cụ MCP có một bản sao REST), và đi kèm với một trình xem và bảng điều khiển thời gian thực để bạn có thể kiểm tra các phiên, bộ nhớ và tình trạng hệ thống trong khi vẫn giữ tất cả dữ liệu trên máy của bạn.
Các Tính năng Chính của Agentmemory
Agentmemory là một thời gian chạy bộ nhớ liên tục cục bộ, một tiến trình dành cho các tác nhân mã hóa AI, ghi lại mọi phiên thông qua các hook tự động, củng cố các quan sát thô thành bộ nhớ ngữ nghĩa bền vững và gọi lại ngữ cảnh liên quan trong mili giây bằng cách sử dụng truy xuất ba luồng kết hợp (BM25 + vector + đồ thị tri thức) với sắp xếp lại trên thiết bị. Nó phơi bày một bề mặt MCP rộng (51 công cụ) với các tương đương REST (121 điểm cuối), bao gồm giao diện người dùng trình xem/bảng điều khiển tích hợp, hỗ trợ nhập bản ghi trước đây, xuất sang markdown/Obsidian và có thể đồng bộ hóa bộ nhớ giữa các nút qua HTTPS được xác thực—trong khi tránh các cơ sở dữ liệu bên ngoài như Redis/Postgres/Neo4j và giữ dữ liệu trên đĩa dưới dạng JSON.
Hook tự động ghi lại (12 hook): Tự động ghi lại các lời nhắc, lệnh gọi công cụ, các sự kiện vòng đời phiên (ví dụ: PreToolUse/PostToolUse/Stop) và nén chúng thành các quan sát mà không yêu cầu mã kết nối tùy chỉnh.
Gọi lại kết hợp trong mili giây: Sử dụng truy xuất ba luồng (BM25 từ vựng + vector ngữ nghĩa + tín hiệu đồ thị tri thức) và sắp xếp lại trên thiết bị để hiển thị ngữ cảnh trước đó phù hợp nhất (được báo cáo 95,2% R@5 trên LongMemEval-S; p50 < 20ms trên máy tính xách tay).
Quy trình hợp nhất (thô → ngữ nghĩa): Chạy các đợt quét định kỳ nén các quan sát thành bộ nhớ ngữ nghĩa, hợp nhất các bản sao, làm mờ các hàng cũ với điểm giữ lại và phát ra các bản ghi kiểm toán về việc xóa để quản trị.
API gốc MCP + HTTP-first: Cung cấp 51 công cụ MCP (lưu/gọi lại/tìm kiếm/phiên/quản trị/kiểm toán/xuất/đồ thị) và phản ánh mỗi công cụ với các điểm cuối REST dưới /agentmemory/* để dễ dàng tích hợp và gỡ lỗi.
Giao diện người dùng và khả năng quan sát tích hợp: Cung cấp trình xem thời gian thực (cổng 3113) cho các luồng trực tiếp, phát lại phiên, duyệt bộ nhớ và trực quan hóa đồ thị, cùng với bảng điều khiển cấp công cụ và dấu vết/nhật ký OpenTelemetry để hiển thị hoạt động.
Lưu trữ cục bộ-first + liên kết/xuất: Chạy dưới dạng một tiến trình Node duy nhất với trạng thái JSON trên đĩa (không có DB bên ngoài), hỗ trợ nhập phiên JSONL, xuất markdown sẵn sàng cho Obsidian và đồng bộ hóa ngang hàng được xác thực giữa các nút agentmemory.
Các Trường hợp Sử dụng của Agentmemory
Tính liên tục của phát triển phần mềm: Lưu giữ các quy ước dự án, các quyết định kiến trúc trước đây và kết quả gỡ lỗi trong các phiên mã hóa để các tác nhân như Claude Code/Cursor/Codex có thể tiếp tục công việc mà không cần giải thích lại ngữ cảnh.
Thu thập kiến thức nhóm cho các tổ chức kỹ thuật: Ghi lại và củng cố các bước khắc phục sự cố lặp đi lặp lại, sổ tay hướng dẫn và các bài học về sự cố thành bộ nhớ ngữ nghĩa có thể tìm kiếm, giảm thời gian làm quen và nỗ lực điều tra lặp lại.
Phối hợp đa tác nhân trong các bản dựng phức tạp: Cho phép nhiều tác nhân/công cụ chia sẻ một lớp bộ nhớ nhất quán (thông qua MCP/REST và liên kết tùy chọn) để các tác vụ song song có thể tham chiếu cùng một kiến thức dự án đang phát triển.
Môi trường được quản lý hoặc nhạy cảm với quyền riêng tư: Giữ bộ nhớ cục bộ trên đĩa mà không có cơ sở dữ liệu bên ngoài và sử dụng các bề mặt kiểm toán/quản trị để theo dõi việc xóa và quản lý việc lưu giữ—hữu ích cho các doanh nghiệp có yêu cầu về vị trí dữ liệu.
Năng suất cá nhân và làm giàu ghi chú: Xuất markdown được gắn thẻ frontmatter vào một kho Obsidian để biến các tương tác của tác nhân thành một cơ sở kiến thức cá nhân có thể điều hướng với trực quan hóa đồ thị.
Tích hợp nền tảng tác nhân thông qua API: Nhúng việc lưu/gọi lại bộ nhớ vào các công cụ phát triển tùy chỉnh hoặc nền tảng nội bộ bằng cách sử dụng các điểm cuối REST (thân thiện với curl/trình duyệt/proxy) mà không bị khóa vào một khung tác nhân cụ thể.
Ưu điểm
Thiết kế cục bộ-first, một tiến trình với 0 cơ sở dữ liệu bên ngoài giúp đơn giản hóa việc triển khai và giữ dữ liệu trên máy của nhà phát triển.
Bề mặt tích hợp mạnh mẽ: 12 hook tự động, 51 công cụ MCP và các cặp REST giúp dễ dàng kết nối với nhiều máy khách tác nhân và quy trình làm việc.
Truy xuất nhanh và mạnh mẽ thông qua BM25+vector+đồ thị kết hợp với sắp xếp lại trên thiết bị; bao gồm trình xem tích hợp và khả năng quan sát OTEL.
Nhược điểm
Chạy mọi thứ trong một tiến trình Node có thể yêu cầu quản lý tài nguyên cẩn thận trên các máy nhỏ mặc dù đã có những cải thiện về hiệu suất cho các tiến trình nhỏ.
Một số tùy chọn và cấu hình nhà cung cấp (ví dụ: dự phòng SDK tác nhân Claude tùy chọn) có thể gây ra rủi ro vận hành nếu sử dụng sai (đã ghi nhận rủi ro đệ quy).
Chủ yếu được tối ưu hóa cho quy trình làm việc của tác nhân mã hóa; các lĩnh vực không liên quan đến mã hóa có thể cần điều chỉnh thêm các chiến lược thu thập/hợp nhất.
Cách Sử dụng Agentmemory
1) Khởi động máy chủ Agentmemory cục bộ: Trong một terminal riêng biệt, chạy: npx @agentmemory/agentmemory. Thao tác này sẽ khởi động thời gian chạy bộ nhớ trên http://localhost:3111 và trình xem thời gian thực trên http://localhost:3113.
2) Xác minh máy chủ hoạt động tốt: Kiểm tra điểm cuối sức khỏe: curl http://localhost:3111/agentmemory/health. Xác nhận nó báo cáo khỏe mạnh trước khi kết nối bất kỳ máy khách nào.
3) Mở trình xem thời gian thực (tùy chọn nhưng được khuyến nghị): Điều hướng đến http://localhost:3113 để xem các luồng quan sát trực tiếp, duyệt bộ nhớ, phát lại các phiên và kiểm tra đồ thị tri thức.
4) Kết nối một máy khách có khả năng MCP (cấu hình MCP chung): Thêm một mục nhập máy chủ MCP vào cấu hình MCP của máy khách của bạn bằng cách sử dụng: command=npx, args=["-y","@agentmemory/mcp"], và env AGENTMEMORY_URL=http://localhost:3111. Điều này sẽ hiển thị toàn bộ bề mặt công cụ MCP của Agentmemory cho máy khách.
5) (Hermes) Cấu hình Agentmemory làm máy chủ MCP: Trong ~/.hermes/config.yaml, thêm một mục nhập mcp_servers cho agentmemory chạy npx với args ["-y","@agentmemory/mcp"], và đặt AGENTMEMORY_URL thành http://localhost:3111 để Hermes có thể truy cập toàn bộ các công cụ bộ nhớ.
6) (Hermes) Bật Agentmemory làm nhà cung cấp bộ nhớ: Trong cùng cấu hình Hermes, đặt memory.provider thành agentmemory để Hermes sử dụng Agentmemory để lưu/gọi lại giữa các phiên.
7) Sử dụng các công cụ bộ nhớ trong quá trình làm việc: Từ máy khách MCP của bạn, gọi các công cụ Agentmemory để lưu trữ và truy xuất thông tin (ví dụ: lưu các quyết định/kết quả chính, sau đó gọi lại chúng sau). Agentmemory cũng hỗ trợ gọi lại thông minh/kết hợp và duyệt phiên thông qua bề mặt công cụ MCP của nó.
8) Sử dụng trực tiếp API REST (tùy chọn): Nếu bạn thích các lệnh gọi HTTP, hãy sử dụng các điểm cuối REST dưới /agentmemory/* trên localhost:3111 (mỗi công cụ MCP có một bản sao REST). Điều này hữu ích cho việc viết script, gỡ lỗi hoặc proxy từ tác nhân của riêng bạn.
9) Nhập các phiên trước đây (tùy chọn): Nếu bạn có các bản ghi tác nhân mã hóa hiện có (ví dụ: JSONL), hãy sử dụng khả năng nhập phiên của Agentmemory để khôi phục các phiên trước đó vào kho lưu trữ để chúng có thể tìm kiếm và phát lại được.
10) Giữ máy chủ chạy trong khi bạn sử dụng tác nhân của mình: Để máy chủ Agentmemory chạy trong nền. Khi bạn làm việc, nó sẽ ghi lại các phiên (thông qua các hook/plugin nếu được hỗ trợ) và làm cho chúng có sẵn để gọi lại nhanh chóng trong các phiên sau.
11) (Tích hợp Hermes sâu hơn) Cài đặt plugin Hermes (tùy chọn): Để ghi lại theo hook và tích hợp phong phú hơn (chèn ngữ cảnh trước, ghi lại lượt, phản chiếu MEMORY.md, khối lời nhắc hệ thống), sao chép plugin tích hợp Hermes từ kho lưu trữ agentmemory vào ~/.hermes/plugins/agentmemory.
12) Xác nhận ghi lại + gọi lại từ đầu đến cuối: Chạy một tác vụ ngắn trong tác nhân của bạn, sau đó sử dụng trình xem (3113) hoặc lệnh gọi công cụ gọi lại/tìm kiếm để xác nhận phiên đã được ghi lại và có thể được truy xuất trong một phiên sau mà không cần giải thích lại ngữ cảnh trước đó.
Câu hỏi Thường gặp về Agentmemory
agentmemory là một thời gian chạy bộ nhớ liên tục dành cho các tác nhân mã hóa AI, giúp ghi lại các phiên, nhanh chóng gợi lại ngữ cảnh liên quan và củng cố các quan sát thô thành các bộ nhớ ngữ nghĩa tồn tại lâu hơn. Nó được định vị là “lớp bộ nhớ mà tác nhân mã hóa của bạn lẽ ra phải có ngay từ đầu,” và không chỉ là một thư viện hay một kho lưu trữ vector.
Bài viết phổ biến

Nano Banana SBTI: Nó là gì, Cách thức hoạt động và Cách sử dụng nó vào năm 2026
Apr 15, 2026

Đánh giá Atoms — Trình tạo sản phẩm AI định nghĩa lại việc tạo nội dung số vào năm 2026
Apr 10, 2026

Kilo Claw: Cách Triển Khai và Sử Dụng AI Agent "Làm-Thay-Bạn" Thực Sự (Cập Nhật 2026)
Apr 3, 2026

OpenAI Đóng Cửa Ứng Dụng Sora: Tương Lai Của Công Nghệ Tạo Video AI Năm 2026 Sẽ Ra Sao?
Mar 25, 2026







