Bỏ qua tới nội dung chính
Quay lại tin tức

Giới thiệu Memory OS: Hệ thống bộ nhớ mã nguồn mở 6 lớp được xây dựng trên Hermes Agent

MarkTechPost· Michal Sutter· 1/6/2026general

Hermes Agent đã có khả năng ghi nhớ xuyên suốt các phiên làm việc. Tác nhân mã nguồn mở từ Nous Research được trang bị các tệp bộ nhớ được tuyển chọn và tính năng tìm kiếm toàn văn phiên làm việc. Tuy nhiên, một dự án cộng đồng mới cho rằng bộ nhớ tích hợp quá nông cạn cho các tác vụ nghiêm túc. Một thư viện mới có tên 'Memory OS' đã được phát hành theo giấy phép MIT bởi một nhà phát triển (ClaudioDrews). Thư viện này bổ sung sáu lớp bộ nhớ cho Hermes, bao gồm cơ sở dữ liệu vector, các sự kiện có cấu trúc và một wiki kiến thức được tự động tuyển chọn. Dự án còn mới nhưng có vẻ có tiềm năng tốt và kiến trúc của nó cho thấy cách bộ nhớ tác nhân có thể được phân lớp. Bộ nhớ

Hermes Agent đã có khả năng ghi nhớ xuyên suốt các phiên làm việc. Công cụ mã nguồn mở từ Nous Research được trang bị các tệp bộ nhớ được tuyển chọn và tính năng tìm kiếm toàn văn theo phiên. Tuy nhiên, một dự án cộng đồng mới cho rằng bộ nhớ tích hợp quá nông cạn cho các tác vụ nghiêm túc. Một thư viện mới có tên 'Memory OS' đã được phát hành theo giấy phép MIT bởi nhà phát triển ClaudioDrews. Thư viện này bổ sung sáu lớp bộ nhớ cho Hermes, bao gồm cơ sở dữ liệu vector, các sự kiện có cấu trúc và một wiki kiến thức tự động tuyển chọn. Dự án còn mới nhưng có vẻ có tiềm năng tốt và kiến trúc của nó cho thấy cách bộ nhớ của tác nhân có thể được phân lớp. Memory OS Memory OS không phải là một plugin của Hermes mà người dùng có thể bật/tắt. Đây là một hệ thống phân lớp nằm cạnh bộ nhớ riêng của Hermes Agent. Hermes đã cung cấp các tệp không gian làm việc và cơ sở dữ liệu phiên. Memory OS giữ lại những thành phần này và bổ sung thêm bốn lớp phía trên. Toàn bộ hệ thống chạy cục bộ bằng Docker, Qdrant, Redis và Python 3.11+. Nó hoạt động với bất kỳ nhà cung cấp LLM nào mà Hermes hỗ trợ, bao gồm OpenRouter, OpenAI, Anthropic và Ollama. Tệp README mô tả đây là một "hệ điều hành bộ nhớ", không phải là một tính năng đơn lẻ. Sáu Lớp, Từ Tệp đến Vector Lớp 1 là Không gian làm việc. Nó chứa MEMORY.md, USER.md và CREATIVE.md, được đưa vào lời nhắc hệ thống mỗi lượt. Lớp 2 là Các phiên. Nó sử dụng state.db, một cơ sở dữ liệu SQLite với tính năng tìm kiếm toàn văn FTS5 trên lịch sử hội thoại. Lớp 3 là Các sự kiện có cấu trúc. Nó lưu trữ các sự kiện bền vững trong memory_store.db, sử dụng SQLite, HRR, FTS5 và tính năng chấm điểm độ tin cậy. Một vòng lặp phản hồi điều chỉnh các điểm độ tin cậy đó theo thời gian, cùng với việc phân giải thực thể. Lớp 4 là Fabric, một phiên bản được phân nhánh nhiều từ Icarus Plugin. Phiên bản phân nhánh này bổ sung tính năng trích xuất phiên được hỗ trợ bởi LLM trên esaradev/icarus-plugin gốc. Nó xử lý việc gọi lại xuyên phiên thông qua 16 công cụ, bao gồm fabric_recall, fabric_write và fabric_brief. Lớp 5 là Cơ sở dữ liệu Vector, được xây dựng trên Qdrant. Nó sử dụng các vector Cosine 4096d cộng với tìm kiếm thưa thớt BM25, một phương pháp xếp hạng kiểu từ khóa. Lớp 6 là một LLM Wiki, một kho lưu trữ các khái niệm, thực thể và so sánh được tự động tuyển chọn. Wiki này liên tục được đưa trở lại Qdrant thông qua một quy trình gọi là wiki-continuous-ingest. Cách thức hoạt động của luồng truy xuất Luồng này tập trung vào thời điểm bộ nhớ được đọc và ghi. Khi pre_llm_call, Memory OS chạy cái mà nó gọi là truy xuất phẫu thuật. Nó lấy dữ liệu từ bốn nguồn cùng một lúc: Fabric, Qdrant, Sessions và Facts. Mỗi nguồn được kiểm soát bởi một ngưỡng liên quan trước khi bất kỳ thứ gì đến mô hình. Tính năng loại bỏ trùng lặp theo phiên ngăn không cho cùng một ngữ cảnh xuất hiện hai lần. Một bộ lọc social-closer bỏ qua các tin nhắn tầm thường, chẳng hạn như một từ "cảm ơn" đơn thuần. Khi post_llm_call và on_session_end, hệ thống tự động trích xuất và ghi lại các kiến thức mới. Mục tiêu đã nêu là hiệu quả token, không phải nhồi nhét cửa sổ ngữ cảnh. Thác dự phòng và dọn dẹp Việc truy xuất của Lớp 5 sử dụng một thác dự phòng bốn cấp. Nó thử tìm kiếm kết hợp trước, sau đó là vector dày đặc, sau đó là từ vựng, sau đó là SQLite. Nếu một phương pháp thất bại hoặc không trả về gì, phương pháp tiếp theo sẽ tiếp quản. Thiết kế này giúp việc gọi lại hoạt động ngay cả khi cơ sở dữ liệu vector gặp khó khăn. Memory OS cũng chạy một trình quét phân rã hàng tuần để loại bỏ các mục cũ. Tính năng loại bỏ trùng lặp ngữ nghĩa hợp nhất các bộ nhớ gần giống nhau khi độ tương đồng cosine vượt quá 0,92. Các bước dọn dẹp này nhằm mục đích ngăn chặn bộ nhớ bị phình to sau nhiều tháng sử dụng. Ưu tiên cục bộ, và có chủ đích Memory OS định vị mình đối lập với các dịch vụ bộ nhớ đám mây như mem0, Zep và Letta. Quan điểm của dự án là hạ tầng bộ nhớ nên chạy trên máy của người dùng. Dữ liệu bộ nhớ được lưu trữ cục bộ, không yêu cầu đăng ký dịch vụ bộ nhớ. Các lệnh gọi LLM vẫn được gửi đến nhà cung cấp mà người dùng lựa chọn. Bản thân Hermes đã hỗ trợ tám nhà cung cấp bộ nhớ bên ngoài, bao gồm mem0 và Honcho. Memory OS không phải là một trong những nhà cung cấp chính thức đó. Đây là một ngăn xếp riêng biệt, do cộng đồng xây dựng, được đặt trực tiếp trên Hermes. Đối với các nhóm có quy định về lưu trú dữ liệu, một kho lưu trữ bộ nhớ cục bộ có thể rất quan trọng. Mới được công bố mã nguồn mở **Memory OS** — một kiến trúc bộ nhớ bền vững phân cấp hoàn chỉnh cho Hermes Agent. 6 lớp, hoàn toàn cục bộ: • Dữ kiện có cấu trúc + chấm điểm độ tin cậy với vòng lặp phản hồi • Tìm kiếm vector lai (Qdrant + BM25) • Wiki LLM tự quản lý • Ngữ nghĩa… — Claudio Drews (@ClaudioDrews25) ngày 31/5/2026 Điểm mạnh và hạn chế Điểm mạnh: Thiết kế phân lớp rõ ràng, tách biệt các tệp, phiên, dữ kiện, vector và wiki Hạ tầng hoàn toàn cục bộ, không cần đăng ký bộ nhớ đám mây Không phụ thuộc vào nhà cung cấp, phù hợp với sự linh hoạt của Hermes Agent Truy xuất hiệu quả về token theo thiết kế, thông qua các nguồn được kiểm soát và loại bỏ trùng lặp theo phiên Hạn chế: Mới ra mắt, với ít cam kết (commit) Một plugin Icarus được phân nhánh mà tác giả cho biết không tương thích với phiên bản gốc Thiết lập phức tạp hơn: yêu cầu Docker, Qdrant, Redis và một ARQ Worker Chưa có điểm chuẩn được công bố về chất lượng truy hồi, độ trễ hoặc tiết kiệm token Những điểm chính Memory OS là một ngăn xếp do cộng đồng xây dựng, được cấp phép MIT, bổ sung sáu lớp bộ nhớ trên Hermes Agent. Nó kết hợp các tệp không gian làm việc, tìm kiếm phiên FTS5, các dữ kiện được chấm điểm độ tin cậy, một cấu trúc Icarus được phân nhánh, các vector Qdrant và một wiki LLM tự động quản lý. Truy xuất chạy trên pre_llm_call với khả năng truy hồi được kiểm soát và loại bỏ trùng lặp từ bốn nguồn; thu thập chạy trên post_llm_call và on_session_end. Hạ tầng bộ nhớ hoàn toàn cục bộ và không phụ thuộc vào nhà cung cấp, nhưng các lệnh gọi LLM vẫn được gửi đến nhà cung cấp mà bạn đã chọn. Hãy xem Kho lưu trữ (Repo). Ngoài ra, hãy theo dõi chúng tôi trên Twitter và đừng quên tham gia hơn 150.000 thành viên của chúng tôi trên ML SubReddit và Đăng ký nhận Bản tin của chúng tôi. Khoan đã! bạn có dùng Telegram không? bây giờ bạn cũng có thể tham gia với chúng tôi trên Telegram. Cần hợp tác với chúng tôi để quảng bá Kho lưu trữ GitHub HOẶC Trang Hugging Face HOẶC Phát hành sản phẩm HOẶC Hội thảo trên web của bạn, v.v.? Hãy liên hệ với chúng tôi Bài viết Meet Memory OS: A 6-Layer Open-Source Memory Stack Built on Top of Hermes Agent xuất hiện đầu tiên trên MarkTechPost.

Nguồn tin: MarkTechPost — Tác giả: Michal Sutter. Bản dịch tiếng Việt do AI thực hiện, có thể có sai sót.