AI News HubLIVE
站内改写2 分鐘閱讀

遇見 Memory OS:基於 Hermes Agent 的六層開源記憶棧

Memory OS 是一個新的 MIT 許可庫,為 Hermes Agent 增加了六層記憶,包括向量數據庫、結構化事實和自動整理的百科。它完全本地運行,需要 Docker、Qdrant、Redis,並注重 token 效率。

來源MarkTechPost作者: Michal Sutter

Hermes Agent 已經具備跨會話記憶能力。Nous Research 的開源智能體附帶策劃的記憶文件和全文會話搜索。但一個新的社區項目認為內置記憶對嚴肅工作來説過於淺薄。一個名為“Memory OS”的新庫已由開發者 ClaudioDrews 以 MIT 許可證發佈。它在 Hermes 之上堆疊了六層記憶,增加了向量數據庫、結構化事實和自動策劃的知識百科。該項目雖新但潛力巨大,其架構展示了代理記憶如何分層構建。

Memory OS 並非一個可以隨意開關的 Hermes 插件。它是一個與 Hermes Agent 自身記憶並行的分層系統。Hermes 已經提供工作區文件和會話數據庫。Memory OS 保留了這些,並在此基礎上增加了四層。完整棧使用 Docker、Qdrant、Redis 和 Python 3.11+ 本地運行。它適用於 Hermes 支持的任何 LLM 提供商,包括 OpenRouter、OpenAI、Anthropic 和 Ollama。README 將其描述為“記憶操作系統”,而非單一功能。

六層結構從文件到向量:第一層工作區包含 MEMORY.md、USER.md 和 CREATIVE.md,每輪注入系統提示。第二層會話使用 state.db(帶 FTS5 全文搜索的 SQLite 數據庫)記錄對話歷史。第三層結構化事實將持久事實存儲在 memory_store.db 中,使用 SQLite、HRR、FTS5 和信任評分,並通過反饋循環隨時間調整信任評分。第四層 Fabric 是 Icarus 插件的重度分支,添加了基於 LLM 的會話提取,提供 16 個工具用於跨會話召回。第五層向量數據庫基於 Qdrant,使用 4096 維餘弦向量加 BM25 稀疏搜索。第六層 LLM 百科是一個自動策劃的概念、實體和比較庫,通過持續攝入過程回注到 Qdrant。

檢索流程:在 pre_llm_call 階段,Memory OS 執行所謂的外科召回,同時從 Fabric、Qdrant、會話和事實四個源拉取信息。每個源通過相關性門控後才到達模型。每會話去重防止相同上下文重複出現。社交過濾器忽略瑣碎消息。在 post_llm_call 和 on_session_end 階段,系統自動提取和捕獲新知識。其目標是 token 效率,而非填滿上下文窗口。

降級級聯與清理:第 5 層的檢索使用四級降級:先嚐試混合搜索,然後是稠密向量、詞彙搜索,最後是 SQLite。若某一方法失敗,下一方法接管。Memory OS 還運行每週衰減掃描以淘汰陳舊條目,語義去重合並餘弦相似度超過 0.92 的近似記憶。這些維護步驟旨在防止記憶在長期使用中膨脹。

Memory OS 定位與雲記憶服務(如 mem0、Zep、Letta)對立,主張記憶基礎設施應運行在本地機器上。記憶數據保持本地,無需記憶訂閲。LLM 調用仍可連接任意提供商。Hermes 本身已支持八種外部記憶提供商,但 Memory OS 並非其中之一,而是社區構建的獨立堆棧。對於有數據駐留規則團隊,本地記憶存儲很重要。

優勢:清晰的分層設計分離文件、會話、事實、向量和百科;全本地基礎設施無需雲記憶訂閲;提供商無關,匹配 Hermes Agent 的靈活性;通過門控源和每會話去重實現 token 高效檢索。侷限性:全新,提交次數少;Fabric 分支與上游不兼容;設置較重,需要 Docker、Qdrant、Redis 和 ARQ Worker;無已發佈的召回質量、延遲或 token 節省基準。

關鍵要點:Memory OS 是一個社區構建的 MIT 許可堆棧,在 Hermes Agent 上增加六層記憶。它結合工作區文件、FTS5 會話搜索、信任評分事實、Fabric 分支、Qdrant 向量和自動策劃的 LLM 百科。檢索在 pre_llm_call 階段進行門控去重召回,捕獲在 post_llm_call 和 on_session_end 階段進行。記憶基礎設施全本地且提供商無關,但 LLM 調用仍需連接所選提供商。