OctaMem:AI代理的可審計記憶層,無需執行向量資料庫
OctaMem為AI代理提供持久的記憶層,包含語義、情景和程式三種記憶型別,無需向量資料庫。它支援檔案匯入、可審計的角色基礎訪問,並與多種執行時相容。
OctaMem 是一個專為 AI 代理設計的永續性記憶層,它解決了代理在沒有記憶系統時面臨的兩種主要問題:重複讀取上下文導致的 token 浪費,以及機構知識的流失。團隊不再需要執行獨立的向量資料庫,OctaMem 本身就具備高效的記憶檢索和管理功能。
該平臺將記憶分為三種型別:語義記憶(儲存穩定的知識和事實)、情景記憶(記錄事件和歷史的順序)以及程式記憶(儲存工作流程和規則)。每次請求,系統都會從這三層記憶中提取相關資訊,為模型構建統一的上下文。這一過程透過類似 MCP 或 REST API 的介面完成,與現有技術棧無縫整合。
OctaMem 支援檔案匯入,可以處理合同、電子表格、簡報和電子郵件等多種格式。檔案上傳後自動解析並儲存為結構化的記憶記錄,便於後續查詢。例如,一份合同上傳後,其條款、簽約方和截止日期都會成為可搜尋的記憶條目。
該平臺的另一個關鍵特性是記憶的可審計性。每一次記憶的寫入和讀取都會被記錄,形成不可篡改的審計日誌,適用於合規性要求嚴格的行業。團隊可以透過 SSO 和角色基礎訪問控制記憶的可見性,確保資訊隔離。
OctaMem 提供通用記憶雲和針對醫療、法律、國防等領域的垂直記憶雲。企業可以選擇部署在公共雲、私有云或本地。效能方面,p50 檢索時間為 84 毫秒,p99 為 210 毫秒,寫入確認僅需 32 毫秒。
OctaMem 專為需要高可靠性的系統設計。在醫療行業,它可維護患者連續就診和治療歷史;在法律領域,它能追蹤判例和客戶互動;在金融方面,它整合投資組合和交易歷史。此外,國防、保險、零售和物流等行業也能從中受益。
對於開發者,OctaMem 提供了多種整合方式:REST API、MCP 伺服器(相容 Claude Desktop、Cursor 等工具)、Python 和 JavaScript SDK。透過簡單的 add() 和 get() 函式,開發者可以快速捕獲和檢索記憶。例如,在 Python 中,使用 OctaMem 客戶端可以透過一行程式碼新增記憶,隨後根據查詢和相關上下文召回。
記憶層還具備政策感知能力:代理在操作時必須遵守組織預定義的規則和限制,這些規則直接嵌入在記憶層中,而非模型提示詞中。這確保了記憶操作的合規性和安全性。
OctaMem 的架構設計使得記憶能夠隨著時間的推移不斷積累。從最初的識別使用者偏好,到 30 天后的模式感知,再到 180 天后的操作深度,智慧持續提升。這種累積效應有助於減少錯誤和重複指導。
總而言之,OctaMem 為 AI 代理提供了一個強大的記憶基礎設施,無需額外管理向量資料庫,同時提供了企業級的安全性、可審計性和可擴充套件性。