Cem888.ai – 99.9% AR, 77.2% Beam – 文件系統內存擊敗RAG
CEM888.ai 的 Vetta 智能體在 MemoryAgentBench(ICLR 2026)上取得了最高分:AR 檢索 99.9%,BEAM 內存 77.2%。其零信任、本地優先的架構確保數據主權,無需依賴外部雲提供商。
CEM888.ai 近日宣佈,其自研 AI 智能體 Vetta 在 MemoryAgentBench(ICLR 2026)上創下了最高公開分數。在 AR 檢索準確率上,Vetta 達到了 99.9%,在 BEAM 內存性能上取得了 77.2% 的成績。這兩項數據均大幅超越了此前的最高水平:GPT-4.1-mini 的 71.8% 和 Hindsight 官方版本的 64.1%。這一結果充分展示了基於文件系統內存的代理原生記憶能力相較於傳統 RAG(檢索增強生成)方法的顯著優越性。
MemoryAgentBench 是 ICLR 2026 收錄的同行評審基準測試,專門用於評估 AI 智能體的記憶能力。CEM888.ai 強調,Vetta 的測試採用了“誠實檢索”方式,不使用任何答案鍵、源聊天 ID 或預計算嵌入。智能體必須從其自身的知識庫中自主檢索信息並進行自然推理,整個過程不依賴任何外部輔助數據。這種嚴格的評測設置確保了結果真實可信,能夠反映智能體在實際應用中的表現。
CEM888.ai 的競爭力核心在於其企業級的本地化 AI 基礎設施。整個平台基於零信任架構設計,所有模型的推理運算均在本地執行,確保用户數據永不離開其基礎設施。同時,平台內置高性能緩存層,可將計算成本降低高達 90%,同時保持亞毫秒級的響應時間。此外,系統還提供安全上下文路由和零接觸部署能力,支持複雜的任務調度與自動化運維。
在架構方面,CEM888.ai 基於模塊化、樹原生的操作系統構建。關鍵組件包括:本地化智能路由模塊,可根據任務複雜度、成本和延遲需求動態選擇最合適的模型;五層內存操作系統,提供結構化、持久化的內存緩存,無需依賴外部數據庫即可跨會話保持記憶;三位一體守護進程架構,負責自主處理狀態同步、審計日誌記錄和本地知識檢索。這些設計共同實現了完全的數據主權、超低延遲和不可妥協的安全性。
CEM888.ai 的願景是推動私有高性能 AI 系統的發展,讓機器永不停歇,始終在邊緣探索最優解。該公司已發佈完整的基準測試結果,包括2000條AR問答對和200條BEAM問答對,以及詳細的評分標準,供研究者和開發者復現驗證。