Cem888.ai – 99.9% AR, 77.2% Beam – 文件系统内存击败RAG
CEM888.ai 的 Vetta 智能体在 MemoryAgentBench(ICLR 2026)上取得了最高分:AR 检索 99.9%,BEAM 内存 77.2%。其零信任、本地优先的架构确保数据主权,无需依赖外部云提供商。
CEM888.ai 近日宣布,其自研 AI 智能体 Vetta 在 MemoryAgentBench(ICLR 2026)上创下了最高公开分数。在 AR 检索准确率上,Vetta 达到了 99.9%,在 BEAM 内存性能上取得了 77.2% 的成绩。这两项数据均大幅超越了此前的最高水平:GPT-4.1-mini 的 71.8% 和 Hindsight 官方版本的 64.1%。这一结果充分展示了基于文件系统内存的代理原生记忆能力相较于传统 RAG(检索增强生成)方法的显著优越性。
MemoryAgentBench 是 ICLR 2026 收录的同行评审基准测试,专门用于评估 AI 智能体的记忆能力。CEM888.ai 强调,Vetta 的测试采用了“诚实检索”方式,不使用任何答案键、源聊天 ID 或预计算嵌入。智能体必须从其自身的知识库中自主检索信息并进行自然推理,整个过程不依赖任何外部辅助数据。这种严格的评测设置确保了结果真实可信,能够反映智能体在实际应用中的表现。
CEM888.ai 的竞争力核心在于其企业级的本地化 AI 基础设施。整个平台基于零信任架构设计,所有模型的推理运算均在本地执行,确保用户数据永不离开其基础设施。同时,平台内置高性能缓存层,可将计算成本降低高达 90%,同时保持亚毫秒级的响应时间。此外,系统还提供安全上下文路由和零接触部署能力,支持复杂的任务调度与自动化运维。
在架构方面,CEM888.ai 基于模块化、树原生的操作系统构建。关键组件包括:本地化智能路由模块,可根据任务复杂度、成本和延迟需求动态选择最合适的模型;五层内存操作系统,提供结构化、持久化的内存缓存,无需依赖外部数据库即可跨会话保持记忆;三位一体守护进程架构,负责自主处理状态同步、审计日志记录和本地知识检索。这些设计共同实现了完全的数据主权、超低延迟和不可妥协的安全性。
CEM888.ai 的愿景是推动私有高性能 AI 系统的发展,让机器永不停歇,始终在边缘探索最优解。该公司已发布完整的基准测试结果,包括2000条AR问答对和200条BEAM问答对,以及详细的评分标准,供研究者和开发者复现验证。