AI News HubLIVE
站内改写2 分钟阅读

Enki——为AI智能体设计的记忆引擎:存储量减半,回答质量不减

Enki是一款面向AI智能体的记忆引擎,与mem0相比,在存储量减少约一半的情况下,实现了相近的问答准确率。在25个实例的评估中,Enki总分14/25对12/25,在多会话推理方面表现突出(4/5对2/5)。CPU检索延迟平均7.6毫秒。

来源Hacker News AI作者: Enkilabs

近日,英国初创公司Enki Labs发布了一款名为Enki的记忆引擎,专为大型语言模型(LLM)代理设计。该引擎目前为闭源软件,但开发团队在GitHub上公开了初步的基准测试结果,展示了其在存储效率方面的显著优势。根据公布的数据,Enki在LongMemEval基准测试的子集(25个实例)中与业界知名的mem0进行了直接对比。双方使用相同的对话历史和检索模型(Claude Haiku),并且检索深度均设为K=10,唯一的不同在于底层的记忆层实现。

测试结果显示,Enki的总得分为14/25,而mem0为12/25。尤其值得一提的是,在多会话推理任务中,Enki取得了4/5的优异成绩,远高于mem0的2/5。这一结果凸显了Enki在跨会话信息整合与推理方面的独特能力。在其他类别如知识更新、单会话用户、单会话助手和单会话偏好方面,两者表现持平,均为3/5、3/5、2/5和2/5。

除了推理准确率,Enki在存储效率上同样令人印象深刻。平均而言,Enki仅需存储138条事实即可完成给定会话的记忆任务,而mem0需要283条,存储量减少了约51%。这意味着在处理长期运行的代理应用时,Enki可以显著降低内存和存储开销,提升系统的可扩展性。

在检索延迟方面,Enki在纯CPU环境下的表现同样出色。基于约139条事实的存储库和240次采样,平均检索延迟为7.6毫秒,中位数为6.1毫秒,第95百分位为11.9毫秒,第99百分位为13.0毫秒。这些数据表明Enki能够满足实时交互的需求。

需要注意的是,Enki Labs团队强调目前的评估基于一个较小且经过人工验证的样本集,整体差距(14 vs 12)并不大,但存储量减半的结果是稳健且可复现的。完整的评估方法论和逐问题答案可以通过申请获取。该存储库以MIT许可证发布,但仅包含评估结果,核心引擎并未开源。

Enki的出现为AI代理的记忆层提供了新的选择,尤其适合需要平衡存储效率与推理准确率的应用场景。随着进一步的评估和可能的开源,它有望成为推动代理系统发展的重要组件。