AI News HubLIVE
站内改写2 分钟阅读

Engram 现已正式发布

Weaviate 宣布其专为智能体应用设计的托管记忆与上下文服务 Engram 正式上线。它通过异步管道、模板和内置作用域,解决了长上下文退化、原始数据混乱和多智能体上下文碎片化等问题,帮助智能体积累经验、优化决策。

Weaviate 今日宣布,其专为智能体应用打造的托管记忆与上下文服务 Engram 现已正式发布。Engram 旨在帮助智能体编排工作流、从经验中学习,并将决策锚定在可信知识上。

记忆是基础设施

智能体本应随时间推移不断积累价值——它们应记录交互、累积上下文,并随着运行时间的增长而变得更加有用。然而在实践中,这种价值积累往往未能实现,甚至可能因以下三种失败模式适得其反:长上下文退化——每次交互都将完整对话发送给模型,导致延迟和成本上升,且即使使用最先进的上下文窗口,输入过长时回答质量也会下降;原始数据混乱——用户交互包含噪音,事实随时间演变,将原始事件堆入存储并在查询时让LLM协调,实际上将最困难的问题推到了最不合适的环节;多智能体上下文碎片化——一旦单个请求跨越多个智能体,内置记忆模式便会失效,需要持久化、有作用域的共享记忆来协调工作流。这些问题对于生产级智能体的成功至关重要,且本质上是结构性的。解决方案不是对提示层的修补,而是系统性的记忆与上下文管理。记忆不应是肤浅的附加组件,而应如同存储、检索和可观测性一样,被视为刻意设计的基础设施组件。

Engram 是什么

Engram 是一项托管服务,它将原始、嘈杂的智能体事件转化为结构化、持久化、有作用域的记忆,并通过 Weaviate 的混合语义与关键词检索回传。它是一个值得信赖的记忆层,继承了 Weaviate 数据库的成熟性。异步管道在后台运行,提取相关信息,与已知信息进行核对(处理去重、偏好变化和随时间演变的事实),并持久化干净的记忆状态。个性化用例模板在发布首日即提供,后续几周将推出持续学习和多智能体状态模板。当团队需求超出模板时,可直接控制底层管道,而无需离开平台。从预览版到正式版的路线由实际用例塑造——将 Engram 应用于不同场景后,我们定义了生产就绪所需的变更:更持久的管道、更高效的提取和转换,以及避免记忆漂移的确定性协调。这一强化是 Engram 所有功能的基础:主动维护的记忆而非不断膨胀的上下文块;应用层的即发即弃——记忆管道在后台异步且持久地运行,热路径从不被记忆 I/O 阻塞;常见情况的模板及其他场景的原语;从第一天起的内置作用域——按项目、用户和属性的隔离是原语的一部分,确保正确的记忆能被正确的调用者访问;基于 Weaviate 的统一检索——记忆继承了 Weaviate 的混合搜索、扩展特性和运营记录。

谁应该使用 Engram

Engram 适用于智能体已超出单次交互的团队:需要跨会话记住用户的助手、应从反馈中改进而非重复错误的智能体,以及需要共享作用域状态的多智能体系统。如果你正在构建这样的智能体,很可能你已经自己搭建过某种记忆方案。通常,它开始于几种方式之一:每次交互都将完整对话发送给模型、手动维护 MEMORY.md、将原始事件直接存储为数据库中的记忆,或在检索栈旁运行独立的记忆提供程序。每种方式在复杂度达到一定程度前都能工作,但随后会因上述原因失效:上下文随增长而退化、原始数据未协调、记忆在多智能体间碎片化。Engram 正是解决这些问题的方案:主动协调而非积累、持久管道而非同步副作用、一个平台同时处理记忆与检索而非两个。

开始使用 Engram

Engram 现已在 Weaviate Cloud 中正式可用。立即通过免费套餐开始积累智能体的价值:创建 Engram 项目,查看项目仪表盘,阅读 Engram 文档,了解完整架构故事请参阅 Engram 深度解析,订阅 Weaviate Agents 新闻通讯获取产品更新和最佳实践。准备开始构建?查看快速入门教程,或通过 Weaviate Cloud 免费试用构建精彩应用。