2026-06-03 08:00 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

Engram 现已正式发布

Weaviate 宣布其专为智能体应用设计的托管记忆与上下文服务 Engram 正式上线。它通过异步管道、模板和内置作用域，解决了长上下文退化、原始数据混乱和多智能体上下文碎片化等问题，帮助智能体积累经验、优化决策。

Weaviate 今日宣布，其专为智能体应用打造的托管记忆与上下文服务 Engram 现已正式发布。Engram 旨在帮助智能体编排工作流、从经验中学习，并将决策锚定在可信知识上。

记忆是基础设施

智能体本应随时间推移不断积累价值——它们应记录交互、累积上下文，并随着运行时间的增长而变得更加有用。然而在实践中，这种价值积累往往未能实现，甚至可能因以下三种失败模式适得其反：长上下文退化——每次交互都将完整对话发送给模型，导致延迟和成本上升，且即使使用最先进的上下文窗口，输入过长时回答质量也会下降；原始数据混乱——用户交互包含噪音，事实随时间演变，将原始事件堆入存储并在查询时让LLM协调，实际上将最困难的问题推到了最不合适的环节；多智能体上下文碎片化——一旦单个请求跨越多个智能体，内置记忆模式便会失效，需要持久化、有作用域的共享记忆来协调工作流。这些问题对于生产级智能体的成功至关重要，且本质上是结构性的。解决方案不是对提示层的修补，而是系统性的记忆与上下文管理。记忆不应是肤浅的附加组件，而应如同存储、检索和可观测性一样，被视为刻意设计的基础设施组件。

Engram 是什么

Engram 是一项托管服务，它将原始、嘈杂的智能体事件转化为结构化、持久化、有作用域的记忆，并通过 Weaviate 的混合语义与关键词检索回传。它是一个值得信赖的记忆层，继承了 Weaviate 数据库的成熟性。异步管道在后台运行，提取相关信息，与已知信息进行核对（处理去重、偏好变化和随时间演变的事实），并持久化干净的记忆状态。个性化用例模板在发布首日即提供，后续几周将推出持续学习和多智能体状态模板。当团队需求超出模板时，可直接控制底层管道，而无需离开平台。从预览版到正式版的路线由实际用例塑造——将 Engram 应用于不同场景后，我们定义了生产就绪所需的变更：更持久的管道、更高效的提取和转换，以及避免记忆漂移的确定性协调。这一强化是 Engram 所有功能的基础：主动维护的记忆而非不断膨胀的上下文块；应用层的即发即弃——记忆管道在后台异步且持久地运行，热路径从不被记忆 I/O 阻塞；常见情况的模板及其他场景的原语；从第一天起的内置作用域——按项目、用户和属性的隔离是原语的一部分，确保正确的记忆能被正确的调用者访问；基于 Weaviate 的统一检索——记忆继承了 Weaviate 的混合搜索、扩展特性和运营记录。

谁应该使用 Engram

Engram 适用于智能体已超出单次交互的团队：需要跨会话记住用户的助手、应从反馈中改进而非重复错误的智能体，以及需要共享作用域状态的多智能体系统。如果你正在构建这样的智能体，很可能你已经自己搭建过某种记忆方案。通常，它开始于几种方式之一：每次交互都将完整对话发送给模型、手动维护 MEMORY.md、将原始事件直接存储为数据库中的记忆，或在检索栈旁运行独立的记忆提供程序。每种方式在复杂度达到一定程度前都能工作，但随后会因上述原因失效：上下文随增长而退化、原始数据未协调、记忆在多智能体间碎片化。Engram 正是解决这些问题的方案：主动协调而非积累、持久管道而非同步副作用、一个平台同时处理记忆与检索而非两个。

开始使用 Engram

Engram 现已在 Weaviate Cloud 中正式可用。立即通过免费套餐开始积累智能体的价值：创建 Engram 项目，查看项目仪表盘，阅读 Engram 文档，了解完整架构故事请参阅 Engram 深度解析，订阅 Weaviate Agents 新闻通讯获取产品更新和最佳实践。准备开始构建？查看快速入门教程，或通过 Weaviate Cloud 免费试用构建精彩应用。