2026-06-23 18:56 UTC+8站内改写2 分钟阅读更新: 2026-06-23 19:06 UTC+8

谁拥有你的自我模型？

本文提出一个概念：自我模型（Self Model）是人控制的、情境化的主张集合，供AI代理在征得同意后用于个性化行为。当前代理的記憶和模型往往是平台绑定的、不透明的、难以审计的。作者介绍了 Alma 实验项目，旨在构建一个可检查、可纠正、可移植、情境化、经同意、由人控制的自我模型架构，包括主张、来源、授权、读取、审计等核心组件。文章讨论了现有方案的不足，并明确了 Alma 的局限：签名只证明来源而非真实，访问控制管理披露而非下游保留，且尚未证明能提升代理的实用性。

来源Hacker News AI作者: 0set0set

本文探讨了人工智能代理中个人模型的所有权和控制权问题。核心论点是：如果一个AI代理构建了关于一个人的模型，那么这个模型应该由该人自己掌控——可见、可纠正、可移植、基于情境、经同意授权。

作者指出，当前AI代理与人的互动存在结构性问题。每次对话都像重新认识一个人，因为代理记忆是碎片化的，不同平台之间无法流通。平台内部构建的用户模型通常不透明，用户难以查看、纠正或导出。自定义指令虽然有用，但过于扁平，无法区分长期偏好与一时需求，也无法区分已验证事实与猜测。记忆系统更是将一切混为一谈，无法区分重要信息与噪声。

为了解决这些问题，作者提出了“自我模型”（Self Model）的概念，并通过一个名为Alma的实验项目来实现。自我模型是人控制的、情境化的主张集合，不是完整的身份或客观档案，也不是平台拥有的个人资料。Alma的核心架构包括：主张（Claims）、来源（Provenance）、授权（Grants）、临时读取（Readings）、审计事件（Audit Events）、检查和纠正（Inspection and Correction）以及模式版本控制（Schema Versioning）。这些组件共同确保了模型的可控性、透明度和可移植性。

Alma的当前原型是用Rust编写的，更具体地实现了事件日志、投影面、基于范围的授权、经同意的过滤读取、持续协调（带数值置信度）、签名导出包和一致性测试。作者强调，其贡献在于组合这些现有思想，而非发明新的密码学原语或身份标准。

文章也坦承了Alma的局限性：签名只能证明来源和完整性，不能保证真实性；访问控制管理披露，但不能控制下游保留；且目前没有证据表明Alma能提升代理的实用性。文中的评估只是测试假设的计划，而非结论。

最后，作者详细回顾了相关领域的工作，包括本地优先软件、个人数据存储、自主身份、对象能力安全、情境完整性、事件溯源、CRDT、个人知识图谱、推荐系统用户模型、检索增强代理记忆以及平台原生AI记忆等。Alma借鉴了这些领域的思路，并增加了面向代理的、基于目的和情境的读取模型。

尽管Alma仍处于实验阶段，但它为个人在AI时代掌控自己的数据模型提供了一个有希望的方向。