谁拥有你的自我模型?
本文提出一个概念:自我模型(Self Model)是人控制的、情境化的主张集合,供AI代理在征得同意后用于个性化行为。当前代理的記憶和模型往往是平台绑定的、不透明的、难以审计的。作者介绍了 Alma 实验项目,旨在构建一个可检查、可纠正、可移植、情境化、经同意、由人控制的自我模型架构,包括主张、来源、授权、读取、审计等核心组件。文章讨论了现有方案的不足,并明确了 Alma 的局限:签名只证明来源而非真实,访问控制管理披露而非下游保留,且尚未证明能提升代理的实用性。
本文探讨了人工智能代理中个人模型的所有权和控制权问题。核心论点是:如果一个AI代理构建了关于一个人的模型,那么这个模型应该由该人自己掌控——可见、可纠正、可移植、基于情境、经同意授权。
作者指出,当前AI代理与人的互动存在结构性问题。每次对话都像重新认识一个人,因为代理记忆是碎片化的,不同平台之间无法流通。平台内部构建的用户模型通常不透明,用户难以查看、纠正或导出。自定义指令虽然有用,但过于扁平,无法区分长期偏好与一时需求,也无法区分已验证事实与猜测。记忆系统更是将一切混为一谈,无法区分重要信息与噪声。
为了解决这些问题,作者提出了“自我模型”(Self Model)的概念,并通过一个名为Alma的实验项目来实现。自我模型是人控制的、情境化的主张集合,不是完整的身份或客观档案,也不是平台拥有的个人资料。Alma的核心架构包括:主张(Claims)、来源(Provenance)、授权(Grants)、临时读取(Readings)、审计事件(Audit Events)、检查和纠正(Inspection and Correction)以及模式版本控制(Schema Versioning)。这些组件共同确保了模型的可控性、透明度和可移植性。
Alma的当前原型是用Rust编写的,更具体地实现了事件日志、投影面、基于范围的授权、经同意的过滤读取、持续协调(带数值置信度)、签名导出包和一致性测试。作者强调,其贡献在于组合这些现有思想,而非发明新的密码学原语或身份标准。
文章也坦承了Alma的局限性:签名只能证明来源和完整性,不能保证真实性;访问控制管理披露,但不能控制下游保留;且目前没有证据表明Alma能提升代理的实用性。文中的评估只是测试假设的计划,而非结论。
最后,作者详细回顾了相关领域的工作,包括本地优先软件、个人数据存储、自主身份、对象能力安全、情境完整性、事件溯源、CRDT、个人知识图谱、推荐系统用户模型、检索增强代理记忆以及平台原生AI记忆等。Alma借鉴了这些领域的思路,并增加了面向代理的、基于目的和情境的读取模型。
尽管Alma仍处于实验阶段,但它为个人在AI时代掌控自己的数据模型提供了一个有希望的方向。