2026-06-23 18:56 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-23 19:06 UTC+8

誰擁有你的自我模型？

本文提出一個概念：自我模型（Self Model）是人控制的、情境化的主張集合，供AI代理在徵得同意後用於個性化行為。當前代理的記憶和模型往往是平台綁定的、不透明的、難以審計的。作者介紹了 Alma 實驗項目，旨在構建一個可檢查、可糾正、可移植、情境化、經同意、由人控制的自我模型架構，包括主張、來源、授權、讀取、審計等核心組件。文章討論了現有方案的不足，並明確了 Alma 的侷限：簽名只證明來源而非真實，訪問控制管理披露而非下游保留，且尚未證明能提升代理的實用性。

來源Hacker News AI作者: 0set0set

本文探討了人工智能代理中個人模型的所有權和控制權問題。核心論點是：如果一個AI代理構建了關於一個人的模型，那麼這個模型應該由該人自己掌控——可見、可糾正、可移植、基於情境、經同意授權。

作者指出，當前AI代理與人的互動存在結構性問題。每次對話都像重新認識一個人，因為代理記憶是碎片化的，不同平台之間無法流通。平台內部構建的用户模型通常不透明，用户難以查看、糾正或導出。自定義指令雖然有用，但過於扁平，無法區分長期偏好與一時需求，也無法區分已驗證事實與猜測。記憶系統更是將一切混為一談，無法區分重要信息與噪聲。

為了解決這些問題，作者提出了“自我模型”（Self Model）的概念，並通過一個名為Alma的實驗項目來實現。自我模型是人控制的、情境化的主張集合，不是完整的身份或客觀檔案，也不是平台擁有的個人資料。Alma的核心架構包括：主張（Claims）、來源（Provenance）、授權（Grants）、臨時讀取（Readings）、審計事件（Audit Events）、檢查和糾正（Inspection and Correction）以及模式版本控制（Schema Versioning）。這些組件共同確保了模型的可控性、透明度和可移植性。

Alma的當前原型是用Rust編寫的，更具體地實現了事件日誌、投影面、基於範圍的授權、經同意的過濾讀取、持續協調（帶數值置信度）、簽名導出包和一致性測試。作者強調，其貢獻在於組合這些現有思想，而非發明新的密碼學原語或身份標準。

文章也坦承了Alma的侷限性：簽名只能證明來源和完整性，不能保證真實性；訪問控制管理披露，但不能控制下游保留；且目前沒有證據表明Alma能提升代理的實用性。文中的評估只是測試假設的計劃，而非結論。

最後，作者詳細回顧了相關領域的工作，包括本地優先軟件、個人數據存儲、自主身份、對象能力安全、情境完整性、事件溯源、CRDT、個人知識圖譜、推薦系統用户模型、檢索增強代理記憶以及平台原生AI記憶等。Alma借鑑了這些領域的思路，並增加了面向代理的、基於目的和情境的讀取模型。

儘管Alma仍處於實驗階段，但它為個人在AI時代掌控自己的數據模型提供了一個有希望的方向。