AI News HubLIVE
站內改寫2 分鐘閱讀

誰擁有你的自我模型?

本文提出一個概念:自我模型(Self Model)是人控制的、情境化的主張集合,供AI代理在徵得同意後用於個性化行為。當前代理的記憶和模型往往是平台綁定的、不透明的、難以審計的。作者介紹了 Alma 實驗項目,旨在構建一個可檢查、可糾正、可移植、情境化、經同意、由人控制的自我模型架構,包括主張、來源、授權、讀取、審計等核心組件。文章討論了現有方案的不足,並明確了 Alma 的侷限:簽名只證明來源而非真實,訪問控制管理披露而非下游保留,且尚未證明能提升代理的實用性。

來源Hacker News AI作者: 0set0set

本文探討了人工智能代理中個人模型的所有權和控制權問題。核心論點是:如果一個AI代理構建了關於一個人的模型,那麼這個模型應該由該人自己掌控——可見、可糾正、可移植、基於情境、經同意授權。

作者指出,當前AI代理與人的互動存在結構性問題。每次對話都像重新認識一個人,因為代理記憶是碎片化的,不同平台之間無法流通。平台內部構建的用户模型通常不透明,用户難以查看、糾正或導出。自定義指令雖然有用,但過於扁平,無法區分長期偏好與一時需求,也無法區分已驗證事實與猜測。記憶系統更是將一切混為一談,無法區分重要信息與噪聲。

為了解決這些問題,作者提出了“自我模型”(Self Model)的概念,並通過一個名為Alma的實驗項目來實現。自我模型是人控制的、情境化的主張集合,不是完整的身份或客觀檔案,也不是平台擁有的個人資料。Alma的核心架構包括:主張(Claims)、來源(Provenance)、授權(Grants)、臨時讀取(Readings)、審計事件(Audit Events)、檢查和糾正(Inspection and Correction)以及模式版本控制(Schema Versioning)。這些組件共同確保了模型的可控性、透明度和可移植性。

Alma的當前原型是用Rust編寫的,更具體地實現了事件日誌、投影面、基於範圍的授權、經同意的過濾讀取、持續協調(帶數值置信度)、簽名導出包和一致性測試。作者強調,其貢獻在於組合這些現有思想,而非發明新的密碼學原語或身份標準。

文章也坦承了Alma的侷限性:簽名只能證明來源和完整性,不能保證真實性;訪問控制管理披露,但不能控制下游保留;且目前沒有證據表明Alma能提升代理的實用性。文中的評估只是測試假設的計劃,而非結論。

最後,作者詳細回顧了相關領域的工作,包括本地優先軟件、個人數據存儲、自主身份、對象能力安全、情境完整性、事件溯源、CRDT、個人知識圖譜、推薦系統用户模型、檢索增強代理記憶以及平台原生AI記憶等。Alma借鑑了這些領域的思路,並增加了面向代理的、基於目的和情境的讀取模型。

儘管Alma仍處於實驗階段,但它為個人在AI時代掌控自己的數據模型提供了一個有希望的方向。