2026-05-26 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

隱藏狀態隱私存在空白中間地帶

對1536種高斯發佈協方差的測試發現，沒有一種能在自適應檢索攻擊下同時實現中等效用和隱私保護。研究者提出了費舍爾球下界，證明均勻高斯安全性不可能，並指出對角逆費舍爾發佈是最優的但處於隱私/效用邊緣。提出分裂記憶Transformer在隱私-效用權衡上顯著優於GPT基線。

來源arXiv Machine Learning作者: Alexander Okezue Bell

一篇最新研究論文《隱藏狀態隱私存在空白中間地帶》深入探討了神經網絡隱藏狀態的隱私保護問題。該論文由Alexander Okezue Bell撰寫，於2026年5月21日提交至arXiv。研究者通過對1536種高斯發佈協方差的系統性測試，發現沒有任何一種能夠在自適應檢索攻擊下同時達到中等效用和隱私保護水平。這一“空白中間地帶”現象表明，在傳統的高斯機制設計框架下，隱私與效用之間存在難以調和的矛盾。

為了從理論上解釋這一現象，論文提出了費舍爾球下界：對於任何滿秩的高斯發佈，若其費舍爾效用為O(1)，則必然存在一個方向，其馬氏距離信號隨隱藏寬度線性增長。這意味着在該類別中，均勻高斯安全性被徹底排除，理論與實驗觀察高度一致。

在機制設計方面，研究指出對角逆費舍爾發佈是滿足一階KL預算的最優對角機制，它在32層模型網格的每個點上都能量差地將最壞攻擊者的top-1準確率控制在0.001以下。然而，這種機制同樣處於隱私/效用的邊緣，並未真正填充“中間地帶”。此外，一種在歐幾里得檢索下達到13倍帕累託改進的廣義特徵機制，在面對自適應馬氏攻擊者時top-1準確率驟降至100%，充分暴露了傳統機制的脆弱性。

作為替代方案，研究者提出了一種分裂記憶Transformer架構。從零開始訓練的模型在90M參數時達到G_Mah在20-33之間，並且在30M到1B參數範圍內，在固定token語言建模損失代價下，相比同等預算的GPT基線保持了6-24倍的顯著優勢。而預訓練模型的效果則相對有限，最佳G_Mah僅為9.3。這些結果深刻揭示了隱藏狀態發佈問題的本質：單純依賴高斯類機制設計已不足以應對複雜攻擊，未來需要轉向架構與發佈的協同設計。該研究為隱私保護機器學習領域提供了新的理論工具和實用方向，對模型選型、推理成本和評估基準等均可能產生重要影響。