2026-06-15站内改写1 分鐘閱讀更新: 2026-06-15

解釋RhythmFormer：遠程光電容積描記法中週期性稀疏注意力的系統性XAI分析

本文針對遠程光電容積描記法（rPPG）Transformer模型的可解釋性不足，提出了一套定量化評估工具。作者將四種歸因方法適配到RhythmFormer的雙層路由注意力機制，引入了皮膚覆蓋度指標，並將忠實度係數從分類任務擴展到rPPG迴歸。實驗發現稀疏top-k路由下的多跳泄漏效應，而Beyond Intuition方法通過值投影加權和梯度掩碼有效緩解，在UBFC-rPPG數據集上取得最高皮膚覆蓋度（0.83）和忠實度（F=0.92）。研究推動了rPPG XAI向可審計的數值證據發展。

來源arXiv Computer Vision作者: Louis Chen, Torbj\"orn E. M. Nordling

遠程光電容積描記法（rPPG）是一種通過視頻分析心率的技術，近年來Transformer模型在該領域取得了出色的基準性能。然而，這些模型的決策過程仍不透明，隨着rPPG向臨牀應用邁進，可解釋性成為關鍵問題。現有可解釋人工智能（XAI）方法大多依賴定性熱圖檢查，缺乏定量忠實度度量和生理學驗證。針對這一空白，Louis Chen和Torbjörn E. M. Nordling在最新論文中提出了一套系統的XAI評估框架。

研究團隊首先將四種歸因方法——原始注意力、注意力回滾、注意力流和Beyond Intuition——適配到RhythmFormer的雙層路由注意力機制。該機制採用top-k稀疏選擇，使得解釋更具挑戰性。其次，他們引入了皮膚覆蓋度指標，用於量化歸因權重在皮膚區域上的分佈比例，從而將解釋與生理學先驗知識對齊。第三，他們將原本用於分類任務的SaCo忠實度係數改編至rPPG迴歸場景，通過原始預測與擾動後預測的rPPG波形之間的平均絕對誤差（MAE）來衡量擾動影響。

應用這些工具後，作者定量揭示了稀疏top-k路由下的多跳泄漏效應：注意力回滾和流幾乎完全恢復了各個精煉注意力層明確置零的連接。這意味着簡單的歸因方法可能高估了模型對非皮膚區域的依賴。相比之下，Beyond Intuition方法通過值投影加權回滾和梯度支持的掩碼，有效緩解了這一問題。在UBFC-rPPG數據集上，Beyond Intuition取得了最高的精煉皮膚覆蓋度（0.83，而標準回滾為0.57）和忠實度（F=0.92）。

儘管結果令人鼓舞，作者強調需要在更多樣化的數據集和模型變體上進行驗證。一個低SaCo異常值的案例研究表明，一旦替換偽影區域，所有四種方法都能一致恢復，表明歸因家族在該案例中具有一致的SaCo行為。總之，這些指標將rPPG的XAI推向可審計的數值證據，包括空間對齊和擾動忠實度，從而邁向可信賴的rPPG XAI。