AI News HubLIVE
站内改写1 分鐘閱讀

解釋RhythmFormer:遠程光電容積描記法中週期性稀疏注意力的系統性XAI分析

本文針對遠程光電容積描記法(rPPG)Transformer模型的可解釋性不足,提出了一套定量化評估工具。作者將四種歸因方法適配到RhythmFormer的雙層路由注意力機制,引入了皮膚覆蓋度指標,並將忠實度係數從分類任務擴展到rPPG迴歸。實驗發現稀疏top-k路由下的多跳泄漏效應,而Beyond Intuition方法通過值投影加權和梯度掩碼有效緩解,在UBFC-rPPG數據集上取得最高皮膚覆蓋度(0.83)和忠實度(F=0.92)。研究推動了rPPG XAI向可審計的數值證據發展。

來源arXiv Computer Vision作者: Louis Chen, Torbj\"orn E. M. Nordling

遠程光電容積描記法(rPPG)是一種通過視頻分析心率的技術,近年來Transformer模型在該領域取得了出色的基準性能。然而,這些模型的決策過程仍不透明,隨着rPPG向臨牀應用邁進,可解釋性成為關鍵問題。現有可解釋人工智能(XAI)方法大多依賴定性熱圖檢查,缺乏定量忠實度度量和生理學驗證。針對這一空白,Louis Chen和Torbjörn E. M. Nordling在最新論文中提出了一套系統的XAI評估框架。

研究團隊首先將四種歸因方法——原始注意力、注意力回滾、注意力流和Beyond Intuition——適配到RhythmFormer的雙層路由注意力機制。該機制採用top-k稀疏選擇,使得解釋更具挑戰性。其次,他們引入了皮膚覆蓋度指標,用於量化歸因權重在皮膚區域上的分佈比例,從而將解釋與生理學先驗知識對齊。第三,他們將原本用於分類任務的SaCo忠實度係數改編至rPPG迴歸場景,通過原始預測與擾動後預測的rPPG波形之間的平均絕對誤差(MAE)來衡量擾動影響。

應用這些工具後,作者定量揭示了稀疏top-k路由下的多跳泄漏效應:注意力回滾和流幾乎完全恢復了各個精煉注意力層明確置零的連接。這意味着簡單的歸因方法可能高估了模型對非皮膚區域的依賴。相比之下,Beyond Intuition方法通過值投影加權回滾和梯度支持的掩碼,有效緩解了這一問題。在UBFC-rPPG數據集上,Beyond Intuition取得了最高的精煉皮膚覆蓋度(0.83,而標準回滾為0.57)和忠實度(F=0.92)。

儘管結果令人鼓舞,作者強調需要在更多樣化的數據集和模型變體上進行驗證。一個低SaCo異常值的案例研究表明,一旦替換偽影區域,所有四種方法都能一致恢復,表明歸因家族在該案例中具有一致的SaCo行為。總之,這些指標將rPPG的XAI推向可審計的數值證據,包括空間對齊和擾動忠實度,從而邁向可信賴的rPPG XAI。