帶迭代去噪的歸一化流
蘋果機器學習研究推出iTARFlow,一種迭代去噪方法,增強了歸一化流在影像生成方面的能力,在多個解析度的ImageNet上取得了有競爭力的結果。
歸一化流(Normalizing Flows, NFs)是一類經典的基於似然的方法,近年來重新受到學術界和工業界的廣泛關注。之前的工作如TARFlow已經表明,NFs在影像建模任務上能夠取得有競爭力的效能,從而成為擴散模型等方法的可行替代方案。在這項由蘋果機器學習研究團隊完成的工作中,他們透過引入迭代TARFlow(iTARFlow)進一步推進了歸一化流生成模型的發展。與擴散模型在訓練過程中依賴複雜的目標函式不同,iTARFlow在訓練過程中保持完全端到端的基於似然的目標,從而簡化了訓練流程並保持了理論上的優雅性。在取樣時,iTARFlow首先執行自迴歸生成,隨後進行受擴散風格方法啟發的迭代去噪過程,這一結合使得模型既能捕捉全域性結構,又能精細調整區域性細節。
透過大量實驗,研究團隊展示了iTARFlow在ImageNet 64x64、128x128和256x256解析度上取得了與當前最先進方法相媲美的效能,甚至在某些指標上超越了現有的擴散模型。這些結果證明了iTARFlow作為強大生成模型的潛力,並推進了歸一化流在高解析度影像合成領域的邊界。此外,他們詳細分析了iTARFlow產生的特徵性偽影,例如在生成影像中出現的特定紋理或結構失真,這些分析提供了可能對未來模型改進有啟發的重要見解。偽影的識別和分類有助於理解當前模型的侷限性,並指導後續的最佳化方向,例如改進去噪策略或調整網路架構。
iTARFlow的程式碼已在GitHub上公開,便於社群復現和進一步研究。這一工作不僅是蘋果在生成模型領域的持續探索的一部分,也為歸一化流的發展注入了新的活力。此前,蘋果研究團隊已相繼推出STARFlow和TARFlow,分別發表於NeurIPS 2025和ICML 2025,這些工作逐步提升了歸一化流的可擴充套件性和生成質量。iTARFlow的提出進一步鞏固了歸一化流作為一類重要生成模型的地位,併為未來研究開闢了新的方向,例如將迭代去噪機制應用於其他模態(如影片或3D資料)的生成任務。