2026-05-06 08:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

帶迭代去噪的歸一化流

蘋果機器學習研究推出iTARFlow，一種迭代去噪方法，增強了歸一化流在影像生成方面的能力，在多個解析度的ImageNet上取得了有競爭力的結果。

歸一化流（Normalizing Flows, NFs）是一類經典的基於似然的方法，近年來重新受到學術界和工業界的廣泛關注。之前的工作如TARFlow已經表明，NFs在影像建模任務上能夠取得有競爭力的效能，從而成為擴散模型等方法的可行替代方案。在這項由蘋果機器學習研究團隊完成的工作中，他們透過引入迭代TARFlow（iTARFlow）進一步推進了歸一化流生成模型的發展。與擴散模型在訓練過程中依賴複雜的目標函式不同，iTARFlow在訓練過程中保持完全端到端的基於似然的目標，從而簡化了訓練流程並保持了理論上的優雅性。在取樣時，iTARFlow首先執行自迴歸生成，隨後進行受擴散風格方法啟發的迭代去噪過程，這一結合使得模型既能捕捉全域性結構，又能精細調整區域性細節。

透過大量實驗，研究團隊展示了iTARFlow在ImageNet 64x64、128x128和256x256解析度上取得了與當前最先進方法相媲美的效能，甚至在某些指標上超越了現有的擴散模型。這些結果證明了iTARFlow作為強大生成模型的潛力，並推進了歸一化流在高解析度影像合成領域的邊界。此外，他們詳細分析了iTARFlow產生的特徵性偽影，例如在生成影像中出現的特定紋理或結構失真，這些分析提供了可能對未來模型改進有啟發的重要見解。偽影的識別和分類有助於理解當前模型的侷限性，並指導後續的最佳化方向，例如改進去噪策略或調整網路架構。

iTARFlow的程式碼已在GitHub上公開，便於社群復現和進一步研究。這一工作不僅是蘋果在生成模型領域的持續探索的一部分，也為歸一化流的發展注入了新的活力。此前，蘋果研究團隊已相繼推出STARFlow和TARFlow，分別發表於NeurIPS 2025和ICML 2025，這些工作逐步提升了歸一化流的可擴充套件性和生成質量。iTARFlow的提出進一步鞏固了歸一化流作為一類重要生成模型的地位，併為未來研究開闢了新的方向，例如將迭代去噪機制應用於其他模態（如影片或3D資料）的生成任務。