带迭代去噪的归一化流
苹果机器学习研究推出iTARFlow,一种迭代去噪方法,增强了归一化流在图像生成方面的能力,在多个分辨率的ImageNet上取得了有竞争力的结果。
归一化流(Normalizing Flows, NFs)是一类经典的基于似然的方法,近年来重新受到学术界和工业界的广泛关注。之前的工作如TARFlow已经表明,NFs在图像建模任务上能够取得有竞争力的性能,从而成为扩散模型等方法的可行替代方案。在这项由苹果机器学习研究团队完成的工作中,他们通过引入迭代TARFlow(iTARFlow)进一步推进了归一化流生成模型的发展。与扩散模型在训练过程中依赖复杂的目标函数不同,iTARFlow在训练过程中保持完全端到端的基于似然的目标,从而简化了训练流程并保持了理论上的优雅性。在采样时,iTARFlow首先执行自回归生成,随后进行受扩散风格方法启发的迭代去噪过程,这一结合使得模型既能捕捉全局结构,又能精细调整局部细节。
通过大量实验,研究团队展示了iTARFlow在ImageNet 64x64、128x128和256x256分辨率上取得了与当前最先进方法相媲美的性能,甚至在某些指标上超越了现有的扩散模型。这些结果证明了iTARFlow作为强大生成模型的潜力,并推进了归一化流在高分辨率图像合成领域的边界。此外,他们详细分析了iTARFlow产生的特征性伪影,例如在生成图像中出现的特定纹理或结构失真,这些分析提供了可能对未来模型改进有启发的重要见解。伪影的识别和分类有助于理解当前模型的局限性,并指导后续的优化方向,例如改进去噪策略或调整网络架构。
iTARFlow的代码已在GitHub上公开,便于社区复现和进一步研究。这一工作不仅是苹果在生成模型领域的持续探索的一部分,也为归一化流的发展注入了新的活力。此前,苹果研究团队已相继推出STARFlow和TARFlow,分别发表于NeurIPS 2025和ICML 2025,这些工作逐步提升了归一化流的可扩展性和生成质量。iTARFlow的提出进一步巩固了归一化流作为一类重要生成模型的地位,并为未来研究开辟了新的方向,例如将迭代去噪机制应用于其他模态(如视频或3D数据)的生成任务。