2026-05-06 08:00 UTC+8站内改写1 分钟阅读更新: 2026-06-27 08:25 UTC+8

带迭代去噪的归一化流

苹果机器学习研究推出iTARFlow，一种迭代去噪方法，增强了归一化流在图像生成方面的能力，在多个分辨率的ImageNet上取得了有竞争力的结果。

归一化流（Normalizing Flows, NFs）是一类经典的基于似然的方法，近年来重新受到学术界和工业界的广泛关注。之前的工作如TARFlow已经表明，NFs在图像建模任务上能够取得有竞争力的性能，从而成为扩散模型等方法的可行替代方案。在这项由苹果机器学习研究团队完成的工作中，他们通过引入迭代TARFlow（iTARFlow）进一步推进了归一化流生成模型的发展。与扩散模型在训练过程中依赖复杂的目标函数不同，iTARFlow在训练过程中保持完全端到端的基于似然的目标，从而简化了训练流程并保持了理论上的优雅性。在采样时，iTARFlow首先执行自回归生成，随后进行受扩散风格方法启发的迭代去噪过程，这一结合使得模型既能捕捉全局结构，又能精细调整局部细节。

通过大量实验，研究团队展示了iTARFlow在ImageNet 64x64、128x128和256x256分辨率上取得了与当前最先进方法相媲美的性能，甚至在某些指标上超越了现有的扩散模型。这些结果证明了iTARFlow作为强大生成模型的潜力，并推进了归一化流在高分辨率图像合成领域的边界。此外，他们详细分析了iTARFlow产生的特征性伪影，例如在生成图像中出现的特定纹理或结构失真，这些分析提供了可能对未来模型改进有启发的重要见解。伪影的识别和分类有助于理解当前模型的局限性，并指导后续的优化方向，例如改进去噪策略或调整网络架构。

iTARFlow的代码已在GitHub上公开，便于社区复现和进一步研究。这一工作不仅是苹果在生成模型领域的持续探索的一部分，也为归一化流的发展注入了新的活力。此前，苹果研究团队已相继推出STARFlow和TARFlow，分别发表于NeurIPS 2025和ICML 2025，这些工作逐步提升了归一化流的可扩展性和生成质量。iTARFlow的提出进一步巩固了归一化流作为一类重要生成模型的地位，并为未来研究开辟了新的方向，例如将迭代去噪机制应用于其他模态（如视频或3D数据）的生成任务。