AI News HubLIVE
サイト内リライト2 分で読了

反復的デノイジングを伴う正規化フロー

Apple Machine Learning Researchは、画像生成のための正規化フローを強化する反復的デノイジング手法iTARFlowを発表。複数の解像度のImageNetで競争力のある結果を達成。

正規化フロー(Normalizing Flows, NFs)は、尤度ベースの手法の古典的なファミリーであり、近年再び注目を集めています。これまでのTARFlowなどの取り組みにより、NFsは画像モデリングタスクで有望なパフォーマンスを達成し、拡散モデルなどの他の手法の有力な代替手段となることが示されています。この研究では、Apple Machine Learning Researchは、反復的TARFlow(iTARFlow)を導入することで、正規化フロー生成モデルの最先端をさらに進めました。拡散モデルとは異なり、iTARFlowはトレーニング中に完全にエンドツーエンドで尤度ベースの目的を維持するため、トレーニングプロセスが簡素化され、理論的な優雅さが保たれます。サンプリング時には、自己回帰生成を実行し、続いて拡散スタイルの手法に触発された反復的デノイジング手順を実行します。この組み合わせにより、モデルは大域的な構造を捉えつつ、局所的な詳細を微調整することが可能になります。

広範な実験を通じて、iTARFlowはImageNetの64x64、128x128、256x256解像度で競争力のあるパフォーマンスを達成し、一部の指標では既存の拡散モデルを上回る結果を示しました。これらの結果は、iTARFlowが強力な生成モデルとしての可能性を持ち、正規化フローのフロンティアを高解像度画像合成の分野で前進させたことを証明しています。さらに、iTARFlowによって生成される特徴的なアーティファクト(例えば、特定のテクスチャや構造の歪み)を詳細に分析し、将来のモデル改善に役立つ洞察を提供しています。アーティファクトの特定と分類は、現在のモデルの限界を理解し、デノイジング戦略の改善やネットワークアーキテクチャの調整などの最適化方向性を導くのに役立ちます。

iTARFlowのコードはGitHubで公開されており、コミュニティによる再現とさらなる研究が容易になっています。この研究は、Appleが生成モデルの分野で継続的に取り組んでいる一環であり、以前にはNeurIPS 2025で発表されたSTARFlowやICML 2025で発表されたTARFlowなどの成果があります。これらの進歩は、正規化フローのスケーラビリティと生成品質を段階的に向上させてきました。iTARFlowの提案は、正規化フローを重要な生成モデルのクラスとしてさらに確固たるものにし、例えばビデオや3Dデータなどの他のモダリティへの反復的デノイジング機構の適用など、将来の研究に新たな方向性を開くものです。