2026-05-28 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

表示條件擴散模型：用於引導訓練資料生成

該研究提出表示條件擴散模型，利用DINOv2、DINOv3和CLIP的表示作為條件生成合成影像資料，在ImageNet100上以+10.76 p.p.的top-1準確率顯著優於類條件生成。透過擴大合成資料集，甚至能超越真實資料訓練的模型（+2.0 p.p.）。此外，該方法在資料增強和樣本過濾方面也表現出色，為大規模視覺學習任務提供了一種有前景的替代或補充真實資料集的方案。

來源arXiv Computer Vision作者: Nithesh Chandher Karthikeyan, Jonas Unger, Gabriel Eilertsen

資料可用性仍然是深度學習應用中的一個關鍵瓶頸。大規模資料集的收集、整理和標註成本高昂，限制了監督學習的可擴充套件性。最近，一篇由Nithesh Chandher Karthikeyan等人提交至arXiv的論文（編號2605.27495）提出了一種利用表示條件擴散模型生成合成訓練資料的新方法，旨在解決這一難題。

研究人員採用潛在擴散模型，並基於DINOv2、DINOv3和CLIP等預訓練模型學到的表示作為條件，生成高質量的合成影像。實驗表明，這種表示條件生成的影像在分類任務中顯著優於傳統的類條件生成方法。在ImageNet100資料集上，表示條件生成實現了+10.76個百分點的top-1準確率提升，這得益於更好的樣本質量和模式覆蓋。更令人矚目的是，透過擴大合成資料集的規模，訓練出的分類器甚至超越了使用真實資料訓練的分類器，準確率高出2.0個百分點。

除了直接用於訓練，該研究還展示了合成影像在資料增強方面的應用。使用生成影像進行增強的效果優於經典的資料增強方法。此外，條件表示空間還可用於樣本過濾，進一步篩選出對訓練更有價值的樣本，從而提升整體訓練效果。

這些發現表明，表示條件擴散模型為大規模視覺學習任務提供了一條有前景的路徑。它們不僅可以增強或補充真實資料集，還有潛力在特定情況下完全替代真實資料，從而緩解資料收集和標註的瓶頸。該工作為利用生成模型解決資料稀缺問題開闢了新的方向。