2026-05-28 12:00 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

表示條件擴散模型：用於引導訓練數據生成

該研究提出表示條件擴散模型，利用DINOv2、DINOv3和CLIP的表示作為條件生成合成圖像數據，在ImageNet100上以+10.76 p.p.的top-1準確率顯著優於類條件生成。通過擴大合成數據集，甚至能超越真實數據訓練的模型（+2.0 p.p.）。此外，該方法在數據增強和樣本過濾方面也表現出色，為大規模視覺學習任務提供了一種有前景的替代或補充真實數據集的方案。

來源arXiv Computer Vision作者: Nithesh Chandher Karthikeyan, Jonas Unger, Gabriel Eilertsen

數據可用性仍然是深度學習應用中的一個關鍵瓶頸。大規模數據集的收集、整理和標註成本高昂，限制了監督學習的可擴展性。最近，一篇由Nithesh Chandher Karthikeyan等人提交至arXiv的論文（編號2605.27495）提出了一種利用表示條件擴散模型生成合成訓練數據的新方法，旨在解決這一難題。

研究人員採用潛在擴散模型，並基於DINOv2、DINOv3和CLIP等預訓練模型學到的表示作為條件，生成高質量的合成圖像。實驗表明，這種表示條件生成的圖像在分類任務中顯著優於傳統的類條件生成方法。在ImageNet100數據集上，表示條件生成實現了+10.76個百分點的top-1準確率提升，這得益於更好的樣本質量和模式覆蓋。更令人矚目的是，通過擴大合成數據集的規模，訓練出的分類器甚至超越了使用真實數據訓練的分類器，準確率高出2.0個百分點。

除了直接用於訓練，該研究還展示了合成圖像在數據增強方面的應用。使用生成圖像進行增強的效果優於經典的數據增強方法。此外，條件表示空間還可用於樣本過濾，進一步篩選出對訓練更有價值的樣本，從而提升整體訓練效果。

這些發現表明，表示條件擴散模型為大規模視覺學習任務提供了一條有前景的路徑。它們不僅可以增強或補充真實數據集，還有潛力在特定情況下完全替代真實數據，從而緩解數據收集和標註的瓶頸。該工作為利用生成模型解決數據稀缺問題開闢了新的方向。