視覺AI的下一個前沿是代碼
視覺AI正從生成像素轉向生成代碼,讓設計師、動畫師和3D藝術家能夠迭代編輯,而不是隻得到最終靜態輸出。
在過去幾年裏,視覺AI主要以其生成的像素質量來評判。最終的圖像或視頻看起來越好,模型就越出色。這種觀點有其合理性:擴散模型將文本提示轉化為精美的圖像,然後是視頻,接着是越來越逼真的世界。人們自然會拿它們與Photoshop或相機做比較。
然而,對於許多視覺相關任務,如圖形設計、UI設計或3D建模,用户最終需要的並不僅僅是靜態像素。他們需要的是能夠基於反饋和新想法不斷迭代的工件。設計師不只需要一個模型,他們需要圖層、組件和交接規範。動畫師不只需要一段視頻,他們需要時間曲線、關鍵幀和可編輯的運動軌跡。3D藝術家不只需要一張渲染圖,他們需要幾何體、材質、燈光、攝像機以及場景結構。
如今,最有趣的視覺AI工具已不再試圖直接生成最終輸出。相反,它們正在生成背後的源代碼。這一轉變解鎖了像素原生模型無法企及的可編輯性、迭代能力和反饋循環。
視覺生成的兩個技術棧——像素層與代碼層——正在重新定義AI在創意產業中的角色。通過輸出代碼(如SVG、Shadertoy或HTML/CSS),AI工具讓用户能夠像對待傳統軟件一樣調整參數、修改結構,從而在創意過程中保持控制權。這種模式不僅提高了最終產品的質量,還賦予了創作者持續改進的能力。