視覺AI的下一個前沿是程式碼
視覺AI正從生成畫素轉向生成程式碼,讓設計師、動畫師和3D藝術家能夠迭代編輯,而不是隻得到最終靜態輸出。
在過去幾年裡,視覺AI主要以其生成的畫素質量來評判。最終的影像或影片看起來越好,模型就越出色。這種觀點有其合理性:擴散模型將文本提示轉化為精美的影像,然後是影片,接著是越來越逼真的世界。人們自然會拿它們與Photoshop或相機做比較。
然而,對於許多視覺相關任務,如圖形設計、UI設計或3D建模,使用者最終需要的並不僅僅是靜態畫素。他們需要的是能夠基於反饋和新想法不斷迭代的工件。設計師不只需要一個模型,他們需要圖層、元件和交接規範。動畫師不只需要一段影片,他們需要時間曲線、關鍵幀和可編輯的運動軌跡。3D藝術家不只需要一張渲染圖,他們需要幾何體、材質、燈光、攝像機以及場景結構。
如今,最有趣的視覺AI工具已不再試圖直接生成最終輸出。相反,它們正在生成背後的原始碼。這一轉變解鎖了畫素原生模型無法企及的可編輯性、迭代能力和反饋迴圈。
視覺生成的兩個技術棧——畫素層與程式碼層——正在重新定義AI在創意產業中的角色。透過輸出程式碼(如SVG、Shadertoy或HTML/CSS),AI工具讓使用者能夠像對待傳統軟體一樣調整引數、修改結構,從而在創意過程中保持控制權。這種模式不僅提高了最終產品的質量,還賦予了創作者持續改進的能力。