2026-06-02 23:45 UTC+8站内改写1 分钟阅读更新: 2026-06-30 21:03 UTC+8

视觉AI的下一个前沿是代码

视觉AI正从生成像素转向生成代码，让设计师、动画师和3D艺术家能够迭代编辑，而不是只得到最终静态输出。

在过去几年里，视觉AI主要以其生成的像素质量来评判。最终的图像或视频看起来越好，模型就越出色。这种观点有其合理性：扩散模型将文本提示转化为精美的图像，然后是视频，接着是越来越逼真的世界。人们自然会拿它们与Photoshop或相机做比较。

然而，对于许多视觉相关任务，如图形设计、UI设计或3D建模，用户最终需要的并不仅仅是静态像素。他们需要的是能够基于反馈和新想法不断迭代的工件。设计师不只需要一个模型，他们需要图层、组件和交接规范。动画师不只需要一段视频，他们需要时间曲线、关键帧和可编辑的运动轨迹。3D艺术家不只需要一张渲染图，他们需要几何体、材质、灯光、摄像机以及场景结构。

如今，最有趣的视觉AI工具已不再试图直接生成最终输出。相反，它们正在生成背后的源代码。这一转变解锁了像素原生模型无法企及的可编辑性、迭代能力和反馈循环。

视觉生成的两个技术栈——像素层与代码层——正在重新定义AI在创意产业中的角色。通过输出代码（如SVG、Shadertoy或HTML/CSS），AI工具让用户能够像对待传统软件一样调整参数、修改结构，从而在创意过程中保持控制权。这种模式不仅提高了最终产品的质量，还赋予了创作者持续改进的能力。