AI News HubLIVE
站内改写1 分钟阅读

视觉AI的下一个前沿是代码

视觉AI正从生成像素转向生成代码,让设计师、动画师和3D艺术家能够迭代编辑,而不是只得到最终静态输出。

来源Hacker News AI作者: ykhli

在过去几年里,视觉AI主要以其生成的像素质量来评判。最终的图像或视频看起来越好,模型就越出色。这种观点有其合理性:扩散模型将文本提示转化为精美的图像,然后是视频,接着是越来越逼真的世界。人们自然会拿它们与Photoshop或相机做比较。

然而,对于许多视觉相关任务,如图形设计、UI设计或3D建模,用户最终需要的并不仅仅是静态像素。他们需要的是能够基于反馈和新想法不断迭代的工件。设计师不只需要一个模型,他们需要图层、组件和交接规范。动画师不只需要一段视频,他们需要时间曲线、关键帧和可编辑的运动轨迹。3D艺术家不只需要一张渲染图,他们需要几何体、材质、灯光、摄像机以及场景结构。

如今,最有趣的视觉AI工具已不再试图直接生成最终输出。相反,它们正在生成背后的源代码。这一转变解锁了像素原生模型无法企及的可编辑性、迭代能力和反馈循环。

视觉生成的两个技术栈——像素层与代码层——正在重新定义AI在创意产业中的角色。通过输出代码(如SVG、Shadertoy或HTML/CSS),AI工具让用户能够像对待传统软件一样调整参数、修改结构,从而在创意过程中保持控制权。这种模式不仅提高了最终产品的质量,还赋予了创作者持续改进的能力。