ビジュアルAIの次のフロンティアはコード
ビジュアルAIはピクセル生成からコード生成へとシフトし、デザイナー、アニメーター、3Dアーティストが最終的な静的な出力ではなく、反復編集できるようになる。
ここ数年、ビジュアルAIは主にピクセルの品質で評価されてきた。最終的な画像や動画が美しく見えるほど、モデルは優れていると見なされた。これは理にかなっていた。拡散モデルはテキストプロンプトを美しい画像に、次に動画に、そしてますますリアルな世界に変換した。比較の対象は明らかにPhotoshopやカメラだった。
しかし、グラフィックデザイン、UIデザイン、3Dモデリングなどの多くのビジュアル関連タスクにおいて、ユーザーが求める最終的な表現は、静的なピクセルだけではない。むしろ、フィードバックや新しいアイデアに基づいて継続的に反復できるアーティファクトを求めている。デザイナーはモックアップだけでなく、レイヤー、コンポーネント、引き継ぎを必要とする。アニメーターは動画だけでなく、タイミングカーブ、キーフレーム、編集可能なモーションを必要とする。3Dアーティストはレンダリング画像だけでなく、ジオメトリ、マテリアル、ライティング、カメラ、シーン構造を必要とする。
今日、最も興味深いビジュアルAIツールは、最終出力を生成しようとするのをやめている。代わりに、その背後にあるソースコードを生成している。この変化は、ピクセルネイティブモデルには不可能な編集可能性、反復、フィードバックループを実現している。
ビジュアル生成の2つのスタック—ピクセル層とコード層—は、クリエイティブ産業におけるAIの役割を再定義している。コード(SVG、Shadertoy、HTML/CSSなど)を出力することで、AIツールはユーザーが従来のソフトウェアと同様にパラメータを調整し、構造を変更できるようにし、創造的なプロセスにおける制御を維持する。このモードは最終製品の品質を向上させるだけでなく、クリエイターに継続的な改善能力を与える。