AI News HubLIVE
站内改写

借助AI成为更好的设计师:成为数字囤积者

文章以Google Gemini Omni模型为引,指出AI设计工具因缺乏审美引导导致输出同质化(“AI垃圾”),并提出解决方案:通过持续收集视觉参考(“数字囤积”)培养个人品味,并将其编码为AI可理解的格式,从而引导模型产出独特且具有品味的设计。

文章情报

工程师中级

要点

  • Google推出Gemini Omni模型,标志着AI从纯文本向多模态推理转变,但当前多数AI设计工具仍局限于文本输入,导致输出千篇一律。
  • 要摆脱“AI垃圾”,设计师需要培养品味,并将品味通过视觉参考库(数字囤积)编码,让模型能够模仿。
  • 持续积累视觉灵感并分析其吸引力模式,是构建个人“审美库”的关键,未来AI将直接理解视觉输入,但审美库的积累仍然不可或缺。
  • 文章还介绍了三则本周资源:2026年AI设计报告、改进人机协作的开源工具Roughdraft、以及大规模项目中运行编码代理的经验帖。

为什么重要

这条新闻值得关注,因为Google推出Gemini Omni模型,标志着AI从纯文本向多模态推理转变,但当前多数AI设计工具仍局限于文本输入,导致输出千篇一律。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

上周,Google在其年度I/O大会上发布了众多更新,其中Gemini Omni模型尤为引人注目。该模型能够从视频等多种输入生成内容,体现了AI从单纯文本处理向多模态推理的重大转变。过去,我们习惯于为不同任务选择不同模型,例如文本用GPT、图像用DALL·E、视频用Veo等。但Omni的出现暗示,未来前沿模型将趋向“任意输入-任意输出”的统一架构。然而,当前绝大多数AI设计工具仍以文本为中心,导致输出不可避免地趋于同质化——人们称之为“AI垃圾”或“AI气味”,例如斜体标题、泛滥的米色与紫色渐变等。问题的根源在于缺乏有观点的引导,使得即便最先进的模型也会回归到平均化的模式。

要突破这一困境,设计师需要两样东西:品味,以及将品味编码为模型可模仿形式的能力。作者将后者定义为“编码品味”的技能,而提升这两者的最佳途径正是“数字囤积”。所谓数字囤积,就是持续收集任何你发现具有视觉吸引力的东西——图片、配色、字体、材质,甚至一段动态效果。这并非新鲜事物,设计师在做项目时常用的“情绪板”便是其体现。但关键在于,应将这种做法从项目性行为转变为日常习惯。每次保存素材时,尝试分析自己喜欢它的原因:是色彩、布局、字体还是动态?运用“五个为什么”深入挖掘,或者借助Claude、ChatGPT等工具解析其吸引力。久而久之,你会逐渐发现模式,丰富自己的审美词汇,培养出更敏锐的视觉判断力。

随着AI向“全知”(omni)方向发展,你积累的参考库将变得愈发宝贵。它不仅封装了你的个人品味,还能直接作为AI生成新内容的原材料。想象你的品味如同一张模糊的图像,每添加一件对齐的素材,这张“品味图像”的清晰度就提升一分。当你启动新项目时,不再需要空洞地要求AI“设计得更现代”,而是能直接提供丰富的视觉参考,从而引导输出远离平庸,走向独特。

当然,当前的多模态模型理解视觉信息的能力已相当强大,但将其转化为文本依然是必要的步骤。例如,你可以利用视觉分析工具生成TASTE.md或DESIGN.md等系统文件,将抽象的审美固定为具体的描述。Midjourney的“风格创建器”就通过让用户选择大量图片来生成精细的风格档案。尽管这种从视觉到文本再到代码的转换过程会丢失部分信息,但随着模型越来越“全知”,对文本转换的依赖将逐渐减少。届时,模型本身将学会直接品味你的审美,使你能更专注于判断、策展和创造。但无论如何,构建一个全面的“品味库”始终是基础。因此,就像AI模型一样,你也应该让自己变得更“全知”——从今天开始建立你的数字品味库,理解它,并为当今的模型编码它。

在本周的资源推荐中,文章提到了三则值得关注的内容:一是Ben Blumenrose发布的《2026年AI设计报告》,据称是迄今为止最全面的设计与AI现状综述;二是Nathan Baschez推出的开源项目Roughdraft,它将注释和建议修改功能引入Markdown文件,旨在改善人与AI代理的协作体验;三是Simon Last分享的关于在大规模项目中运行编码代理的实践经验帖,其中包含一些与半年前截然相反的新见解。这些资源为本文的观点提供了丰富的实践背景和工具支持。