AI News HubLIVE
站内改写2 分钟阅读

Show HN: AI视频提示词烹饪书——图像到视频工作流

这是一本面向创作者、营销人员和小型内容团队的实用提示词模式集,专注于图像到视频和文本到视频工作流。包含提示卡格式、产品视频和用户生成内容风格的示例提示、模型对比测试方法、评估计分卡以及常见失败案例与解决方案。

来源Hacker News AI作者: Ash_yasuomang

本烹饪书面向创作者、营销人员和小型内容团队,旨在提供实用的提示词模式,帮助用户通过图像到视频或文本到视频工作流生成可用的AI视频片段,而非一次性演示提示。其重点包括源图像准备、运动措辞、保留约束、可重复测试以及失败分析。

目标受众包括:将产品图像转化为短视频广告的产品营销人员;测试钩子、用户生成内容风格运动和竖屏构图的社交创作者;需要可重复方式比较AI视频输出的品牌团队;以及希望剪辑后仍可裁剪、添加字幕和复用的编辑人员。本书并非API集成指南,目的是让通过视觉判断输出的用户更轻松地进行提示测试。

提示卡格式要求每次测试使用一张卡片,以便将想法、约束和结果关联起来。卡片包含以下字段:剪辑任务、源图像、需保持的主体、运动、镜头、构图、风格、负面约束、成功标准、结果备注和下一步更改。其中最重要的两个字段是“需保持的主体”和“运动”,因为许多薄弱的AI视频提示只是重复描述图像,而未说明什么应该移动。

书中提供了两种典型提示示例。图像到视频产品提示适用于源图像已成为创意锚点的情况,例如5秒垂直产品广告,要求保持产品形状、瓶盖、标签、颜色和位置不变,运动为柔和光线在产品表面扫过,背景阴影自然移动,镜头缓慢推近,构图稳定。用户生成内容风格钩子提示则适用于输出需要像创作者拍摄但仍需保持产品可读性的情况,例如手持产品靠近简单桌面背景,要求保持产品标签、包装形状和手部位置稳定,运动为轻微手持晃动,产品微微倾向镜头,自然光线变化,镜头为近距离垂直手机拍摄,带有轻微手持感。

在进行模型对比测试时,提示必须保持稳定,不能在看到第一个结果后改变提示,否则对比将变成提示重写测试而非模型比较。建议固定测试名称、输入源图像和提示版本,然后针对不同模型进行评分,评分标准包括主体保真度(30%)、运动有用性(20%)、提示遵循度(20%)、可编辑性(20%)和重试成本(10%)。不要因为片段看起来令人印象深刻就保留它,只有当片段能解决原始剪辑任务时才保留。

常见失败情况包括:产品漂移(形状、颜色或标签改变),需增加更严格的保留约束并简化源图像;背景侵占(背景比主体移动更多),需要求微妙的环境运动并禁止背景替换;文字扭曲(标签或UI文字变得不可读),避免生成新文字,后期添加;运动过于静态(前几秒几乎不动),需描述立即开始的运动;过度电影化输出(片段像预告片而非可用广告),降低风格强度并明确指定平台/用例。

建议的文件夹结构为:ai-video-prompt-cookbook/ 下的 product-video-prompts/、ugc-ad-prompts/、same-prompt-tests/、failure-notes/ 和 scorecards/。

本烹饪书采用MIT许可证,提示模板和计分卡结构可自由调整以适应自有产品、品牌、安全规则和编辑工作流。