AI News HubLIVE
站内改写2 分钟阅读

如何为 Veo 3.1 编写提示词

Google 最新推出的 Veo 3.1 视频生成模型带来了多项强大新功能,包括参考图像、首/尾帧控制以及增强的图像转视频能力。本文详细介绍了这些功能的用法、提示词技巧以及 API 调用示例。

Google 近期发布了 Veo 3.1,这是其视频生成模型的最新版本,引入了多项创新功能,包括角色参考图像、首尾帧控制以及改进的图像转视频能力。以下是对这些功能的详细介绍及提示词编写指南。

通用提示词技巧

无论使用何种视频生成模型,良好的提示词都是获得高质量输出的关键。Veo 3.1 同样遵循一些基本规则:

  • 镜头构图:明确指定画面中主体的数量和构图方式,例如“单人镜头”、“双人镜头”或“过肩镜头”。
  • 焦点与镜头效果:使用“浅景深”、“深景深”、“柔焦”、“微距镜头”或“广角镜头”等术语实现特定视觉效果。
  • 整体风格与主体:通过“科幻片”、“浪漫喜剧”、“动作片”或“动画”等风格词引导创作方向。
  • 摄像机位置与运动:使用“平视”、“高角度”、“虫眼视角”、“推拉镜头”、“变焦镜头”、“摇镜头”或“跟拍镜头”等术语控制摄像机运动。

参考转视频(Reference to Video)

这是 Veo 3.1 最令人兴奋的新功能。它允许您将最多三张参考图像合并到一个连贯的视频场景中,并通过文本提示词指导组合方式。

例如,您可以提供一张人物肖像和一张产品照片,模型会生成一段逼真的产品评测视频,同时保持人物和产品的外观一致。该功能特别适用于品牌吉祥物或角色在不同场景中的故事叙述。

首尾帧转视频(First and Last Frame to Video)

此功能扩展了传统的图像转视频,允许您指定视频的起始帧和结束帧。模型会根据文本提示词在两者之间进行插值,生成过渡动画。

一个典型的应用场景是物体变形序列,例如从一只羊逐渐变成一只老虎,或者房间装修前后的对比。这对于需要精确控制叙事起点的视频创作非常有用。

增强的图像转视频(Enhanced Image to Video)

Veo 3.1 改进了经典图像转视频功能,输出质量更高且提示词跟随性更好。只需提供一张起始图像和一段描述动作的文字,模型即可生成以该图像开头的视频。模型内置的智能逻辑能够理解图像内容,并生成自然且连贯的运动,无需显式指定过渡方式。

快速生成选项

除参考转视频外,所有端点均提供快速生成模式:速度在 60 秒以内(标准约为 90 秒),成本约为标准版本的一半,质量略有降低但依然出色。

API 调用示例

以下是通过 Replicate API 使用 Veo 3.1 的 JavaScript 示例:

基本图像转视频:需提供图像 URL、提示词、时长和分辨率。

多图像参考转视频:使用 reference_images 参数传递最多三张图像 URL。

首尾帧:分别传入 first_framelast_frame 参数。

模型返回一个视频 URL,可直接嵌入应用。生成式视频应用的开发者可考虑切换至 Veo 3.1,以获得更强大的视频生成能力。

Veo 3.1 已在 Replicate 平台上线,欢迎尝试并分享您的创作。