2025-10-16 08:00 UTC+8站内改写2 分钟阅读更新: 2026-06-27 08:25 UTC+8

如何为 Veo 3.1 编写提示词

Google 最新推出的 Veo 3.1 视频生成模型带来了多项强大新功能，包括参考图像、首/尾帧控制以及增强的图像转视频能力。本文详细介绍了这些功能的用法、提示词技巧以及 API 调用示例。

Google 近期发布了 Veo 3.1，这是其视频生成模型的最新版本，引入了多项创新功能，包括角色参考图像、首尾帧控制以及改进的图像转视频能力。以下是对这些功能的详细介绍及提示词编写指南。

通用提示词技巧

无论使用何种视频生成模型，良好的提示词都是获得高质量输出的关键。Veo 3.1 同样遵循一些基本规则：

这是 Veo 3.1 最令人兴奋的新功能。它允许您将最多三张参考图像合并到一个连贯的视频场景中，并通过文本提示词指导组合方式。

例如，您可以提供一张人物肖像和一张产品照片，模型会生成一段逼真的产品评测视频，同时保持人物和产品的外观一致。该功能特别适用于品牌吉祥物或角色在不同场景中的故事叙述。

此功能扩展了传统的图像转视频，允许您指定视频的起始帧和结束帧。模型会根据文本提示词在两者之间进行插值，生成过渡动画。

一个典型的应用场景是物体变形序列，例如从一只羊逐渐变成一只老虎，或者房间装修前后的对比。这对于需要精确控制叙事起点的视频创作非常有用。

Veo 3.1 改进了经典图像转视频功能，输出质量更高且提示词跟随性更好。只需提供一张起始图像和一段描述动作的文字，模型即可生成以该图像开头的视频。模型内置的智能逻辑能够理解图像内容，并生成自然且连贯的运动，无需显式指定过渡方式。

除参考转视频外，所有端点均提供快速生成模式：速度在 60 秒以内（标准约为 90 秒），成本约为标准版本的一半，质量略有降低但依然出色。

以下是通过 Replicate API 使用 Veo 3.1 的 JavaScript 示例：

基本图像转视频：需提供图像 URL、提示词、时长和分辨率。

多图像参考转视频：使用 reference_images 参数传递最多三张图像 URL。

首尾帧：分别传入 first_frame 和 last_frame 参数。

模型返回一个视频 URL，可直接嵌入应用。生成式视频应用的开发者可考虑切换至 Veo 3.1，以获得更强大的视频生成能力。

Veo 3.1 已在 Replicate 平台上线，欢迎尝试并分享您的创作。