2025-10-16 08:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

如何為 Veo 3.1 編寫提示詞

Google 最新推出的 Veo 3.1 視頻生成模型帶來了多項強大新功能，包括參考圖像、首/尾幀控制以及增強的圖像轉視頻能力。本文詳細介紹了這些功能的用法、提示詞技巧以及 API 調用示例。

Google 近期發佈了 Veo 3.1，這是其視頻生成模型的最新版本，引入了多項創新功能，包括角色參考圖像、首尾幀控制以及改進的圖像轉視頻能力。以下是對這些功能的詳細介紹及提示詞編寫指南。

通用提示詞技巧

無論使用何種視頻生成模型，良好的提示詞都是獲得高質量輸出的關鍵。Veo 3.1 同樣遵循一些基本規則：

這是 Veo 3.1 最令人興奮的新功能。它允許您將最多三張參考圖像合併到一個連貫的視頻場景中，並通過文本提示詞指導組合方式。

例如，您可以提供一張人物肖像和一張產品照片，模型會生成一段逼真的產品評測視頻，同時保持人物和產品的外觀一致。該功能特別適用於品牌吉祥物或角色在不同場景中的故事敍述。

此功能擴展了傳統的圖像轉視頻，允許您指定視頻的起始幀和結束幀。模型會根據文本提示詞在兩者之間進行插值，生成過渡動畫。

一個典型的應用場景是物體變形序列，例如從一隻羊逐漸變成一隻老虎，或者房間裝修前後的對比。這對於需要精確控制敍事起點的視頻創作非常有用。

Veo 3.1 改進了經典圖像轉視頻功能，輸出質量更高且提示詞跟隨性更好。只需提供一張起始圖像和一段描述動作的文字，模型即可生成以該圖像開頭的視頻。模型內置的智能邏輯能夠理解圖像內容，並生成自然且連貫的運動，無需顯式指定過渡方式。

除參考轉視頻外，所有端點均提供快速生成模式：速度在 60 秒以內（標準約為 90 秒），成本約為標準版本的一半，質量略有降低但依然出色。

以下是通過 Replicate API 使用 Veo 3.1 的 JavaScript 示例：

基本圖像轉視頻：需提供圖像 URL、提示詞、時長和分辨率。

多圖像參考轉視頻：使用 reference_images 參數傳遞最多三張圖像 URL。

首尾幀：分別傳入 first_frame 和 last_frame 參數。

模型返回一個視頻 URL，可直接嵌入應用。生成式視頻應用的開發者可考慮切換至 Veo 3.1，以獲得更強大的視頻生成能力。

Veo 3.1 已在 Replicate 平台上線，歡迎嘗試並分享您的創作。