AI News HubLIVE
站內改寫2 分鐘閱讀

如何為 Veo 3.1 編寫提示詞

Google 最新推出的 Veo 3.1 視頻生成模型帶來了多項強大新功能,包括參考圖像、首/尾幀控制以及增強的圖像轉視頻能力。本文詳細介紹了這些功能的用法、提示詞技巧以及 API 調用示例。

Google 近期發佈了 Veo 3.1,這是其視頻生成模型的最新版本,引入了多項創新功能,包括角色參考圖像、首尾幀控制以及改進的圖像轉視頻能力。以下是對這些功能的詳細介紹及提示詞編寫指南。

通用提示詞技巧

無論使用何種視頻生成模型,良好的提示詞都是獲得高質量輸出的關鍵。Veo 3.1 同樣遵循一些基本規則:

  • 鏡頭構圖:明確指定畫面中主體的數量和構圖方式,例如“單人鏡頭”、“雙人鏡頭”或“過肩鏡頭”。
  • 焦點與鏡頭效果:使用“淺景深”、“深景深”、“柔焦”、“微距鏡頭”或“廣角鏡頭”等術語實現特定視覺效果。
  • 整體風格與主體:通過“科幻片”、“浪漫喜劇”、“動作片”或“動畫”等風格詞引導創作方向。
  • 攝像機位置與運動:使用“平視”、“高角度”、“蟲眼視角”、“推拉鏡頭”、“變焦鏡頭”、“搖鏡頭”或“跟拍鏡頭”等術語控制攝像機運動。

參考轉視頻(Reference to Video)

這是 Veo 3.1 最令人興奮的新功能。它允許您將最多三張參考圖像合併到一個連貫的視頻場景中,並通過文本提示詞指導組合方式。

例如,您可以提供一張人物肖像和一張產品照片,模型會生成一段逼真的產品評測視頻,同時保持人物和產品的外觀一致。該功能特別適用於品牌吉祥物或角色在不同場景中的故事敍述。

首尾幀轉視頻(First and Last Frame to Video)

此功能擴展了傳統的圖像轉視頻,允許您指定視頻的起始幀和結束幀。模型會根據文本提示詞在兩者之間進行插值,生成過渡動畫。

一個典型的應用場景是物體變形序列,例如從一隻羊逐漸變成一隻老虎,或者房間裝修前後的對比。這對於需要精確控制敍事起點的視頻創作非常有用。

增強的圖像轉視頻(Enhanced Image to Video)

Veo 3.1 改進了經典圖像轉視頻功能,輸出質量更高且提示詞跟隨性更好。只需提供一張起始圖像和一段描述動作的文字,模型即可生成以該圖像開頭的視頻。模型內置的智能邏輯能夠理解圖像內容,並生成自然且連貫的運動,無需顯式指定過渡方式。

快速生成選項

除參考轉視頻外,所有端點均提供快速生成模式:速度在 60 秒以內(標準約為 90 秒),成本約為標準版本的一半,質量略有降低但依然出色。

API 調用示例

以下是通過 Replicate API 使用 Veo 3.1 的 JavaScript 示例:

基本圖像轉視頻:需提供圖像 URL、提示詞、時長和分辨率。

多圖像參考轉視頻:使用 reference_images 參數傳遞最多三張圖像 URL。

首尾幀:分別傳入 first_framelast_frame 參數。

模型返回一個視頻 URL,可直接嵌入應用。生成式視頻應用的開發者可考慮切換至 Veo 3.1,以獲得更強大的視頻生成能力。

Veo 3.1 已在 Replicate 平台上線,歡迎嘗試並分享您的創作。