如何為 Veo 3.1 編寫提示詞
Google 最新推出的 Veo 3.1 影片生成模型帶來了多項強大新功能,包括參考影像、首/尾幀控制以及增強的影像轉影片能力。本文詳細介紹了這些功能的用法、提示詞技巧以及 API 呼叫示例。
Google 近期釋出了 Veo 3.1,這是其影片生成模型的最新版本,引入了多項創新功能,包括角色參考影像、首尾幀控制以及改進的影像轉影片能力。以下是對這些功能的詳細介紹及提示詞編寫指南。
通用提示詞技巧
無論使用何種影片生成模型,良好的提示詞都是獲得高質量輸出的關鍵。Veo 3.1 同樣遵循一些基本規則:
- 鏡頭構圖:明確指定畫面中主體的數量和構圖方式,例如“單人鏡頭”、“雙人鏡頭”或“過肩鏡頭”。
- 焦點與鏡頭效果:使用“淺景深”、“深景深”、“柔焦”、“微距鏡頭”或“廣角鏡頭”等術語實現特定視覺效果。
- 整體風格與主體:透過“科幻片”、“浪漫喜劇”、“動作片”或“動畫”等風格詞引導創作方向。
- 攝像機位置與運動:使用“平視”、“高角度”、“蟲眼視角”、“推拉鏡頭”、“變焦鏡頭”、“搖鏡頭”或“跟拍鏡頭”等術語控制攝像機運動。
參考轉影片(Reference to Video)
這是 Veo 3.1 最令人興奮的新功能。它允許您將最多三張參考影像合併到一個連貫的影片場景中,並透過文本提示詞指導組合方式。
例如,您可以提供一張人物肖像和一張產品照片,模型會生成一段逼真的產品評測影片,同時保持人物和產品的外觀一致。該功能特別適用於品牌吉祥物或角色在不同場景中的故事敘述。
首尾幀轉影片(First and Last Frame to Video)
此功能擴充套件了傳統的影像轉影片,允許您指定影片的起始幀和結束幀。模型會根據文本提示詞在兩者之間進行插值,生成過渡動畫。
一個典型的應用場景是物體變形序列,例如從一隻羊逐漸變成一隻老虎,或者房間裝修前後的對比。這對於需要精確控制敘事起點的影片創作非常有用。
增強的影像轉影片(Enhanced Image to Video)
Veo 3.1 改進了經典影像轉影片功能,輸出質量更高且提示詞跟隨性更好。只需提供一張起始影像和一段描述動作的文字,模型即可生成以該影像開頭的影片。模型內建的智慧邏輯能夠理解影像內容,並生成自然且連貫的運動,無需顯式指定過渡方式。
快速生成選項
除參考轉影片外,所有端點均提供快速生成模式:速度在 60 秒以內(標準約為 90 秒),成本約為標準版本的一半,質量略有降低但依然出色。
API 呼叫示例
以下是透過 Replicate API 使用 Veo 3.1 的 JavaScript 示例:
基本影像轉影片:需提供影像 URL、提示詞、時長和解析度。
多影像參考轉影片:使用 reference_images 引數傳遞最多三張影像 URL。
首尾幀:分別傳入 first_frame 和 last_frame 引數。
模型返回一個影片 URL,可直接嵌入應用。生成式影片應用的開發者可考慮切換至 Veo 3.1,以獲得更強大的影片生成能力。
Veo 3.1 已在 Replicate 平臺上線,歡迎嘗試並分享您的創作。