AI News HubLIVE
站內改寫2 分鐘閱讀

Show HN: AI視頻提示詞烹飪書——圖像到視頻工作流

這是一本面向創作者、營銷人員和小型內容團隊的實用提示詞模式集,專注於圖像到視頻和文本到視頻工作流。包含提示卡格式、產品視頻和用户生成內容風格的示例提示、模型對比測試方法、評估計分卡以及常見失敗案例與解決方案。

來源Hacker News AI作者: Ash_yasuomang

本烹飪書面向創作者、營銷人員和小型內容團隊,旨在提供實用的提示詞模式,幫助用户通過圖像到視頻或文本到視頻工作流生成可用的AI視頻片段,而非一次性演示提示。其重點包括源圖像準備、運動措辭、保留約束、可重複測試以及失敗分析。

目標受眾包括:將產品圖像轉化為短視頻廣告的產品營銷人員;測試鈎子、用户生成內容風格運動和豎屏構圖的社交創作者;需要可重複方式比較AI視頻輸出的品牌團隊;以及希望剪輯後仍可裁剪、添加字幕和複用的編輯人員。本書並非API集成指南,目的是讓通過視覺判斷輸出的用户更輕鬆地進行提示測試。

提示卡格式要求每次測試使用一張卡片,以便將想法、約束和結果關聯起來。卡片包含以下字段:剪輯任務、源圖像、需保持的主體、運動、鏡頭、構圖、風格、負面約束、成功標準、結果備註和下一步更改。其中最重要的兩個字段是“需保持的主體”和“運動”,因為許多薄弱的AI視頻提示只是重複描述圖像,而未説明什麼應該移動。

書中提供了兩種典型提示示例。圖像到視頻產品提示適用於源圖像已成為創意錨點的情況,例如5秒垂直產品廣告,要求保持產品形狀、瓶蓋、標籤、顏色和位置不變,運動為柔和光線在產品表面掃過,背景陰影自然移動,鏡頭緩慢推近,構圖穩定。用户生成內容風格鈎子提示則適用於輸出需要像創作者拍攝但仍需保持產品可讀性的情況,例如手持產品靠近簡單桌面背景,要求保持產品標籤、包裝形狀和手部位置穩定,運動為輕微手持晃動,產品微微傾向鏡頭,自然光線變化,鏡頭為近距離垂直手機拍攝,帶有輕微手持感。

在進行模型對比測試時,提示必須保持穩定,不能在看到第一個結果後改變提示,否則對比將變成提示重寫測試而非模型比較。建議固定測試名稱、輸入源圖像和提示版本,然後針對不同模型進行評分,評分標準包括主體保真度(30%)、運動有用性(20%)、提示遵循度(20%)、可編輯性(20%)和重試成本(10%)。不要因為片段看起來令人印象深刻就保留它,只有當片段能解決原始剪輯任務時才保留。

常見失敗情況包括:產品漂移(形狀、顏色或標籤改變),需增加更嚴格的保留約束並簡化源圖像;背景侵佔(背景比主體移動更多),需要求微妙的環境運動並禁止背景替換;文字扭曲(標籤或UI文字變得不可讀),避免生成新文字,後期添加;運動過於靜態(前幾秒幾乎不動),需描述立即開始的運動;過度電影化輸出(片段像預告片而非可用廣告),降低風格強度並明確指定平台/用例。

建議的文件夾結構為:ai-video-prompt-cookbook/ 下的 product-video-prompts/、ugc-ad-prompts/、same-prompt-tests/、failure-notes/ 和 scorecards/。

本烹飪書採用MIT許可證,提示模板和計分卡結構可自由調整以適應自有產品、品牌、安全規則和編輯工作流。