Show HN: Vivijure – 在自有GPU上自託管的AI電影工作室(AGPL協議)
Vivijure 是一個自託管的AI電影工作室,基於 Cloudflare Workers 構建,可連接自有GPU後端。它允許用户從故事板生成視頻,支持關鍵幀生成、角色LoRA、音樂配樂、TTS配音和口型同步對話。所有產物歸用户所有,無訂閲費用。
Vivijure 是一個自託管的 AI 電影工作室,基於 Cloudflare Workers 構建,可連接你自有的 GPU 後端(如 RunPod、自有服務器或雲端 API)。它完全免費使用 Workers 免費層,所有生成的產物(包括視頻、音頻、模型)都歸你所有,沒有訂閲費用,也沒有賬户鎖定。
該項目展示了四部實際渲染的電影:無聲短片《NEON HALFLIFE》、配樂短片《FUR AND CIRCUITS》、配音短片《RUST》以及帶口型同步的《Vivijure Speaks》。這些電影完全通過 Vivijure 流水線生成,未經任何後期編輯,涵蓋了從無聲到配樂、配音以及對話同步的完整功能。其中,《NEON HALFLIFE》是首個無人值守完整運行的作品,十次鏡頭全部渲染成功,並且系統在出現故障時自動恢復了運行,展現了強大的穩定性。
Vivijure 的核心是一個模塊化宿主架構。主 Workers 負責項目管理、故事板、角色庫、渲染編排和模塊註冊。所有高級功能(如關鍵幀生成、運動後端、後期處理、音軌合成)都是通過可選的模塊 Worker 插件實現。你可以只安裝需要的模塊,UI 會自動適應。模塊化設計使得擴展非常靈活,甚至可以跨語言和平台使用。
渲染流程從故事板開始,首先生成 SDXL 關鍵幀,然後通過運動後端(支持七個後端,包括自有 GPU 的 Wan 2.2 I2V 和多個雲端服務如 Kling、Seedance 等)生成視頻片段。之後,可選的完成鏈包括插幀(RIFE)、口型同步(MuseTalk)和超分辨率(CUDA Real-ESRGAN)。最後,所有片段聚集並混音輸出最終電影。對話音軌在每個鏡頭中生成,驅動口型同步,並最終混入視頻。
Vivijure 特別適合那些擁有自有 GPU 並希望完全掌控創作流程的創意開發者。如果你想更換運動模型、調整採樣器,而無需提交工單等待,Vivijure 給了你自由。所有產物存儲在你的 R2 存儲桶中,無需為存儲付費。快速開始只需克隆倉庫、安裝依賴、配置 wrangler.toml 並設置密鑰,然後通過 npm run dev 本地開發或 npm run deploy 部署。項目採用 AGPL-3.0 許可證,完全開源。