Show HN: Vivijure – 在自有GPU上自托管的AI电影工作室(AGPL协议)
Vivijure 是一个自托管的AI电影工作室,基于 Cloudflare Workers 构建,可连接自有GPU后端。它允许用户从故事板生成视频,支持关键帧生成、角色LoRA、音乐配乐、TTS配音和口型同步对话。所有产物归用户所有,无订阅费用。
Vivijure 是一个自托管的 AI 电影工作室,基于 Cloudflare Workers 构建,可连接你自有的 GPU 后端(如 RunPod、自有服务器或云端 API)。它完全免费使用 Workers 免费层,所有生成的产物(包括视频、音频、模型)都归你所有,没有订阅费用,也没有账户锁定。
该项目展示了四部实际渲染的电影:无声短片《NEON HALFLIFE》、配乐短片《FUR AND CIRCUITS》、配音短片《RUST》以及带口型同步的《Vivijure Speaks》。这些电影完全通过 Vivijure 流水线生成,未经任何后期编辑,涵盖了从无声到配乐、配音以及对话同步的完整功能。其中,《NEON HALFLIFE》是首个无人值守完整运行的作品,十次镜头全部渲染成功,并且系统在出现故障时自动恢复了运行,展现了强大的稳定性。
Vivijure 的核心是一个模块化宿主架构。主 Workers 负责项目管理、故事板、角色库、渲染编排和模块注册。所有高级功能(如关键帧生成、运动后端、后期处理、音轨合成)都是通过可选的模块 Worker 插件实现。你可以只安装需要的模块,UI 会自动适应。模块化设计使得扩展非常灵活,甚至可以跨语言和平台使用。
渲染流程从故事板开始,首先生成 SDXL 关键帧,然后通过运动后端(支持七个后端,包括自有 GPU 的 Wan 2.2 I2V 和多个云端服务如 Kling、Seedance 等)生成视频片段。之后,可选的完成链包括插帧(RIFE)、口型同步(MuseTalk)和超分辨率(CUDA Real-ESRGAN)。最后,所有片段聚集并混音输出最终电影。对话音轨在每个镜头中生成,驱动口型同步,并最终混入视频。
Vivijure 特别适合那些拥有自有 GPU 并希望完全掌控创作流程的创意开发者。如果你想更换运动模型、调整采样器,而无需提交工单等待,Vivijure 给了你自由。所有产物存储在你的 R2 存储桶中,无需为存储付费。快速开始只需克隆仓库、安装依赖、配置 wrangler.toml 并设置密钥,然后通过 npm run dev 本地开发或 npm run deploy 部署。项目采用 AGPL-3.0 许可证,完全开源。