Show HN: Vivijure – 自身のGPUでセルフホスト型AIフィルムスタジオ(AGPL)
Vivijure は、Cloudflare Workers 上で動作し、自分の GPU に接続するセルフホスト型の AI フィルムスタジオです。ストーリーボードからビデオを生成し、キーフレーム生成、キャラクター LoRA、音楽スコアリング、TTS ナレーション、リップシンクダイアログなどの機能を提供します。すべてのアーティファクトは自分自身のものであり、様々なモーションバックエンドを使用できます。
Vivijure は、Cloudflare Workers をベースに構築されたセルフホスト型の AI フィルムスタジオで、自身の GPU バックエンド(RunPod、自前のサーバー、クラウド API など)に接続できます。Workers の無料枠で完全に無料で使用でき、生成されたすべての成果物(ビデオ、オーディオ、モデルなど)はあなたのものであり、サブスクリプション料金やアカウントのロックはありません。
このプロジェクトでは、4つの実際にレンダリングされたフィルムが紹介されています:無声短編『NEON HALFLIFE』、スコア付き短編『FUR AND CIRCUITS』、ナレーション付き短編『RUST』、そしてリップシンク付きの『Vivijure Speaks』です。これらのフィルムはすべて Vivijure パイプラインを通じてエンドツーエンドで生成され、無声からスコア、ナレーション、そして対話までの完全な機能をカバーしています。特に『NEON HALFLIFE』は初の無人完全実行であり、10ショットすべてがレンダリングされ、システムが障害から自動回復したことで安定性を示しました。
Vivijure の核はモジュラーホストアーキテクチャです。メインの Workers はプロジェクト、ストーリーボード、キャスト、バンドルアセンブリ、レンダリングオーケストレーション、モジュールレジストリを担当します。すべての高度な機能(キーフレーム生成、モーションバックエンド、後処理、オーディオスコアリングなど)はオプションのモジュールワーカープラグインとして提供されます。必要なモジュールだけをインストールでき、UI は自動的に適応します。
レンダリングフローはストーリーボードから始まり、まず SDXL キーフレームを生成し、次にモーションバックエンド(自前GPUの Wan 2.2 I2V や Kling、Seedance などのクラウドサービスを含む7つのバックエンドをサポート)を通じてビデオクリップを生成します。その後、オプションのフィニッシュチェーンでは、補間(RIFE)、リップシンク(MuseTalk)、超解像(CUDA Real-ESRGAN)を実行できます。最後に、すべてのショットが集められ、オーディオがミックスされて最終的なフィルムが出力されます。
Vivijure は、自身の GPU を持ち、制作プロセスを完全にコントロールしたいと考えているクリエイティブなホームラバーに最適です。モーションモデルの交換やサンプラーの調整をサポートチケットを出さずに行いたい場合に、自由を提供します。すべての成果物は自身の R2 バケットに保存され、ストレージに料金はかかりません。クイックスタートは、リポジトリをクローンし、依存関係をインストールし、wrangler.toml を構成してシークレットを設定した後、npm run dev でローカル開発または npm run deploy でデプロイします。プロジェクトは AGPL-3.0 ライセンスで提供されており、完全にオープンソースです。