VibeClip:开源AI视频编辑器,通过聊天控制剪辑
VibeClip 是一款开源、自托管的 AI 视频编辑器,用户只需通过聊天即可将长视频转换为带有字幕的 9:16 短视频。它使用本地 faster-whisper 进行转录,并通过 LLM 智能分析精彩片段,支持多种 LLM 提供商,且数据完全由用户掌控。
VibeClip 是一款完全开源的 AI 视频编辑工具,采用自托管架构,用户可以通过简单的聊天对话控制视频剪辑。该项目托管在 GitHub 上,遵循 AGPL-3.0 许可证,目前获得了 2 颗星,使用 Python、JavaScript、HTML 和 CSS 构建。VibeClip 的核心工作流程包括:上传视频、本地 faster-whisper 进行语音转文字、LLM 分析视频结构并识别高光时刻(如开场、流程、价值点)、自动进行跳切、9:16 重新构图、添加同步字幕、背景音乐和环境音,最后导出为竖版 MP4。用户还可通过聊天界面下达深度编辑指令,如去除填充词(“嗯”“啊”)、缩放、添加品牌覆盖层、B 卷素材等。VibeClip 内置了多种预设风格,包括 Hormozi、MrBeast、Podcast Minimal 和 Kinetic,一键即可应用完整的字幕、节奏、缩放、音乐和音效组合。用户也可以自定义预设,以 JSON 文件形式导入。
在数据隐私方面,VibeClip 采用 BYOK(自带密钥)模式,从不内置任何 API 密钥。用户可以通过环境变量或应用内设置页面提供自己的 LLM 密钥,支持的提供商包括 OpenAI、DeepSeek、Gemini、Claude 以及任何兼容 OpenAI 的端点(如 Ollama、LM Studio、OpenRouter)。密钥在存储时加密,不会发送到浏览器。语音转文字完全在本地运行,无需网络连接。所有渲染任务也由本地 faster-whisper 和 ffmpeg 完成,只有 LLM 调用和可选的 Pexels 素材请求会联网。
部署方式极为简便。用户只需克隆仓库,复制 .env.example 为 .env,填入一行 LLM 密钥,然后运行 docker compose up -d --build 即可启动实例。默认配置下,注册无需邮箱验证,系统使用控制台输出一次性密码,适合个人使用。如果没有 Docker,也可以直接通过 Python 3.12+ 和 uv 运行。项目提供了丰富的配置选项,包括视频编码器(libx264 或 Apple Silicon 的 h264_videotoolbox)、最大上传时长、每个用户的最大项目数、是否启用托管模式等。
VibeClip 还包含一个完整的 Web 应用界面,提供实时 9:16 预览、剪辑卡片、类似 CapCut 的时间线以及内嵌聊天助手。项目捆绑了免版税的音效、音乐和演示素材,部分曲目(如 Kevin MacLeod 的作品)需要署名。社区贡献者可以通过提交 Issue 和 Pull Request 参与开发,项目还提供了贡献指南和安全策略。总的来说,VibeClip 是一个功能强大、注重隐私的自托管 AI 视频编辑解决方案,特别适合希望避免 SaaS 锁定并完全控制数据的创作者。