Vox:GitHub Copilot的语音交互界面
Vox 是一个开源的 CLI 扩展,允许用户通过语音与 GitHub Copilot 进行交互,实现免提操作。它支持 Windows、macOS 和 Linux。
Vox 是一款全新的 GitHub Copilot CLI 扩展,它允许开发者通过语音直接与 Copilot 对话,而无需使用键盘。该工具由开发者 aasis21 创建,旨在提供一种免提的交互方式,特别适合注重可访问性的用户以及那些希望提高编码效率的开发者。Vox 的核心理念是“语音进、语音出”,用户只需说出自己的需求,代理便会以语音回复,实现真正的无障碍交流。
Vox 的核心功能是通过在终端中运行 /vox 命令来激活一个响应式的语音界面。该界面以一个浮动小球的形式出现在独立窗口中,用户对着它说话,会话便会识别并处理指令,随后将 Copilot 的回复朗读出来。除了基本的语音交互外,Vox 还支持语音打断功能,用户可以随时中断 Copilot 的回复并立即纠正或补充问题,使对话更加自然流畅。此外,Vox 提供实时字幕显示和完整的对话记录,方便用户回顾和确认信息。它甚至能够朗读用户通过键盘输入的文本,确保所有交互方式都能以语音形式反馈。
从技术角度来看,Vox 完全使用 JavaScript 编写,但并未采用常见的 Electron 框架,而是通过启动 Chromium 浏览器的应用模式来利用 Web Speech API,因此没有额外的构建步骤。这使得安装变得异常简单:用户只需在终端中执行一行命令即可完成安装,且支持 Windows、macOS 和 Linux 三大操作系统。Vox 在 GitHub Copilot CLI 和 Copilot 应用程序内部均可正常工作,覆盖了大多数使用场景。该项目完全免费且开源,采用 MIT 许可证,开发者鼓励社区贡献和反馈。
开发者 aasis21 表示,这个项目最初是作为一个关于可访问性的实验开始的,他希望通过语音驱动 AI 代理,为那些无法长时间使用键盘或希望减少重复性劳损的开发者提供一个替代方案。特别地,他非常希望获得关于语音时机和中断流程的反馈,以进一步优化用户体验。Vox 的官方页面和源代码均已公开,感兴趣的开发者可以立即尝试。总之,Vox 为 GitHub Copilot 提供了一种全新的交互维度,将语音助手的便捷性引入了编码工作流。