AI News HubLIVE
站內改寫1 分鐘閱讀

Vox:GitHub Copilot的語音交互界面

Vox 是一個開源的 CLI 擴展,允許用户通過語音與 GitHub Copilot 進行交互,實現免提操作。它支持 Windows、macOS 和 Linux。

來源Product Hunt AI作者: Ashish Kumar

Vox 是一款全新的 GitHub Copilot CLI 擴展,它允許開發者通過語音直接與 Copilot 對話,而無需使用鍵盤。該工具由開發者 aasis21 創建,旨在提供一種免提的交互方式,特別適合注重可訪問性的用户以及那些希望提高編碼效率的開發者。Vox 的核心理念是“語音進、語音出”,用户只需説出自己的需求,代理便會以語音回覆,實現真正的無障礙交流。

Vox 的核心功能是通過在終端中運行 /vox 命令來激活一個響應式的語音界面。該界面以一個浮動小球的形式出現在獨立窗口中,用户對着它説話,會話便會識別並處理指令,隨後將 Copilot 的回覆朗讀出來。除了基本的語音交互外,Vox 還支持語音打斷功能,用户可以隨時中斷 Copilot 的回覆並立即糾正或補充問題,使對話更加自然流暢。此外,Vox 提供實時字幕顯示和完整的對話記錄,方便用户回顧和確認信息。它甚至能夠朗讀用户通過鍵盤輸入的文本,確保所有交互方式都能以語音形式反饋。

從技術角度來看,Vox 完全使用 JavaScript 編寫,但並未採用常見的 Electron 框架,而是通過啓動 Chromium 瀏覽器的應用模式來利用 Web Speech API,因此沒有額外的構建步驟。這使得安裝變得異常簡單:用户只需在終端中執行一行命令即可完成安裝,且支持 Windows、macOS 和 Linux 三大操作系統。Vox 在 GitHub Copilot CLI 和 Copilot 應用程序內部均可正常工作,覆蓋了大多數使用場景。該項目完全免費且開源,採用 MIT 許可證,開發者鼓勵社區貢獻和反饋。

開發者 aasis21 表示,這個項目最初是作為一個關於可訪問性的實驗開始的,他希望通過語音驅動 AI 代理,為那些無法長時間使用鍵盤或希望減少重複性勞損的開發者提供一個替代方案。特別地,他非常希望獲得關於語音時機和中斷流程的反饋,以進一步優化用户體驗。Vox 的官方頁面和源代碼均已公開,感興趣的開發者可以立即嘗試。總之,Vox 為 GitHub Copilot 提供了一種全新的交互維度,將語音助手的便捷性引入了編碼工作流。