AI News HubLIVE
站內改寫2 分鐘閱讀

Vox:GitHub Copilot的語音互動介面

Vox 是一個開源的 CLI 擴充套件,允許使用者透過語音與 GitHub Copilot 進行互動,實現擴音操作。它支援 Windows、macOS 和 Linux。

來源Product Hunt AI作者: Ashish Kumar

Vox 是一款全新的 GitHub Copilot CLI 擴充套件,它允許開發者透過語音直接與 Copilot 對話,而無需使用鍵盤。該工具由開發者 aasis21 建立,旨在提供一種擴音的互動方式,特別適合注重可訪問性的使用者以及那些希望提高編碼效率的開發者。Vox 的核心理念是“語音進、語音出”,使用者只需說出自己的需求,代理便會以語音回覆,實現真正的無障礙交流。

Vox 的核心功能是透過在終端中執行 /vox 命令來啟用一個響應式的語音介面。該介面以一個浮動小球的形式出現在獨立視窗中,使用者對著它說話,會話便會識別並處理指令,隨後將 Copilot 的回覆朗讀出來。除了基本的語音互動外,Vox 還支援語音打斷功能,使用者可以隨時中斷 Copilot 的回覆並立即糾正或補充問題,使對話更加自然流暢。此外,Vox 提供即時字幕顯示和完整的對話記錄,方便使用者回顧和確認資訊。它甚至能夠朗讀使用者透過鍵盤輸入的文本,確保所有互動方式都能以語音形式反饋。

從技術角度來看,Vox 完全使用 JavaScript 編寫,但並未採用常見的 Electron 框架,而是透過啟動 Chromium 瀏覽器的應用模式來利用 Web Speech API,因此沒有額外的構建步驟。這使得安裝變得異常簡單:使用者只需在終端中執行一行命令即可完成安裝,且支援 Windows、macOS 和 Linux 三大作業系統。Vox 在 GitHub Copilot CLI 和 Copilot 應用程式內部均可正常工作,覆蓋了大多數使用場景。該專案完全免費且開源,採用 MIT 許可證,開發者鼓勵社群貢獻和反饋。

開發者 aasis21 表示,這個專案最初是作為一個關於可訪問性的實驗開始的,他希望透過語音驅動 AI 代理,為那些無法長時間使用鍵盤或希望減少重複性勞損的開發者提供一個替代方案。特別地,他非常希望獲得關於語音時機和中斷流程的反饋,以進一步最佳化使用者體驗。Vox 的官方頁面和原始碼均已公開,感興趣的開發者可以立即嘗試。總之,Vox 為 GitHub Copilot 提供了一種全新的互動維度,將語音助手的便捷性引入了編碼工作流。