Show HN:每隻爪子都值得擁有一張臉
Nyxclaw 是一個開源專案,能讓 AI 代理擁有即時面部和語音功能,完全在本地執行,無需 GPU。它提供自託管伺服器、端到端加密、兩種語音管道(OpenAI Realtime 和本地 CPU 堆疊),並支援 ARKit 面部混合形狀。
Nyxclaw 是一個開源專案,旨在為任何 AI 代理賦予即時面部和語音能力。該專案完全在使用者自己的機器上執行,無需 GPU,確保了資料隱私和自主控制。
Nyxclaw 伺服器採用自託管模式,執行在使用者本地,與 AI 代理配對時使用加密挑戰(Ed25519 認證),並透過自動配置的 Cloudflare Tunnel 實現端到端 WebSocket 加密通訊,無需埠轉發或證書管理。裝置配對透過 QR 碼掃描完成,一次僅連線一臺裝置,程式碼需像密碼一樣妥善保管。
專案提供兩種參考語音管道:OpenAI Realtime 管道利用雲端 API 實現最佳語音質量,但需要 API 金鑰;本地 CPU 管道則使用 faster-whisper、Silero VAD 和 Piper VITS ONNX TTS,完全離線執行,無需任何 API 金鑰或 GPU。兩種管道均支援在 CPU 上執行 Wav2Arkit ONNX 模型,以每秒 30 幀的速度生成 52 個 ARKit 面部混合形狀。
Nyxclaw 目前支援多種 AI 代理(稱為“爪子”),使用者也可以請求新增尚未支援的代理。專案鼓勵社群參與,共同擴充套件“爪子”生態。