AI News HubLIVE
站内改写1 分鐘閱讀

Sun:面向智慧體的協作式語音API

Sun是一款專為即時協作語音互動設計的AI模型,區別於單一使用者與AI對話的工具,它支援多說話人輪換、大型上下文視窗,並允許在單一音訊通道中執行多個智慧體,適用於會議、課堂討論、多智慧體工作流等場景。

來源Product Hunt AI作者: Anand B

今日在Product Hunt上釋出的Sun,是一款革命性的協作式語音API,專為智慧體(agent)設計,旨在解決傳統語音AI在多人場景中的侷限性。與OpenAI Realtime、Gemini Live等僅支援一對一對話的模型不同,Sun從一開始就為多人協作而構建——無論是銷售電話、課堂辯論、多智慧體工作流還是團隊頭腦風暴,它都能輕鬆應對。

Sun的核心優勢在於其多說話人輪換機制(multi-speaker turn-taking),能夠準確識別誰在說話、何時可以打斷,並允許多達三名參與者共享發言權。此外,它擁有比ChatGPT Realtime和Gemini Live大10倍的上下文視窗,確保長時間對話中的資訊不丟失。Sun還引入了智慧體感知的插話功能(agent-aware barge-in),超越傳統的語音活動檢測(VAD),使智慧體能更自然地介入對話。

該產品由Anand聯合創立,他在Product Hunt上解釋說:“每個即時語音API都是為一對一對話設計的,一旦第三個人加入,就會出問題。”Sun的API支援在同一音訊通道中執行多個智慧體,例如讓兩個AI互相辯論或協作完成任務。

Sun目前提供免費試用,使用者可在瀏覽器中體驗其演示(https://demo.getsun.io),無需信用卡。團隊鼓勵開發者測試並反饋任何問題,同時詢問使用者最希望整合的平臺(如LiveKit、Daily、Vonage、Twilio或自定義WebRTC)。

對於評論中提到的“讓會議智慧體像Fireflies或Otter那樣參與對話”的用例,Anand確認Sun完全支援——它不僅能監聽,還能在適當時刻發言,進行總結、回答問題或調節討論。這意味著企業可以構建一個主動參與的會議助手,而不僅僅是被動記錄。Sun的推出可能重新定義即時語音AI在多參與者場景下的應用邊界,為開發者提供前所未有的靈活性和控制力。