AI News HubLIVE
站内改写1 分钟阅读

Sun:面向智能体的协作式语音API

Sun是一款专为实时协作语音交互设计的AI模型,区别于单一用户与AI对话的工具,它支持多说话人轮换、大型上下文窗口,并允许在单一音频通道中运行多个智能体,适用于会议、课堂讨论、多智能体工作流等场景。

来源Product Hunt AI作者: Anand B

今日在Product Hunt上发布的Sun,是一款革命性的协作式语音API,专为智能体(agent)设计,旨在解决传统语音AI在多人场景中的局限性。与OpenAI Realtime、Gemini Live等仅支持一对一对话的模型不同,Sun从一开始就为多人协作而构建——无论是销售电话、课堂辩论、多智能体工作流还是团队头脑风暴,它都能轻松应对。

Sun的核心优势在于其多说话人轮换机制(multi-speaker turn-taking),能够准确识别谁在说话、何时可以打断,并允许多达三名参与者共享发言权。此外,它拥有比ChatGPT Realtime和Gemini Live大10倍的上下文窗口,确保长时间对话中的信息不丢失。Sun还引入了智能体感知的插话功能(agent-aware barge-in),超越传统的语音活动检测(VAD),使智能体能更自然地介入对话。

该产品由Anand联合创立,他在Product Hunt上解释说:“每个实时语音API都是为一对一对话设计的,一旦第三个人加入,就会出问题。”Sun的API支持在同一音频通道中运行多个智能体,例如让两个AI互相辩论或协作完成任务。

Sun目前提供免费试用,用户可在浏览器中体验其演示(https://demo.getsun.io),无需信用卡。团队鼓励开发者测试并反馈任何问题,同时询问用户最希望集成的平台(如LiveKit、Daily、Vonage、Twilio或自定义WebRTC)。

对于评论中提到的“让会议智能体像Fireflies或Otter那样参与对话”的用例,Anand确认Sun完全支持——它不仅能监听,还能在适当时刻发言,进行总结、回答问题或调节讨论。这意味着企业可以构建一个主动参与的会议助手,而不仅仅是被动记录。Sun的推出可能重新定义实时语音AI在多参与者场景下的应用边界,为开发者提供前所未有的灵活性和控制力。