Sun:エージェントのための協調型音声API
Sunは、リアルタイムの協調型音声対話に特化したAIモデルです。従来の1対1チャットとは異なり、複数話者のターンテイキング、大規模コンテキストウィンドウ、マルチエージェント同時実行をサポートし、会議、グループ通話、多エージェントディベートなどに最適です。
本日Product Huntで発表されたSunは、エージェント向けの協調型音声APIです。従来の音声AIが1対1の対話に特化していたのに対し、Sunは複数参加者によるリアルタイムコミュニケーションのために設計されています。セールスコール、教室での議論、マルチエージェントワークフロー、グループブレインストーミングなど、複数の声が関わるシーンで真価を発揮します。
Sunの主な特徴は、マルチスピーカーのターンテイキング、ChatGPT RealtimeやGemini Liveの10倍のコンテキストウィンドウ、そして音声アクティビティ検出(VAD)を超えたエージェント認識型の割り込み機能(agent-aware barge-in)です。これにより、エージェントは誰が話しているかを認識し、適切なタイミングで自然会話に参加できます。さらに、1つの音声チャンネル上で複数のAIエージェントを同時に動作させ、互いに議論させることも可能です。
共同創業者のAnand氏は「既存のリアルタイム音声APIはすべて1対1の対話向けであり、3人目が加わると破綻する」と述べ、Sunがその課題を解決すると説明しています。同社は本日、無料トライアルを提供しており、ブラウザ上でデモを試せます(https://demo.getsun.io)。クレジットカードは不要です。
コミュニティからのフィードバックを募集中で、特に統合希望のプラットフォーム(LiveKit、Daily、Vonage、Twilio、カスタムWebRTCなど)についてのコメントを求めています。会議用エージェントがFirefliesやOtterのように会話に参加できるかという質問に対し、Anand氏は「聴くだけでなく、適切なタイミングで発言し、要約や質問応答、議論の調整が可能」と回答しています。Sunは、既存のサイレントリスニングツールとは一線を画し、能動的な会議参加者として機能するエージェントを構築できる点で、リアルタイム音声AIの新たな可能性を切り拓くでしょう。