AIエージェント向け通話スキル
CometChatがCalling Skillsを発表。AIコーディングエージェントが単一のスキルファイルでHD音声・ビデオ通話を統合可能に。リンギングモードとセッションモードをサポートし、23項目の検証と複数フレームワークに対応。
記事インテリジェンス
要点
- CometChatがCalling Skillsをリリースし、AIエージェントによる通話機能の迅速な統合を実現。
- リンギング(着信画面あり)とセッション(リンク駆動型)の2つの統合パスを提供。
- フレームワークを自動検出し、23項目の検証を実行。
- React、Next.js、React Native、Angular、Android、iOS、Flutterに対応。
重要な理由
このニュースが重要なのは、CometChatがCalling Skillsをリリースし、AIエージェントによる通話機能の迅速な統合を実現ためです。
技術的影響
モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。
CometChat は本日、Product Hunt にて Calling Skills for AI Agents を発表しました。これは、Chat Skills に続く新製品で、AIコーディングエージェント(Cursor、Kiro、VS Code Copilot、Claude、Codexなど)が単一のスキルファイルを使って高精細な音声・ビデオ通話を統合できるようにするものです。ドキュメントを参照する必要はありません。
Calling Skills の核心は、2つの統合パスの選択にあります。リンギングモードは、着信・発信の完全なインターフェースを提供し、iOSのCallKit、AndroidのConnectionService、VoIPプッシュによる端末の起動をサポートします。一方、セッションモードはリンク駆動型の会議室方式で、双方が同じセッションIDで参加し、着信インターフェースやChat SDKの依存関係は不要です。AIエージェントは統合開始前にユーザーにどちらのモードを選択するか尋ね、後戻りによるコストを防ぎます。
モードが選択されると、AIエージェントは自動的にプロジェクトのフレームワーク(React、Next.js、React Native、Angular、Android、iOS、Flutter)とSDKバージョンを検出し、適切なファイル構造をセットアップした後、23項目の検証を実行します。この検証には、VoIPプッシュ設定、SDK初期化順序、通話切断処理、パーミッション文字列、クロスプラットフォームのAPI差異などが含まれます。これにより、数分でゼロから動作する通話機能が実現します。
すでにChat Skillsを利用しているユーザーは、Calling Skillsを追加しても既存のチャット統合に影響を与えません。製品はCometChatの実績ある基盤の上に構築されており、録画、画面共有、通話ログ、挙手、ブロードキャストモード、ピクチャーインピクチャーなどの高度な機能を備え、グローバルなコンプライアンス基準に対応しています。CometChatのエンジニアリング担当VPであるSwapnil氏はProduct Huntで、Chat Skillsのフィードバックを基に新スキルを最適化し、既存のワークフローとシームレスに連携するようにしたと述べています。