AI代理的通話技能
CometChat推出Calling Skills,通過AI編程代理一鍵集成高清語音和視頻通話功能,支持鈴聲模式或會話模式,提供23點驗證,兼容多種框架。
文章情報
要點
- CometChat推出Calling Skills,允許AI代理快速集成通話功能。
- 提供鈴聲和會話兩種集成路徑。
- 自動檢測框架並執行23點驗證。
- 支持React、Next.js、React Native等主流框架。
為甚麼重要
這條新聞值得關注,因為CometChat推出Calling Skills,允許AI代理快速集成通話功能。
技術影響
可能影響模型選型、推理成本、產品能力和評測基準。
CometChat 今日在 Product Hunt 上發佈了 Calling Skills for AI Agents,這是繼 Chat Skills 之後的又一力作。該產品允許開發者通過 AI 編程代理(如 Cursor、Kiro、VS Code Copilot、Claude、Codex)以單個技能文件快速集成高清語音和視頻通話功能,全程無需手動查閲文檔。
Calling Skills 的核心在於兩種集成路徑的選擇:鈴聲模式(Ringing)和會話模式(Session)。鈴聲模式提供完整的來電/去電界面,支持 iOS 的 CallKit、Android 的 ConnectionService 以及 VoIP 推送喚醒設備;會話模式則採用鏈接驅動的會議室方式,雙方通過相同的會話 ID 加入,不需要鈴聲界面和 Chat SDK 依賴。AI 代理在集成前會詢問用户選擇哪種模式,從而避免後續高昂的修改成本。
一旦選定模式,AI 代理會自動檢測項目使用的框架(如 React、Next.js、React Native、Angular、Android、iOS、Flutter)和 SDK 版本,並搭建正確的文件結構,隨後執行包含 23 個檢查點的驗證流程,涵蓋 VoIP 推送配置、SDK 初始化順序、掛斷清理、權限字符串以及跨平台 API 偏移等問題。整個流程從零到可用通話僅需幾分鐘。
對於已經使用 Chat Skills 的用户,Calling Skills 完全可疊加,無需改變現有聊天集成。產品底層基於 CometChat 成熟的基礎設施,支持錄製、屏幕共享、通話記錄、舉手、廣播模式、畫中畫等高級功能,並符合全球合規標準。CometChat 的工程副總裁 Swapnil 在 Product Hunt 上表示,團隊根據 Chat Skills 的反響進行了大量優化,確保新技能與現有工作流無縫銜接。