AI News HubLIVE
站内改写

AI代理的通話技能

CometChat推出Calling Skills,透過AI程式設計代理一鍵整合高畫質語音和視訊通話功能,支援鈴聲模式或會話模式,提供23點驗證,相容多種框架。

文章情報

工程師中級

要點

  • CometChat推出Calling Skills,允許AI代理快速整合通話功能。
  • 提供鈴聲和會話兩種整合路徑。
  • 自動檢測框架並執行23點驗證。
  • 支援React、Next.js、React Native等主流框架。

為什麼重要

這條新聞值得關注,因為CometChat推出Calling Skills,允許AI代理快速整合通話功能。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

CometChat 今日在 Product Hunt 上釋出了 Calling Skills for AI Agents,這是繼 Chat Skills 之後的又一力作。該產品允許開發者透過 AI 程式設計代理(如 Cursor、Kiro、VS Code Copilot、Claude、Codex)以單個技能檔案快速整合高畫質語音和視訊通話功能,全程無需手動查閱文件。

Calling Skills 的核心在於兩種整合路徑的選擇:鈴聲模式(Ringing)和會話模式(Session)。鈴聲模式提供完整的來電/去電介面,支援 iOS 的 CallKit、Android 的 ConnectionService 以及 VoIP 推送喚醒裝置;會話模式則採用連結驅動的會議室方式,雙方透過相同的會話 ID 加入,不需要鈴聲介面和 Chat SDK 依賴。AI 代理在整合前會詢問使用者選擇哪種模式,從而避免後續高昂的修改成本。

一旦選定模式,AI 代理會自動檢測專案使用的框架(如 React、Next.js、React Native、Angular、Android、iOS、Flutter)和 SDK 版本,並搭建正確的檔案結構,隨後執行包含 23 個檢查點的驗證流程,涵蓋 VoIP 推送配置、SDK 初始化順序、結束通話清理、許可權字串以及跨平臺 API 偏移等問題。整個流程從零到可用通話僅需幾分鐘。

對於已經使用 Chat Skills 的使用者,Calling Skills 完全可疊加,無需改變現有聊天整合。產品底層基於 CometChat 成熟的基礎設施,支援錄製、螢幕共享、通話記錄、舉手、廣播模式、畫中畫等高階功能,並符合全球合規標準。CometChat 的工程副總裁 Swapnil 在 Product Hunt 上表示,團隊根據 Chat Skills 的反響進行了大量最佳化,確保新技能與現有工作流無縫銜接。