AI News HubLIVE
站内改写

AI代理的通话技能

CometChat推出Calling Skills,通过AI编程代理一键集成高清语音和视频通话功能,支持铃声模式或会话模式,提供23点验证,兼容多种框架。

文章情报

工程师中级

要点

  • CometChat推出Calling Skills,允许AI代理快速集成通话功能。
  • 提供铃声和会话两种集成路径。
  • 自动检测框架并执行23点验证。
  • 支持React、Next.js、React Native等主流框架。

为什么重要

这条新闻值得关注,因为CometChat推出Calling Skills,允许AI代理快速集成通话功能。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

CometChat 今日在 Product Hunt 上发布了 Calling Skills for AI Agents,这是继 Chat Skills 之后的又一力作。该产品允许开发者通过 AI 编程代理(如 Cursor、Kiro、VS Code Copilot、Claude、Codex)以单个技能文件快速集成高清语音和视频通话功能,全程无需手动查阅文档。

Calling Skills 的核心在于两种集成路径的选择:铃声模式(Ringing)和会话模式(Session)。铃声模式提供完整的来电/去电界面,支持 iOS 的 CallKit、Android 的 ConnectionService 以及 VoIP 推送唤醒设备;会话模式则采用链接驱动的会议室方式,双方通过相同的会话 ID 加入,不需要铃声界面和 Chat SDK 依赖。AI 代理在集成前会询问用户选择哪种模式,从而避免后续高昂的修改成本。

一旦选定模式,AI 代理会自动检测项目使用的框架(如 React、Next.js、React Native、Angular、Android、iOS、Flutter)和 SDK 版本,并搭建正确的文件结构,随后执行包含 23 个检查点的验证流程,涵盖 VoIP 推送配置、SDK 初始化顺序、挂断清理、权限字符串以及跨平台 API 偏移等问题。整个流程从零到可用通话仅需几分钟。

对于已经使用 Chat Skills 的用户,Calling Skills 完全可叠加,无需改变现有聊天集成。产品底层基于 CometChat 成熟的基础设施,支持录制、屏幕共享、通话记录、举手、广播模式、画中画等高级功能,并符合全球合规标准。CometChat 的工程副总裁 Swapnil 在 Product Hunt 上表示,团队根据 Chat Skills 的反响进行了大量优化,确保新技能与现有工作流无缝衔接。