Vox Dictum:带有说话人分类和AI摘要的本地转录工具
Vox Dictum 是一款为macOS设计的隐私优先的转录应用,支持100%本地处理,无需联网。它提供高精度转录(60多种语言)、自动说话人识别、AI摘要生成、音频增强以及灵活的导出选项。所有数据仅存储在你的Mac上,零数据收集。
Vox Dictum 是由 Cobalt InFX 开发的一款 macOS 应用,专注于提供完全本地的转录和摘要服务。该应用支持 Apple Silicon(M1 及以上)和 macOS 14.6 及以上版本,所有处理均在设备上完成,无需将数据发送至云端,从而确保用户隐私。
在转录方面,Vox Dictum 利用 AI 语音识别技术,能够处理超过 60 种语言的音频和视频文件,准确率较高。此外,它具备自动说话人识别功能,可检测并标记不同说话人,且在 Pro+ 版本中,同一说话人的声音可在多个录音中被跨文件识别。用户还可以手动重命名说话人,系统会自动更新所有相关片段。
除了转录,Vox Dictum 还提供 AI 摘要功能,能够为会议、访谈、播客等场景生成结构化摘要,包含关键决策、行动项和发言人贡献。该摘要完全在本地生成,不依赖云端。录音增强功能包括语音增强、背景噪音消除和静音移除,以提升转录质量。导出选项丰富,支持 TXT、Markdown、HTML 和 SRT 字幕格式,且保留说话人名称。
隐私是 Vox Dictum 的核心卖点。该应用不收集任何个人数据、使用分析或崩溃报告,也不包含任何第三方 SDK 跟踪。唯一的网络活动是首次使用时下载 AI 模型(约 2-7 GB)和 Apple 验证订阅状态。录音、转录文本和摘要始终存储在本地,用户卸载应用时一并删除。订阅管理由 Apple 通过 App Store 处理,Cobalt InFX 不接触支付信息。
定价方面,Vox Dictum 提供免费版、Pro 版(每月 £7.99)和 Pro+ 版(每月 £12.99)。免费版支持无限转录、基础模型、说话人分类和重命名、60 多种语言、音频增强和基本导出。Pro 版添加高级转录模型、AI 摘要、重叠解决、自定义词汇校正、说话人重分配等。Pro+ 版进一步包括说话人识别(声音匹配)、批量作业中的一致标签、自动标签传播等功能。年付可享 36% 折扣。
与同类产品如 MacWhisper、Otter.ai 和 Dragon 相比,Vox Dictum 在本地处理、零数据收集、AI 摘要本地化、说话人识别本地化、重叠检测和音频增强方面具有优势。它适用于需要高度隐私的专业人士,如律师、记者和研究人员。