AI News HubLIVE
站内改写2 分鐘閱讀

Vox Dictum:帶有說話人分類和AI摘要的本地轉錄工具

Vox Dictum 是一款為macOS設計的隱私優先的轉錄應用,支援100%本地處理,無需聯網。它提供高精度轉錄(60多種語言)、自動說話人識別、AI摘要生成、音訊增強以及靈活的匯出選項。所有資料僅儲存在你的Mac上,零資料收集。

來源Hacker News AI作者: mozairr

Vox Dictum 是由 Cobalt InFX 開發的一款 macOS 應用,專注於提供完全本地的轉錄和摘要服務。該應用支援 Apple Silicon(M1 及以上)和 macOS 14.6 及以上版本,所有處理均在裝置上完成,無需將資料傳送至雲端,從而確保使用者隱私。

在轉錄方面,Vox Dictum 利用 AI 語音識別技術,能夠處理超過 60 種語言的音訊和影片檔案,準確率較高。此外,它具備自動說話人識別功能,可檢測並標記不同說話人,且在 Pro+ 版本中,同一說話人的聲音可在多個錄音中被跨檔案識別。使用者還可以手動重新命名說話人,系統會自動更新所有相關片段。

除了轉錄,Vox Dictum 還提供 AI 摘要功能,能夠為會議、訪談、播客等場景生成結構化摘要,包含關鍵決策、行動項和發言人貢獻。該摘要完全在本地生成,不依賴雲端。錄音增強功能包括語音增強、背景噪音消除和靜音移除,以提升轉錄質量。匯出選項豐富,支援 TXT、Markdown、HTML 和 SRT 字幕格式,且保留說話人名稱。

隱私是 Vox Dictum 的核心賣點。該應用不收集任何個人資料、使用分析或崩潰報告,也不包含任何第三方 SDK 跟蹤。唯一的網路活動是首次使用時下載 AI 模型(約 2-7 GB)和 Apple 驗證訂閱狀態。錄音、轉錄文本和摘要始終儲存在本地,使用者解除安裝應用時一併刪除。訂閱管理由 Apple 透過 App Store 處理,Cobalt InFX 不接觸支付資訊。

定價方面,Vox Dictum 提供免費版、Pro 版(每月 £7.99)和 Pro+ 版(每月 £12.99)。免費版支援無限轉錄、基礎模型、說話人分類和重新命名、60 多種語言、音訊增強和基本匯出。Pro 版新增高階轉錄模型、AI 摘要、重疊解決、自定義詞彙校正、說話人重分配等。Pro+ 版進一步包括說話人識別(聲音匹配)、批次作業中的一致標籤、自動標籤傳播等功能。年付可享 36% 折扣。

與同類產品如 MacWhisper、Otter.ai 和 Dragon 相比,Vox Dictum 在本地處理、零資料收集、AI 摘要本地化、說話人識別本地化、重疊檢測和音訊增強方面具有優勢。它適用於需要高度隱私的專業人士,如律師、記者和研究人員。