AI News HubLIVE
站内改写2 分で読了

Vox Dictum:話者識別とAI要約を備えたオンデバイス文字起こし

Vox Dictumは、macOS向けのプライバシー重視の文字起こしアプリです。すべての処理をデバイス上で行い、60以上の言語に対応したAI文字起こし、自動話者識別、AI要約、音声強調、柔軟なエクスポート機能を備えています。データはMacにのみ保存され、収集は一切行いません。

ソースHacker News AI著者: mozairr

Vox Dictumは、Cobalt InFXが開発したmacOS向けアプリで、完全にローカルで動作する文字起こしおよび要約サービスを提供します。Apple Silicon(M1以降)とmacOS 14.6以降に対応しており、すべての処理がデバイス上で完了するため、データがクラウドに送信されることはなく、ユーザーのプライバシーが保護されます。

文字起こし機能では、AI音声認識技術を活用し、60以上の言語の音声および動画ファイルを高精度で処理できます。また、自動話者識別機能により、話者を検出してラベル付けが可能で、Pro+版では同一話者の声を複数の録音にわたって認識できます。話者名は手動で変更でき、ファイル内のすべての該当箇所が自動更新されます。

AI要約機能は、会議、インタビュー、ポッドキャストなど向けに、重要な決定、アクションアイテム、話者の貢献を含む構造化された要約を生成します。この要約もローカルで処理され、クラウドには依存しません。音声強調機能には、音声強調、背景ノイズ除去、無音除去が含まれ、文字起こしの品質を向上させます。エクスポートはTXT、Markdown、HTML、SRT字幕形式に対応し、話者名が保持されます。

プライバシー面では、Vox Dictumはいかなる個人データ、使用分析、クラッシュレポートも収集しません。また、サードパーティのSDKやトラッキングも含まれていません。唯一のネットワークアクティビティは、初回使用時のAIモデルダウンロード(約2〜7 GB)とAppleによるサブスクリプション確認のみです。録音、文字起こし、要約は常にローカルに保存され、アンインストール時に削除されます。サブスクリプションはAppleのApp Storeを通じて管理され、Cobalt InFXは支払い情報にアクセスしません。

料金プランは、無料版、Pro版(月額£7.99)、Pro+版(月額£12.99)の3段階です。無料版では無制限の文字起こし、基本モデル、話者分類と名前変更、60以上の言語、音声強調、基本エクスポートが利用できます。Pro版では高度な文字起こしモデル、AI要約、重なり解決、カスタム語彙修正、話者再割り当てなどが追加されます。Pro+版では話者認識(声のマッチング)、バッチジョブでの一貫したラベル、自動ラベル伝播などが利用可能で、年間契約では36%割引となります。

MacWhisper、Otter.ai、Dragonなどの競合製品と比較して、Vox Dictumはローカル処理、ゼロデータ収集、ローカルAI要約、ローカル話者認識、重なり検出、音声強調の点で優位性を持ちます。弁護士、ジャーナリスト、研究者など、高度なプライバシーを必要とするプロフェッショナルに適しています。