AI News HubLIVE
站内改写

AI MOD音楽リマスタリング:32ビット96kHz

Quinlight Audioは、MOD/S3M/XM/IT形式のトラッカーミュージックプレイヤー兼リマスタリングツールです。AIエンジン(AudioSR、LavaSR、FLowHigh、AP-BWE)を使用してサンプルをリアルタイムでリマスタリングし、再生中にA/B比較できます。64ビット浮動小数点ミキサー、マルチエンジンコンセンサスアルゴリズム(ロータ多様体上のKarcher平均)、異方性補間を採用し、32ビット浮動小数点96kHzで出力します。

記事インテリジェンス

エンジニア上級

要点

  • トラッカー形式を再生し、AIエンジンでサンプルを48kHzにアップスケール
  • マルチエンジンコンセンサスで幻覚を抑制、ロータ多様体上のKarcher平均でスペクトルを統合
  • 64ビット倍精度ミキサー、異方性補間、量子化歪みゼロ
  • リアルタイムA/B比較、バッチレンダリング、アーカイブからの直接読み込み対応

重要な理由

このニュースが重要なのは、トラッカー形式を再生し、AIエンジンでサンプルを48kHzにアップスケールためです。

技術的影響

モデル選定、推論コスト、プロダクト能力、評価基準に影響する可能性があります。

Quinlight Audioは、トラッカーミュージック(MOD/S3M/XM/IT形式)のプレイヤーおよびリマスタリングツールです。内蔵のlibopenmptライブラリを倍精度ミキサーで使用し、ZIP、7z、RARなどのアーカイブから直接モジュールを開くことができます。リマスタリングでは、AudioSR、LavaSR、FLowHigh、AP-BWEといったAIバックエンドをオプションで利用し、元のサンプル(通常8~22kHz)を48kHzにアップスケールします。再生中にオリジナル、48kHzリファレンス(FFmpeg sincリサンプリング)、AIリマスターをリアルタイムで切り替えて比較できます。

複数のAIエンジンの出力を統合するために、Quinlight Audioは革新的なマルチエンジンコンセンサスアルゴリズムを採用しています。このアルゴリズムは、ロータ多様体(ℝ⁺ × S¹)上の各周波数ビンでKarcher平均を計算します。振幅は幾何平均、位相は円平均を取り、位相の一致度(0~1)でコンセンサス振幅をスケーリングします。エンジン間で位相の不一致が大きいビン(典型的な幻覚の兆候)は自動的に減衰されます。元の信号のナイキスト周波数以下では、コンセンサス結果を元のスペクトルとロータ混合し、低域の忠実性を保持します。ナイキスト周波数以上ではコンセンサスをそのまま使用します。この手法は、デカルト座標系での線形混合に比べ、位相の不一致による振幅減衰を明示的に扱うため、プリエコーやトランジェントのぼやけを防ぎます。このアルゴリズムは現在米国特許出願中です。

音質面では、Quinlight Audioはエンドツーエンドの64ビット浮動小数点処理チェーンを採用しています。すべてのミックスバス操作(音量、パン、補間、フィルタフィードバック)は倍精度で行われ、ボリュームランプにはHermiteスムーズステップ曲線(t²(3−2t))を使用し、ノート遷移時のジッパーノイズを排除します。チャンネルフィルターはカスケード4ポール設計(ITスタイル2ポール共振バイクアッド+バターワースポストフィルター)で、24 dB/オクターブのロールオフを提供し、係数パスに整数切り捨てはありません。

補間フィルターは64タップのポリフェーズsincで、65536フェーズ(16ビット位相分解能)とオクターブ間隔のミップマップチェーンを持ちます。各ミップマップレベルはKaiserウィンドウのβ値を独立に調整し(ユニティゲインで14.0、128倍ダウンサンプルで8.0)、異方性速度シア係数(k_β = 0.65, k_β² = 0.15)を導入して高速ピッチスイープ時のストップバンドをクリーンに保ちます。SIMDカーネルはSSE2、AVX、AVX2、AVX-512に対応し、実行時に最も広いパスを選択します。

デフォルトの再生/エクスポートターゲットは96kHz、32ビット浮動小数点(64ビットエンドツーエンドミックス)です。リアルタイム結果をFLACまたはAAC(256 kbps)にエクスポートでき、モジュールディレクトリのバッチCLIレンダリングもサポートしています。また、Linuxデスクトップアプリとしてのインストール機能(--install-icon)も提供されています。

AIエンジンがインストールされていなくても、Quinlight Audioのコアプレイヤー、アーカイブサポート、リファレンスクリーンパス、エクスポート機能は利用可能です。このプロジェクトはGitHubでMITライセンスの下で公開されており、試聴用の96kHzオーディオサンプルパックも提供されています。