AI MOD音乐重制:32位96kHz高清体验
Quinlight Audio是一款支持MOD/S3M/XM/IT格式的追踪音乐播放器和重制工具,利用AI引擎(AudioSR、LavaSR、FLowHigh、AP-BWE)对样本进行实时重制,并提供A/B对比功能。它采用64位浮点混合器、多引擎共识算法(转子流形上的Karcher均值)和各向异性插值,输出32位浮点96kHz音频。支持从压缩包直接打开模块,导出FLAC或AAC,并提供CLI批量处理。
文章情报
要点
- 播放并重制追踪音乐格式,支持AI引擎提升样本质量至48kHz
- 多引擎共识算法抑制幻觉,通过转子流形上的Karcher均值合并频谱
- 64位双精度混合器,各向异性插值,零量化失真
- 支持实时A/B对比、批量渲染,以及从压缩包直接加载模块
为什么重要
这条新闻值得关注,因为播放并重制追踪音乐格式,支持AI引擎提升样本质量至48kHz。
技术影响
可能影响模型选型、推理成本、产品能力和评测基准。
Quinlight Audio 是一款专为追踪音乐(MOD/S3M/XM/IT及相关格式)设计的播放器与重制工具。它不仅能够播放模块,还能利用可选的AI后端对样本进行实时重制,并在播放过程中进行A/B对比。该项目由Kind Computers, LLC开发,采用Linux优先的发布策略,主要面向x86_64平台。
该工具通过内嵌的libopenmpt库以双精度混音器播放模块,支持直接从ZIP、7z、RAR等压缩包中打开模块。在重制方面,Quinlight Audio支持多种AI引擎,包括AudioSR、LavaSR、FLowHigh和AP-BWE,能够将原始样本(通常为8–22kHz)上采样至48kHz。用户可以在播放过程中实时切换原始、48kHz参考(通过FFmpeg sinc重采样)以及AI重制版本,而无需重新启动歌曲。
为了处理多个AI引擎的输出,Quinlight Audio采用了一种创新的多引擎共识算法。该算法在转子流形(ℝ⁺ × S¹)上对每个频率仓进行Karcher均值计算:幅度取几何均值,相位取圆均值,并通过相位一致性(0–1)缩放共识幅度。引擎之间相位分歧较大的频率仓(典型的“幻觉”特征)会被自动衰减。在源信号的奈奎斯特频率以下,共识结果会与原始频谱进行转子混合,以保持低频段的真实性;而在奈奎斯特频率以上,则直接采用共识结果。这种方法的优势在于,相比于笛卡尔坐标系下的线性混合,它能够显式地处理相位不一致导致的幅度衰减,从而避免预回声和瞬态模糊。该算法目前正在申请美国专利。
在音频质量方面,Quinlight Audio采用端到端的64位浮点处理链。所有混音总线操作(音量、声像、插值、滤波器反馈)均以双精度进行,音量渐变使用Hermite平滑曲线(t²(3−2t))替代线性渐变,以消除音符过渡时的“拉链”噪声。通道滤波器采用级联4极点设计(IT式2极点谐振双二阶滤波加巴特沃斯后置滤波器),提供24 dB/倍频程的滚降,且系数路径无整数截断。
插值滤波器采用64抽头多相sinc,具有65536个相位(16位相位精度)和八度间距的mipmap链。每个mipmap级别独立调整Kaiser窗的β值(从单位增益时的14.0到128倍降采样时的8.0),并引入各向异性速度剪切系数(k_β = 0.65, k_β² = 0.15),从而在快速音高扫掠时保持阻带的清洁。SIMD内核支持SSE2、AVX、AVX2和AVX-512,并在运行时选择最宽的可用路径。
默认播放/导出目标为96kHz、32位浮点(64位端到端混音)。用户可以将实时结果导出为FLAC或AAC(256 kbps),并支持对目录中的模块进行批量CLI渲染。此外,该工具还提供了Linux桌面应用安装功能(--install-icon)。
即使没有安装AI引擎,Quinlight Audio的核心播放器、压缩包支持、参考清理路径和导出功能仍然可用。该项目在GitHub上开源,采用MIT许可证,并提供预编译的96kHz音频示例包供试听。