2026-05-25 00:11 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

AI MOD音乐重制：32位96kHz高清体验

Quinlight Audio是一款支持MOD/S3M/XM/IT格式的追踪音乐播放器和重制工具，利用AI引擎（AudioSR、LavaSR、FLowHigh、AP-BWE）对样本进行实时重制，并提供A/B对比功能。它采用64位浮点混合器、多引擎共识算法（转子流形上的Karcher均值）和各向异性插值，输出32位浮点96kHz音频。支持从压缩包直接打开模块，导出FLAC或AAC，并提供CLI批量处理。

来源Hacker News AI作者: fechols

Quinlight Audio 是一款专为追踪音乐（MOD/S3M/XM/IT及相关格式）设计的播放器与重制工具。它不仅能够播放模块，还能利用可选的AI后端对样本进行实时重制，并在播放过程中进行A/B对比。该项目由Kind Computers, LLC开发，采用Linux优先的发布策略，主要面向x86_64平台。

该工具通过内嵌的libopenmpt库以双精度混音器播放模块，支持直接从ZIP、7z、RAR等压缩包中打开模块。在重制方面，Quinlight Audio支持多种AI引擎，包括AudioSR、LavaSR、FLowHigh和AP-BWE，能够将原始样本（通常为8–22kHz）上采样至48kHz。用户可以在播放过程中实时切换原始、48kHz参考（通过FFmpeg sinc重采样）以及AI重制版本，而无需重新启动歌曲。

为了处理多个AI引擎的输出，Quinlight Audio采用了一种创新的多引擎共识算法。该算法在转子流形（ℝ⁺ × S¹）上对每个频率仓进行Karcher均值计算：幅度取几何均值，相位取圆均值，并通过相位一致性（0–1）缩放共识幅度。引擎之间相位分歧较大的频率仓（典型的“幻觉”特征）会被自动衰减。在源信号的奈奎斯特频率以下，共识结果会与原始频谱进行转子混合，以保持低频段的真实性；而在奈奎斯特频率以上，则直接采用共识结果。这种方法的优势在于，相比于笛卡尔坐标系下的线性混合，它能够显式地处理相位不一致导致的幅度衰减，从而避免预回声和瞬态模糊。该算法目前正在申请美国专利。

在音频质量方面，Quinlight Audio采用端到端的64位浮点处理链。所有混音总线操作（音量、声像、插值、滤波器反馈）均以双精度进行，音量渐变使用Hermite平滑曲线（t²(3−2t)）替代线性渐变，以消除音符过渡时的“拉链”噪声。通道滤波器采用级联4极点设计（IT式2极点谐振双二阶滤波加巴特沃斯后置滤波器），提供24 dB/倍频程的滚降，且系数路径无整数截断。

插值滤波器采用64抽头多相sinc，具有65536个相位（16位相位精度）和八度间距的mipmap链。每个mipmap级别独立调整Kaiser窗的β值（从单位增益时的14.0到128倍降采样时的8.0），并引入各向异性速度剪切系数（k_β = 0.65, k_β² = 0.15），从而在快速音高扫掠时保持阻带的清洁。SIMD内核支持SSE2、AVX、AVX2和AVX-512，并在运行时选择最宽的可用路径。

默认播放/导出目标为96kHz、32位浮点（64位端到端混音）。用户可以将实时结果导出为FLAC或AAC（256 kbps），并支持对目录中的模块进行批量CLI渲染。此外，该工具还提供了Linux桌面应用安装功能（--install-icon）。

即使没有安装AI引擎，Quinlight Audio的核心播放器、压缩包支持、参考清理路径和导出功能仍然可用。该项目在GitHub上开源，采用MIT许可证，并提供预编译的96kHz音频示例包供试听。