GB-LSR:一种具有单一全局带宽的快速局部频谱图像表示方法,用于连续重建和超分辨率
GB-LSR提出了一种固定网格的局部频谱表示方法,用于连续图像重建。该方法采用单个可训练的全局带宽参数,在所有图像块间共享,从而简化模型并降低计算成本。在标准本机重建基准测试中,GB-LSR的PSNR比LIIF、LTE和WIRE等方法高出2.8-3.6 dB,而推理成本仅为最慢基线的四分之一。在超分辨率任务中,GB-LSR在4倍放大时比LIIF-RDN快1.44倍,比LTE-SwinIR快3.25倍。此外,一种无需局部集成平均的变体实现了1.77倍加速和35%的内存减少,而PSNR几乎没有变化。
GB-LSR(Global-Bandwidth Local Spectral Representation)是一种用于连续图像重建的固定网格局部频谱表示方法。该方法将图像域划分为不重叠的方形块,每个块携带截断傅里叶基的系数,这些系数由共享的卷积编码器特征预测得到。一个关键创新是采用单个可训练的标量带宽,并在所有块和图像之间全局共享。这样,任意连续坐标上的重建就是固定大小的基收缩,其计算成本与图像尺寸无关。这使得GB-LSR在处理高分辨率图像时特别高效。
作者研究了三种带宽处理变体:可训练的全局标量(主要方法)、固定的全局标量和逐块带宽场。在标准本机重建基准测试中(包括Kodak、Set14和Urban100数据集),主要变体在PSNR上比同等计算量的LIIF、LTE和WIRE复现方法高出2.8-3.6 dB,在LPIPS上低0.11-0.15,同时推理成本仅为最慢基线的四分之一。实验表明,单个全局标量在经验上已经足够:无论是封闭形式的局部诊断还是端到端的消融研究,逐块自适应带宽替代方案都没有带来改进。这证实了全局共享带宽的简洁性和有效性。
在超分辨率方面,GB-LSR扩展了任意尺度超分辨率(ASR)功能。在标准SR协议下,GB-LSR实现了具有竞争力的PSNR-Y,并且在4倍放大时,运行速度比LIIF-RDN快1.44倍,比LTE-SwinIR快3.25倍。在同一扩展中,一种无需4角局部集成平均的变体实现了1.77倍加速和35%的峰值内存降低,而PSNR变化可忽略不计。此外,将RDN编码器从64通道扩展到96通道,在实现1.58倍加速和31%内存降低的同时,还带来了小幅的PSNR提升。
值得注意的是,本机重建的结论限于匹配预算的摊销协议,而超分辨率的结论限于独立的规范SR协议。这些范围界定确保了评估的公平性和可重复性。GB-LSR在计算机视觉、图形学和机器学习领域具有潜在应用价值,特别是在需要高效、高质量图像重建和超分辨率的场景中。