2026-01-10 17:00 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

基於信息驅動的成像系統設計

研究人員開發了一種基於互信息的成像系統評估與優化框架，在四個成像領域預測系統性能，並實現無需任務特定解碼器的高效設計。

許多成像系統產生的測量結果人類無法直接觀察或解讀。智能手機通過算法處理原始傳感器數據生成最終照片，MRI掃描儀採集頻域測量值需要重建後才能供醫生查看，自動駕駛汽車則直接利用神經網絡處理攝像頭和LiDAR數據。這些系統的核心不在於測量結果的視覺效果，而在於它們包含的有用信息量。人工智能能夠提取這些信息，即使信息編碼方式人類無法理解。然而，我們很少直接評估信息含量。傳統指標如分辨率和信噪比分別評估質量的單個方面，難以比較在這些因素間權衡的系統。而訓練神經網絡進行重建或分類的常用方法，則會將成像硬件的質量與算法的質量混為一談。

我們開發了一個框架，能夠直接基於信息含量評估和優化成像系統。在NeurIPS 2025論文中，我們展示了這一信息指標在四個成像領域預測系統性能，並且通過優化該指標獲得的系統設計能夠匹配最先進的端到端方法，同時減少內存和計算需求，無需針對特定任務設計解碼器。

互信息量化了測量結果對物體不確定性的減少程度。兩個系統即使測量結果完全不同，只要互信息相同，它們區分物體的能力就等價。這一單一數字綜合了分辨率、噪聲、採樣及其他所有影響測量質量的因素。一張模糊、有噪聲但保留了區分物體所需特徵的圖像，可能比一張清晰、乾淨但丟失關鍵特徵的圖像包含更多信息。信息統一了傳統上各自獨立的質量指標，將噪聲、分辨率和光譜靈敏度綜合考慮。

過去將信息論應用於成像的嘗試面臨兩個問題：一是將成像系統視為無約束通信信道，忽略鏡頭和傳感器的物理限制，導致估計嚴重失準；二是需要顯式建模成像物體，限制了通用性。我們的方法通過直接從測量結果估計信息，避免了這兩類問題。

高維變量間互信息估計極其困難，樣本需求隨維度指數增長，且估計偏差和方差很大。然而，成像系統的特性使我們可以將這一難題分解為更簡單的子問題。互信息可表示為總測量變異減去噪聲變異：I(X;Y)=H(Y)−H(Y|X)。成像系統的噪聲特性明確（光子散粒噪聲服從泊松分佈，電子讀出噪聲服從高斯分佈），因此我們可以直接計算H(Y|X)，僅需從數據中學習H(Y)。我們通過概率模型（如Transformer或其他自迴歸模型）擬合測量數據集，學習所有可能測量的分佈。我們測試了三種模型：平穩高斯過程（最快）、全高斯模型（中等）和自迴歸PixelCNN（最準確）。該方法提供真實信息的上界，任何建模誤差只會高估而不會低估信息。

我們驗證了信息估計與解碼器性能的關係。在四個成像應用中，信息估計正確預測瞭解碼器性能：更高信息量產生更好的下游任務結果。彩色攝影中，信息估計正確排序了不同濾色器陣列設計的重建質量，且無需重建算法。射電天文學中，信息估計預測瞭望遠鏡配置的重建質量，從而無需昂貴圖像重建即可選擇站點。無透鏡成像中，信息估計預測了不同光學設計在各種噪聲水平下的重建精度。顯微鏡領域，信息估計與神經網絡預測蛋白質表達的準確性相關，避免了對昂貴蛋白質標記實驗的需求。

我們開發的IDEAL（信息驅動編碼器分析學習）方法，利用信息估計的梯度上升來優化成像系統參數。與需要聯合訓練硬件和解碼器的端到端優化不同，IDEAL僅優化編碼器。在彩色濾光器設計測試中，IDEAL從隨機排列起步，逐步改進設計，最終在信息含量和重建質量上與端到端優化相當，同時避免瞭解碼器反向傳播帶來的內存和優化難題。

基於信息的評估為真實條件下成像系統的嚴格評估創造了新可能。當前方法依賴主觀視覺評估、部署時不可用的真值數據或孤立的指標。我們的方法僅從測量結果中提供客觀、統一的指標。IDEAL的計算效率表明，它能夠設計以前難以處理的成像系統。該框架可能擴展到其他感知領域，任何可建模為具有已知噪聲特性的確定性編碼的系統，包括電子、生物和化學傳感器，都將受益於基於信息的評估與設計。