arXiv Machine Learning AI 新聞來源

公開文章 330採集文章 350可信度 75刷新頻率 360 分鐘

健康狀態健康來源類型研究原文權限 允許原文最近入庫 2026-06-26ID arxiv-cs-lg運行狀態 已啟用

Use abstract and metadata; check individual paper license before full text.

最新公開文章

拓撲資訊神經網路用於光學與合成孔徑雷達影像洪水檢測

2026-06-26 12:00 UTC+8

該研究提出一種結合拓撲資料分析的神經網路方法，用於提升洪水檢測的準確性和可解釋性。使用SEN12-FLOOD資料集，透過提取影像的拓撲特徵並融入神經網路，證明拓撲描述符能獨立攜帶洪水訊號，並增強現有網路的魯棒性與可解釋性。

洪水檢測對應急響應至關重要，但云層覆蓋常阻礙光學衛星觀測。
現有深度模型多為黑箱，缺乏可解釋性。

演算法公平性的統計與結構方法

2026-06-26 12:00 UTC+8

現代機器學習系統已演變為複雜的社會技術架構，深刻影響著人類獲取經濟和社會機會的途徑。演算法公平性領域旨在解決模型在最佳化預測精度時可能系統性地邊緣化弱勢群體的問題。本文（arXiv:2606.26200）指出當前公平性正規化的兩大根本侷限：依賴確定性點估計進行審計，以及將個體視為脫離結構背景的孤立實體。

現代機器學習系統已成為中介人類機會的社會技術架構，內嵌環境中的結構性不平等與偏見。
早期緩解策略基於脆弱的簡化假設，限制了其在複雜環境中的有效性。

聯邦雜湊投影潛在因子學習

2026-06-26 12:00 UTC+8

提出一種聯邦雜湊投影潛在因子（FHPLF）模型，將雜湊學習與聯邦學習結合，透過二進位制梯度矩陣、投影漢明距離和隱私增強上傳策略，在保證隱私的同時提升模型精度與效率。

FHPLF模型用二進位制梯度矩陣替代實值梯度，降低通訊與隱私風險。
採用投影漢明距離建模相似性，增強二進位制碼錶示能力。

線索引導的洗錢團伙發現

2026-06-26 12:00 UTC+8

本文提出線索引導的團伙發現（CGGD）方法，透過分析師互動從初始線索逐步恢復洗錢團伙。Clue2Group框架構建區域性調查環境，利用多語義區域性時序圖神經網路估計風險場，整合證據恢復團伙結構，在大型AML基準上驗證有效性。

提出CGGD正規化，模擬真實AML調查流程
Clue2Group框架結合區域性調查環境與多語義GNN

必要但不充分：溫度控制與LLM作為裁判的安全評估可重複性

2026-06-26 12:00 UTC+8

本文挑戰了將LLM作為裁判的取樣溫度設定為0即可確保評估確定性的普遍假設。透過對日本AISI開原始碼庫的測試，研究發現預設溫度1.0導致邊界專案結果翻轉，即使在溫度=0時仍有1-2個邊界專案不可重複。建議將裁判分歧作為一等健康指標。

設定溫度為0並不能保證LLM裁判的確定性分級。
評估框架未設定溫度或種子，預設溫度1.0導致邊界專案透過/失敗翻轉。

KG-TRACE：一種用於抗菌素耐藥性預測中機械歸因的神經符號框架

2026-06-26 12:00 UTC+8

KG-TRACE是一種新型神經符號框架，將WHO突變知識圖譜作為結構生物約束整合到神經基因組模型中，透過可學習的認知信任門動態加權神經證據與符號生物學知識。在CRyPTIC結核分枝桿菌佇列上評估，對異煙肼的AUROC達0.9760，並引入生物學歸因比（BGR）量化神經歸因與已知生物學的對齊。

KG-TRACE將WHO突變知識圖譜作為結構約束整合到神經模型中，實現神經符號融合。
在結核分枝桿菌資料集上對異煙肼預測達到0.9760 AUROC，主要價值在符號歸因而非預測提升。

生成對抗網路的神經架構搜尋：綜述與批判性分析

2026-06-26 12:00 UTC+8

本文全面綜述了應用於生成對抗網路（GAN）的神經架構搜尋（NAS）方法，比較了搜尋策略、評估指標和效能結果，強調了進化演算法和梯度方法的優勢，並指出了當前評估指標的不足及未來研究方向。

NAS自動最佳化GAN架構，提升效能、穩定性和效率。
進化演算法和梯度方法在某些場景下表現優越。

強化學習在化學反應網路中的實現：以光趨性作為好奇心驅動的探索

2026-06-26 12:00 UTC+8

該研究將單細胞藻類的趨光行為重新建模為一種資訊驅動的感測器運動過程，透過部分可觀察馬爾可夫決策過程（POMDP）與化學反應網路常微分方程（CRN-ODE）結合，利用逆強化學習從實驗軌跡中推斷行為目標，展示了細胞內生化網路如何支援自適應資訊尋求行為。

提出將趨光性視為好奇心驅動的探索，而不僅僅是刺激-響應機制。
建立連線POMDP與生化反應動力學的框架，使用CRN-ODE實現。

χ-sao：一種透過收斂-反收斂振盪實現多模態黑箱函式的GPU原生並行最佳化器

2026-06-26 12:00 UTC+8

提出了一種名為χ-sao（Convergence-Halt-Invert-Stick-And-Oscillate）的GPU原生群體最佳化演算法，透過收斂-反收斂振盪迴圈在凍結已確認模態的同時逃離區域性陷阱。在Simon Fraser大學最佳化基準套件的42個函式上，針對維度d∈{2,4,8,16,32,64}，χ-sao在最有挑戰性的多模態函式上實現了100%的模態恢復，而所有CPU基線在d≥8時均失敗。在Michalewicz d=64上，相比盆地跳躍加速達34倍；在Rotated Hyper-Ellipsoid d=64（純GPU紅利）上加速達39倍。即使在噪聲σ_noise高達1.0時，模態檢測仍保持100%可靠。演算法已作為開源Python包釋出在PyPI上。

χ-sao是首個利用收斂-反收斂振盪的GPU原生並行最佳化器，能同時執行整個樣本批次。
在Simon Fraser大學基準套件的所有42個函式上，χ-sao在多模態函式維度≥8時實現100%模態恢復，遠超CPU基線。

物理引導卷積神經網路用於守恆動力學系統中的域長大預測

2026-06-26 12:00 UTC+8

研究人員提出了一種基於注意力機制的物理引導卷積神經網路作為替代模型，用於預測由Cahn-Hilliard方程描述的系統中的微觀結構演化。該模型能準確預測二元混合物的相分離過程，在長時間推演中保持穩定，並符合Lifshitz-Slyozov域長大規律。

提出物理引導CNN預測相分離動力學
模型在長時間滾動中保持穩定準確

MacroLens：宏觀經濟場景下的多工上下文金融推理基準研究

2026-06-25 12:00 UTC+8

MacroLens是一個全新的多工基準，涵蓋2021-2026年間4,416只美國小盤和微盤股。它整合價格、會計資料、宏觀經濟序列、SEC檔案和新聞，旨在解決金融時間序列評估中四大假設違反問題。基準包含七個任務、1,130個宏觀經濟事件，評估了19種方法，並進行了特徵消融實驗。

首個同時處理價格、基本面、宏觀和文本四類訊號的公開基準
覆蓋4,416只美國股票，包含46.8M XBRL事實、53個宏觀序列和215,882篇新聞

知識圖譜中零樣本組合推理的全息記憶機制研究：失敗之處與原因剖析

2026-06-25 12:00 UTC+8

研究發現，全息記憶模型在知識圖譜零樣本組合查詢中表現不佳，其根源在於容量和干擾效應，而非繫結代數本身。

真實值HRR和傅立葉HRR在單跳檢索中表現優秀，但零樣本組合準確率接近隨機。
機制分析表明，即使中間實體正確，組合仍然失敗，因為組合鏈中的事實本身更難檢索。

用於分散式能源資源協調的監督強化學習

2026-06-25 12:00 UTC+8

一篇新論文提出了一種監督強化學習（SRL）框架，用於協調分散式能源資源（DERs）。該方法先在演示資料上透過監督學習預訓練策略，然後透過離線和線上強化學習進行微調，即使在低質量資料下也能顯著優於基準方法。

SRL框架結合了監督預訓練和強化學習微調，靈感來自大型語言模型的訓練正規化。
兩步微調過程：離線微調提升策略效能，線上微調適應實際動態。

等變世界模型的共形軌道有效信任視界

2026-06-25 12:00 UTC+8

該論文研究具有已知群對稱性的潛在世界模型的信任視界認證。透過分割共形乘法因子校準原始視界曲線，實驗表明準確等變性可將校準後的信任視界曲線沿群軌道傳輸，使得滾動誤差和信任視界在軌道上恆定。在2D和3D實驗中，等變模型在單校準區域內獲得安全且非空洞的軌道有效證書，而非等變基線需要額外代價。證書是保守的分佈審計，而非全域性可達性保證。

提出一種基於分割共形預測的信任視界認證方法，用於等變潛在世界模型。
主要理論結果是準確等變性可沿群軌道傳輸校準的信任視界曲線。

守恆定律何時能在學習表示中存活？潛在世界模型的認證視野

2026-06-25 12:00 UTC+8

本研究探討了一個表示學習問題：物理世界模型在學習潛在表示後，守恆定律是否仍可被認證。作者提出“認證視野”的概念，即從可測量的模型缺陷出發，預先保證模擬軌跡在物理不變數水平集上保持的步數。核心創新在於認證物件是解碼後的物理不變數，而非學習到的潛在哈密頓量或標量見證。透過分解表示、讀出和潛在動力學缺陷的預算，並引入單調對齊橋，該框架在保守系統上進行了測試，發現不同的幾何先驗表現各異：硬規範辛結構在已知相座標下視野最長，但無法跨越學習圖表；而受控Lipschitz對齊的軟不變數在學習表示設定中表現良好。畫素認證可在讀出穩定的子管道中恢復，開普勒問題則暴露了幾何邊界。

提出“認證視野”概念，用於預先保證潛在世界模型中守恆定律的保持步數
認證物件為解碼後的物理不變數，而非學習到的潛在量

二元少樣本分類的譜相圖：內在維度、幾何飽和與表徵診斷

2026-06-25 12:00 UTC+8

本文提出了一種用於二元少樣本分類的飽和指數，幫助決定何時停止收集標註樣本。該指數基於類內協方差的有效秩，可在無測試標籤的情況下計算。實驗表明該指數與準確率增益高度相關，並定義了探索、過渡和飽和三個階段。作為停止規則，AUC達到0.752，同時可用於診斷表徵不足問題。

飽和指數S(K)衡量有效秩與樣本數的比值，在協方差估計收斂時下降
在17個任務中，該指數與邊際準確率增益的Spearman相關係數中位數為0.811

LLM進化作為工業級生態系統：持續學習的生命週期視角

2026-06-25 12:00 UTC+8

本調查將工業LLM的持續學習重新定義為版本化生態系統中的閉環更新與釋出問題，識別出三大核心挑戰（適應性侵蝕、能力傳承斷裂、可持續性約束），並提出五項生命週期設計原則，評估了各原則的成熟度並勾勒出實際部署藍圖。

工業LLM需要持續更新而非從頭訓練
調查提出以版本化生態系統視角看待持續學習

裝置端神經架構搜尋

2026-06-25 12:00 UTC+8

本文提出一種在部署裝置上直接執行輕量級神經架構搜尋（NAS）的方法，以找到最佳的小型神經網路分析感測器即時資料。該方法特別適用於人機介面，可根據使用者變化重新設計網路。在義大利手語資料集（ISL）和CWRU資料集上的驗證表明，在樹莓派4上，該NAS在減少RAM佔用的同時提升了準確率。

新方法在裝置端直接進行神經架構搜尋，實現近感測器計算。
適應個體差異，可針對不同使用者重新設計生物特徵分析網路。

從元想法到高階數學發現——人類與AI共同發現符號嵌入量子演算法

2026-06-25 12:00 UTC+8

一篇新論文展示了人類與AI如何協同工作，將模糊的研究直覺轉化為具體的數學發現。該案例研究聚焦於符號嵌入量子演算法，這是量子線性代數中的基礎原語。AI系統AIM在擴充套件直覺、比較候選公式和連線已知恆等式方面發揮了關鍵作用，但最終的科學判斷（如選擇研究方向、拒絕無效近似、最佳化實現）始終由人類做出。作者認為，人類-AI共同發現工作流最有價值的是作為研究夥伴，而非獨立的定理證明器。

人類直覺認為有理逼近對符號函式等跳躍型函式特別有效，AI幫助將其擴充套件為符號嵌入量子演算法的路線圖。
AI系統AIM協助連線了已知矩陣符號恆等式與更廣泛的矩陣方程和函式類，並起草了證明和複雜度計算。

退化蒸餾器：自動檢測並解析引數退化，大幅降低模擬預算

2026-06-24 12:00 UTC+8

一種名為“退化蒸餾器”的新方法，透過估算和扁平化Fisher資訊矩陣，自動從引數-資料對中檢測並解析退化引數組合，無需實際觀測資料。該方法發現的符號座標變換能識別對資料產生獨立影響的引數組合，全域性扁平化Fisher資訊，使後續神經後驗估計所需的模擬預算減少多達10倍。

退化現象指多個引數或標籤產生相似資料，導致標籤預測和逆問題求解困難。
退化蒸餾器利用Fisher資訊矩陣的估計和扁平化，自動檢測和解析退化引數組合。

使用時空圖神經網路重建GRACE陸地水儲量：南美洲應用

2026-06-24 12:00 UTC+8

本研究提出一種深度學習應用，利用多變數時間序列圖神經網路（MTGNN）重建1940年以來的月度GRACE類陸地水儲量異常（TWSA）。該方法透過混合鄰接矩陣編碼空間依賴關係，在南美洲流域實現了0.94的平均相關係數，併成功再現了2015/16年厄爾尼諾和2020/21年拉尼娜事件。與現有方法相比，MTGNN僅需少量預測變數即可達到競爭性效能。

MTGNN架構從城市感測器網路遷移至衛星測地任務，重建GRACE水儲量資料至1940年。
混合鄰接矩陣結合測地鄰近性和氣候時間序列滯後相關，捕捉本地和遙相關。

解讀3D分子表面指紋以實現精確表位預測

2026-06-24 12:00 UTC+8

分子表面編碼了決定抗體-抗原識別的幾何和物理化學模式，這對於表位預測至關重要。然而，現有方法依賴於序列或骨架結構，難以捕捉不連續的、表面驅動的表位。本研究提出SurfBind，一種直接作用於分子表面表示的表位預測表面中心學習框架。SurfBind透過基於Transformer的架構整合幾何和物理化學線索，包括補丁級表面建模、結合物感知交叉注意力和分層粗到細預測正規化。在SAbDab和DB5.5等具有挑戰性的表位識別基準上的實驗表明，SurfBind達到了最先進的效能，並對未見抗體和構象狀態具有良好的泛化能力，突顯了互動感知表面建模在理解蛋白質-蛋白質相互作用關鍵機制中的價值。

現有表位預測方法依賴序列或骨架結構，難以處理不連續表位。
SurfBind直接利用分子表面表示，結合Transformer架構進行預測。

一把尺：對圖賓根雙變數因果方向的同批重新評估及無引數壓縮基線

2026-06-24 12:00 UTC+8

一項新研究對圖賓根因果資料集的多種方法進行了統一標準的重新評估，引入了一個零引數的壓縮基線，發現各方法效能集中在70%左右，且簡單基線表現與最強方法相當，揭示了現有報告準確率被誇大的機制。

研究者使用相同的資料集和協議重新評估了圖賓根因果對上的多種因果推斷方法。
引入的排序條件壓縮基線無需調參，準確率達74.7%，與最強方法持平。

探索雙元元學習以增強開放集場景下的域泛化

2026-06-24 12:00 UTC+8

本文提出了一種名為MEDIC的新型元學習策略，透過同時考慮域間和類間的隱式梯度匹配，在開放集域泛化中實現了更優的決策邊界平衡，有效解決了傳統方法中正負樣本不平衡導致的過拒絕問題，並在保持封閉集泛化能力的同時，在開放集場景下超越了現有方法。

開放集域泛化旨在識別未見域中的未知類別，但簡單的一對多分類器因樣本不平衡導致決策邊界偏移。
MEDIC策略透過雙元元學習聯合域-類匹配，同時最佳化域間和類間的梯度，找到平衡的決策邊界。

物理約束MCMC與化學資訊高斯過程協同發現反應網路

2026-06-24 12:00 UTC+8

提出了一種名為PC-MCMC-CIGP的灰箱工作流，整合了尖峰–平板拓撲取樣、硬守恆與熱力學篩選以及化學資訊高斯過程殘差模型，用於從稀疏、含噪聲的化學時間序列資料中提取可解釋的控制方程。在H2+Br2基準測試中，該方法能區分基本自由基路徑與欺騙性現象學擬合；在苯乙烯環氧化反應中，最佳化迴圈使最終產率比基線提高12.5%。一項10種子採集研究表明，不同採集函式存在權衡：PC-EI可減少低產率貝葉斯最佳化建議，而EI類準則可獲得最強最終產率表現。

PC-MCMC-CIGP將物理約束MCMC與化學資訊高斯過程整合，實現反應網路發現。
在H2+Br2基準中成功區分了基本自由基路徑。

用於連續控制的具有可訓練非線性連線的低功耗模擬神經網路

2026-06-24 12:00 UTC+8

一種新的物理神經網路方法在連線上放置可訓練的非線性函式，而非使用標量權重，以更少的節點實現低功耗連續控制任務。該設計在模擬陣列上實現，顯示出任務相關的優勢，並在CMOS中預計功耗約30微瓦。

受Kolmogorov-Arnold網路啟發，在連線上放置可訓練的非線性函式。
該網路在機器人運動學、連續控制和光伏最大功率點跟蹤等平滑連續目標上表現出色，但在分類決策邊界上沒有引數效率優勢。

聯邦因果發現與推理綜述

2026-06-24 12:00 UTC+8

本文對聯邦因果發現與推理進行了全面綜述，提出了多維度分類法，強調了因果結構學習與效應估計在統一流水線中的整合，並討論了隱私和資料異質性等挑戰。

論文使用多維度分類法系統回顧了聯邦因果發現（FCD）和聯邦因果推理（FCI）。
它從方法論正規化、聯邦拓撲和結構範圍三個軸組織FCD。

離線推理訓練的權重空間幾何

2026-06-24 12:00 UTC+8

該論文研究了六種離線強化學習損失函式（SFT、RFT、DFT、RIFT、Offline GRPO、DPO）在推理蒸餾中的權重更新幾何特性。實驗基於Qwen3-4B模型和相同數學資料，發現SFT、RFT和RIFT的權重增量近乎共線，DFT偏離較大，Offline GRPO增加了正交分量，而DPO位於近乎正交的子空間且準確率最高，但存在模式連線障礙。

SFT、RFT和RIFT的權重餘弦相似度≥0.97，GSM8K準確率約87-88%。
DFT的更新方向比任何獎勵加權方法都更發散。

基於自動流水線搜尋的四專家異構混合專家系統的系統探索

2026-06-24 12:00 UTC+8

本文提出了一種自動大規模搜尋流水線，用於在LEMUR神經網路資料集生態系統中探索4專家異構混合專家（MoE4）架構。該流水線執行在NVIDIA RTX 4090上，28天內生成4463個候選模型，評估了1021個。發現一個重要覆蓋偏差：由於列舉方式，搜尋空間錨定在AirNet家族。在AirNet範圍內，ShuffleNet和MobileNetV3的組合達到了最高平均準確率0.632。FractalNet和MNASNet被認為是低收益家族。

自動流水線生成4463個MoE4候選模型，評估1021個。
發現搜尋空間覆蓋偏差，根源在於列舉邏輯錨定AirNet家族。

cAPM：基於主動學習的持續性AI輔助起搏標測

2026-06-19 12:00 UTC+8

室性心動過速是一種危及生命的心律失常。起搏標測用於識別消融靶點。cAPM利用持續學習跨多個VT轉移知識，減少所需起搏點。在模擬中，cAPM以4.5個起搏點實現了81%的定位準確率，而現有方法需要13.7個起搏點僅達到38%。

cAPM是一種新型AI起搏標測系統，能夠跨多個室性心動過速靶點持續學習。
它使用任務無關的替代神經網路和主動學習策略選擇資訊量最大的起搏點。

arXiv Machine Learning

最新公開文章

拓撲資訊神經網路用於光學與合成孔徑雷達影像洪水檢測

演算法公平性的統計與結構方法

聯邦雜湊投影潛在因子學習

線索引導的洗錢團伙發現

必要但不充分：溫度控制與LLM作為裁判的安全評估可重複性

KG-TRACE：一種用於抗菌素耐藥性預測中機械歸因的神經符號框架

生成對抗網路的神經架構搜尋：綜述與批判性分析

強化學習在化學反應網路中的實現：以光趨性作為好奇心驅動的探索

χ-sao：一種透過收斂-反收斂振盪實現多模態黑箱函式的GPU原生並行最佳化器

物理引導卷積神經網路用於守恆動力學系統中的域長大預測

MacroLens：宏觀經濟場景下的多工上下文金融推理基準研究

知識圖譜中零樣本組合推理的全息記憶機制研究：失敗之處與原因剖析

用於分散式能源資源協調的監督強化學習

等變世界模型的共形軌道有效信任視界

守恆定律何時能在學習表示中存活？潛在世界模型的認證視野

二元少樣本分類的譜相圖：內在維度、幾何飽和與表徵診斷

LLM進化作為工業級生態系統：持續學習的生命週期視角

裝置端神經架構搜尋

從元想法到高階數學發現——人類與AI共同發現符號嵌入量子演算法

退化蒸餾器：自動檢測並解析引數退化，大幅降低模擬預算

使用時空圖神經網路重建GRACE陸地水儲量：南美洲應用

解讀3D分子表面指紋以實現精確表位預測

一把尺：對圖賓根雙變數因果方向的同批重新評估及無引數壓縮基線

探索雙元元學習以增強開放集場景下的域泛化

物理約束MCMC與化學資訊高斯過程協同發現反應網路

用於連續控制的具有可訓練非線性連線的低功耗模擬神經網路

聯邦因果發現與推理綜述

離線推理訓練的權重空間幾何

基於自動流水線搜尋的四專家異構混合專家系統的系統探索

cAPM：基於主動學習的持續性AI輔助起搏標測

全部來源