arXiv Machine Learning AI 新闻来源

公开文章 330采集文章 350可信度 75刷新频率 360 分钟

健康状态健康来源类型研究原文权限 允许原文最近入库 2026-06-26ID arxiv-cs-lg运行状态 已启用

Use abstract and metadata; check individual paper license before full text.

最新公开文章

拓扑信息神经网络用于光学与合成孔径雷达影像洪水检测

2026-06-26 12:00 UTC+8

该研究提出一种结合拓扑数据分析的神经网络方法，用于提升洪水检测的准确性和可解释性。使用SEN12-FLOOD数据集，通过提取图像的拓扑特征并融入神经网络，证明拓扑描述符能独立携带洪水信号，并增强现有网络的鲁棒性与可解释性。

洪水检测对应急响应至关重要，但云层覆盖常阻碍光学卫星观测。
现有深度模型多为黑箱，缺乏可解释性。

算法公平性的统计与结构方法

2026-06-26 12:00 UTC+8

现代机器学习系统已演变为复杂的社会技术架构，深刻影响着人类获取经济和社会机会的途径。算法公平性领域旨在解决模型在优化预测精度时可能系统性地边缘化弱势群体的问题。本文（arXiv:2606.26200）指出当前公平性范式的两大根本局限：依赖确定性点估计进行审计，以及将个体视为脱离结构背景的孤立实体。

现代机器学习系统已成为中介人类机会的社会技术架构，内嵌环境中的结构性不平等与偏见。
早期缓解策略基于脆弱的简化假设，限制了其在复杂环境中的有效性。

联邦哈希投影潜在因子学习

2026-06-26 12:00 UTC+8

提出一种联邦哈希投影潜在因子（FHPLF）模型，将哈希学习与联邦学习结合，通过二进制梯度矩阵、投影汉明距离和隐私增强上传策略，在保证隐私的同时提升模型精度与效率。

FHPLF模型用二进制梯度矩阵替代实值梯度，降低通信与隐私风险。
采用投影汉明距离建模相似性，增强二进制码表示能力。

线索引导的洗钱团伙发现

2026-06-26 12:00 UTC+8

本文提出线索引导的团伙发现（CGGD）方法，通过分析师互动从初始线索逐步恢复洗钱团伙。Clue2Group框架构建局部调查环境，利用多语义局部时序图神经网络估计风险场，整合证据恢复团伙结构，在大型AML基准上验证有效性。

提出CGGD范式，模拟真实AML调查流程
Clue2Group框架结合局部调查环境与多语义GNN

必要但不充分：温度控制与LLM作为裁判的安全评估可重复性

2026-06-26 12:00 UTC+8

本文挑战了将LLM作为裁判的采样温度设置为0即可确保评估确定性的普遍假设。通过对日本AISI开源代码库的测试，研究发现默认温度1.0导致边界项目结果翻转，即使在温度=0时仍有1-2个边界项目不可重复。建议将裁判分歧作为一等健康指标。

设置温度为0并不能保证LLM裁判的确定性分级。
评估框架未设置温度或种子，默认温度1.0导致边界项目通过/失败翻转。

KG-TRACE：一种用于抗菌素耐药性预测中机械归因的神经符号框架

2026-06-26 12:00 UTC+8

KG-TRACE是一种新型神经符号框架，将WHO突变知识图谱作为结构生物约束集成到神经基因组模型中，通过可学习的认知信任门动态加权神经证据与符号生物学知识。在CRyPTIC结核分枝杆菌队列上评估，对异烟肼的AUROC达0.9760，并引入生物学归因比（BGR）量化神经归因与已知生物学的对齐。

KG-TRACE将WHO突变知识图谱作为结构约束集成到神经模型中，实现神经符号融合。
在结核分枝杆菌数据集上对异烟肼预测达到0.9760 AUROC，主要价值在符号归因而非预测提升。

生成对抗网络的神经架构搜索：综述与批判性分析

2026-06-26 12:00 UTC+8

本文全面综述了应用于生成对抗网络（GAN）的神经架构搜索（NAS）方法，比较了搜索策略、评估指标和性能结果，强调了进化算法和梯度方法的优势，并指出了当前评估指标的不足及未来研究方向。

NAS自动优化GAN架构，提升性能、稳定性和效率。
进化算法和梯度方法在某些场景下表现优越。

强化学习在化学反应网络中的实现：以光趋性作为好奇心驱动的探索

2026-06-26 12:00 UTC+8

该研究将单细胞藻类的趋光行为重新建模为一种信息驱动的传感器运动过程，通过部分可观察马尔可夫决策过程（POMDP）与化学反应网络常微分方程（CRN-ODE）结合，利用逆强化学习从实验轨迹中推断行为目标，展示了细胞内生化网络如何支持自适应信息寻求行为。

提出将趋光性视为好奇心驱动的探索，而不仅仅是刺激-响应机制。
建立连接POMDP与生化反应动力学的框架，使用CRN-ODE实现。

χ-sao：一种通过收敛-反收敛振荡实现多模态黑箱函数的GPU原生并行优化器

2026-06-26 12:00 UTC+8

提出了一种名为χ-sao（Convergence-Halt-Invert-Stick-And-Oscillate）的GPU原生群体优化算法，通过收敛-反收敛振荡循环在冻结已确认模态的同时逃离局部陷阱。在Simon Fraser大学优化基准套件的42个函数上，针对维度d∈{2,4,8,16,32,64}，χ-sao在最有挑战性的多模态函数上实现了100%的模态恢复，而所有CPU基线在d≥8时均失败。在Michalewicz d=64上，相比盆地跳跃加速达34倍；在Rotated Hyper-Ellipsoid d=64（纯GPU红利）上加速达39倍。即使在噪声σ_noise高达1.0时，模态检测仍保持100%可靠。算法已作为开源Python包发布在PyPI上。

χ-sao是首个利用收敛-反收敛振荡的GPU原生并行优化器，能同时运行整个样本批次。
在Simon Fraser大学基准套件的所有42个函数上，χ-sao在多模态函数维度≥8时实现100%模态恢复，远超CPU基线。

物理引导卷积神经网络用于守恒动力学系统中的域长大预测

2026-06-26 12:00 UTC+8

研究人员提出了一种基于注意力机制的物理引导卷积神经网络作为替代模型，用于预测由Cahn-Hilliard方程描述的系统中的微观结构演化。该模型能准确预测二元混合物的相分离过程，在长时间推演中保持稳定，并符合Lifshitz-Slyozov域长大规律。

提出物理引导CNN预测相分离动力学
模型在长时间滚动中保持稳定准确

MacroLens：宏观经济场景下的多任务上下文金融推理基准研究

2026-06-25 12:00 UTC+8

MacroLens是一个全新的多任务基准，涵盖2021-2026年间4,416只美国小盘和微盘股。它整合价格、会计数据、宏观经济序列、SEC文件和新闻，旨在解决金融时间序列评估中四大假设违反问题。基准包含七个任务、1,130个宏观经济事件，评估了19种方法，并进行了特征消融实验。

首个同时处理价格、基本面、宏观和文本四类信号的公开基准
覆盖4,416只美国股票，包含46.8M XBRL事实、53个宏观序列和215,882篇新闻

知识图谱中零样本组合推理的全息记忆机制研究：失败之处与原因剖析

2026-06-25 12:00 UTC+8

研究发现，全息记忆模型在知识图谱零样本组合查询中表现不佳，其根源在于容量和干扰效应，而非绑定代数本身。

真实值HRR和傅里叶HRR在单跳检索中表现优秀，但零样本组合准确率接近随机。
机制分析表明，即使中间实体正确，组合仍然失败，因为组合链中的事实本身更难检索。

用于分布式能源资源协调的监督强化学习

2026-06-25 12:00 UTC+8

一篇新论文提出了一种监督强化学习（SRL）框架，用于协调分布式能源资源（DERs）。该方法先在演示数据上通过监督学习预训练策略，然后通过离线和在线强化学习进行微调，即使在低质量数据下也能显著优于基准方法。

SRL框架结合了监督预训练和强化学习微调，灵感来自大型语言模型的训练范式。
两步微调过程：离线微调提升策略性能，在线微调适应实际动态。

等变世界模型的共形轨道有效信任视界

2026-06-25 12:00 UTC+8

该论文研究具有已知群对称性的潜在世界模型的信任视界认证。通过分割共形乘法因子校准原始视界曲线，实验表明准确等变性可将校准后的信任视界曲线沿群轨道传输，使得滚动误差和信任视界在轨道上恒定。在2D和3D实验中，等变模型在单校准区域内获得安全且非空洞的轨道有效证书，而非等变基线需要额外代价。证书是保守的分布审计，而非全局可达性保证。

提出一种基于分割共形预测的信任视界认证方法，用于等变潜在世界模型。
主要理论结果是准确等变性可沿群轨道传输校准的信任视界曲线。

守恒定律何时能在学习表示中存活？潜在世界模型的认证视野

2026-06-25 12:00 UTC+8

本研究探讨了一个表示学习问题：物理世界模型在学习潜在表示后，守恒定律是否仍可被认证。作者提出“认证视野”的概念，即从可测量的模型缺陷出发，预先保证模拟轨迹在物理不变量水平集上保持的步数。核心创新在于认证对象是解码后的物理不变量，而非学习到的潜在哈密顿量或标量见证。通过分解表示、读出和潜在动力学缺陷的预算，并引入单调对齐桥，该框架在保守系统上进行了测试，发现不同的几何先验表现各异：硬规范辛结构在已知相坐标下视野最长，但无法跨越学习图表；而受控Lipschitz对齐的软不变量在学习表示设置中表现良好。像素认证可在读出稳定的子管道中恢复，开普勒问题则暴露了几何边界。

提出“认证视野”概念，用于预先保证潜在世界模型中守恒定律的保持步数
认证对象为解码后的物理不变量，而非学习到的潜在量

二元少样本分类的谱相图：内在维度、几何饱和与表征诊断

2026-06-25 12:00 UTC+8

本文提出了一种用于二元少样本分类的饱和指数，帮助决定何时停止收集标注样本。该指数基于类内协方差的有效秩，可在无测试标签的情况下计算。实验表明该指数与准确率增益高度相关，并定义了探索、过渡和饱和三个阶段。作为停止规则，AUC达到0.752，同时可用于诊断表征不足问题。

饱和指数S(K)衡量有效秩与样本数的比值，在协方差估计收敛时下降
在17个任务中，该指数与边际准确率增益的Spearman相关系数中位数为0.811

LLM进化作为工业级生态系统：持续学习的生命周期视角

2026-06-25 12:00 UTC+8

本调查将工业LLM的持续学习重新定义为版本化生态系统中的闭环更新与发布问题，识别出三大核心挑战（适应性侵蚀、能力传承断裂、可持续性约束），并提出五项生命周期设计原则，评估了各原则的成熟度并勾勒出实际部署蓝图。

工业LLM需要持续更新而非从头训练
调查提出以版本化生态系统视角看待持续学习

设备端神经架构搜索

2026-06-25 12:00 UTC+8

本文提出一种在部署设备上直接执行轻量级神经架构搜索（NAS）的方法，以找到最佳的小型神经网络分析传感器实时数据。该方法特别适用于人机界面，可根据用户变化重新设计网络。在意大利手语数据集（ISL）和CWRU数据集上的验证表明，在树莓派4上，该NAS在减少RAM占用的同时提升了准确率。

新方法在设备端直接进行神经架构搜索，实现近传感器计算。
适应个体差异，可针对不同用户重新设计生物特征分析网络。

从元想法到高级数学发现——人类与AI共同发现符号嵌入量子算法

2026-06-25 12:00 UTC+8

一篇新论文展示了人类与AI如何协同工作，将模糊的研究直觉转化为具体的数学发现。该案例研究聚焦于符号嵌入量子算法，这是量子线性代数中的基础原语。AI系统AIM在扩展直觉、比较候选公式和连接已知恒等式方面发挥了关键作用，但最终的科学判断（如选择研究方向、拒绝无效近似、优化实现）始终由人类做出。作者认为，人类-AI共同发现工作流最有价值的是作为研究伙伴，而非独立的定理证明器。

人类直觉认为有理逼近对符号函数等跳跃型函数特别有效，AI帮助将其扩展为符号嵌入量子算法的路线图。
AI系统AIM协助连接了已知矩阵符号恒等式与更广泛的矩阵方程和函数类，并起草了证明和复杂度计算。

退化蒸馏器：自动检测并解析参数退化，大幅降低模拟预算

2026-06-24 12:00 UTC+8

一种名为“退化蒸馏器”的新方法，通过估算和扁平化Fisher信息矩阵，自动从参数-数据对中检测并解析退化参数组合，无需实际观测数据。该方法发现的符号坐标变换能识别对数据产生独立影响的参数组合，全局扁平化Fisher信息，使后续神经后验估计所需的模拟预算减少多达10倍。

退化现象指多个参数或标签产生相似数据，导致标签预测和逆问题求解困难。
退化蒸馏器利用Fisher信息矩阵的估计和扁平化，自动检测和解析退化参数组合。

使用时空图神经网络重建GRACE陆地水储量：南美洲应用

2026-06-24 12:00 UTC+8

本研究提出一种深度学习应用，利用多变量时间序列图神经网络（MTGNN）重建1940年以来的月度GRACE类陆地水储量异常（TWSA）。该方法通过混合邻接矩阵编码空间依赖关系，在南美洲流域实现了0.94的平均相关系数，并成功再现了2015/16年厄尔尼诺和2020/21年拉尼娜事件。与现有方法相比，MTGNN仅需少量预测变量即可达到竞争性性能。

MTGNN架构从城市传感器网络迁移至卫星测地任务，重建GRACE水储量数据至1940年。
混合邻接矩阵结合测地邻近性和气候时间序列滞后相关，捕捉本地和遥相关。

解读3D分子表面指纹以实现精确表位预测

2026-06-24 12:00 UTC+8

分子表面编码了决定抗体-抗原识别的几何和物理化学模式，这对于表位预测至关重要。然而，现有方法依赖于序列或骨架结构，难以捕捉不连续的、表面驱动的表位。本研究提出SurfBind，一种直接作用于分子表面表示的表位预测表面中心学习框架。SurfBind通过基于Transformer的架构集成几何和物理化学线索，包括补丁级表面建模、结合物感知交叉注意力和分层粗到细预测范式。在SAbDab和DB5.5等具有挑战性的表位识别基准上的实验表明，SurfBind达到了最先进的性能，并对未见抗体和构象状态具有良好的泛化能力，突显了交互感知表面建模在理解蛋白质-蛋白质相互作用关键机制中的价值。

现有表位预测方法依赖序列或骨架结构，难以处理不连续表位。
SurfBind直接利用分子表面表示，结合Transformer架构进行预测。

一把尺：对图宾根双变量因果方向的同批重新评估及无参数压缩基线

2026-06-24 12:00 UTC+8

一项新研究对图宾根因果数据集的多种方法进行了统一标准的重新评估，引入了一个零参数的压缩基线，发现各方法性能集中在70%左右，且简单基线表现与最强方法相当，揭示了现有报告准确率被夸大的机制。

研究者使用相同的数据集和协议重新评估了图宾根因果对上的多种因果推断方法。
引入的排序条件压缩基线无需调参，准确率达74.7%，与最强方法持平。

探索双元元学习以增强开放集场景下的域泛化

2026-06-24 12:00 UTC+8

本文提出了一种名为MEDIC的新型元学习策略，通过同时考虑域间和类间的隐式梯度匹配，在开放集域泛化中实现了更优的决策边界平衡，有效解决了传统方法中正负样本不平衡导致的过拒绝问题，并在保持封闭集泛化能力的同时，在开放集场景下超越了现有方法。

开放集域泛化旨在识别未见域中的未知类别，但简单的一对多分类器因样本不平衡导致决策边界偏移。
MEDIC策略通过双元元学习联合域-类匹配，同时优化域间和类间的梯度，找到平衡的决策边界。

物理约束MCMC与化学信息高斯过程协同发现反应网络

2026-06-24 12:00 UTC+8

提出了一种名为PC-MCMC-CIGP的灰箱工作流，整合了尖峰–平板拓扑采样、硬守恒与热力学筛选以及化学信息高斯过程残差模型，用于从稀疏、含噪声的化学时间序列数据中提取可解释的控制方程。在H2+Br2基准测试中，该方法能区分基本自由基路径与欺骗性现象学拟合；在苯乙烯环氧化反应中，优化循环使最终产率比基线提高12.5%。一项10种子采集研究表明，不同采集函数存在权衡：PC-EI可减少低产率贝叶斯优化建议，而EI类准则可获得最强最终产率表现。

PC-MCMC-CIGP将物理约束MCMC与化学信息高斯过程集成，实现反应网络发现。
在H2+Br2基准中成功区分了基本自由基路径。

用于连续控制的具有可训练非线性连接的低功耗模拟神经网络

2026-06-24 12:00 UTC+8

一种新的物理神经网络方法在连接上放置可训练的非线性函数，而非使用标量权重，以更少的节点实现低功耗连续控制任务。该设计在模拟阵列上实现，显示出任务相关的优势，并在CMOS中预计功耗约30微瓦。

受Kolmogorov-Arnold网络启发，在连接上放置可训练的非线性函数。
该网络在机器人运动学、连续控制和光伏最大功率点跟踪等平滑连续目标上表现出色，但在分类决策边界上没有参数效率优势。

联邦因果发现与推理综述

2026-06-24 12:00 UTC+8

本文对联邦因果发现与推理进行了全面综述，提出了多维度分类法，强调了因果结构学习与效应估计在统一流水线中的集成，并讨论了隐私和数据异质性等挑战。

论文使用多维度分类法系统回顾了联邦因果发现（FCD）和联邦因果推理（FCI）。
它从方法论范式、联邦拓扑和结构范围三个轴组织FCD。

离线推理训练的权重空间几何

2026-06-24 12:00 UTC+8

该论文研究了六种离线强化学习损失函数（SFT、RFT、DFT、RIFT、Offline GRPO、DPO）在推理蒸馏中的权重更新几何特性。实验基于Qwen3-4B模型和相同数学数据，发现SFT、RFT和RIFT的权重增量近乎共线，DFT偏离较大，Offline GRPO增加了正交分量，而DPO位于近乎正交的子空间且准确率最高，但存在模式连接障碍。

SFT、RFT和RIFT的权重余弦相似度≥0.97，GSM8K准确率约87-88%。
DFT的更新方向比任何奖励加权方法都更发散。

基于自动流水线搜索的四专家异构混合专家系统的系统探索

2026-06-24 12:00 UTC+8

本文提出了一种自动大规模搜索流水线，用于在LEMUR神经网络数据集生态系统中探索4专家异构混合专家（MoE4）架构。该流水线运行在NVIDIA RTX 4090上，28天内生成4463个候选模型，评估了1021个。发现一个重要覆盖偏差：由于枚举方式，搜索空间锚定在AirNet家族。在AirNet范围内，ShuffleNet和MobileNetV3的组合达到了最高平均准确率0.632。FractalNet和MNASNet被认为是低收益家族。

自动流水线生成4463个MoE4候选模型，评估1021个。
发现搜索空间覆盖偏差，根源在于枚举逻辑锚定AirNet家族。

cAPM：基于主动学习的持续性AI辅助起搏标测

2026-06-19 12:00 UTC+8

室性心动过速是一种危及生命的心律失常。起搏标测用于识别消融靶点。cAPM利用持续学习跨多个VT转移知识，减少所需起搏点。在模拟中，cAPM以4.5个起搏点实现了81%的定位准确率，而现有方法需要13.7个起搏点仅达到38%。

cAPM是一种新型AI起搏标测系统，能够跨多个室性心动过速靶点持续学习。
它使用任务无关的替代神经网络和主动学习策略选择信息量最大的起搏点。

arXiv Machine Learning

最新公开文章

拓扑信息神经网络用于光学与合成孔径雷达影像洪水检测

算法公平性的统计与结构方法

联邦哈希投影潜在因子学习

线索引导的洗钱团伙发现

必要但不充分：温度控制与LLM作为裁判的安全评估可重复性

KG-TRACE：一种用于抗菌素耐药性预测中机械归因的神经符号框架

生成对抗网络的神经架构搜索：综述与批判性分析

强化学习在化学反应网络中的实现：以光趋性作为好奇心驱动的探索

χ-sao：一种通过收敛-反收敛振荡实现多模态黑箱函数的GPU原生并行优化器

物理引导卷积神经网络用于守恒动力学系统中的域长大预测

MacroLens：宏观经济场景下的多任务上下文金融推理基准研究

知识图谱中零样本组合推理的全息记忆机制研究：失败之处与原因剖析

用于分布式能源资源协调的监督强化学习

等变世界模型的共形轨道有效信任视界

守恒定律何时能在学习表示中存活？潜在世界模型的认证视野

二元少样本分类的谱相图：内在维度、几何饱和与表征诊断

LLM进化作为工业级生态系统：持续学习的生命周期视角

设备端神经架构搜索

从元想法到高级数学发现——人类与AI共同发现符号嵌入量子算法

退化蒸馏器：自动检测并解析参数退化，大幅降低模拟预算

使用时空图神经网络重建GRACE陆地水储量：南美洲应用

解读3D分子表面指纹以实现精确表位预测

一把尺：对图宾根双变量因果方向的同批重新评估及无参数压缩基线

探索双元元学习以增强开放集场景下的域泛化

物理约束MCMC与化学信息高斯过程协同发现反应网络

用于连续控制的具有可训练非线性连接的低功耗模拟神经网络

联邦因果发现与推理综述

离线推理训练的权重空间几何

基于自动流水线搜索的四专家异构混合专家系统的系统探索

cAPM：基于主动学习的持续性AI辅助起搏标测

全部来源