谷歌云推出AI威胁防御平台,几分钟内自动修复安全漏洞
谷歌云发布了“AI Threat Defense”平台,能自动发现、评估并修复企业系统中的安全漏洞,整合了部分通过收购获得的技术。
- 谷歌云推出AI威胁防御平台,应对AI加速的网络攻击。
- 平台可自动查找、评估和修补企业安全漏洞。
主题流
融资、并购、产品发布与商业化进展。
谷歌云发布了“AI Threat Defense”平台,能自动发现、评估并修复企业系统中的安全漏洞,整合了部分通过收购获得的技术。
CNN对AI搜索初创公司Perplexity提起诉讼,声称其AI工具生成CNN文章的“逐字”副本,并绕过付费墙向用户提供订阅内容。诉讼指出,Perplexity无视CNN阻止数据抓取的努力,且此前曾尝试与CNN达成授权协议但未能成功。CNN要求赔偿并永久禁止Perplexity的侵权行为。
CNN对AI搜索公司Perplexity提起诉讼,指控其未经授权复制并使用CNN的新闻内容,这是CNN首次采取AI版权行动,也是首家电视网络提起此类诉讼。CNN表示曾试图与Perplexity达成内容许可协议但未成功,现寻求法律赔偿。Perplexity尚未回应。
黄仁勋宣布英伟达将每年在台湾投入1500亿美元建设AI基础设施,尽管此前承诺了5000亿美元美国投资。这凸显了台湾在全球AI芯片制造和封装生态系统中的核心地位。
英伟达CEO黄仁勋计划在台湾投资1500亿美元建设AI基础设施,尽管特朗普政府试图通过关税将芯片制造带回美国。台湾拒绝放弃其半导体主导地位,而美国芯片制造能力不足。
该供应商的增长与企业AI中代理的爆炸性出现同步。
一项由宗教大学联盟进行的研究发现,主要AI模型在回答伦理问题时倾向于世俗理性主义,忽视宗教视角。所有模型对耶和华见证人表现出负面偏见,而对天主教有正面偏见。
Netflix正在建立名为INKubator的新内部工作室,利用AI制作短篇动画内容。该工作室已悄然启动,正在招聘各种职位,包括制片人、软件工程师和CG艺术家。其长期技术战略聚焦于生成式AI工作流程、艺术家工具和可扩展的多节目环境,旨在制作出达到电影品质的内容。目前计划专注于动画短片和特辑,但有迹象表明未来可能扩展到长篇内容。此举可能用于Netflix的Clips功能或儿童节目。然而,AI在动画领域的应用也引发了强烈反弹,包括日本动画大师宫崎骏的批评和动画师工会的抗议。
梵蒂冈新通谕《伟大的人性》捍卫人类不完美作为尊严的来源,并警告将核心人类能力外包给AI的风险,反驳硅谷对人类局限性的轻视。
上个月,在北京半程马拉松中,名为“闪电”的机器人以比人类世界纪录快近七分钟的成绩完赛。这引发人们对机器人是否将像聊天机器人一样进入日常生活的讨论。中国领跑这场变革,政府承诺未来20年投资超1000亿英镑于机器人技术。
第十届ABAW研讨会与竞赛在CVPR 2026上举办,通过引入情感模仿强度估计、矛盾/犹豫识别和细粒度暴力检测等新挑战,以及传统的情感估计和识别任务,推进多模态以人为中心的AI。竞赛利用大规模野外数据集,论文轨道涵盖从姿态估计到公平性和鲁棒性的广泛主题。
大型语言模型(LLM)作为计算社会分析的代理日益普及,但能否忠实再现人类社区的“厚描述”仍是关键挑战。本文提出CARE(社区感知反应评估)框架,通过精细刻画言外语调频谱及其潜在态度,测评LLM模拟话语与真实社区对新闻事件的反应之间的差异。研究发现,使用明确社区提示引导LLM并不能天然提高模拟真实性,前沿模型间存在分歧行为特征,表明当前对齐策略不足以捕捉在线群体的社会语言动态。
现有机器学习遗忘验证仅关注输出级指标,但模型内部表示可能仍保留遗忘数据。RULER提出表示级验证指标M2和M4,实验表明多种近似遗忘方法虽通过输出级评估,但在表示级检测中表现出显著残留。
本文类比生物进化中的物种起源,探讨合成信息的起源问题,提出利用隐写术实现信息血统追踪的机制,以应对AI生成内容难以追溯来源的挑战。
Soro是一系列专为塔吉克语优化的对话大语言模型,基于Gemma 3检查点,通过19亿标记的塔吉克语持续预训练和4万示例的指令微调,显著提升了塔吉克语任务表现,同时保持英语性能。模型支持FP8和INT4量化,适用于边缘部署,已在塔吉克斯坦教育领域试点。
Cognition公司为其AI软件开发工具Devin融资超10亿美元,估值达260亿美元,显示了投资者对AI编程工具的热情,尽管其实际价值仍存争议。
Robinhood 通过 MCP 让客户连接 Anthropic 的 Claude 等 AI 代理,这些代理可以自主交易股票。美国券商监管机构 FINRA 已将其视为新的风险领域,警告不可控的决策。Robinhood 也承认该产品并非适合所有人。
OpenAI和Anthropic的争斗意外地让纽约州议员Alex Bores成为AI安全监管的代言人。尽管背后有超级政治行动委员会投入数百万美元攻击他,Bores却因这些攻击而声名鹊起,目前在初选中领先。
美国情报机构秘密申请 90 亿美元采购英伟达 GB10 超级芯片,以帮助 CIA 和 NSA 追赶 Anthropic、OpenAI 等 AI 巨头的步伐。这笔资金尚待国会批准,同时国防预算已调拨 8 亿美元用于云算力。文章详细介绍了芯片规格、成本以及 AI 硬件竞赛的升级趋势。
英伟达CEO黄仁勋在即将在台湾设立总部的发布会上称该国为AI革命的“中心”。
Robinhood宣布开放其交易平台给AI代理,用户可以创建独立账户并为代理分配资金,让其自动买卖股票。该功能旨在自动化投资决策,但Robinhood发出重大风险警告,称AI驱动策略可能表现不佳,用户可能损失全部投资。此外,Robinhood Gold Card用户可连接AI代理进行信用卡购物。该功能通过MCP协议实现,初期支持股票,未来将扩展至期权、加密货币等。
Sam Altman和Dario Amodei在即将进行数十亿美元IPO之际,收回了他们关于AI导致工作末日的预言。
教皇方济各发布通谕《伟大的人类》,警告人工智能的社会影响,强调AI不是纯粹的技术问题,而是涉及权利、机会和自由。该通谕与Anthropic合作,引发科技界不同反应,有人批评未提及AGI,有人赞赏其关注人类尊严。
随着对AI技术的仇恨情绪上升,美国执法部门开始警告“反科技极端主义”的威胁。然而,专家担心这一概念可能被滥用,将和平抗议者和技术批评者定性为威胁。一例非营利组织的视频被错误标记为潜在威胁,引发了关于言论自由的担忧。
Mr. Guy Invests 是一款面向初学者的免费股票研究与投资组合追踪工具,利用SEC公开数据追踪对冲基金和内幕交易,提供AI股票导师、虚拟交易挑战、每日市场简报等功能。免费版有每日使用限制,Pro版每月4.99美元可解锁无限功能。
AI芯片需求爆涨推动SK海力士和美光市值突破万亿美元,三星也跻身其中,但市场对AI泡沫的担忧加剧。
这项研究在视网膜眼底多病种图像数据集(RFMiD)上对12种架构(包括卷积神经网络、视觉Transformer、混合模型和视觉语言模型)进行了基准测试,比较它们在二元筛查和多标签分类中的性能。结果表明,所有模型在二元筛查中表现良好(AUC>84%),但基于注意力的模型(如SwinTiny、CoAtNet0、MaxViTTiny)在二元和多标签任务中均最优。视觉语言模型与CNN基线相当,但未超越最佳Transformer和混合模型。在Messidor-2上的外部验证中,AUC范围为66.8%-84.7%,混合和Transformer模型表现强劲。
VesselSim提出一个两阶段框架,通过随机几何驱动模拟生成16,500个解剖学合理的3D血管造影体积,并仅用合成数据训练3D U-Net。采用测试时自适应策略弥合域差距,在真实MRI和CT数据集上达到与最先进基础模型竞争的性能,显著减少对专家标注的依赖。
LongAV-Compass是一个系统化基准,用于评估分钟级视听生成任务,涵盖文本到视听、图像到视听和视频到视听三种模态。包含284个测试案例,集成多模态大模型辅助评估和感知指标,评估超过20个细粒度维度。对11个代表性模型的实验揭示了当前系统在长时间生成中的局限性。
RoMo是一个大规模、高质量的人体运动数据集,通过分类感知过滤管道去除静态和伪影序列,采用新颖的三级语义分类体系进行标注,支持细粒度评估,训练模型在保真度和多样性方面达到最先进水平,并发布了Motion Toolbox以标准化指标和数据转换。
本综述首次统一了预训练数据暴露(PDE)框架下的成员推理和数据污染研究,形式化定义了不同暴露水平,回顾了攻击与防御方法,综合了实证发现,并指出了开放挑战和未来方向。
针对时间序列基础模型(TSFMs)在预训练中可能遇到评估数据集导致性能评估过于乐观的问题,本文首次研究了TSFMs的预训练数据污染审计。提出TSFMAudit方法,基于探测适应动态,通过微调探测后污染数据集更快的损失下降和更小的骨干网络移动来检测污染。在6个TSFMs和187个数据集上评估,优于10个基线方法。
当前评估大语言模型(LLM)心智理论(ToM)的方法多依赖最终答案,无法揭示模型是否真正构建了心理状态表征。本研究提出OmniToM基准,通过显式建模故事中所有角色的信念结构来直接评估。基准包含信念提取与信念标注两阶段,采用七维标签体系。基于895个故事和22,343个标注信念命题,借助人类校准的LLM辅助流程构建。零样本评估表明,LLM在将叙事事实转化为角色信念和共享心理状态时存在瓶颈。
约束获取(CA)及相关研究因缺乏适当基准而进展受限。现有基准多为求解器设计,忽视领域知识工件。本文提出MPMMine基准套件,以一致性、标准化、完整性、可扩展性、开放性和版本控制为指导,采用MiniZinc、CommonMark和JSON开放格式,提供多模型、多实例及大量解与非解,并附有自然语言描述,以支持文本到模型方法。
一项新研究质疑大型语言模型是否具有真正的内省能力,认为现有证据可能仅仅是基于表面线索的模式匹配,而非真正的元认知监控。
谷歌最新无屏幕健康追踪器Fitbit Air售价仅100美元,是Whoop的强力竞争对手。经过一周的跑步、力量训练、瑜伽等测试,我们发现这款设备轻便舒适,电池续航约一周,配合AI健康教练提供全面的追踪体验。虽然无屏幕设计减少了干扰,但在运动中查看数据需要打开手机应用。订阅Google Health Premium可解锁AI教练的高级功能。
生成式AI供应商Mistral AI宣布与法律AI初创公司Harvey合作,拓展法律行业应用,此举与Anthropic的法律AI交易类似。
Y Combinator创始人保罗·格雷厄姆表示,他会忽略明显由AI撰写的创始人邮件,因为感觉像被欺骗。作为OpenAI早期投资者,他的反应并不罕见。
据报道,优步在2026年仅用四个月就耗尽了年度AI预算,公司高层质疑投资是否带来实际回报。总裁Andrew Macdonald表示,难以将AI支出与消费者功能改进直接挂钩。
近期大学毕业的毕业生对毕业典礼上鼓吹人工智能的演讲者并不感冒,他们认为这项技术威胁到自己的职业前景。
本文系统综述了自监督学习(SSL)在医学图像分析中的应用,分析了75项研究,将方法分为对比学习、非对比预测学习、生成式重建学习和混合学习四类。研究发现,没有通用的最优SSL策略,性能取决于预文本任务、成像模态和目标任务的对齐。对比学习适合分类,但可能忽略病理细节;生成式方法保留局部解剖结构,适合分割;混合方法性能最平衡。文章还提出了实践设计指南,并指出了开放挑战。
数字人水印面临独特挑战:数字人经常需要经过背景替换、重新构图和格式转换等后处理才能部署。本文提出RAW基准,包含来自5家商业供应商的50个合成数字人视频和6种模拟实际工作流的攻击。评估7种现有方法发现,背景移除等数字人特有攻击会显著降低水印恢复率。提出WALT方法,通过3D人脸重建在UV纹理空间嵌入水印,在缩放攻击下鲁棒性最高(92.4%),背景移除性能也强(95.6%)。该基准已开源以促进数字人水印研究。
Nano World Models 是一个极简代码库,专注于基于扩散强制(diffusion forcing)的未来视频预测。它提供统一的接口,支持生成目标、模型规模、动作条件机制、潜在观测空间、数据集、评估协议和长期推演过程,旨在为世界模型研究提供可重复、可扩展的实验平台。
大型语言模型(LLM)常被用作自动评判者,但研究发现它们存在位置、冗长和风格偏好等偏差。本文提出因果框架,引入一套干预措施和指标,检验LLM评判者是否具备提示不变性,即当非证据性提示被扰动时,其排名和解释是否稳定。实验发现,在标签和安慰剂扰动下,LLM存在显著的提示锚定合理化,而PROOF-BEFORE-PREFERENCE方法能显著改善提示不变性。
Raon-Speech 是一个9B参数的语音语言模型,支持英语和韩语,在语音理解和生成任务上达到顶尖水平,同时保持强大的文本能力。其全双工扩展 Raon-SpeechChat 通过持续训练实现自然的实时对话。所有模型及代码均已开源。
现有蛋白质-配体基准通常评估蛋白质与配体是否相互作用及结合强度,但无法判断模型是否能够定位结合位点或识别分子识别中的非共价相互作用。为此,研究者引入InteractBind,一个包含约10万对蛋白质-配体的大规模数据集及细粒度评估基准,通过六种非共价相互作用类型的残基-原子相互作用图来评估结合位点定位能力。评估八个现有模型发现,尽管二元结合预测表现强劲,但结合位点定位能力有限,且在不同非共价相互作用类型间差异显著。InteractBind鼓励开发更具可解释性和物理基础的蛋白质-配体模型。
本文提出CAFD,一种结合模型信号、距离特征和概念失败比(CFR)的故障检测方法,利用视觉-语言模型提取图像概念,有效提升DNN故障检测性能,在多个基准上平均故障检测率提升18.3%。
专家警告,伪装成地方新闻机构的AI生成新闻网站(即“粉红肉渣”新闻业)已在澳大利亚偏远地区出现,引发对虚假信息和媒体信任度下降的担忧。这些网站背后是一位海外居住的澳大利亚人,他表示这只是一次失败的实验。
随着怀俄明州面临又一个火灾季节,一家位于杰克逊霍尔的公司利用人工智能喷水灭火系统在野火中保护房屋。该系统在加州帕利塞兹火灾中表现出色,61套激活的系统仅损失2套房屋。
教皇利奥十四世在其首份通谕《伟大的人类》中,呼吁监管数字革命,强调人类尊严,为关于人工智能的伦理辩论做出了关键贡献。