Google Pay 为 AI 代理推出通用商务协议 2026-05-28 Google Pay 正在全面升级其支付基础设施,以应对即将到来的 AI 代理交易浪潮。新推出的通用商务协议(UCP)和商家商务平台(MCP)服务器旨在为机器对机器商务创建基于 API 的后端。此次更新还包括动态回调、扩展的 WebView 支持以及跨设备生物识别认证,以解决安全挑战。这标志着向机器驱动经济的转变,企业必须调整其数字存在以适应 AI 代理。
Google Pay 推出通用商务协议(UCP),标准化 AI 代理支付。 新的商家商务平台(MCP)服务器充当中介,聚合交易数据。 AGI时间线随主导实验室变化而波动 2026-05-28 一项新的分析显示,顶级AI预测者正根据当前领先的AI实验室调整对AGI(通用人工智能)时间线的预测。从ChatGPT到xAI、Meta、Gemini,再到Anthropic时代,预测方向多次反转。
多数认知工作被自动化(AGI)的时间预测,随着主导AI实验室的更替而大幅波动。 2023-2025年间,多数研究者将AGI预测时间提前;2025-2026年则普遍推迟;2026年初至今,在Anthropic快速进展下又再次提前。 借助AI成为更好的设计师:成为数字囤积者 2026-05-28 文章以Google Gemini Omni模型为引,指出AI设计工具因缺乏审美引导导致输出同质化(“AI垃圾”),并提出解决方案:通过持续收集视觉参考(“数字囤积”)培养个人品味,并将其编码为AI可理解的格式,从而引导模型产出独特且具有品味的设计。
Google推出Gemini Omni模型,标志着AI从纯文本向多模态推理转变,但当前多数AI设计工具仍局限于文本输入,导致输出千篇一律。 要摆脱“AI垃圾”,设计师需要培养品味,并将品味通过视觉参考库(数字囤积)编码,让模型能够模仿。 我是iPhone用户,但Gemini搭配Android Auto在车里比Siri好用 - 原因在这里 2026-05-28 作为一名iPhone用户,作者通常在开车时使用Siri和CarPlay,但尝试了Android Auto上的Gemini后,发现Gemini能处理更多任务,包括发送邮件、获取餐厅信息、玩游戏等,且设置简单。作者认为Gemini是更一站式的人工智能助手。
作者是iPhone用户,但认为Gemini搭配Android Auto在车里比Siri更好用。 Gemini可以处理从基本指令到复杂交互的各种任务,如发送邮件、获取本地信息等。 Mistral 将 LeChat 更名为 Vibe,押注聊天机器人的未来是全能工作代理 2026-05-28 Mistral AI 将其聊天机器人 Le Chat 更名为 Vibe,并将聊天、编程代理和新的工作模式整合在一个品牌下。工作模式可接入 Google Workspace、Outlook、Slack 或 GitHub,独立处理电子邮件、报告或拉取请求等任务。Pro 套餐价格从 17.99 欧元降至 14.99 欧元,但未明确使用限制。此举直接对标 OpenAI、Google 和 Anthropic 的代理型产品。
Mistral AI 将聊天机器人 Le Chat 更名为 Vibe,整合聊天、编程代理和工作模式。 工作模式可连接 Google Workspace、Outlook、Slack 或 GitHub,自主处理任务。 你的AI助手已经忘记了你告诉它的一半内容 2026-05-28 本文是AI驱动开发系列文章的第七篇,重点讨论AI会话中的上下文管理。作者通过个人经历(Gemini移动应用忘记之前记录的笔记)引出上下文压缩问题,并分享了四种实用技巧:将探索与文档编写分离、使用交接文档而非延续提示、给AI设定验收标准而非详细步骤、以及使用规范文档作为不同AI工具之间的桥梁。这些技巧适用于从编程到写作的各种AI使用场景。
AI助手在长对话中会因上下文窗口限制而“忘记”早期信息,这种现象称为上下文压缩。 四种实用技巧:分离探索与文档编写、使用交接文档、设定验收标准、使用规范文档作为桥梁。 Money Printer Pro —— 开源 AI 内容生成器 2026-05-28 Money Printer Pro 是一个基于 Google Gemini 和 VEO 3.1 的开源 AI 内容生成器,可创建逼真的图像和电影级视频,并保持身份一致性。它拥有 7 个视觉引擎、自动批量生成、AI 质量评分和发布把关功能,用户直接向 Google 付费,无需额外订阅。
支持图像和视频生成,包括多镜头视频序列。 身份锁定引擎确保同一人物在不同生成中面部一致。 前谷歌和苹果研究员创立初创公司,为AI打造缺失的“反馈流” 2026-05-28 一群前谷歌DeepMind、苹果、OpenAI和Meta的研究员成立了新创公司Trajectory,旨在帮助企业通过真实用户交互持续改进AI产品。Trajectory旨在构建一个平台,让AI能够在部署后持续学习,而不是在训练完成后停滞不前。该公司已获得1500万美元种子轮融资,估值1.15亿美元,由Conviction领投。其CEO Ronak Malde表示,AI编程产品如Cursor已在实践早期版本的持续学习,Trajectory希望将类似技术扩展到更多领域。
Trajectory由前谷歌DeepMind、苹果、OpenAI和Meta的研究员创立,旨在实现AI的持续学习。 公司已融资1500万美元,估值1.15亿美元,投资者包括Jeff Dean和Fei-Fei Li。 弥合稳定性与表现力之间的鸿沟:面向低资源口语模型的合成数据扩展与偏好对齐 2026-05-28 研究人员发现,在低资源语言的口语模型中使用合成数据会导致“稳定性-表现力鸿沟”,并提出两种自对齐框架(DGSA和TDSC),能够恢复韵律变异性,超越ElevenLabs和Gemini Pro等商业系统,实现老挝语的首次零样本人声克隆。
低资源语言的口语模型在合成数据训练时面临音素准确度与韵律表现力之间的权衡。 提出的解耦引导自对齐(DGSA)通过分离韵律和音色来恢复表现力。 我用这个免费应用深入挖掘Oura Ring数据——发现如下 2026-05-28 Simple Wearable Report利用AI从Oura Ring数据中提取更多见解。本文介绍了作者如何使用它,以及它如何与Gemini等AI工具配合提供详细分析。
Simple Wearable Report能将Oura数据转化为实验室风格报告,便于医生查看或上传至AI聊天机器人。 与Oura内置AI顾问相比,Gemini等工具提供更具体、量化的数据分析。 Google将展示广告整合到AI优先的需求生成平台 2026-05-27 Google宣布将其展示广告(Display Ads)整合到AI驱动的需求生成(Demand Gen)平台中,标志着传统数字广告模式的终结。这一变化要求营销团队放弃手动广告控制,转向依赖Google AI进行自动化的广告创意组合、投放和优化。同时,传统指标如点击率(CTR)和每次点击成本(CPC)的重要性下降,广告主需关注更广泛的业务成果。
Google将展示广告(GDN)整合到AI驱动的需求生成平台,结束近二十年的传统广告模式。 广告主不再手动选择网站或调整受众,而是提供创意素材,由AI自动测试并优化组合。 我的眼科医生开错了电脑验光处方,AI帮我修正了 2026-05-27 一位患者的验光医生给出了错误且不合适的电脑眼镜处方,导致无法正常使用电脑。借助ChatGPT、Claude和Gemini等AI工具,他重新计算了适配其实际用眼距离的处方,并成功配镜。故事警示患者需与医生充分沟通,同时展示了AI在特定场景下的辅助能力。
医生给患者开具了基于错误距离的电脑眼镜处方,原处方实际为阅读距离。 通过ChatGPT、Claude和Gemini三个AI分析,一致指出问题并给出修正数值。 上周AI资讯#341 - 马斯克败诉OpenAI,Google IO更新,OpenAI解决埃尔德什问题 2026-05-27 本周AI头条:马斯克对OpenAI的1500亿美元诉讼被驳回;Google I/O 2026发布多项AI更新,包括Gemini 3.5 Flash和Gemini Spark;OpenAI的AI解决了一个80年历史的数学问题;美国《Take It Down Act》生效,要求平台48小时内删除深度伪造内容;SpaceX IPO后计划以600亿美元收购AI编码初创公司Cursor。
马斯克对OpenAI的1500亿美元诉讼被陪审团驳回,OpenAI准备IPO。 Google I/O 2026推出Gemini 3.5 Flash、Gemini Spark、Gemini Omni等重大AI更新。 Crew44:将编程智能体转变为专业团队 2026-05-27 Crew44 是一款本地优先的开源工具,可将多个 AI 编程智能体(如 Claude Code、Codex、Gemini、Cursor)组织成协同工作的专业团队。无需账户、免费、MIT 许可,支持记忆与技能积累。
Crew44 将多个 AI 编程智能体整合到一个本地工作区,形成协同团队。 支持创建专家角色(如联合创始人、工程师、产品主管),并为每个角色绑定合适的运行时/模型。 AI代理马具:将LLM转变为数字工人的粘合剂 2026-05-27 AI模型在原始智能方面似乎已达到平台期,下一阶段的进步来自于围绕模型构建的“代理马具”。本文介绍了代理马具的概念,包括工具、记忆和人类参与,并比较了Google、LangChain、OpenAI、Anthropic等公司的解决方案。
AI模型智能提升放缓,代理马具成为新焦点。 代理马具为LLM提供工具、记忆和纠错能力。 我佩戴了谷歌的Fitbit Air进行一周健康追踪——它是一款价格更低的Whoop强劲对手 2026-05-27 谷歌最新无屏幕健康追踪器Fitbit Air售价仅100美元,是Whoop的强力竞争对手。经过一周的跑步、力量训练、瑜伽等测试,我们发现这款设备轻便舒适,电池续航约一周,配合AI健康教练提供全面的追踪体验。虽然无屏幕设计减少了干扰,但在运动中查看数据需要打开手机应用。订阅Google Health Premium可解锁AI教练的高级功能。
Fitbit Air售价100美元,比Whoop更实惠。 无屏幕设计促进更健康的追踪习惯,但运动中查看数据不便。 AI周刊第496期:Anthropic的国防级模型现已全民可用 2026-05-27 本周AI新闻要点:Anthropic公开了此前仅限国防承包商使用的顶级模型Mythos,使五角大楼级AI能力向开发者开放;DeepMind CEO哈萨比斯将AGI时间线提前至2029年;Starlette框架爆出严重认证绕过漏洞,影响数百万AI代理;CrowdStrike等联合摧毁Glassworm僵尸网络;法国巴黎银行与Mistral达成主权AI安全合作;中国限制阿里和深度求索顶尖AI工程师出境;Uber AI预算超支、ClickUp裁员并引入数千AI代理,同时MIT技术评论数据显示AI暴露岗位失业率更低,奥特曼撤回白领失业预言。
Anthropic发布Mythos模型,原本仅限NSA和五角大楼使用,现可通过标准API访问。 深度思维CEO哈萨比斯将AGI实现时间从5-10年缩短至2029年。 Zero.xyz:让你的AI代理访问超过4000种工具、API和服务 2026-05-26 Zero.xyz是一个免费工具,能让AI代理通过统一API访问超过4000种工具和服务,无需配置API密钥。它兼容Claude Code、Codex、Gemini等多种CLI代理,并提供5美元免费额度。
Zero.xyz提供超过4000种工具和服务的统一访问接口 无需API密钥或配置,简化AI代理的操作流程 关于接下来会发生什么的一些想法,2026年5月 2026-05-26 2026年AI领域将继续快速发展,开源模型在智能体能力上仍落后于闭源模型,谷歌的Gemini尚未对Claude Code和Codex构成有力竞争,美国开源模型正在崛起,Anthropic与OpenAI竞争激烈,现有权力结构开始介入AI发展。
开源模型在智能体能力上落后闭源模型约12个月。 谷歌Gemini在智能体工具方面无明显竞争优势。 桑达尔·皮查伊谈AI、搜索未来及网络变革 2026-05-26 在Google I/O大会后的Decoder访谈中,CEO桑达尔·皮查伊深入讨论了Google的AI优先转型、搜索的剧变、与出版商的紧张关系以及对AGI的展望。
Google合并Brain和DeepMind为Google DeepMind,并集中AI基础设施团队。 搜索体验引入AI概览和Gemini Spark代理平台,从根本上改变信息获取方式。 序列知识 #866:你需要了解的三款文本扩散模型 2026-05-26 文本扩散模型挑战了传统自回归语言生成范式,将生成过程视为从噪声或掩码开始、逐步精炼的编辑过程。文章介绍了该领域的三个关键系统:LLaDA(证明扩散可扩展为大型语言模型)、Mercury(实现商业速度优势)和Gemini Diffusion(前沿验证),它们共同代表了新架构类的三阶段:科学证明、工业部署和前沿验证。
文本扩散模型通过迭代去噪而非逐词生成文本,利用双向上下文。 LLaDA证明了扩散模型可以扩展到真正的大语言模型规模。 留给人类数学家的悬赏不多了!谷歌DeepMind一口气解决9道埃尔德什问题 2026-05-26 谷歌DeepMind发布AlphaProof Nexus,基于Gemini 3.1 Pro和Lean编译器,一口气解决了9道埃尔德什开放问题,另有44个OEIS猜想、一道15年代数几何难题等,每道题成本仅几百美元。
AlphaProof Nexus解决了9道埃尔德什问题,其中最长悬置56年。 系统由四个智能体组成,最简单版本仅靠大模型加编译器反馈就完成任务。 LWiAI 播客 #246:Gemini 3.5 + Omni、马斯克败诉、OpenAI 对决 Erdős 2026-05-26 谷歌在 I/O 大会上推出 Gemini 3.5 和 Gemini Spark 智能体,以及 Gemini Omni 多模态视频生成;埃隆·马斯克因诉讼时效问题输掉对 OpenAI 的诉讼;Anthropic 以 9000 亿美元估值融资 300 亿美元;AI 解决了 80 年历史的 Erdős 几何问题。
谷歌发布 Gemini 3.5 和持续运行的智能体 Gemini Spark,支持 MCP 工具。 Gemini Omni 可将图像、音频和文本转换为视频。 ContextVault – 适用于ChatGPT、Claude、Gemini的本地优先AI对话记录器 2026-05-26 ContextVault是一款浏览器扩展,可在所有主要LLM平台(如ChatGPT、Claude和Gemini)上实时捕获AI对话,并将其本地存储在IndexedDB中。支持一键导出为Markdown或ZIP格式,确保您的对话数据不会离开您的设备。该工具免费、开源,无需账户或后端,注重隐私。
实时捕获来自ChatGPT、Claude、Gemini等7个LLM平台的AI对话。 所有数据本地存储在IndexedDB中,无云端同步或第三方访问。 谷歌Deepmind的AlphaProof Nexus仅花几百美元就解决了几十年未解的数学难题 2026-05-25 谷歌Deepmind的AlphaProof Nexus系统自主解决了九个开放的爱尔迪什问题,包括两个困扰数学家56年的难题,每个问题的推理成本仅需几百美元。与OpenAI的自然语言方法不同,该系统使用Lean编译器自动验证每一步证明。不过,整体成功率仅为2.5%。
AlphaProof Nexus自主解决了九个开放的爱尔迪什问题,其中两个已存在56年。 每个问题的推理成本仅为几百美元。 HTML Deployer:一键将AI生成的HTML转化为在线网站 2026-05-25 HTML Deployer是一款Chrome扩展,可从ChatGPT、Claude和Gemini中提取AI生成的HTML,并提供预览、下载ZIP或直接发布到Netlify、GitHub、FTP或自托管服务器的功能。适合开发者、创始人、营销人员、机构和初学者。
支持从ChatGPT、Claude和Gemini提取HTML代码块。 提供预览、ZIP导出和直接发布到云存储、FTP或自托管服务器。 我看到了Android Auto的未来,现在Google让我对自己的车感到恐惧 2026-05-25 Google即将推出的Android Auto更新带来了重新设计的界面,采用Material 3 Expressive设计、自定义小部件、沉浸式导航以及更深入的Gemini集成。作者的演示让他印象深刻,并期待今年晚些时候的更新。
新的Android Auto界面采用Material 3 Expressive设计,具有三面板布局和自定义小部件。 Google Maps获得沉浸式导航,显示详细的3D建筑和地形。 Google Antigravity 2.0:完整开发者指南(I/O 2026) 2026-05-25 Google 在 I/O 2026 上发布了 Antigravity 2.0,这是一次从 AI 辅助编码到多智能体编排的平台级转变。新版本包括独立桌面应用、CLI、SDK 和托管智能体,默认使用 Gemini 3.5 Flash,速度提升 4 倍。
Antigravity 2.0 是一个全新的平台,专注于多智能体编排,而非简单的 IDE 更新。 新功能包括独立桌面应用、Go 语言编写的 CLI、SDK 以及通过 Gemini API 提供的托管智能体。 AI模型常给出正确答案却指向错误来源 2026-05-25 北京大学研究人员发现,像GPT和Gemini这样的领先AI模型在文档分析中经常引用不支持的文本段落,即使答案正确,引用的证据也常常错误。他们称之为“归因幻觉”,对法律和医学等监管领域构成风险。新的CiteVQA基准是首个系统测试该问题的工具。
AI模型在文档分析中常引用不支持的证据,导致“归因幻觉” 即使答案正确,引用的文本段落也常错误 AI能猜出你知道什么?大型语言模型从沟通日志中评估人类领域知识的性能比较 2026-05-25 研究评估了七个大型语言模型(包括Gemini、Claude和GPT系列)从长期Slack日志中推断个人领域知识的能力。分析27,188条来自43名用户的消息,对比零样本估计与27名参与者的自我报告技能评分。Gemini 2.5 Flash表现最佳(MAE 21.13%),而GPT模型误差较大。研究发现,估计准确性仅微弱依赖于消息数量,表明更多文本并不能保证更好的推断。该结果展示了自动专业知识映射的可行性和当前局限性,强调需要隐私保护部署和更丰富的结构感知知识表示。
员工常难以识别“谁知道什么”,导致组织效率损失 Gemini 2.5 Flash在零样本评估中取得最低误差(MAE 21.13%) Show HN:实时AI音乐序列代理 2026-05-25 Pretzel 是一个实验性的实时AI音乐代理,通过一个网络同步的音乐序列生成器,让所有用户与同一AI代理聊天并听到相同的音乐。该项目在Google IO黑客松中诞生,旨在让用户表达情绪并实时更新音乐。
Pretzel 是一个由AI控制的网络同步音乐序列生成器。 所有用户与同一AI代理互动,听到相同的音乐。 Deepmind的哈萨比斯认为人类处于“奇点山麓”,而LeCun称当前AI并不智能 2026-05-24 Yann LeCun认为当前AI系统并非真正智能。Demis Hassabis则认为人类已“站在奇点的山麓”。Gemini联合负责人Oriol Vinyals则持折中观点:今天的模型在七年前看起来像是AGI,但它们仍无法从经验中学习或产生真正的突破。
Yann LeCun表示当前AI系统没有真正的智能。 Demis Hassabis认为人类已进入奇点时代的初期。 The Sequence Radar #865:上周AI回顾:Karpathy、Google、Colossus与即将到来的IPO浪潮 2026-05-24 上周AI领域迎来重大转折:Google发布Gemini Omni及代理优先平台;Andrej Karpathy加入Anthropic,专注于利用Claude加速预训练研究;Anthropic与xAI达成价值450亿美元的Colossus算力租赁协议;Cerebras IPO成功,市值近950亿美元;SpaceX、OpenAI和Anthropic计划在未来六个月内相继上市,总估值可能超过3万亿美元。此外,多项前沿研究发布,包括HRM-Text高效预训练范式、AI评审员效果评估、NVIDIA的联合AR-扩散模型等。
Google在I/O大会上推出Gemini Omni多模态模型和代理优先平台Antigravity,整合TPU 8i实现垂直集成。 Andrej Karpathy加入Anthropic,组建团队利用Claude加速预训练研究,标志着自我改进循环的实质性进展。 为什么不应在Copilot、Gemini等AI工具中使用默认模型选择 2026-05-24 数学家Adam Kucharski向Microsoft Copilot提供了完全相同的数据集,仅更改国家标签,结果Copilot生成了详细的刻板印象而非准确结果。思考模型能够识别这种错误,但需要用户主动选择。
Microsoft Copilot在分析数据时会凭空捏造国家差异,输出刻板印象。 思考模型能识别这种把戏,但用户需知道何时切换模型。 OpenAI 和 Nvidia 正在使用 Google 的 SynthID 为 AI 内容添加水印 2026-05-24 Google 的 SynthID 水印系统正被 OpenAI、Nvidia、ElevenLabs 和 Kakao 采用,标志着 AI 内容检测向共享行业标准转变。
SynthID 直接将水印嵌入像素和音频波形,使其比元数据更难移除。 OpenAI、Nvidia、ElevenLabs 和 Kakao 现在将 SynthID 用于其图像、视频和语音生成工具。 加强新加坡的AI未来:新的国家合作伙伴关系 2026-05-23 Google DeepMind宣布与新加坡政府及多家机构建立新的国家AI合作伙伴关系,重点推动医疗、教育、科学和可持续发展领域的负责任AI应用,预计到2040年将带来33亿新元的经济价值。
合作涵盖公共部门转型、企业增长和劳动力培训,聚焦医疗、科学发现和教育。 具体项目包括AI临床辅助研究、大流行病防范、为盲人运动员开发的跑步助手,以及教育领域的Gemini应用。 回顾Google I/O 2026的对话舞台 2026-05-22 在今年的I/O大会上,对话舞台汇聚了谷歌领导者、科学家和创意先驱,共同探讨人工智能、量子计算、机器人技术和创造力等领域的突破性进展。
谷歌CEO桑达尔·皮查伊与未来前进创始人马特·伯曼对话,解读I/O重大公告。 谷歌团队与Logan Kilpatrick讨论AI代理如何改变生产力。 Nota:AI 笔记与语音应用正式发布 2026-05-22 Nota 是一款全新的 AI 笔记应用,支持语音、扫描、涂鸦和文本输入,可在 iPhone、iPad、Mac 和 Apple Watch 上使用。它提供 45 种语言的语音转录,用户可自由选择 OpenAI、Claude、Gemini 等 AI 模型,并且注重隐私和本地优先。免费版即可使用无限本地笔记。
支持四种输入方式:语音、扫描、涂鸦和文本 语音转录覆盖 45 种语言 微软发布Fara1.5:浏览器计算机使用代理家族(4B/9B/27B)在Online-Mind2Web上超越OpenAI Operator和Gemini 2.5计算机使用 2026-05-22 微软研究院发布了Fara1.5,这是一个浏览器计算机使用代理模型家族,包括4B、9B和27B三种规模。其中Fara1.5-27B在Online-Mind2Web基准测试中达到72%的任务成功率,超过了OpenAI Operator(58.3%)和Gemini 2.5 Computer Use(57.3%)。该发布还包含了FaraGen1.5,一个用于生成训练轨迹的合成数据流水线。
Fara1.5是微软研究院推出的浏览器计算机使用代理模型,基于Qwen3.5,有4B、9B和27B三种参数规模。 Fara1.5-27B在Online-Mind2Web上取得72%的分数,领先于OpenAI Operator和Gemini 2.5 Computer Use。 使用OpenMythos构建循环深度Transformer:MLA、GQA、稀疏MoE与循环缩放推理 2026-05-22 本教程介绍如何利用OpenMythos库在Google Colab中构建端到端的循环深度Transformer工作流。我们创建了MLA和GQA两种注意力变体,比较参数量,并通过谱半径检查循环注入矩阵的稳定性。在合成组合推理任务(预测数字链模固定值的和)上训练模型,研究循环循环如何使单一模型重用参数进行更深层次的计算。最终展示在推理时增加循环次数如何在不改变参数的情况下提升推理深度。
使用OpenMythos构建支持MLA和GQA的循环深度Transformer,并比较参数量。 通过谱半径验证循环注入矩阵的稳定性。 AI基础设施新独角兽:Exa、Modal、TurboPuffer融资动态 2026-05-22 本周AI新闻相对平静,但基础设施领域迎来重大融资:TurboPuffer实现1亿美元ARR且盈利;Exa以22亿美元估值融资2.5亿美元;Modal以47亿美元估值融资3.55亿美元。其他亮点包括RAEv2表示学习框架、Gated DeltaNet-2注意力机制、以及Codex和Gemini的智能体工具更新。
TurboPuffer达到1亿美元ARR并实现盈利;Exa和Modal完成大规模融资。 新模型架构如RAEv2和Gated DeltaNet-2在收敛速度和长上下文检索方面表现出色。 Google I/O 2026 重大发布:AI 代理进入搜索,全新模型与工具亮相 2026-05-21 Google I/O 2026 展示了从回答型AI到行动型AI的转变,AI代理进入搜索,推出Gemini 3.5 Flash、个人代理Spark、视频生成模型Omni,以及大量开发者工具。
Google 搜索引入 AI 代理,可执行购物、编码、提醒等任务 Gemini 3.5 Flash 成为默认模型,速度快 4 倍,专注于代理和编码 Gembokwarkop:Base64-Vigenere 与人工智能的对决 2026-05-21 一个名为 Gembokwarkop 的项目将 Base64 编码与 Vigenere 密码结合,形成一种“日常使用”的加密方案。作者测试了 ChatGPT、Gemini 和 Claude 等 AI 模型,结果从无法破解到完全胡编乱造,展现了 AI 在密码分析上的有趣局限。
方案:先 Base64 编码,再 Vigenere 密码加密。 ChatGPT 承认其弱点但无法在没有密钥的情况下解密。 千问3.7问鼎国产模型冠军,全球前五 2026-05-21 Artificial Analysis最新榜单显示,阿里Qwen3.7-Max以56.6分位列全球第五、国产第一,性能接近GPT、Claude、Gemini最强模型。该模型专为Agent设计,在编程、智能体、推理等核心能力上实现大幅突破,即将上线阿里云百炼提供API服务。
Qwen3.7-Max在Artificial Analysis榜单得分56.6,全球第五、国产第一 性能逼近GPT-5.4、Gemini3.1 Pro Preview、Claude-Opus4.7 Show HN:Gemini Omni Flash 使用说明和AI视频生成器 2026-05-21 Gemini Omni Flash 的可用性取决于 Google AI 计划、地区和账户状态。如果无法访问,建议比较其他 AI 视频生成工具。
Gemini Omni Flash 的可用性因 Google AI 计划、区域和账户状态而异。 免费积分可能无法解锁所有视频模型。 【AINews】OpenAI GPT-next 花不到1000美元推翻80年历史的Erdős平面单位距离问题 2026-05-21 今日AI新闻汇总:OpenAI的通用推理模型在不到1000美元的成本下推翻了著名的Erdős平面单位距离问题,获得数学家高度认可;Cohere发布Command A+开源模型,采用Apache 2.0许可;Google推出Gemini 3.5 Flash和Omni等多款更新;多项基准测试显示当前AI代理在复杂工程任务中仍表现不佳。
OpenAI内部模型以低于1000美元的计算成本否定了Erdős平面单位距离问题,这是通用AI解决公开数学难题的里程碑。 Cohere发布Command A+作为Apache 2.0开源模型,约218B MoE参数,可在2×H100上运行。 唯唯诺诺综合征:具身机器人代理中的弃权行为基准测试 2026-05-21 视觉语言模型(VLM)被用作具身代理的高层规划器,但它们在面对模糊、不可行或基于错误前提的指令时往往无法弃权。新提出的RoboAbstention基准框架基于五个机器人数据集的图像生成了6,069条可验证指令,评估发现即使是最先进的模型也表现不佳:Gemini 2.5 Flash仅在39.0%的指令中正确弃权,而具身规划器Gemini Robotics ER 1.6 Preview仅16.5%。防御性提示和上下文学习可将弃权率提升至93.6%以上,但仍未完全解决该问题。
VLM作为机器人规划器时,缺乏对模糊或不可行指令的弃权能力。 RoboAbstention通过结构化视觉基础、确定性约束推导和模板生成,构建了包含6,069条可验证指令的数据集。 Google AI Pro订阅计划悄然降级 2026-05-21 谷歌悄悄将每月20美元的Google AI Pro计划从固定消息限制改为基于积分的配额系统。用户反映,复杂提示词单次即可消耗13%至30%的配额,引发不满。新限制适用于所有Gemini功能,包括谷歌相册等服务,可能促使重度用户转向新的每月100美元的Ultra计划。
Google AI Pro计划改用基于积分的配额系统,不再有固定消息限制。 复杂提示词和AI工具会消耗大量可用配额。 谷歌希望搜索栏在人工智能改造中代表你行事 2026-05-20 谷歌在年度开发者大会上宣布,其搜索栏将升级为AI代理,可代表用户预订餐厅、追踪新闻和管理购物清单。同时推出Gemini Spark个人AI助手和最新的Gemini 3.5 Flash模型。这些功能可能影响新闻网站的流量和收入。
谷歌搜索将内置始终在线的AI代理,可代表用户执行任务。 Gemini Spark个人AI助手面向高端订阅者,下周在美国上线。 “解决所有疾病”,你说呢? 2026-05-20 谷歌DeepMind首席执行官在Google I/O上声称要“解决所有疾病”,引发了对AI在医疗领域作用的讨论。本文分析了这一雄心背后的现实,包括AlphaFold和AlphaGenome等工具的潜力与局限,以及公众对AI健康声明的误解风险。
Demis Hassabis在Google I/O上宣布Gemini for Science,旨在加速药物发现,最终解决所有疾病。 AI在医疗研究中的应用历史悠久,但重大突破需要时间,通常需20年或更久。