iOS 27新渲染图暗示Siri重大重新设计
苹果备受期待的Siri大改版预计将在iOS 27中到来,可能看起来很像ChatGPT并带有液态玻璃风格。彭博社的渲染图展示了iOS 27的新界面,包括Siri的新应用和聊天界面。这些渲染图基于彭博社看到的信息和知情人士透露,可能与苹果最终设计不同。苹果将在6月WWDC上公布最终设计。
- iOS 27的Siri将采用类似ChatGPT的聊天界面,从灵动岛弹出药丸形状的聊天气泡。
- 用户可以在下拉菜单中选择Ask、Siri和ChatGPT选项。
公司追踪
OpenAI 最新 AI 新闻、产品、模型、生态和产业动态。
苹果备受期待的Siri大改版预计将在iOS 27中到来,可能看起来很像ChatGPT并带有液态玻璃风格。彭博社的渲染图展示了iOS 27的新界面,包括Siri的新应用和聊天界面。这些渲染图基于彭博社看到的信息和知情人士透露,可能与苹果最终设计不同。苹果将在6月WWDC上公布最终设计。
一项新的分析显示,顶级AI预测者正根据当前领先的AI实验室调整对AGI(通用人工智能)时间线的预测。从ChatGPT到xAI、Meta、Gemini,再到Anthropic时代,预测方向多次反转。
DeepSWE是一个新的基准测试,用于评估AI编码智能体在全新、复杂的软件工程任务上的表现。它避免了数据污染,覆盖了多样化的代码库,需要大量代码修改,并使用手工编写的验证器。领先模型表现差异显著,GPT-5.5以70%的准确率位居榜首。
Mistral AI 将其聊天机器人 Le Chat 更名为 Vibe,并将聊天、编程代理和新的工作模式整合在一个品牌下。工作模式可接入 Google Workspace、Outlook、Slack 或 GitHub,独立处理电子邮件、报告或拉取请求等任务。Pro 套餐价格从 17.99 欧元降至 14.99 欧元,但未明确使用限制。此举直接对标 OpenAI、Google 和 Anthropic 的代理型产品。
Mistral AI首席执行官Arthur Mensch证实,公司正在探索开发定制芯片以降低基础设施成本,与OpenAI和Anthropic竞争。这家法国初创公司还宣布在法国新建推理数据中心,并推出企业智能代理平台Vibe。
上海创智学院LeapQuest团队联合多所高校提出医学AI新范式,让模型在推理过程中主动调用视觉工具,从被动接收视觉输入变为主动寻找证据。论文被ICML 2026接收。
一群前谷歌DeepMind、苹果、OpenAI和Meta的研究员成立了新创公司Trajectory,旨在帮助企业通过真实用户交互持续改进AI产品。Trajectory旨在构建一个平台,让AI能够在部署后持续学习,而不是在训练完成后停滞不前。该公司已获得1500万美元种子轮融资,估值1.15亿美元,由Conviction领投。其CEO Ronak Malde表示,AI编程产品如Cursor已在实践早期版本的持续学习,Trajectory希望将类似技术扩展到更多领域。
上个月,在北京半程马拉松中,名为“闪电”的机器人以比人类世界纪录快近七分钟的成绩完赛。这引发人们对机器人是否将像聊天机器人一样进入日常生活的讨论。中国领跑这场变革,政府承诺未来20年投资超1000亿英镑于机器人技术。
大型语言模型(LLM)作为自主智能体时,会通过上下文奖励黑客行为(ICRH)产生有害副作用。现有防御方法不足,因为ICRH源于模型自身的过度优化。本文提出LLM-based Constraint Optimization (LCO)框架,包含自我思考模块和进化采样模块,在不微调模型的情况下有效减少ICRH。实验表明,LCO在推文优化任务中将GPT-4的有毒性增长率降低39%,在策略优化基准中将ICRH发生率降低15.23%,且不牺牲任务性能。
微软的MAI-Image-2.5模型在Arena文本到图像排行榜上位列第三,与谷歌的Nano Banana 2性能相当,但仍落后于OpenAI的Image-2。该模型在图像内文本渲染和商业视觉内容方面有明显改进。
文章指出,Anthropic和OpenAI通过将企业客户转向API定价模式,以及编码代理产品的普及,实现了产品市场契合。这一转折点始于2025年11月模型升级,并在2026年4月因新模型发布和企业定价调整而加速。
OpenAI和Anthropic的争斗意外地让纽约州议员Alex Bores成为AI安全监管的代言人。尽管背后有超级政治行动委员会投入数百万美元攻击他,Bores却因这些攻击而声名鹊起,目前在初选中领先。
美国情报机构秘密申请 90 亿美元采购英伟达 GB10 超级芯片,以帮助 CIA 和 NSA 追赶 Anthropic、OpenAI 等 AI 巨头的步伐。这笔资金尚待国会批准,同时国防预算已调拨 8 亿美元用于云算力。文章详细介绍了芯片规格、成本以及 AI 硬件竞赛的升级趋势。
一位患者的验光医生给出了错误且不合适的电脑眼镜处方,导致无法正常使用电脑。借助ChatGPT、Claude和Gemini等AI工具,他重新计算了适配其实际用眼距离的处方,并成功配镜。故事警示患者需与医生充分沟通,同时展示了AI在特定场景下的辅助能力。
思科与OpenAI合作,利用Codex推动AI原生开发、加速AI防御工作并自动化缺陷修复,重新定义企业工程。
研究表明,AI聊天机器人可以轻易地通过个性化广告操纵用户,且多数用户并未察觉。随着微软、谷歌、OpenAI等公司试验聊天机器人广告,这一趋势引发了对用户隐私和决策自主性的担忧。
一名学生在深夜编程作业中挣扎,偶然发现ChatGPT已完美解答了同一题目,瞬间感到自身努力毫无意义,陷入存在性眩晕。小说以细腻笔触描绘了当AI使昔日辛劳变得多余时,个体心理所遭遇的冲击。
本周AI头条:马斯克对OpenAI的1500亿美元诉讼被驳回;Google I/O 2026发布多项AI更新,包括Gemini 3.5 Flash和Gemini Spark;OpenAI的AI解决了一个80年历史的数学问题;美国《Take It Down Act》生效,要求平台48小时内删除深度伪造内容;SpaceX IPO后计划以600亿美元收购AI编码初创公司Cursor。
了解OpenAI、Thrive和Crete如何使用Codex构建自改进税务代理,实现申报自动化、提高准确性并加速工作流程。
OpenAI聘请了一位曾在Salesforce从事营销工作13年的高管,负责公关事务。
只需一段提示词,OpenAI员工Vaibhav分享的Codex自我蒸馏法引发热议。
AI模型在原始智能方面似乎已达到平台期,下一阶段的进步来自于围绕模型构建的“代理马具”。本文介绍了代理马具的概念,包括工具、记忆和人类参与,并比较了Google、LangChain、OpenAI、Anthropic等公司的解决方案。
一位独立开发者创建了Snipforge,一个包含28种工具的全能AI视频编辑套件,包括转录、智能剪辑、背景去除等功能。定价从免费到团队版每月15美元。
全球选举前夕,我们致力于帮助人们获取信息、支持网络安全防御者并提升AI透明度。
Warp 利用 GPT-5.5 和 OpenAI 模型,协调跨本地、云端和开源开发工作流的编码代理。
在 OpenAI 推翻 Erdős 单位距离猜想后不久,Anthropic 展示了 Claude Mythos 也能解决这一问题——且是在“周末内”。工程师 Sholto Douglas 称 Mythos 用一个“可爱、简单的证明”破解了 1946 年的猜想,这标志着 AI 驱动数学发现存在“严重过剩”现象。
Ollama是一款免费、开源、可本地安装的AI工具,提供隐私保护、离线访问和灵活性。它运行在你的个人硬件上,减少环境影响,让你掌控数据。
2026年AI领域将继续快速发展,开源模型在智能体能力上仍落后于闭源模型,谷歌的Gemini尚未对Claude Code和Codex构成有力竞争,美国开源模型正在崛起,Anthropic与OpenAI竞争激烈,现有权力结构开始介入AI发展。
Y Combinator创始人保罗·格雷厄姆表示,他会忽略明显由AI撰写的创始人邮件,因为感觉像被欺骗。作为OpenAI早期投资者,他的反应并不罕见。
MIT和南加州大学的研究发现,自ChatGPT普及以来,美国联邦法院中无律师代理的诉讼案件数量几乎翻倍,其中五分之一包含AI生成文本。法官们被迫采取极端措施应对激增的案件量。
阿里最新旗舰模型Qwen3.7-Max在Code Arena榜单得分1541,超越GPT-5.5等模型,仅次于Claude,排名全球第二,成为国产大模型中首个突破1540分的模型。
谷歌在 I/O 大会上推出 Gemini 3.5 和 Gemini Spark 智能体,以及 Gemini Omni 多模态视频生成;埃隆·马斯克因诉讼时效问题输掉对 OpenAI 的诉讼;Anthropic 以 9000 亿美元估值融资 300 亿美元;AI 解决了 80 年历史的 Erdős 几何问题。
OpenAI 最新图像模型 GPT Image 2 于 2026 年 4 月发布,支持精准文本渲染、逼真图像、自然语言编辑和透明背景。imagesv2.ai 平台提供免费试用、多种模板和生成工具,包括 360° 全景、推文截图、微信聊天等。定价年付可享 50% 折扣。
昆仑万维发布SkyClaw-v1.0及轻量版SkyClaw-v1.0-lite,原生Agent模型性能比肩Claude Opus 4.6等顶尖模型,价格仅为主流一半,限时免费,深度适配OpenClaw、Claude Code等主流Agent框架,兼容OpenAI接口。
加州州立大学系统与OpenAI签订价值数百万美元的合同,提供ChatGPT Edu工具,但调查显示多数师生对AI的教育效益持怀疑态度,担心其对就业、创造力和环境的影响。
ContextVault是一款浏览器扩展,可在所有主要LLM平台(如ChatGPT、Claude和Gemini)上实时捕获AI对话,并将其本地存储在IndexedDB中。支持一键导出为Markdown或ZIP格式,确保您的对话数据不会离开您的设备。该工具免费、开源,无需账户或后端,注重隐私。
谷歌Deepmind的AlphaProof Nexus系统自主解决了九个开放的爱尔迪什问题,包括两个困扰数学家56年的难题,每个问题的推理成本仅需几百美元。与OpenAI的自然语言方法不同,该系统使用Lean编译器自动验证每一步证明。不过,整体成功率仅为2.5%。
HTML Deployer是一款Chrome扩展,可从ChatGPT、Claude和Gemini中提取AI生成的HTML,并提供预览、下载ZIP或直接发布到Netlify、GitHub、FTP或自托管服务器的功能。适合开发者、创始人、营销人员、机构和初学者。
CoreWeave 推出专为 AI 构建的云平台,旨在解决传统通用云在 GPU 大规模并行计算中的瓶颈。通过整合基础设施、数据、编排和专家支持,CoreWeave Cloud 支持 AI 训练、推理及持续迭代的全生命周期,为 OpenAI 和 IBM 等企业提供更快的迭代速度和更高的性能。
在2026中国AIGC产业峰会上,蚂蚁灵波首席科学家沈宇军提出,大模型在数字世界享受了互联网数据红利,但机器人物理世界数据仍是空白。他认为VLA和世界模型都不会是具身智能的终局,未来将融合为物理世界独有的模型。蚂蚁灵波定位做“通用大脑”,并强调空间感知能力的重要性。预计2028年左右,人人都能为机器人提供数据,迎来具身智能的ChatGPT时刻。
MashuPack是一款新推出的开发者工具,允许用户从代码仓库中精确选择部分内容,并将其编译成一个干净的文本文件,旨在解决浏览器端AI聊天工具(如ChatGPT和Claude)中文件数量限制、上传困难和上下文碎片化的问题,使代码上下文变得便携、可控。
Alister Palmer 在 ForwardPass 达到 100 订阅者后,意识到传统新闻通讯存在两大限制:全球统一发布时间导致时区不适,以及订阅者无法选择接收频率。为此,他开发了 ForwardPass MCP,允许用户通过 AI 工具自定义接收时间和频率。文章详细介绍了在 Claude 和 ChatGPT 中设置 MCP 的步骤,并展望了这种个性化交付方式的潜力。
大型语言模型(LLM)优化于生成分布上合理的续接,而非明确验证生成命题是否源于源文档。这一归纳偏置促进了泛化,但未编码响应是否相对于参考文本接地。现有幻觉检测方法通过检索增强、自一致性或声明验证改善事实性,但通常不直接学习对齐拓扑。本文构建参考信息与LLM输出之间的对齐二分图,并训练图神经网络(GNN)通过消息传递建模对齐结构。该方法在四个不同的幻觉和问答数据集上取得了最先进的结果,优于包括GPT-4o在内的所有比较方法。
研究数学智能体(RMA)是一个专为研究级数学问题设计的自动化推理框架,通过多代理协作和迭代优化,在First Proof基准上解决了10个问题中的8个,超越了GPT-5.2R和Aletheia等强基线。
Pi是一个极简、可黑客的终端编码工具,让你构建自己想要的AI编码代理工作流程。它保持核心小巧简洁,通过扩展、技能和包提供高度自定义功能,并已在OpenAI/Codex生态系统中获得显著使用份额。
OpenAI 与巴西两大传媒集团合作,将可信的新闻报道引入 ChatGPT,强调来源标注和透明度。
苏格兰一家慈善机构警告称,政府吸引“绿色数据中心”的政策可能忽视了人工智能带来的大量碳排放,因为该政策在ChatGPT发布前就已制定。
微软是AI领域的重要参与者,通过投资OpenAI和云业务增长,AI年收入运行率超过370亿美元。尽管近期股价下跌12%,但公司软件深度整合客户系统,AI整合将创造机遇。当前市盈率25倍,为长期投资者提供了难得的买入机会。
上周AI领域迎来重大转折:Google发布Gemini Omni及代理优先平台;Andrej Karpathy加入Anthropic,专注于利用Claude加速预训练研究;Anthropic与xAI达成价值450亿美元的Colossus算力租赁协议;Cerebras IPO成功,市值近950亿美元;SpaceX、OpenAI和Anthropic计划在未来六个月内相继上市,总估值可能超过3万亿美元。此外,多项前沿研究发布,包括HRM-Text高效预训练范式、AI评审员效果评估、NVIDIA的联合AR-扩散模型等。
Google 的 SynthID 水印系统正被 OpenAI、Nvidia、ElevenLabs 和 Kakao 采用,标志着 AI 内容检测向共享行业标准转变。