OpenAI

来源分布

Hacker News AI22
The New Stack AI5
The Verge AI4
Simon Willison's Weblog3
Analytics Vidhya2
Latent Space2
The Guardian AI2
ZDNet AI2

主题分布

Agent35
模型28
政策16
芯片10
研究9
工具4
创业融资3
机器人1

日期线

2026-07-1026
2026-07-1113
2026-07-125
2026-07-094
2026-07-132

最新动态

GPT-5.6、Fable 5和Grok 4.5根据同一规格重建Basecamp

2026-07-13 01:02 UTC+8

作者通过Basecamp基准测试评估了GPT-5.6 Sol、Fable 5、Grok 4.5等AI模型在构建前端和后端方面的表现。Fable 5在两个赛道上均获胜，Grok 4.5在速度和成本之间取得了最佳平衡。结果显示，即使是顶级模型在完成度上也有显著差异，尤其是最后10%的打磨工作。

Fable 5在前端和后端基准测试中均得分最高，接近真实Basecamp实现。
Grok 4.5以9.30美元的成本在37分钟内完成构建，速度成本比最优。

OpenAI的AI在AtCoder世界巡回赛决赛中击败所有人类选手

2026-07-13 00:54 UTC+8

OpenAI的AI系统在AtCoder世界巡回赛2026算法组中解出全部五道题，得分8300分，而人类最高分仅4300分。启发式组中，AI得分是人类最佳成绩的七倍以上。60万日元的“人类胜出奖”无人领取。该系统被比作即将发布的GPT-5.6。

OpenAI的AI解出所有五道算法题，得8300分，人类最高4300分
无人解出最难的C题和E题

苹果起诉OpenAI窃取商业机密

2026-07-12 22:52 UTC+8

苹果公司指控OpenAI及其两名前苹果员工窃取商业机密，用于开发ChatGPT硬件设备。诉讼称这是“机构层面的协调不当行为模式”，OpenAI否认并表示没有兴趣窃取其他公司的机密。

苹果起诉OpenAI窃取商业机密，涉及前员工唐探和刘畅。
OpenAI否认指控，称仍在审查诉讼文件。

The Sequence Radar #893：上周AI动态：GPT-5.6、Grok 4.5、Muse Spark 1.1与后聊天机器人栈

2026-07-12 19:02 UTC+8

前沿AI实验室正从聊天机器人转向集成系统，模型作为运行时，频繁发布强大模型和代理。本周亮点包括OpenAI的GPT-5.6（Sol、Terra、Luna），具备程序化工具调用和并行子代理；GPT-Live全双工音频；ChatGPT Work用于创建工件；Meta的Muse Spark 1.1拥有百万token上下文和主动上下文管理；Grok 4.5专注于编码和知识工作。研究方面，OpenAI审计表明SWE-Bench Pro基准30%任务有问题；Anthropic提出GRAM方法可选择性移除危险知识；SkillOpt-Lite优化代理自我进化；DSpark和Nemotron-Labs-Diffusion改进推理效率。行业新闻包括Lovable融资3亿美元，Prime Intellect融资1.3亿美元，SambaNova融资10亿美元等。

OpenAI发布GPT-5.6，分为Sol、Terra、Luna，支持程序化工具调用和并行子代理。
GPT-Live实现全双工音频对话，从回合制转向连续交互。

Show HN: Inkfold – 跨多AI提供商的共享内存工作空间

2026-07-12 15:38 UTC+8

Inkfold 是一个专为多 AI 订阅用户设计的平台，可在 ChatGPT、Claude、Gemini、Grok 等工具间共享记忆和上下文，避免重复解释。它提供智能、私密或隐身三种保留模式，支持订阅或按需付费。适用于个人、团队和组织，提供免费和付费方案。

跨多个AI提供商共享记忆和上下文
支持智能、私密或隐身三种保留模式

Mesh LLM：基于iroh的分布式AI计算

2026-07-12 06:38 UTC+8

Mesh LLM是一种新型分布式AI计算系统，通过iroh网络将多台机器的GPU和内存池化，提供一个OpenAI兼容的API。用户可以在本地或对等节点上运行模型，甚至将大型模型拆分到多台机器上。它解决了AI计算成本高、缺乏控制的问题，支持私有部署和公共网格，无需依赖中央服务器。

Mesh LLM将多台机器的GPU资源池化，提供统一的OpenAI兼容API
支持本地运行、路由到对等节点或拆分模型跨多台机器

两个大语言模型在线下国际象棋，每局后重新训练自己的大脑

2026-07-12 05:44 UTC+8

两个AI模型ChatGPT 5.5和Claude Fable 5进行实时国际象棋对决，用户也可以免费挑战它们。每场比赛都计入排名，AI在夜间复习中学习人类棋步。同时，它们也在运行实时交易策略。

ChatGPT 5.5与Claude Fable 5进行实时国际象棋对决
用户可免费挑战AI，无需账户

免费AI可见性审计工具与代理

2026-07-11 23:59 UTC+8

这个免费工具可检查ChatGPT、Gemini、Claude、Perplexity、Grok和Google AI能否抓取、理解、验证和引用你的网站。报告涵盖全面站点抓取、品牌实体档案、声明级证据、AI意图覆盖、技术可抓取性、结构化数据、信任信号、竞争对手差距以及执行路线图，并附有电商、AI SaaS和B2B服务的案例。

免费审计工具评估AI系统对网站的可见性。
报告覆盖12个维度，包括技术、内容和信任信号。

2026年中AI模型分级

2026-07-11 23:43 UTC+8

作者从个人编码和审计经验出发，对2026年中的主流AI模型进行非正式分级，涵盖Anthropic Fable、OpenAI Sol、Mistral、Gemini和DeepSeek等模型，并融入美国出口管制和欧洲视角的评论。

Fable（Anthropic）被评为B级，虽然流畅但不可靠，常隐藏错误。
Sol（OpenAI）被评为S级，在低级代码和测试方面表现出色，值得信赖。

微软紧随谷歌，支持Go语言开发AI代理——OpenAI和Anthropic落后

2026-07-11 22:00 UTC+8

Go语言已成为云端基础设施的通用语言，微软现在为其Agent Framework推出Go版本，使云原生开发者能够用他们熟悉的语言构建AI代理。与此同时，谷歌早已支持Go，而OpenAI和Anthropic仍未跟上。

微软发布Agent Framework for Go公开预览，支持多种模型和工具调用。
Go语言广泛应用于Kubernetes、Docker等云基础设施。

24小时内，OpenAI、SpaceXAI和Meta将AI拖入价格战

2026-07-11 18:30 UTC+8

在短短24小时内，OpenAI、SpaceXAI和Meta相继发布新模型，但共同点是降价竞争。价格战正在重塑AI市场，企业需构建模型组合以优化成本与性能。

OpenAI推出GPT-5.6，Meta首次发布付费模型，SpaceXAI发布Grok 4.5，均以低价为卖点。
价格战导致模型每token成本大幅下降，但总任务成本可能因多次尝试而上升。

Show HN：使用AI实时创建逼真的团体照片

2026-07-11 17:48 UTC+8

Pixailer 是一款AI工具，可让用户上传个人照片并描述场景，在几秒钟内生成包含最多8人的高质量团体照片。它提供多种AI引擎（Google Gemini和OpenAI GPT-Image），支持多种语言提示，并有灵活的付费方案。隐私方面，上传的照片不会用于训练模型，并在生成后自动删除。

上传清晰照片并描述场景，AI在10秒内生成团体照
支持最多8人，可选Express（快速）或Studio（高保真）引擎

AINews：今日平静，模型发布潮后的小憩

2026-07-11 10:53 UTC+8

在持续一周的模型发布热潮后，今日相对平静。主要新闻包括GPT-5.6令人困惑的发布及快速修正、Meta的Muse Spark 1.1以激进定价提供接近前沿的质量、开源模型工具的进步，以及安全担忧的加剧。

GPT-5.6发布36种变体，用户体验问题导致快速修正。
Meta推出Muse Spark 1.1，定价激进，性能接近前沿模型。

GDP.pdf：前沿模型能否掌握驱动世界的文档？

2026-07-11 10:26 UTC+8

GDP.pdf是一个新的基准测试，评估AI模型处理现实世界PDF文档的能力。测试涵盖金融、法律、医疗等10个领域，结果显示即使是顶尖模型（如GPT-5.5）的得分也低于30%。文章强调了PDF作为全球经济命脉的重要性，并指出模型在关键任务中的失败可能导致严重后果。

GDP.pdf基准测试包含100个真实世界提示和PDF，覆盖10个专业领域。
所有前沿模型得分均低于30%，GPT-5.5以25%居首。

苹果起诉OpenAI，指控人工智能公司窃取商业机密

2026-07-11 06:33 UTC+8

苹果公司于周五对OpenAI提起诉讼，指控这家人工智能公司通过挖走苹果员工并诱使他们泄露机密材料，试图窃取商业机密以开发自己的硬件设备。

苹果指控OpenAI挖走其员工，并要求他们提供机密信息。
诉讼称OpenAI意图利用苹果的商业机密开发硬件。

苹果起诉OpenAI窃取商业机密以构建AI硬件

2026-07-11 04:47 UTC+8

苹果公司提起一项诉讼，指控OpenAI窃取其商业机密来开发AI硬件设备，该计划由前苹果员工Tang Tan和Chang Liu主导。

苹果指控OpenAI硬件负责人、前苹果设计师Tang Tan策划了一场窃取机密信息的计划。
前工程师Chang Liu保留了一台苹果笔记本电脑，并下载了数十份机密文件。

将生产AI代理迁移至GPT 5.6

2026-07-11 04:40 UTC+8

Ploy公司将其AI代理从Claude Opus 4.8迁移至OpenAI新发布的GPT-5.6 Sol，获得了速度提升2.2倍、成本降低27%以及视觉评分提高的成绩。迁移过程中遇到了工具调用参数填充、提示缓存机制差异和推理重放等问题，并通过一系列工程优化得以解决。

GPT-5.6 Sol在完成时间、成本和视觉评分上均优于Claude Opus 4.8
迁移中遇到工具调用参数全量填充问题，通过架构变换解决

用户因“网络滥用”被OpenAI封禁，其AI代写申诉并获另一AI批准

2026-07-11 03:50 UTC+8

一名OpenAI用户因“网络滥用”被莫名封禁，他利用OpenAI的Codex模型分析封禁原因并代写申诉，数分钟后申诉被另一AI系统批准。

用户因未知原因被OpenAI以“网络滥用”封禁
用户将封禁通知输入Codex，AI分析发现可能因请求自身服务器API密钥触发

OpenAI模型在世界编程竞赛中击败顶级人类程序员

2026-07-11 02:16 UTC+8

在2026年的AtCoder世界巡回总决赛中，OpenAI的AI模型在启发式和算法两个赛区均击败了人类顶级选手，甚至解决了人类无法完成的问题。主办方颁发了“人类投降奖”。这可能是人类最后一次有机会在编程竞赛中战胜顶尖AI。

OpenAI模型在2026年AtCoder总决赛的启发式赛区中大幅领先人类选手。
在算法赛区，模型解决了所有五道题，包括人类无人能解的两道。

本周AI：芯片、监管与职业变革

2026-07-11 00:04 UTC+8

本周AI新闻梳理：IBM推出0.7纳米芯片技术，OpenAI与博通发布专为推理设计的Jalapeño芯片，英伟达展示全液冷AI工厂设计；政府监管加强，Anthropic恢复模型访问权限，OpenAI提议向美国政府转让5%股权；工作角色快速演变，前哨工程师、SAP外部招聘与宜家内部培训成为焦点。

IBM发布0.7纳米芯片，性能提升50%，功耗降低70%。
OpenAI推出专为LLM推理设计的Jalapeño芯片。

OpenAI 关闭其 AI 浏览器 Atlas

2026-07-10 23:47 UTC+8

OpenAI 将关闭去年十月推出的 AI 浏览器 Atlas，但不会放弃 AI 辅助浏览的理念。其核心的代理浏览功能将被整合到 ChatGPT 桌面应用和 Chrome 扩展中。此举遵循了 OpenAI 削减“支线任务”的策略，此前已关闭视频生成工具 Sora。

OpenAI 关闭 AI 浏览器 Atlas，该浏览器以 ChatGPT 为核心。
Atlas 的代理浏览功能将转移至 ChatGPT 桌面版和 Chrome 扩展。

GPT-5.6如何反映新的AI监管

2026-07-10 22:40 UTC+8

此次发布显示了美国政府目前在AI模型领域的影响力。ChatGPT Work突显了OpenAI向企业供应商的持续演变。

美国政府的影响力在AI模型监管中日益显著。
GPT-5.6的发布体现了新的监管环境。

AI网页设计：Opus与Sol的对决

2026-07-10 21:49 UTC+8

本文基于作者多年经验，对比了两大AI模型（Opus 4.8和GPT-5.6 Sol）在网页设计中的表现。文章强调视觉参考优于文本提示，详细分析了各模型的优缺点，并提供了从规划到迭代的实用工作流建议。

使用视觉参考（截图或设计稿）能显著提升AI网页设计质量。
Opus 4.8更安全可靠，但趋于保守；GPT-5.6 Sol更具创意，但容易过度结构化。

OpenAI二号高管Fidji Simo离职

2026-07-10 16:05 UTC+8

OpenAI第二号高管Fidji Simo因医疗休假延长，将辞去全职职务，转为兼职顾问。她于2025年5月加入OpenAI，担任应用业务CEO。

Fidji Simo因医疗休假延长，辞去OpenAI全职职务。
她将转为兼职顾问角色。

德国电信如何用人工智能重塑电信行业

2026-07-10 15:00 UTC+8

德国电信正通过与OpenAI合作，利用人工智能改造客户服务、员工工作流程、网络运营以及语音服务的未来，旨在成为AI原生电信公司。

德国电信与OpenAI合作推动AI转型
AI用于提升客户服务和员工效率

「AINews」OpenAI 发布 GPT 5.6 Sol/Terra/Luna，Codex 成为 ChatGPT 超级应用

2026-07-10 14:19 UTC+8

OpenAI 发布了三款新 GPT-5.6 模型——Sol、Terra 和 Luna，同时更新了应用层，推出 ChatGPT Work 和 Codex 集成。新模型在基准测试中以更低成本展现了强大性能，其中 Sol 能力最强。独立评估显示其在编码和代理任务上接近前沿水平。

OpenAI 推出 GPT-5.6 三种尺寸：旗舰级 Sol、中端 Terra 和低成本 Luna。
全新 ultra 推理级别可并行协调多个代理处理复杂任务。

AI投资者收购会计公司并强制其使用OpenAI

2026-07-10 13:23 UTC+8

AI投资者正收购会计公司并强制其采用OpenAI技术，引发行业变革与数据隐私担忧。

AI投资者收购会计公司
强制使用OpenAI工具

GPT-5.6 正式发布：Sol、Terra 和 Luna 三款模型

2026-07-10 12:19 UTC+8

OpenAI 发布 GPT-5.6 系列，包括旗舰模型 Sol、工作模型 Terra 和快速模型 Luna。所有用户均可免费使用。本文详细介绍定价、性能、安全特性及实际测试结果。

三款模型：Sol（旗舰）、Terra（工作）、Luna（快速），均开放给所有用户。
定价灵活：Sol 标准版 $5/$30，快速版 $12.50/$75；Terra $2.50/$15；Luna $1/$6（每百万 token）。

TensorSharp：开源的本地LLM推理引擎

2026-07-10 10:42 UTC+8

TensorSharp是一个基于.NET 10的本地LLM推理引擎，支持GGUF模型、GPU加速，并提供命令行工具、浏览器聊天服务器及兼容Ollama和OpenAI的API。它强调隐私性、零按token费用，并支持多种硬件后端。文中还提供了快速入门指南和性能基准测试比较。

使用C#和.NET 10构建的本地LLM推理引擎，支持GGUF模型和GPU加速。
提供命令行工具、Web UI聊天服务器以及兼容Ollama和OpenAI的HTTP API。

引用OpenAI

2026-07-10 09:05 UTC+8

OpenAI发布帮助文章澄清ChatGPT Work的云端与桌面端行为：网页和移动端对话在云端运行，桌面端可经授权使用本地文件，但上线初期云端对话不会出现在桌面端。该引述来自Simon Willison的博客。

网页和移动端的ChatGPT Work对话在云端运行。
桌面端应用经授权可访问本地文件和应用程序。

AI #176 第一部分：现场直播

2026-07-10 09:00 UTC+8

本周AI新闻分两部分。OpenAI发布GPT-Live语音模型，实现更自然的交互。Grok 4.5以1.5万亿参数亮相，但基准测试表现存疑。GPT-5.6 Sol即将发布，早期测试者称赞其判断力。Fable展现出意外能力，但AI写作泛滥引发担忧。文章还讨论了AI的实用性和各种基准测试。

OpenAI推出GPT-Live语音模式，交互更自然
Grok 4.5发布，参数1.5万亿，但基准测试表现存疑

OpenAI推出ChatGPT Work，用于自动化业务流程的代理工具

2026-07-10 07:52 UTC+8

OpenAI今日发布ChatGPT Work，一款基于GPT-5.6的自主代理工具，可跨应用、文件和工具执行复杂任务，同时推出GPT-5.6系列模型和Sites功能，旨在提升企业工作效率。

ChatGPT Work是ChatGPT中的新模式，能够自主执行跨应用和文件的任务。
该工具由GPT-5.6驱动，带来54%的代币效率提升。

OpenAI的AGI主管Fidji Simo因病离职

2026-07-10 07:24 UTC+8

OpenAI的AGI主管Fidji Simo因神经免疫疾病离开全职岗位，转为兼职顾问。她于四月宣布病假，之后公司管理层发生一系列变动。

Fidji Simo因严重疾病辞去OpenAI AGI主管职务
她将转为兼职顾问专注康复

OpenAI 发布 GPT-5.6（Sol、Terra、Luna）：三层级模型家族，Responses API 集成程序化工具调用

2026-07-10 04:45 UTC+8

OpenAI 推出了 GPT-5.6 家族，包含三个层级：旗舰级 Sol、平衡型 Terra 和经济型 Luna。定价从每百万 token 1/6 美元到 5/30 美元不等。Sol 在 Artificial Analysis 编码智能体指数上达到 80 分，比 Claude Fable 5 高出 2.8 分，同时使用更少的 token。主要的开发者特性是程序化工具调用，可在隔离的 V8 运行时中运行 JavaScript，将 token 使用量减少 38% 到 63.5%。然而，差距依然存在：Sol 在 SWE-Bench Pro、智能指数和工具使用基准上落后于 Claude 模型。

GPT-5.6 推出三个层级：Sol、Terra、Luna，定价从每百万 token 1/6 美元到 5/30 美元。
Sol 在编码智能体指数上得分 80，超过 Claude Fable 5 的 77.2。

ChatGPT浏览器已宣告死亡

2026-07-10 04:34 UTC+8

OpenAI正在关闭其名为Atlas的ChatGPT浏览器，该浏览器能够代表用户执行任务，距离其发布不到一年。Atlas于去年10月推出，但作为今日ChatGPT Work系列公告的一部分，公司确认将“停用”Atlas，目标日期为8月9日。近几个月来，OpenAI还关闭了视频生成应用Sora，并暂停了ChatGPT“成人模式”的计划，旨在减少“支线任务”并追赶Anthropic在生产力功能方面的进展。OpenAI表示，从Atlas用户学到的经验将应用于新产品中。

OpenAI关闭其ChatGPT Atlas浏览器，该浏览器于去年10月推出，将于8月9日停用。
此举是OpenAI聚焦核心功能、减少“支线任务”的一部分，同时关闭了Sora并暂停了成人模式。

OpenAI的GPT-5.6和ChatGPT Work旨在在价格、速度和生产力上超越Anthropic

2026-07-10 04:26 UTC+8

OpenAI发布了GPT-5.6系列模型（Sol、Terra、Luna）和ChatGPT Work工具，直接对标Anthropic的Fable 5和Claude Cowork。新模型在基准测试中表现优异，成本更低，速度更快。ChatGPT Work将智能代理功能扩展到桌面应用，支持非编码任务。

GPT-5.6推出三个型号：Sol、Terra、Luna，分别对应不同性能层级。
Sol在Agent's Last Exam基准测试中得分53.6，超过Claude Fable 5的13.1分。

全新GPT-5.6系列：Luna、Terra、Sol

2026-07-10 03:46 UTC+8

OpenAI今日发布了GPT-5.6系列模型，包含Luna、Terra和Sol三种尺寸。该系列在长时代理任务基准测试中超越Claude Fable 5，但SWE-Bench Pro编码基准测试表现落后。新API特性包括程序化工具调用、多智能体支持、提示缓存断点和原图细节处理。

GPT-5.6系列包含三款模型：Luna（最小）、Terra和Sol（最大），定价分别为每百万输入/输出token $1/$6、$2.50/$15、$5/$30。
在Agent's Last Exam基准测试中，Sol以53.6分领先Claude Fable 5（40.5分），Terra和Luna也以约1/16的成本超越Fable 5。

OpenAI 将 Codex 整合到 ChatGPT 应用中，剑指 Claude Cowork

2026-07-10 02:55 UTC+8

OpenAI 在发布 GPT-5.6 的同时，宣布了多项产品更新，包括推出基于 Codex 的代理工具 ChatGPT Work，并将其与 Claude Cowork 直接竞争。ChatGPT 桌面应用将整合 Codex 和 ChatGPT 为一体，形成一个超级应用，同时提供浏览器扩展和淘汰 Atlas 浏览器。

OpenAI 宣布推出 ChatGPT Work，一个基于 Codex 的代理工具，面向知识工作者。
Codex 和 ChatGPT 桌面应用合并为一个超级应用，ChatGPT 品牌主导。

GPT-5.6 Sol (max) 基准测试结果

2026-07-10 02:51 UTC+8

OpenAI 的最新一代推理模型 GPT-5.6 Sol (max) 在 Artificial Analysis 智能指数中取得 59 分，远超同类模型平均水平。该模型具备文本与图像输入、100 万 tokens 上下文窗口，但定价高昂（输入 $5/百万 tokens，输出 $30/百万 tokens），且评估中生成 7000 万 tokens，冗长性较高。

GPT-5.6 Sol (max) 在 Artificial Analysis 智能指数中得分 59，远高于同类模型的中位数 30。
定价昂贵：输入 $5/百万 tokens，输出 $30/百万 tokens，评估总成本高达 $2824.18。

我测试了ChatGPT的实时语音升级，它几乎像人一样——如何尝试

2026-07-10 02:51 UTC+8

ChatGPT的新实时语音模式采用全双工架构，可以同时说话和聆听，实现更自然的对话。所有用户均可使用，在聊天过程中可以搜索网页并流畅处理打断。虽然不完美，但感觉几乎像真人。

ChatGPT实时语音可以同时说话和聆听，减少对话延迟。
它可以在对话中搜索网页而不中断交流。

OpenAI发布最新ChatGPT模型，此前因白宫网络安全担忧而延迟

2026-07-10 02:48 UTC+8

OpenAI于周四发布了其最新的高级AI模型ChatGPT 5.6，此前因美国政府担忧网络安全而推迟了公开发布。特朗普政府上月要求OpenAI将发布范围限制在政府批准的小部分用户内。OpenAI遵从了要求，在向政府官员介绍能力后，仅向受信任合作伙伴开放。更广泛的发布是在政府AI标准与创新机构进行额外测试后进行的。此举与竞争对手Anthropic最新AI模型所受限制类似。

OpenAI发布ChatGPT 5.6，此前因白宫网络安全担忧延迟发布。
特朗普政府要求OpenAI限制发布范围，OpenAI遵从。

OpenAI的GPT-5.6现已上线

2026-07-10 02:16 UTC+8

OpenAI正式发布GPT-5.6系列模型，包括旗舰版Sol、主流版Terra和经济版Luna，在多个基准测试中与Anthropic的Fable 5竞争，但成本更低。新模型在编程、知识工作和安全性方面均有提升。

OpenAI发布三款GPT-5.6模型：Sol、Terra和Luna。
Sol在多项基准测试中与Fable 5持平或更优，成本减半。

ChatGPT Work

2026-07-10 01:16 UTC+8

ChatGPT Work 是一款智能助手，可跨应用和文件执行任务，支持数小时持续工作，并能将目标转化为完成的工作。它集成了 Slack、Google Drive 等工具，支持桌面和移动端协作，还具备 Codex 编码功能。

可在手机、桌面和网页间无缝切换任务
集成 Slack、Gmail、Salesforce 等工具

AI代理的循环工程：/loop如何改变AI工作流程

2026-07-10 01:13 UTC+8

AI代理正从一次性助手转变为持续工作的代理人，能够重复任务、监控变化、运行检查、更新工作流程并返回结果。本文探讨了循环（Loop）在AI代理工作中的作用，介绍了Claude Code的/loop命令和OpenAI Codex的自动化功能，以及循环工程的架构、类型和应用实例。

AI代理循环允许代理重复工作直到满足停止条件，实现持久化任务处理。
循环工程从提示工程演进而来，侧重于设计可重复的代理系统。

OpenAI推出GPT-5.6并获得政府批准——同时发布'ChatGPT Work'

2026-07-10 01:00 UTC+8

大约两周前，OpenAI的GPT-5.6因监管问题仅向政府批准的组织提供预览，如今获得特朗普政府批准公开推出。同日，OpenAI发布了AI代理ChatGPT Work，结合ChatGPT和Codex，使非技术用户也能利用Codex的能力完成非编码任务。该代理由GPT-5.6模型套件（Sol、Terra、Luna）驱动，可连接多种应用和文件生成文档、电子表格等。全球Mac和Windows用户可通过桌面应用立即使用，移动端和网页版将逐步推出。OpenAI希望此举在AI代理竞争中领先。

OpenAI的GPT-5.6在短暂受限预览后获得公开推出批准。
ChatGPT Work是结合ChatGPT和Codex的新AI代理，专为非技术用户设计。

llm 0.31.1 发布

2026-07-10 00:06 UTC+8

Simon Willison 发布了 llm 0.31.1，修复了 OpenAI Chat Completion 端点中工具调用空参数导致的 JSON 错误。该问题在测试 llm-meta-ai 时被发现。

修复了空参数工具调用引发的 JSON 解析错误
该问题影响某些 OpenAI 兼容的提供商

Meta称其新AI模型在编程方面已具备竞争力

2026-07-09 22:00 UTC+8

Meta发布了Muse Spark 1.1 AI模型，通过新的Meta Model API向开发者开放。该模型在代码生成、复杂漏洞检测与修复、多智能体工作流支持以及多模态感知方面有显著提升，旨在追赶OpenAI、谷歌和Anthropic等竞争对手。

Muse Spark 1.1是Meta基于开发者反馈的重大升级，支持更高级的编程任务。
模型通过Meta Model API向美国开发者公开预览，并提供20美元免费积分。

“AI的瑞士”：OpenClaw成为非营利基金会

2026-07-09 20:44 UTC+8

OpenClaw，一个开源AI代理项目，在2026年取得巨大成功。创始人Peter Steinberger加入OpenAI后，该项目现已成立独立基金会，由Dave Morin担任主席。基金会旨在保持项目的开放性和中立性，并已获得多家科技巨头的支持。

OpenClaw是一个开源、自托管的AI代理，用户可在本地运行，访问文件和消息应用。
项目GitHub星数历史第六，超过Linux和React。

Show HN：QX Labs – 构建跨工具工作的代理、流程和网格

2026-07-09 19:52 UTC+8

QX Labs 是一个AI代理平台，允许用户在几分钟内构建代理，并将其连接到Slack、电子邮件、WhatsApp和电子表格等工具。平台提供三种工作方式：独立代理、大规模并行网格和自动化流程，支持与超过1000个应用集成，并允许在OpenAI、Anthropic、Gemini等模型间自由切换。

QX Labs 使团队能够快速构建AI代理并连接到常用工具。
网格功能可同时运行数千个代理，用于大规模研究和外联。

WhisperShortcut：macOS上的AI语音层（自带API密钥，支持离线Whisper）

2026-07-09 19:49 UTC+8

WhisperShortcut 是一款开源的 macOS 应用，让你通过快捷键在任何应用中用语音进行转录、编辑、朗读、截图和聊天。它支持 Google Gemini、OpenAI GPT、xAI Grok 等云服务，也支持完全离线的本地 Whisper 模型，无需账户或订阅。

通过 ⌘1 到 ⌘4 及 ⌥Space 等快捷键快速调用语音、朗读、截图和聊天功能。
支持 Google Gemini、OpenAI GPT、xAI Grok 等多种 AI 模型，可离线运行本地 Whisper。