OpenAI

來源分布

Hacker News AI22
The New Stack AI5
The Verge AI4
Simon Willison's Weblog3
Analytics Vidhya2
Latent Space2
The Guardian AI2
ZDNet AI2

主題分布

Agent35
模型28
政策16
芯片10
研究9
工具4
創業融資3
機械人1

日期線

2026-07-1026
2026-07-1113
2026-07-125
2026-07-094
2026-07-132

最新動態

GPT-5.6、Fable 5和Grok 4.5根據同一規格重建Basecamp

2026-07-13 01:02 UTC+8

作者通過Basecamp基準測試評估了GPT-5.6 Sol、Fable 5、Grok 4.5等AI模型在構建前端和後端方面的表現。Fable 5在兩個賽道上均獲勝，Grok 4.5在速度和成本之間取得了最佳平衡。結果顯示，即使是頂級模型在完成度上也有顯著差異，尤其是最後10%的打磨工作。

Fable 5在前端和後端基準測試中均得分最高，接近真實Basecamp實現。
Grok 4.5以9.30美元的成本在37分鐘內完成構建，速度成本比最優。

OpenAI的AI在AtCoder世界巡迴賽決賽中擊敗所有人類選手

2026-07-13 00:54 UTC+8

OpenAI的AI系統在AtCoder世界巡迴賽2026算法組中解出全部五道題，得分8300分，而人類最高分僅4300分。啓發式組中，AI得分是人類最佳成績的七倍以上。60萬日元的“人類勝出獎”無人領取。該系統被比作即將發佈的GPT-5.6。

OpenAI的AI解出所有五道算法題，得8300分，人類最高4300分
無人解出最難的C題和E題

蘋果起訴OpenAI竊取商業機密

2026-07-12 22:52 UTC+8

蘋果公司指控OpenAI及其兩名前蘋果員工竊取商業機密，用於開發ChatGPT硬件設備。訴訟稱這是“機構層面的協調不當行為模式”，OpenAI否認並表示沒有興趣竊取其他公司的機密。

蘋果起訴OpenAI竊取商業機密，涉及前員工唐探和劉暢。
OpenAI否認指控，稱仍在審查訴訟文件。

The Sequence Radar #893：上週AI動態：GPT-5.6、Grok 4.5、Muse Spark 1.1與後聊天機器人棧

2026-07-12 19:02 UTC+8

前沿AI實驗室正從聊天機器人轉向集成系統，模型作為運行時，頻繁發佈強大模型和代理。本週亮點包括OpenAI的GPT-5.6（Sol、Terra、Luna），具備程序化工具調用和並行子代理；GPT-Live全雙工音頻；ChatGPT Work用於創建工件；Meta的Muse Spark 1.1擁有百萬token上下文和主動上下文管理；Grok 4.5專注於編碼和知識工作。研究方面，OpenAI審計表明SWE-Bench Pro基準30%任務有問題；Anthropic提出GRAM方法可選擇性移除危險知識；SkillOpt-Lite優化代理自我進化；DSpark和Nemotron-Labs-Diffusion改進推理效率。行業新聞包括Lovable融資3億美元，Prime Intellect融資1.3億美元，SambaNova融資10億美元等。

OpenAI發佈GPT-5.6，分為Sol、Terra、Luna，支持程序化工具調用和並行子代理。
GPT-Live實現全雙工音頻對話，從回合制轉向連續交互。

Show HN: Inkfold – 跨多AI提供商的共享內存工作空間

2026-07-12 15:38 UTC+8

Inkfold 是一個專為多 AI 訂閲用户設計的平台，可在 ChatGPT、Claude、Gemini、Grok 等工具間共享記憶和上下文，避免重複解釋。它提供智能、私密或隱身三種保留模式，支持訂閲或按需付費。適用於個人、團隊和組織，提供免費和付費方案。

跨多個AI提供商共享記憶和上下文
支持智能、私密或隱身三種保留模式

Mesh LLM：基於iroh的分佈式AI計算

2026-07-12 06:38 UTC+8

Mesh LLM是一種新型分佈式AI計算系統，通過iroh網絡將多台機器的GPU和內存池化，提供一個OpenAI兼容的API。用户可以在本地或對等節點上運行模型，甚至將大型模型拆分到多台機器上。它解決了AI計算成本高、缺乏控制的問題，支持私有部署和公共網格，無需依賴中央服務器。

Mesh LLM將多台機器的GPU資源池化，提供統一的OpenAI兼容API
支持本地運行、路由到對等節點或拆分模型跨多台機器

兩個大語言模型在線下國際象棋，每局後重新訓練自己的大腦

2026-07-12 05:44 UTC+8

兩個AI模型ChatGPT 5.5和Claude Fable 5進行實時國際象棋對決，用户也可以免費挑戰它們。每場比賽都計入排名，AI在夜間複習中學習人類棋步。同時，它們也在運行實時交易策略。

ChatGPT 5.5與Claude Fable 5進行實時國際象棋對決
用户可免費挑戰AI，無需賬户

免費AI可見性審計工具與代理

2026-07-11 23:59 UTC+8

這個免費工具可檢查ChatGPT、Gemini、Claude、Perplexity、Grok和Google AI能否抓取、理解、驗證和引用你的網站。報告涵蓋全面站點抓取、品牌實體檔案、聲明級證據、AI意圖覆蓋、技術可抓取性、結構化數據、信任信號、競爭對手差距以及執行路線圖，並附有電商、AI SaaS和B2B服務的案例。

免費審計工具評估AI系統對網站的可見性。
報告覆蓋12個維度，包括技術、內容和信任信號。

2026年中AI模型分級

2026-07-11 23:43 UTC+8

作者從個人編碼和審計經驗出發，對2026年中的主流AI模型進行非正式分級，涵蓋Anthropic Fable、OpenAI Sol、Mistral、Gemini和DeepSeek等模型，並融入美國出口管制和歐洲視角的評論。

Fable（Anthropic）被評為B級，雖然流暢但不可靠，常隱藏錯誤。
Sol（OpenAI）被評為S級，在低級代碼和測試方面表現出色，值得信賴。

微軟緊隨谷歌，支持Go語言開發AI代理——OpenAI和Anthropic落後

2026-07-11 22:00 UTC+8

Go語言已成為雲端基礎設施的通用語言，微軟現在為其Agent Framework推出Go版本，使雲原生開發者能夠用他們熟悉的語言構建AI代理。與此同時，谷歌早已支持Go，而OpenAI和Anthropic仍未跟上。

微軟發佈Agent Framework for Go公開預覽，支持多種模型和工具調用。
Go語言廣泛應用於Kubernetes、Docker等雲基礎設施。

24小時內，OpenAI、SpaceXAI和Meta將AI拖入價格戰

2026-07-11 18:30 UTC+8

在短短24小時內，OpenAI、SpaceXAI和Meta相繼發佈新模型，但共同點是降價競爭。價格戰正在重塑AI市場，企業需構建模型組合以優化成本與性能。

OpenAI推出GPT-5.6，Meta首次發佈付費模型，SpaceXAI發佈Grok 4.5，均以低價為賣點。
價格戰導致模型每token成本大幅下降，但總任務成本可能因多次嘗試而上升。

Show HN：使用AI實時創建逼真的團體照片

2026-07-11 17:48 UTC+8

Pixailer 是一款AI工具，可讓用户上傳個人照片並描述場景，在幾秒鐘內生成包含最多8人的高質量團體照片。它提供多種AI引擎（Google Gemini和OpenAI GPT-Image），支持多種語言提示，並有靈活的付費方案。隱私方面，上傳的照片不會用於訓練模型，並在生成後自動刪除。

上傳清晰照片並描述場景，AI在10秒內生成團體照
支持最多8人，可選Express（快速）或Studio（高保真）引擎

AINews：今日平靜，模型發佈潮後的小憩

2026-07-11 10:53 UTC+8

在持續一週的模型發佈熱潮後，今日相對平靜。主要新聞包括GPT-5.6令人困惑的發佈及快速修正、Meta的Muse Spark 1.1以激進定價提供接近前沿的質量、開源模型工具的進步，以及安全擔憂的加劇。

GPT-5.6發佈36種變體，用户體驗問題導致快速修正。
Meta推出Muse Spark 1.1，定價激進，性能接近前沿模型。

GDP.pdf：前沿模型能否掌握驅動世界的文檔？

2026-07-11 10:26 UTC+8

GDP.pdf是一個新的基準測試，評估AI模型處理現實世界PDF文檔的能力。測試涵蓋金融、法律、醫療等10個領域，結果顯示即使是頂尖模型（如GPT-5.5）的得分也低於30%。文章強調了PDF作為全球經濟命脈的重要性，並指出模型在關鍵任務中的失敗可能導致嚴重後果。

GDP.pdf基準測試包含100個真實世界提示和PDF，覆蓋10個專業領域。
所有前沿模型得分均低於30%，GPT-5.5以25%居首。

蘋果起訴OpenAI，指控人工智能公司竊取商業機密

2026-07-11 06:33 UTC+8

蘋果公司於週五對OpenAI提起訴訟，指控這家人工智能公司通過挖走蘋果員工並誘使他們泄露機密材料，試圖竊取商業機密以開發自己的硬件設備。

蘋果指控OpenAI挖走其員工，並要求他們提供機密信息。
訴訟稱OpenAI意圖利用蘋果的商業機密開發硬件。

蘋果起訴OpenAI竊取商業機密以構建AI硬件

2026-07-11 04:47 UTC+8

蘋果公司提起一項訴訟，指控OpenAI竊取其商業機密來開發AI硬件設備，該計劃由前蘋果員工Tang Tan和Chang Liu主導。

蘋果指控OpenAI硬件負責人、前蘋果設計師Tang Tan策劃了一場竊取機密信息的計劃。
前工程師Chang Liu保留了一台蘋果筆記本電腦，並下載了數十份機密文件。

將生產AI代理遷移至GPT 5.6

2026-07-11 04:40 UTC+8

Ploy公司將其AI代理從Claude Opus 4.8遷移至OpenAI新發布的GPT-5.6 Sol，獲得了速度提升2.2倍、成本降低27%以及視覺評分提高的成績。遷移過程中遇到了工具調用參數填充、提示緩存機制差異和推理重放等問題，並通過一系列工程優化得以解決。

GPT-5.6 Sol在完成時間、成本和視覺評分上均優於Claude Opus 4.8
遷移中遇到工具調用參數全量填充問題，通過架構變換解決

用户因“網絡濫用”被OpenAI封禁，其AI代寫申訴並獲另一AI批准

2026-07-11 03:50 UTC+8

一名OpenAI用户因“網絡濫用”被莫名封禁，他利用OpenAI的Codex模型分析封禁原因並代寫申訴，數分鐘後申訴被另一AI系統批准。

用户因未知原因被OpenAI以“網絡濫用”封禁
用户將封禁通知輸入Codex，AI分析發現可能因請求自身服務器API密鑰觸發

OpenAI模型在世界編程競賽中擊敗頂級人類程序員

2026-07-11 02:16 UTC+8

在2026年的AtCoder世界巡迴總決賽中，OpenAI的AI模型在啓發式和算法兩個賽區均擊敗了人類頂級選手，甚至解決了人類無法完成的問題。主辦方頒發了“人類投降獎”。這可能是人類最後一次有機會在編程競賽中戰勝頂尖AI。

OpenAI模型在2026年AtCoder總決賽的啓發式賽區中大幅領先人類選手。
在算法賽區，模型解決了所有五道題，包括人類無人能解的兩道。

本週AI：芯片、監管與職業變革

2026-07-11 00:04 UTC+8

本週AI新聞梳理：IBM推出0.7納米芯片技術，OpenAI與博通發佈專為推理設計的Jalapeño芯片，英偉達展示全液冷AI工廠設計；政府監管加強，Anthropic恢復模型訪問權限，OpenAI提議向美國政府轉讓5%股權；工作角色快速演變，前哨工程師、SAP外部招聘與宜家內部培訓成為焦點。

IBM發佈0.7納米芯片，性能提升50%，功耗降低70%。
OpenAI推出專為LLM推理設計的Jalapeño芯片。

OpenAI 關閉其 AI 瀏覽器 Atlas

2026-07-10 23:47 UTC+8

OpenAI 將關閉去年十月推出的 AI 瀏覽器 Atlas，但不會放棄 AI 輔助瀏覽的理念。其核心的代理瀏覽功能將被整合到 ChatGPT 桌面應用和 Chrome 擴展中。此舉遵循了 OpenAI 削減“支線任務”的策略，此前已關閉視頻生成工具 Sora。

OpenAI 關閉 AI 瀏覽器 Atlas，該瀏覽器以 ChatGPT 為核心。
Atlas 的代理瀏覽功能將轉移至 ChatGPT 桌面版和 Chrome 擴展。

GPT-5.6如何反映新的AI監管

2026-07-10 22:40 UTC+8

此次發佈顯示了美國政府目前在AI模型領域的影響力。ChatGPT Work突顯了OpenAI向企業供應商的持續演變。

美國政府的影響力在AI模型監管中日益顯著。
GPT-5.6的發佈體現了新的監管環境。

AI網頁設計：Opus與Sol的對決

2026-07-10 21:49 UTC+8

本文基於作者多年經驗，對比了兩大AI模型（Opus 4.8和GPT-5.6 Sol）在網頁設計中的表現。文章強調視覺參考優於文本提示，詳細分析了各模型的優缺點，並提供了從規劃到迭代的實用工作流建議。

使用視覺參考（截圖或設計稿）能顯著提升AI網頁設計質量。
Opus 4.8更安全可靠，但趨於保守；GPT-5.6 Sol更具創意，但容易過度結構化。

OpenAI二號高管Fidji Simo離職

2026-07-10 16:05 UTC+8

OpenAI第二號高管Fidji Simo因醫療休假延長，將辭去全職職務，轉為兼職顧問。她於2025年5月加入OpenAI，擔任應用業務CEO。

Fidji Simo因醫療休假延長，辭去OpenAI全職職務。
她將轉為兼職顧問角色。

德國電信如何用人工智能重塑電信行業

2026-07-10 15:00 UTC+8

德國電信正通過與OpenAI合作，利用人工智能改造客户服務、員工工作流程、網絡運營以及語音服務的未來，旨在成為AI原生電信公司。

德國電信與OpenAI合作推動AI轉型
AI用於提升客户服務和員工效率

「AINews」OpenAI 發佈 GPT 5.6 Sol/Terra/Luna，Codex 成為 ChatGPT 超級應用

2026-07-10 14:19 UTC+8

OpenAI 發佈了三款新 GPT-5.6 模型——Sol、Terra 和 Luna，同時更新了應用層，推出 ChatGPT Work 和 Codex 集成。新模型在基準測試中以更低成本展現了強大性能，其中 Sol 能力最強。獨立評估顯示其在編碼和代理任務上接近前沿水平。

OpenAI 推出 GPT-5.6 三種尺寸：旗艦級 Sol、中端 Terra 和低成本 Luna。
全新 ultra 推理級別可並行協調多個代理處理複雜任務。

AI投資者收購會計公司並強制其使用OpenAI

2026-07-10 13:23 UTC+8

AI投資者正收購會計公司並強制其採用OpenAI技術，引發行業變革與數據隱私擔憂。

AI投資者收購會計公司
強制使用OpenAI工具

GPT-5.6 正式發佈：Sol、Terra 和 Luna 三款模型

2026-07-10 12:19 UTC+8

OpenAI 發佈 GPT-5.6 系列，包括旗艦模型 Sol、工作模型 Terra 和快速模型 Luna。所有用户均可免費使用。本文詳細介紹定價、性能、安全特性及實際測試結果。

三款模型：Sol（旗艦）、Terra（工作）、Luna（快速），均開放給所有用户。
定價靈活：Sol 標準版 $5/$30，快速版 $12.50/$75；Terra $2.50/$15；Luna $1/$6（每百萬 token）。

TensorSharp：開源的本地LLM推理引擎

2026-07-10 10:42 UTC+8

TensorSharp是一個基於.NET 10的本地LLM推理引擎，支持GGUF模型、GPU加速，並提供命令行工具、瀏覽器聊天服務器及兼容Ollama和OpenAI的API。它強調隱私性、零按token費用，並支持多種硬件後端。文中還提供了快速入門指南和性能基準測試比較。

使用C#和.NET 10構建的本地LLM推理引擎，支持GGUF模型和GPU加速。
提供命令行工具、Web UI聊天服務器以及兼容Ollama和OpenAI的HTTP API。

引用OpenAI

2026-07-10 09:05 UTC+8

OpenAI發佈幫助文章澄清ChatGPT Work的雲端與桌面端行為：網頁和移動端對話在雲端運行，桌面端可經授權使用本地文件，但上線初期雲端對話不會出現在桌面端。該引述來自Simon Willison的博客。

網頁和移動端的ChatGPT Work對話在雲端運行。
桌面端應用經授權可訪問本地文件和應用程序。

AI #176 第一部分：現場直播

2026-07-10 09:00 UTC+8

本週AI新聞分兩部分。OpenAI發佈GPT-Live語音模型，實現更自然的交互。Grok 4.5以1.5萬億參數亮相，但基準測試表現存疑。GPT-5.6 Sol即將發佈，早期測試者稱讚其判斷力。Fable展現出意外能力，但AI寫作氾濫引發擔憂。文章還討論了AI的實用性和各種基準測試。

OpenAI推出GPT-Live語音模式，交互更自然
Grok 4.5發佈，參數1.5萬億，但基準測試表現存疑

OpenAI推出ChatGPT Work，用於自動化業務流程的代理工具

2026-07-10 07:52 UTC+8

OpenAI今日發佈ChatGPT Work，一款基於GPT-5.6的自主代理工具，可跨應用、文件和工具執行復雜任務，同時推出GPT-5.6系列模型和Sites功能，旨在提升企業工作效率。

ChatGPT Work是ChatGPT中的新模式，能夠自主執行跨應用和文件的任務。
該工具由GPT-5.6驅動，帶來54%的代幣效率提升。

OpenAI的AGI主管Fidji Simo因病離職

2026-07-10 07:24 UTC+8

OpenAI的AGI主管Fidji Simo因神經免疫疾病離開全職崗位，轉為兼職顧問。她於四月宣佈病假，之後公司管理層發生一系列變動。

Fidji Simo因嚴重疾病辭去OpenAI AGI主管職務
她將轉為兼職顧問專注康復

OpenAI 發佈 GPT-5.6（Sol、Terra、Luna）：三層級模型家族，Responses API 集成程序化工具調用

2026-07-10 04:45 UTC+8

OpenAI 推出了 GPT-5.6 家族，包含三個層級：旗艦級 Sol、平衡型 Terra 和經濟型 Luna。定價從每百萬 token 1/6 美元到 5/30 美元不等。Sol 在 Artificial Analysis 編碼智能體指數上達到 80 分，比 Claude Fable 5 高出 2.8 分，同時使用更少的 token。主要的開發者特性是程序化工具調用，可在隔離的 V8 運行時中運行 JavaScript，將 token 使用量減少 38% 到 63.5%。然而，差距依然存在：Sol 在 SWE-Bench Pro、智能指數和工具使用基準上落後於 Claude 模型。

GPT-5.6 推出三個層級：Sol、Terra、Luna，定價從每百萬 token 1/6 美元到 5/30 美元。
Sol 在編碼智能體指數上得分 80，超過 Claude Fable 5 的 77.2。

ChatGPT瀏覽器已宣告死亡

2026-07-10 04:34 UTC+8

OpenAI正在關閉其名為Atlas的ChatGPT瀏覽器，該瀏覽器能夠代表用户執行任務，距離其發佈不到一年。Atlas於去年10月推出，但作為今日ChatGPT Work系列公告的一部分，公司確認將“停用”Atlas，目標日期為8月9日。近幾個月來，OpenAI還關閉了視頻生成應用Sora，並暫停了ChatGPT“成人模式”的計劃，旨在減少“支線任務”並追趕Anthropic在生產力功能方面的進展。OpenAI表示，從Atlas用户學到的經驗將應用於新產品中。

OpenAI關閉其ChatGPT Atlas瀏覽器，該瀏覽器於去年10月推出，將於8月9日停用。
此舉是OpenAI聚焦核心功能、減少“支線任務”的一部分，同時關閉了Sora並暫停了成人模式。

OpenAI的GPT-5.6和ChatGPT Work旨在在價格、速度和生產力上超越Anthropic

2026-07-10 04:26 UTC+8

OpenAI發佈了GPT-5.6系列模型（Sol、Terra、Luna）和ChatGPT Work工具，直接對標Anthropic的Fable 5和Claude Cowork。新模型在基準測試中表現優異，成本更低，速度更快。ChatGPT Work將智能代理功能擴展到桌面應用，支持非編碼任務。

GPT-5.6推出三個型號：Sol、Terra、Luna，分別對應不同性能層級。
Sol在Agent's Last Exam基準測試中得分53.6，超過Claude Fable 5的13.1分。

全新GPT-5.6系列：Luna、Terra、Sol

2026-07-10 03:46 UTC+8

OpenAI今日發佈了GPT-5.6系列模型，包含Luna、Terra和Sol三種尺寸。該系列在長時代理任務基準測試中超越Claude Fable 5，但SWE-Bench Pro編碼基準測試表現落後。新API特性包括程序化工具調用、多智能體支持、提示緩存斷點和原圖細節處理。

GPT-5.6系列包含三款模型：Luna（最小）、Terra和Sol（最大），定價分別為每百萬輸入/輸出token $1/$6、$2.50/$15、$5/$30。
在Agent's Last Exam基準測試中，Sol以53.6分領先Claude Fable 5（40.5分），Terra和Luna也以約1/16的成本超越Fable 5。

OpenAI 將 Codex 整合到 ChatGPT 應用中，劍指 Claude Cowork

2026-07-10 02:55 UTC+8

OpenAI 在發佈 GPT-5.6 的同時，宣佈了多項產品更新，包括推出基於 Codex 的代理工具 ChatGPT Work，並將其與 Claude Cowork 直接競爭。ChatGPT 桌面應用將整合 Codex 和 ChatGPT 為一體，形成一個超級應用，同時提供瀏覽器擴展和淘汰 Atlas 瀏覽器。

OpenAI 宣佈推出 ChatGPT Work，一個基於 Codex 的代理工具，面向知識工作者。
Codex 和 ChatGPT 桌面應用合併為一個超級應用，ChatGPT 品牌主導。

GPT-5.6 Sol (max) 基準測試結果

2026-07-10 02:51 UTC+8

OpenAI 的最新一代推理模型 GPT-5.6 Sol (max) 在 Artificial Analysis 智能指數中取得 59 分，遠超同類模型平均水平。該模型具備文本與圖像輸入、100 萬 tokens 上下文窗口，但定價高昂（輸入 $5/百萬 tokens，輸出 $30/百萬 tokens），且評估中生成 7000 萬 tokens，冗長性較高。

GPT-5.6 Sol (max) 在 Artificial Analysis 智能指數中得分 59，遠高於同類模型的中位數 30。
定價昂貴：輸入 $5/百萬 tokens，輸出 $30/百萬 tokens，評估總成本高達 $2824.18。

我測試了ChatGPT的實時語音升級，它幾乎像人一樣——如何嘗試

2026-07-10 02:51 UTC+8

ChatGPT的新實時語音模式採用全雙工架構，可以同時説話和聆聽，實現更自然的對話。所有用户均可使用，在聊天過程中可以搜索網頁並流暢處理打斷。雖然不完美，但感覺幾乎像真人。

ChatGPT實時語音可以同時説話和聆聽，減少對話延遲。
它可以在對話中搜索網頁而不中斷交流。

OpenAI發佈最新ChatGPT模型，此前因白宮網絡安全擔憂而延遲

2026-07-10 02:48 UTC+8

OpenAI於週四發佈了其最新的高級AI模型ChatGPT 5.6，此前因美國政府擔憂網絡安全而推遲了公開發布。特朗普政府上月要求OpenAI將發佈範圍限制在政府批准的小部分用户內。OpenAI遵從了要求，在向政府官員介紹能力後，僅向受信任合作伙伴開放。更廣泛的發佈是在政府AI標準與創新機構進行額外測試後進行的。此舉與競爭對手Anthropic最新AI模型所受限制類似。

OpenAI發佈ChatGPT 5.6，此前因白宮網絡安全擔憂延遲發佈。
特朗普政府要求OpenAI限制發佈範圍，OpenAI遵從。

OpenAI的GPT-5.6現已上線

2026-07-10 02:16 UTC+8

OpenAI正式發佈GPT-5.6系列模型，包括旗艦版Sol、主流版Terra和經濟版Luna，在多個基準測試中與Anthropic的Fable 5競爭，但成本更低。新模型在編程、知識工作和安全性方面均有提升。

OpenAI發佈三款GPT-5.6模型：Sol、Terra和Luna。
Sol在多項基準測試中與Fable 5持平或更優，成本減半。

ChatGPT Work

2026-07-10 01:16 UTC+8

ChatGPT Work 是一款智能助手，可跨應用和文件執行任務，支持數小時持續工作，並能將目標轉化為完成的工作。它集成了 Slack、Google Drive 等工具，支持桌面和移動端協作，還具備 Codex 編碼功能。

可在手機、桌面和網頁間無縫切換任務
集成 Slack、Gmail、Salesforce 等工具

AI代理的循環工程：/loop如何改變AI工作流程

2026-07-10 01:13 UTC+8

AI代理正從一次性助手轉變為持續工作的代理人，能夠重複任務、監控變化、運行檢查、更新工作流程並返回結果。本文探討了循環（Loop）在AI代理工作中的作用，介紹了Claude Code的/loop命令和OpenAI Codex的自動化功能，以及循環工程的架構、類型和應用實例。

AI代理循環允許代理重複工作直到滿足停止條件，實現持久化任務處理。
循環工程從提示工程演進而來，側重於設計可重複的代理系統。

OpenAI推出GPT-5.6並獲得政府批准——同時發佈'ChatGPT Work'

2026-07-10 01:00 UTC+8

大約兩週前，OpenAI的GPT-5.6因監管問題僅向政府批准的組織提供預覽，如今獲得特朗普政府批准公開推出。同日，OpenAI發佈了AI代理ChatGPT Work，結合ChatGPT和Codex，使非技術用户也能利用Codex的能力完成非編碼任務。該代理由GPT-5.6模型套件（Sol、Terra、Luna）驅動，可連接多種應用和文件生成文檔、電子表格等。全球Mac和Windows用户可通過桌面應用立即使用，移動端和網頁版將逐步推出。OpenAI希望此舉在AI代理競爭中領先。

OpenAI的GPT-5.6在短暫受限預覽後獲得公開推出批准。
ChatGPT Work是結合ChatGPT和Codex的新AI代理，專為非技術用户設計。

llm 0.31.1 發佈

2026-07-10 00:06 UTC+8

Simon Willison 發佈了 llm 0.31.1，修復了 OpenAI Chat Completion 端點中工具調用空參數導致的 JSON 錯誤。該問題在測試 llm-meta-ai 時被發現。

修復了空參數工具調用引發的 JSON 解析錯誤
該問題影響某些 OpenAI 兼容的提供商

Meta稱其新AI模型在編程方面已具備競爭力

2026-07-09 22:00 UTC+8

Meta發佈了Muse Spark 1.1 AI模型，通過新的Meta Model API向開發者開放。該模型在代碼生成、複雜漏洞檢測與修復、多智能體工作流支持以及多模態感知方面有顯著提升，旨在追趕OpenAI、谷歌和Anthropic等競爭對手。

Muse Spark 1.1是Meta基於開發者反饋的重大升級，支持更高級的編程任務。
模型通過Meta Model API向美國開發者公開預覽，並提供20美元免費積分。

“AI的瑞士”：OpenClaw成為非營利基金會

2026-07-09 20:44 UTC+8

OpenClaw，一個開源AI代理項目，在2026年取得巨大成功。創始人Peter Steinberger加入OpenAI後，該項目現已成立獨立基金會，由Dave Morin擔任主席。基金會旨在保持項目的開放性和中立性，並已獲得多家科技巨頭的支持。

OpenClaw是一個開源、自託管的AI代理，用户可在本地運行，訪問文件和消息應用。
項目GitHub星數歷史第六，超過Linux和React。

Show HN：QX Labs – 構建跨工具工作的代理、流程和網格

2026-07-09 19:52 UTC+8

QX Labs 是一個AI代理平台，允許用户在幾分鐘內構建代理，並將其連接到Slack、電子郵件、WhatsApp和電子表格等工具。平台提供三種工作方式：獨立代理、大規模並行網格和自動化流程，支持與超過1000個應用集成，並允許在OpenAI、Anthropic、Gemini等模型間自由切換。

QX Labs 使團隊能夠快速構建AI代理並連接到常用工具。
網格功能可同時運行數千個代理，用於大規模研究和外聯。

WhisperShortcut：macOS上的AI語音層（自帶API密鑰，支持離線Whisper）

2026-07-09 19:49 UTC+8

WhisperShortcut 是一款開源的 macOS 應用，讓你通過快捷鍵在任何應用中用語音進行轉錄、編輯、朗讀、截圖和聊天。它支持 Google Gemini、OpenAI GPT、xAI Grok 等雲服務，也支持完全離線的本地 Whisper 模型，無需賬户或訂閲。

通過 ⌘1 到 ⌘4 及 ⌥Space 等快捷鍵快速調用語音、朗讀、截圖和聊天功能。
支持 Google Gemini、OpenAI GPT、xAI Grok 等多種 AI 模型，可離線運行本地 Whisper。