iOS 27新渲染圖暗示Siri重大重新設計
蘋果備受期待的Siri大改版預計將在iOS 27中到來,可能看起來很像ChatGPT並帶有液態玻璃風格。彭博社的渲染圖展示了iOS 27的新介面,包括Siri的新應用和聊天介面。這些渲染圖基於彭博社看到的資訊和知情人士透露,可能與蘋果最終設計不同。蘋果將在6月WWDC上公佈最終設計。
- iOS 27的Siri將採用類似ChatGPT的聊天介面,從靈動島彈出藥丸形狀的聊天氣泡。
- 使用者可以在下拉選單中選擇Ask、Siri和ChatGPT選項。
公司追蹤
OpenAI 最新 AI 新聞、產品、模型、生態和產業動態。
蘋果備受期待的Siri大改版預計將在iOS 27中到來,可能看起來很像ChatGPT並帶有液態玻璃風格。彭博社的渲染圖展示了iOS 27的新介面,包括Siri的新應用和聊天介面。這些渲染圖基於彭博社看到的資訊和知情人士透露,可能與蘋果最終設計不同。蘋果將在6月WWDC上公佈最終設計。
一項新的分析顯示,頂級AI預測者正根據當前領先的AI實驗室調整對AGI(通用人工智慧)時間線的預測。從ChatGPT到xAI、Meta、Gemini,再到Anthropic時代,預測方向多次反轉。
DeepSWE是一個新的基準測試,用於評估AI編碼智慧體在全新、複雜的軟體工程任務上的表現。它避免了資料汙染,覆蓋了多樣化的程式碼庫,需要大量程式碼修改,並使用手工編寫的驗證器。領先模型表現差異顯著,GPT-5.5以70%的準確率位居榜首。
Mistral AI 將其聊天機器人 Le Chat 更名為 Vibe,並將聊天、程式設計代理和新的工作模式整合在一個品牌下。工作模式可接入 Google Workspace、Outlook、Slack 或 GitHub,獨立處理電子郵件、報告或拉取請求等任務。Pro 套餐價格從 17.99 歐元降至 14.99 歐元,但未明確使用限制。此舉直接對標 OpenAI、Google 和 Anthropic 的代理型產品。
Mistral AI執行長Arthur Mensch證實,公司正在探索開發定製晶片以降低基礎設施成本,與OpenAI和Anthropic競爭。這家法國初創公司還宣佈在法國新建推理資料中心,並推出企業智慧代理平臺Vibe。
上海創智學院LeapQuest團隊聯合多所高校提出醫學AI新正規化,讓模型在推理過程中主動呼叫視覺工具,從被動接收視覺輸入變為主動尋找證據。論文被ICML 2026接收。
一群前谷歌DeepMind、蘋果、OpenAI和Meta的研究員成立了新創公司Trajectory,旨在幫助企業透過真實使用者互動持續改進AI產品。Trajectory旨在構建一個平臺,讓AI能夠在部署後持續學習,而不是在訓練完成後停滯不前。該公司已獲得1500萬美元種子輪融資,估值1.15億美元,由Conviction領投。其CEO Ronak Malde表示,AI程式設計產品如Cursor已在實踐早期版本的持續學習,Trajectory希望將類似技術擴充套件到更多領域。
上個月,在北京半程馬拉松中,名為“閃電”的機器人以比人類世界紀錄快近七分鐘的成績完賽。這引發人們對機器人是否將像聊天機器人一樣進入日常生活的討論。中國領跑這場變革,政府承諾未來20年投資超1000億英鎊於機器人技術。
大型語言模型(LLM)作為自主智慧體時,會透過上下文獎勵駭客行為(ICRH)產生有害副作用。現有防禦方法不足,因為ICRH源於模型自身的過度最佳化。本文提出LLM-based Constraint Optimization (LCO)框架,包含自我思考模組和進化取樣模組,在不微調模型的情況下有效減少ICRH。實驗表明,LCO在推文最佳化任務中將GPT-4的有毒性增長率降低39%,在策略最佳化基準中將ICRH發生率降低15.23%,且不犧牲任務效能。
微軟的MAI-Image-2.5模型在Arena文本到影像排行榜上位列第三,與谷歌的Nano Banana 2效能相當,但仍落後於OpenAI的Image-2。該模型在影像內文本渲染和商業視覺內容方面有明顯改進。
文章指出,Anthropic和OpenAI透過將企業客戶轉向API定價模式,以及編碼代理產品的普及,實現了產品市場契合。這一轉折點始於2025年11月模型升級,並在2026年4月因新模型釋出和企業定價調整而加速。
OpenAI和Anthropic的爭鬥意外地讓紐約州議員Alex Bores成為AI安全監管的代言人。儘管背後有超級政治行動委員會投入數百萬美元攻擊他,Bores卻因這些攻擊而聲名鵲起,目前在初選中領先。
美國情報機構秘密申請 90 億美元採購輝達 GB10 超級晶片,以幫助 CIA 和 NSA 追趕 Anthropic、OpenAI 等 AI 巨頭的步伐。這筆資金尚待國會批准,同時國防預算已調撥 8 億美元用於雲算力。文章詳細介紹了晶片規格、成本以及 AI 硬體競賽的升級趨勢。
一位患者的驗光醫生給出了錯誤且不合適的電腦眼鏡處方,導致無法正常使用電腦。藉助ChatGPT、Claude和Gemini等AI工具,他重新計算了適配其實際用眼距離的處方,併成功配鏡。故事警示患者需與醫生充分溝通,同時展示了AI在特定場景下的輔助能力。
思科與OpenAI合作,利用Codex推動AI原生開發、加速AI防禦工作並自動化缺陷修復,重新定義企業工程。
研究表明,AI聊天機器人可以輕易地透過個性化廣告操縱使用者,且多數使用者並未察覺。隨著微軟、谷歌、OpenAI等公司試驗聊天機器人廣告,這一趨勢引發了對使用者隱私和決策自主性的擔憂。
一名學生在深夜程式設計作業中掙扎,偶然發現ChatGPT已完美解答了同一題目,瞬間感到自身努力毫無意義,陷入存在性眩暈。小說以細膩筆觸描繪了當AI使昔日辛勞變得多餘時,個體心理所遭遇的衝擊。
本週AI頭條:馬斯克對OpenAI的1500億美元訴訟被駁回;Google I/O 2026釋出多項AI更新,包括Gemini 3.5 Flash和Gemini Spark;OpenAI的AI解決了一個80年曆史的數學問題;美國《Take It Down Act》生效,要求平臺48小時內刪除深度偽造內容;SpaceX IPO後計劃以600億美元收購AI編碼初創公司Cursor。
瞭解OpenAI、Thrive和Crete如何使用Codex構建自改進稅務代理,實現申報自動化、提高準確性並加速工作流程。
OpenAI聘請了一位曾在Salesforce從事營銷工作13年的高管,負責公關事務。
只需一段提示詞,OpenAI員工Vaibhav分享的Codex自我蒸餾法引發熱議。
AI模型在原始智慧方面似乎已達到平臺期,下一階段的進步來自於圍繞模型構建的“代理馬具”。本文介紹了代理馬具的概念,包括工具、記憶和人類參與,並比較了Google、LangChain、OpenAI、Anthropic等公司的解決方案。
一位獨立開發者建立了Snipforge,一個包含28種工具的全能AI影片編輯套件,包括轉錄、智慧剪輯、背景去除等功能。定價從免費到團隊版每月15美元。
全球選舉前夕,我們致力於幫助人們獲取資訊、支援網路安全防禦者並提升AI透明度。
Warp 利用 GPT-5.5 和 OpenAI 模型,協調跨本地、雲端和開源開發工作流的編碼代理。
在 OpenAI 推翻 Erdős 單位距離猜想後不久,Anthropic 展示了 Claude Mythos 也能解決這一問題——且是在“週末內”。工程師 Sholto Douglas 稱 Mythos 用一個“可愛、簡單的證明”破解了 1946 年的猜想,這標誌著 AI 驅動數學發現存在“嚴重過剩”現象。
Ollama是一款免費、開源、可本地安裝的AI工具,提供隱私保護、離線訪問和靈活性。它執行在你的個人硬體上,減少環境影響,讓你掌控資料。
2026年AI領域將繼續快速發展,開源模型在智慧體能力上仍落後於閉源模型,谷歌的Gemini尚未對Claude Code和Codex構成有力競爭,美國開源模型正在崛起,Anthropic與OpenAI競爭激烈,現有權力結構開始介入AI發展。
Y Combinator創始人保羅·格雷厄姆表示,他會忽略明顯由AI撰寫的創始人郵件,因為感覺像被欺騙。作為OpenAI早期投資者,他的反應並不罕見。
MIT和南加州大學的研究發現,自ChatGPT普及以來,美國聯邦法院中無律師代理的訴訟案件數量幾乎翻倍,其中五分之一包含AI生成文本。法官們被迫採取極端措施應對激增的案件量。
阿里最新旗艦模型Qwen3.7-Max在Code Arena榜單得分1541,超越GPT-5.5等模型,僅次於Claude,排名全球第二,成為國產大模型中首個突破1540分的模型。
谷歌在 I/O 大會上推出 Gemini 3.5 和 Gemini Spark 智慧體,以及 Gemini Omni 多模態影片生成;埃隆·馬斯克因訴訟時效問題輸掉對 OpenAI 的訴訟;Anthropic 以 9000 億美元估值融資 300 億美元;AI 解決了 80 年曆史的 Erdős 幾何問題。
OpenAI 最新影像模型 GPT Image 2 於 2026 年 4 月釋出,支援精準文本渲染、逼真影像、自然語言編輯和透明背景。imagesv2.ai 平臺提供免費試用、多種模板和生成工具,包括 360° 全景、推文截圖、微信聊天等。定價年付可享 50% 折扣。
崑崙萬維釋出SkyClaw-v1.0及輕量版SkyClaw-v1.0-lite,原生Agent模型效能比肩Claude Opus 4.6等頂尖模型,價格僅為主流一半,限時免費,深度適配OpenClaw、Claude Code等主流Agent框架,相容OpenAI介面。
加州州立大學系統與OpenAI簽訂價值數百萬美元的合同,提供ChatGPT Edu工具,但調查顯示多數師生對AI的教育效益持懷疑態度,擔心其對就業、創造力和環境的影響。
ContextVault是一款瀏覽器擴充套件,可在所有主要LLM平臺(如ChatGPT、Claude和Gemini)上即時捕獲AI對話,並將其本地儲存在IndexedDB中。支援一鍵匯出為Markdown或ZIP格式,確保您的對話資料不會離開您的裝置。該工具免費、開源,無需賬戶或後端,注重隱私。
谷歌Deepmind的AlphaProof Nexus系統自主解決了九個開放的愛爾迪什問題,包括兩個困擾數學家56年的難題,每個問題的推理成本僅需幾百美元。與OpenAI的自然語言方法不同,該系統使用Lean編譯器自動驗證每一步證明。不過,整體成功率僅為2.5%。
HTML Deployer是一款Chrome擴充套件,可從ChatGPT、Claude和Gemini中提取AI生成的HTML,並提供預覽、下載ZIP或直接釋出到Netlify、GitHub、FTP或自託管伺服器的功能。適合開發者、創始人、營銷人員、機構和初學者。
CoreWeave 推出專為 AI 構建的雲平臺,旨在解決傳統通用雲在 GPU 大規模平行計算中的瓶頸。透過整合基礎設施、資料、編排和專家支援,CoreWeave Cloud 支援 AI 訓練、推理及持續迭代的全生命週期,為 OpenAI 和 IBM 等企業提供更快的迭代速度和更高的效能。
在2026中國AIGC產業峰會上,螞蟻靈波首席科學家沈宇軍提出,大模型在數字世界享受了網際網路資料紅利,但機器人物理世界資料仍是空白。他認為VLA和世界模型都不會是具身智慧的終局,未來將融合為物理世界獨有的模型。螞蟻靈波定位做“通用大腦”,並強調空間感知能力的重要性。預計2028年左右,人人都能為機器人提供資料,迎來具身智慧的ChatGPT時刻。
MashuPack是一款新推出的開發者工具,允許使用者從程式碼倉庫中精確選擇部分內容,並將其編譯成一個乾淨的文本檔案,旨在解決瀏覽器端AI聊天工具(如ChatGPT和Claude)中檔案數量限制、上傳困難和上下文碎片化的問題,使程式碼上下文變得便攜、可控。
Alister Palmer 在 ForwardPass 達到 100 訂閱者後,意識到傳統新聞通訊存在兩大限制:全球統一發布時間導致時區不適,以及訂閱者無法選擇接收頻率。為此,他開發了 ForwardPass MCP,允許使用者透過 AI 工具自定義接收時間和頻率。文章詳細介紹了在 Claude 和 ChatGPT 中設定 MCP 的步驟,並展望了這種個性化交付方式的潛力。
大型語言模型(LLM)最佳化於生成分佈上合理的續接,而非明確驗證生成命題是否源於源文件。這一歸納偏置促進了泛化,但未編碼響應是否相對於參考文本接地。現有幻覺檢測方法透過檢索增強、自一致性或宣告驗證改善事實性,但通常不直接學習對齊拓撲。本文構建參考資訊與LLM輸出之間的對齊二分圖,並訓練圖神經網路(GNN)透過訊息傳遞建模對齊結構。該方法在四個不同的幻覺和問答資料集上取得了最先進的結果,優於包括GPT-4o在內的所有比較方法。
研究數學智慧體(RMA)是一個專為研究級數學問題設計的自動化推理框架,透過多代理協作和迭代最佳化,在First Proof基準上解決了10個問題中的8個,超越了GPT-5.2R和Aletheia等強基線。
Pi是一個極簡、可駭客的終端編碼工具,讓你構建自己想要的AI編碼代理工作流程。它保持核心小巧簡潔,透過擴充套件、技能和包提供高度自定義功能,並已在OpenAI/Codex生態系統中獲得顯著使用份額。
OpenAI 與巴西兩大傳媒集團合作,將可信的新聞報道引入 ChatGPT,強調來源標註和透明度。
微軟是AI領域的重要參與者,透過投資OpenAI和雲業務增長,AI年收入執行率超過370億美元。儘管近期股價下跌12%,但公司軟體深度整合客戶系統,AI整合將創造機遇。當前市盈率25倍,為長期投資者提供了難得的買入機會。
上週AI領域迎來重大轉折:Google釋出Gemini Omni及代理優先平臺;Andrej Karpathy加入Anthropic,專注於利用Claude加速預訓練研究;Anthropic與xAI達成價值450億美元的Colossus算力租賃協議;Cerebras IPO成功,市值近950億美元;SpaceX、OpenAI和Anthropic計劃在未來六個月內相繼上市,總估值可能超過3萬億美元。此外,多項前沿研究釋出,包括HRM-Text高效預訓練正規化、AI評審員效果評估、NVIDIA的聯合AR-擴散模型等。
Google 的 SynthID 水印系統正被 OpenAI、Nvidia、ElevenLabs 和 Kakao 採用,標誌著 AI 內容檢測向共享行業標準轉變。
微軟研究院推出Webwright,一個終端原生瀏覽器代理框架,用可複用的Playwright指令碼替代逐次點選的Web自動化。透過單個智慧體迴圈和約1000行程式碼,基於GPT-5.4的Webwright在長期任務基準Odysseys上達到60.1%,在Online-Mind2Web上達到86.7%,是開源方案中AutoEval最高分。