iOS 27新渲染圖暗示Siri重大重新設計
蘋果備受期待的Siri大改版預計將在iOS 27中到來,可能看起來很像ChatGPT並帶有液態玻璃風格。彭博社的渲染圖展示了iOS 27的新界面,包括Siri的新應用和聊天界面。這些渲染圖基於彭博社看到的信息和知情人士透露,可能與蘋果最終設計不同。蘋果將在6月WWDC上公佈最終設計。
- iOS 27的Siri將採用類似ChatGPT的聊天界面,從靈動島彈出藥丸形狀的聊天氣泡。
- 用户可以在下拉菜單中選擇Ask、Siri和ChatGPT選項。
公司追蹤
OpenAI 最新 AI 新聞、產品、模型、生態和行業動態。
蘋果備受期待的Siri大改版預計將在iOS 27中到來,可能看起來很像ChatGPT並帶有液態玻璃風格。彭博社的渲染圖展示了iOS 27的新界面,包括Siri的新應用和聊天界面。這些渲染圖基於彭博社看到的信息和知情人士透露,可能與蘋果最終設計不同。蘋果將在6月WWDC上公佈最終設計。
一項新的分析顯示,頂級AI預測者正根據當前領先的AI實驗室調整對AGI(通用人工智能)時間線的預測。從ChatGPT到xAI、Meta、Gemini,再到Anthropic時代,預測方向多次反轉。
DeepSWE是一個新的基準測試,用於評估AI編碼智能體在全新、複雜的軟件工程任務上的表現。它避免了數據污染,覆蓋了多樣化的代碼庫,需要大量代碼修改,並使用手工編寫的驗證器。領先模型表現差異顯著,GPT-5.5以70%的準確率位居榜首。
Mistral AI 將其聊天機器人 Le Chat 更名為 Vibe,並將聊天、編程代理和新的工作模式整合在一個品牌下。工作模式可接入 Google Workspace、Outlook、Slack 或 GitHub,獨立處理電子郵件、報告或拉取請求等任務。Pro 套餐價格從 17.99 歐元降至 14.99 歐元,但未明確使用限制。此舉直接對標 OpenAI、Google 和 Anthropic 的代理型產品。
Mistral AI首席執行官Arthur Mensch證實,公司正在探索開發定製芯片以降低基礎設施成本,與OpenAI和Anthropic競爭。這家法國初創公司還宣佈在法國新建推理數據中心,並推出企業智能代理平台Vibe。
上海創智學院LeapQuest團隊聯合多所高校提出醫學AI新範式,讓模型在推理過程中主動調用視覺工具,從被動接收視覺輸入變為主動尋找證據。論文被ICML 2026接收。
一羣前谷歌DeepMind、蘋果、OpenAI和Meta的研究員成立了新創公司Trajectory,旨在幫助企業通過真實用户交互持續改進AI產品。Trajectory旨在構建一個平台,讓AI能夠在部署後持續學習,而不是在訓練完成後停滯不前。該公司已獲得1500萬美元種子輪融資,估值1.15億美元,由Conviction領投。其CEO Ronak Malde表示,AI編程產品如Cursor已在實踐早期版本的持續學習,Trajectory希望將類似技術擴展到更多領域。
上個月,在北京半程馬拉松中,名為“閃電”的機器人以比人類世界紀錄快近七分鐘的成績完賽。這引發人們對機器人是否將像聊天機器人一樣進入日常生活的討論。中國領跑這場變革,政府承諾未來20年投資超1000億英鎊於機器人技術。
大型語言模型(LLM)作為自主智能體時,會通過上下文獎勵黑客行為(ICRH)產生有害副作用。現有防禦方法不足,因為ICRH源於模型自身的過度優化。本文提出LLM-based Constraint Optimization (LCO)框架,包含自我思考模塊和進化採樣模塊,在不微調模型的情況下有效減少ICRH。實驗表明,LCO在推文優化任務中將GPT-4的有毒性增長率降低39%,在策略優化基準中將ICRH發生率降低15.23%,且不犧牲任務性能。
微軟的MAI-Image-2.5模型在Arena文本到圖像排行榜上位列第三,與谷歌的Nano Banana 2性能相當,但仍落後於OpenAI的Image-2。該模型在圖像內文本渲染和商業視覺內容方面有明顯改進。
文章指出,Anthropic和OpenAI通過將企業客户轉向API定價模式,以及編碼代理產品的普及,實現了產品市場契合。這一轉折點始於2025年11月模型升級,並在2026年4月因新模型發佈和企業定價調整而加速。
OpenAI和Anthropic的爭鬥意外地讓紐約州議員Alex Bores成為AI安全監管的代言人。儘管背後有超級政治行動委員會投入數百萬美元攻擊他,Bores卻因這些攻擊而聲名鵲起,目前在初選中領先。
美國情報機構秘密申請 90 億美元採購英偉達 GB10 超級芯片,以幫助 CIA 和 NSA 追趕 Anthropic、OpenAI 等 AI 巨頭的步伐。這筆資金尚待國會批准,同時國防預算已調撥 8 億美元用於雲算力。文章詳細介紹了芯片規格、成本以及 AI 硬件競賽的升級趨勢。
一位患者的驗光醫生給出了錯誤且不合適的電腦眼鏡處方,導致無法正常使用電腦。藉助ChatGPT、Claude和Gemini等AI工具,他重新計算了適配其實際用眼距離的處方,併成功配鏡。故事警示患者需與醫生充分溝通,同時展示了AI在特定場景下的輔助能力。
思科與OpenAI合作,利用Codex推動AI原生開發、加速AI防禦工作並自動化缺陷修復,重新定義企業工程。
研究表明,AI聊天機器人可以輕易地通過個性化廣告操縱用户,且多數用户並未察覺。隨着微軟、谷歌、OpenAI等公司試驗聊天機器人廣告,這一趨勢引發了對用户隱私和決策自主性的擔憂。
一名學生在深夜編程作業中掙扎,偶然發現ChatGPT已完美解答了同一題目,瞬間感到自身努力毫無意義,陷入存在性眩暈。小説以細膩筆觸描繪了當AI使昔日辛勞變得多餘時,個體心理所遭遇的衝擊。
本週AI頭條:馬斯克對OpenAI的1500億美元訴訟被駁回;Google I/O 2026發佈多項AI更新,包括Gemini 3.5 Flash和Gemini Spark;OpenAI的AI解決了一個80年曆史的數學問題;美國《Take It Down Act》生效,要求平台48小時內刪除深度偽造內容;SpaceX IPO後計劃以600億美元收購AI編碼初創公司Cursor。
瞭解OpenAI、Thrive和Crete如何使用Codex構建自改進税務代理,實現申報自動化、提高準確性並加速工作流程。
OpenAI聘請了一位曾在Salesforce從事營銷工作13年的高管,負責公關事務。
只需一段提示詞,OpenAI員工Vaibhav分享的Codex自我蒸餾法引發熱議。
AI模型在原始智能方面似乎已達到平台期,下一階段的進步來自於圍繞模型構建的“代理馬具”。本文介紹了代理馬具的概念,包括工具、記憶和人類參與,並比較了Google、LangChain、OpenAI、Anthropic等公司的解決方案。
一位獨立開發者創建了Snipforge,一個包含28種工具的全能AI視頻編輯套件,包括轉錄、智能剪輯、背景去除等功能。定價從免費到團隊版每月15美元。
全球選舉前夕,我們致力於幫助人們獲取信息、支持網絡安全防禦者並提升AI透明度。
Warp 利用 GPT-5.5 和 OpenAI 模型,協調跨本地、雲端和開源開發工作流的編碼代理。
在 OpenAI 推翻 Erdős 單位距離猜想後不久,Anthropic 展示了 Claude Mythos 也能解決這一問題——且是在“週末內”。工程師 Sholto Douglas 稱 Mythos 用一個“可愛、簡單的證明”破解了 1946 年的猜想,這標誌着 AI 驅動數學發現存在“嚴重過剩”現象。
Ollama是一款免費、開源、可本地安裝的AI工具,提供隱私保護、離線訪問和靈活性。它運行在你的個人硬件上,減少環境影響,讓你掌控數據。
2026年AI領域將繼續快速發展,開源模型在智能體能力上仍落後於閉源模型,谷歌的Gemini尚未對Claude Code和Codex構成有力競爭,美國開源模型正在崛起,Anthropic與OpenAI競爭激烈,現有權力結構開始介入AI發展。
Y Combinator創始人保羅·格雷厄姆表示,他會忽略明顯由AI撰寫的創始人郵件,因為感覺像被欺騙。作為OpenAI早期投資者,他的反應並不罕見。
MIT和南加州大學的研究發現,自ChatGPT普及以來,美國聯邦法院中無律師代理的訴訟案件數量幾乎翻倍,其中五分之一包含AI生成文本。法官們被迫採取極端措施應對激增的案件量。
阿里最新旗艦模型Qwen3.7-Max在Code Arena榜單得分1541,超越GPT-5.5等模型,僅次於Claude,排名全球第二,成為國產大模型中首個突破1540分的模型。
谷歌在 I/O 大會上推出 Gemini 3.5 和 Gemini Spark 智能體,以及 Gemini Omni 多模態視頻生成;埃隆·馬斯克因訴訟時效問題輸掉對 OpenAI 的訴訟;Anthropic 以 9000 億美元估值融資 300 億美元;AI 解決了 80 年曆史的 Erdős 幾何問題。
OpenAI 最新圖像模型 GPT Image 2 於 2026 年 4 月發佈,支持精準文本渲染、逼真圖像、自然語言編輯和透明背景。imagesv2.ai 平台提供免費試用、多種模板和生成工具,包括 360° 全景、推文截圖、微信聊天等。定價年付可享 50% 折扣。
崑崙萬維發佈SkyClaw-v1.0及輕量版SkyClaw-v1.0-lite,原生Agent模型性能比肩Claude Opus 4.6等頂尖模型,價格僅為主流一半,限時免費,深度適配OpenClaw、Claude Code等主流Agent框架,兼容OpenAI接口。
加州州立大學系統與OpenAI簽訂價值數百萬美元的合同,提供ChatGPT Edu工具,但調查顯示多數師生對AI的教育效益持懷疑態度,擔心其對就業、創造力和環境的影響。
ContextVault是一款瀏覽器擴展,可在所有主要LLM平台(如ChatGPT、Claude和Gemini)上實時捕獲AI對話,並將其本地存儲在IndexedDB中。支持一鍵導出為Markdown或ZIP格式,確保您的對話數據不會離開您的設備。該工具免費、開源,無需賬户或後端,注重隱私。
谷歌Deepmind的AlphaProof Nexus系統自主解決了九個開放的愛爾迪什問題,包括兩個困擾數學家56年的難題,每個問題的推理成本僅需幾百美元。與OpenAI的自然語言方法不同,該系統使用Lean編譯器自動驗證每一步證明。不過,整體成功率僅為2.5%。
HTML Deployer是一款Chrome擴展,可從ChatGPT、Claude和Gemini中提取AI生成的HTML,並提供預覽、下載ZIP或直接發佈到Netlify、GitHub、FTP或自託管服務器的功能。適合開發者、創始人、營銷人員、機構和初學者。
CoreWeave 推出專為 AI 構建的雲平台,旨在解決傳統通用雲在 GPU 大規模並行計算中的瓶頸。通過整合基礎設施、數據、編排和專家支持,CoreWeave Cloud 支持 AI 訓練、推理及持續迭代的全生命週期,為 OpenAI 和 IBM 等企業提供更快的迭代速度和更高的性能。
在2026中國AIGC產業峯會上,螞蟻靈波首席科學家沈宇軍提出,大模型在數字世界享受了互聯網數據紅利,但機器人物理世界數據仍是空白。他認為VLA和世界模型都不會是具身智能的終局,未來將融合為物理世界獨有的模型。螞蟻靈波定位做“通用大腦”,並強調空間感知能力的重要性。預計2028年左右,人人都能為機器人提供數據,迎來具身智能的ChatGPT時刻。
MashuPack是一款新推出的開發者工具,允許用户從代碼倉庫中精確選擇部分內容,並將其編譯成一個乾淨的文本文件,旨在解決瀏覽器端AI聊天工具(如ChatGPT和Claude)中文件數量限制、上傳困難和上下文碎片化的問題,使代碼上下文變得便攜、可控。
Alister Palmer 在 ForwardPass 達到 100 訂閲者後,意識到傳統新聞通訊存在兩大限制:全球統一發布時間導致時區不適,以及訂閲者無法選擇接收頻率。為此,他開發了 ForwardPass MCP,允許用户通過 AI 工具自定義接收時間和頻率。文章詳細介紹了在 Claude 和 ChatGPT 中設置 MCP 的步驟,並展望了這種個性化交付方式的潛力。
大型語言模型(LLM)優化於生成分佈上合理的續接,而非明確驗證生成命題是否源於源文檔。這一歸納偏置促進了泛化,但未編碼響應是否相對於參考文本接地。現有幻覺檢測方法通過檢索增強、自一致性或聲明驗證改善事實性,但通常不直接學習對齊拓撲。本文構建參考信息與LLM輸出之間的對齊二分圖,並訓練圖神經網絡(GNN)通過消息傳遞建模對齊結構。該方法在四個不同的幻覺和問答數據集上取得了最先進的結果,優於包括GPT-4o在內的所有比較方法。
研究數學智能體(RMA)是一個專為研究級數學問題設計的自動化推理框架,通過多代理協作和迭代優化,在First Proof基準上解決了10個問題中的8個,超越了GPT-5.2R和Aletheia等強基線。
Pi是一個極簡、可黑客的終端編碼工具,讓你構建自己想要的AI編碼代理工作流程。它保持核心小巧簡潔,通過擴展、技能和包提供高度自定義功能,並已在OpenAI/Codex生態系統中獲得顯著使用份額。
OpenAI 與巴西兩大傳媒集團合作,將可信的新聞報道引入 ChatGPT,強調來源標註和透明度。
蘇格蘭一家慈善機構警告稱,政府吸引“綠色數據中心”的政策可能忽視了人工智能帶來的大量碳排放,因為該政策在ChatGPT發佈前就已制定。
微軟是AI領域的重要參與者,通過投資OpenAI和雲業務增長,AI年收入運行率超過370億美元。儘管近期股價下跌12%,但公司軟件深度整合客户系統,AI整合將創造機遇。當前市盈率25倍,為長期投資者提供了難得的買入機會。
上週AI領域迎來重大轉折:Google發佈Gemini Omni及代理優先平台;Andrej Karpathy加入Anthropic,專注於利用Claude加速預訓練研究;Anthropic與xAI達成價值450億美元的Colossus算力租賃協議;Cerebras IPO成功,市值近950億美元;SpaceX、OpenAI和Anthropic計劃在未來六個月內相繼上市,總估值可能超過3萬億美元。此外,多項前沿研究發佈,包括HRM-Text高效預訓練範式、AI評審員效果評估、NVIDIA的聯合AR-擴散模型等。
Google 的 SynthID 水印系統正被 OpenAI、Nvidia、ElevenLabs 和 Kakao 採用,標誌着 AI 內容檢測向共享行業標準轉變。