蘋果正努力將Gemini整合到iPhone中
儘管蘋果一直強調本地AI的隱私優勢,但最新報告顯示,蘋果計劃藉助谷歌和英偉達的雲端算力為Siri注入Gemini能力。這種混合架構或能解決本地AI模型在性能上的不足,但也意味着對用户隱私的權衡。
- 蘋果與谷歌合作,計劃在iPhone上集成Gemini AI到Siri中。
- 由於本地芯片算力有限,Siri將同時使用本地和雲端處理,以提升AI能力。
主題流
AI 芯片、算力供給、基礎設施與供應鏈。
儘管蘋果一直強調本地AI的隱私優勢,但最新報告顯示,蘋果計劃藉助谷歌和英偉達的雲端算力為Siri注入Gemini能力。這種混合架構或能解決本地AI模型在性能上的不足,但也意味着對用户隱私的權衡。
阿塞拜疆電信公司Azercell與AWS生成式AI創新中心合作,在Amazon SageMaker AI上構建了針對阿塞拜疆語的大語言模型,通過自定義分詞器、分佈式訓練和Liger Kernel優化,實現了23%的訓練吞吐量提升、58%的GPU內存峯值降低和2倍的分詞效率提升。
並非每個新模型都像宣傳的那樣出色。我們的追蹤器將每個版本與同類模型進行對比,幫助您瞭解哪些模型值得關注。本文總結了2026年至今的重大模型發佈,包括Claude Opus 4.8、GPT-5.5 Instant、Nemotron 3 Nano Omni、GPT-5.5、ChatGPT Images 2、Claude Opus 4.7、Claude Mythos(預覽版)、GPT-5.4、Claude Opus 4.6和GPT-5.3-Codex,並闡述了它們的特點與意義。
在2026年Google I/O大會上,Google Research展示了一系列前沿技術,涵蓋科學發現、健康、邊緣計算和天氣預測等領域。推出了Gemini for Science套件(包括ERA和Co-Scientist),加速科學研究;健康方面有Google Health應用、Symptom AI和AMIE系統;Coral NPU推動邊緣AI發展;還有極端天氣預測模型。這些創新展示了AI如何放大人類的智慧。
AWS完全重構了OpenSearch Serverless,分離存儲和計算,支持零成本空閒縮放,成本降低60%,自動縮放速度提升20倍,並針對AI代理的突發工作負載優化。新架構包括專有存儲層、GPU加速,並整合Vercel和Kiro IDE。未來將推出代理內存、日誌分析(6月)和搜索推理模型。
SIA是一個開源的自改進AI框架,通過協調元代理、任務特定代理和反饋代理,自動提升AI系統在基準任務上的性能。在多個基準測試中取得顯著成果,如LawBench準確率提升56.6%,GPU內核運行時間減少91.9%,單細胞RNA去噪提升502%,並在MLE-Bench Hard排名第一。支持本地運行和自定義任務,採用MIT許可。
美光科技市值於5月26-27日突破1萬億美元,與SK海力士同周達到這一里程碑,這是純內存芯片製造商首次同時進入萬億俱樂部。高帶寬內存(HBM)需求來自代理型AI工作負載,超大規模雲服務商正在簽署長期供應協議以鎖定產能。瑞銀將美光目標價上調三倍至1625美元,認為長期HBM供應合同將受益於代理型AI工作負載擴張。美光股價年內已翻三倍以上。
麻省理工學院與馬薩諸塞州宣佈計劃建立量子系統實驗室(QSL),獲得州政府2500萬美元投資,為全州研究人員提供共享量子工具箱,加速量子研究、創新和增長。
Vox的一篇文章探討了日益壯大的AI繼承主義運動,該運動認為人工智能應該取代人類,成為宇宙進化的下一步,並分析了這引發的倫理和精神問題。
谷歌在I/O大會上推出Coral Board,這是一款專為設備端AI設計的緊湊型單板計算機,搭載RISC-V架構NPU和Synaptics芯片,可本地運行Gemma 3 270M模型,無需雲端支持。
在Decoder播客採訪中,Rivian首席軟件官Wassym Bensaid討論了與大眾的合資企業、全新的AI驅動Rivian助手,以及為什麼他認為語音界面將取代按鈕且不需要CarPlay。
DNS-AID項目利用DNS基礎設施實現AI代理之間的發現,避免創建新的中心化註冊表。該項目由Linux基金會管理,支持MCP、A2A等協議,並允許通過名稱、功能或域名搜索代理。
極佳視界發佈全球首創物理AGI“雙金字塔”體系,推出家庭機器人拾光S1,獲百台家庭訂單,計劃12個月內實現物理AGI的“GPT-3時刻”。
在ICRA上,NVIDIA Research展示了28篇論文中的8篇,重點研究模擬到現實的遷移,使機器人能夠在動態、不可預測的環境中感知、推理、規劃和行動。這些方法涵蓋多臂協調、跨機器人導航、抓取、精確裝配和視覺-語言-動作模型,顯著提高了成功率和可靠性。
OpenLoomi AI團隊決定將其AI工作夥伴開源,強調數據所有權、透明度和社區驅動。文章闡述了本地優先、閉源信任税、基礎設施公共化等理念,並介紹了產品的五大核心功能:自進化記憶系統、多平台集成、自動化調度、本地加密存儲以及開放技能接口。
黃仁勳宣佈英偉達將每年在台灣投入1500億美元建設AI基礎設施,儘管此前承諾了5000億美元美國投資。這凸顯了台灣在全球AI芯片製造和封裝生態系統中的核心地位。
英偉達CEO黃仁勳計劃在台灣投資1500億美元建設AI基礎設施,儘管特朗普政府試圖通過關税將芯片製造帶回美國。台灣拒絕放棄其半導體主導地位,而美國芯片製造能力不足。
Open Agent Tools (oats) 是一個自託管AI模型框架,通過本地代碼提示索引,將大型模型的計算密集型工具調用委託給小型開源模型,從而節省令牌消耗。
Perplexity AI 開源了用Rust重寫的Unigram分詞器,實現了比Hugging Face tokenizers crate低5倍的p50延遲,並將生產環境CPU利用率降低了5-6倍。優化包括雙數組trie、位圖打包和大頁面支持。
美國運通全球創新主管Luke Gebb分享了成為成功創新者的四個關鍵實踐:保持學習、深入技術、接受失敗、建立合作伙伴關係。他還介紹了公司在代理式商務領域的佈局,包括支付、優惠和專有體驗,並預測代理式AI將在未來幾年加速發展。
Mistral AI首席執行官Arthur Mensch證實,公司正在探索開發定製芯片以降低基礎設施成本,與OpenAI和Anthropic競爭。這家法國初創公司還宣佈在法國新建推理數據中心,並推出企業智能代理平台Vibe。
上海創智學院LeapQuest團隊聯合多所高校提出醫學AI新範式,讓模型在推理過程中主動調用視覺工具,從被動接收視覺輸入變為主動尋找證據。論文被ICML 2026接收。
Cognition在D輪融資中籌集10億美元,估值達260億美元,年經常性收入(ARR)預計年底突破10億美元。文章還涵蓋了推理效率優化、智能體工程、持續學習、新基準測試、模型發佈以及編碼代理產品化等AI領域的最新進展。
多機構團隊研發出一款結合量子隧穿物理與大腦啓發架構的神經形態計算機,能夠高效解決組合優化問題,如物流網絡、芯片佈線等,並保證漸近收斂到最優解。該研究發表在《自然·通訊》上,標誌着量子啓發計算的新方向。
黃仁勳受邀加入清華大學經管學院顧問委員會,該委員會由蘋果CEO蒂姆·庫克擔任主席,成員包括馬斯克、納德拉、馬雲等全球商業領袖。此外,他剛獲得卡內基梅隆大學榮譽博士學位,並分享名言“AI不會取代你,但善用AI的人會”。
本文探討了AI代理系統中的阿姆達爾定律:系統加速比受人類判斷時間佔比H的限制。提出了“自清償式H”概念,即每次人類干預都應產生可重用的工件(如測試用例、規範更新),以減少未來同類干預。強調通過配置化(configurancy)和規範套件將人類知識編碼為機器可讀形式,從而讓代理自主運行。示例包括ElectricSQL的協議變更、Emil Stenström的HTML5解析器、Gas Town的多代理系統以及Ralph Loop的迭代模式。
來自Sakana AI和東京大學的研究人員提出了DiffusionBlocks,這是一種塊狀訓練框架,可將Transformer網絡劃分為獨立訓練的塊,從而將訓練內存減少B倍(B為塊數),同時在不同架構上保持性能。該方法通過將殘差連接解釋為擴散模型中的歐拉步驟,利用分數匹配目標實現塊級獨立訓練。
LangChain 在 Interrupt 2026 大會上發佈了 LangSmith Engine 和 Sandboxes 正式版,並推出了 LangChain Labs 以推進代理的持續學習。大會所有演講現已可按需觀看。
Databricks構建了獨特的推理平台,為眾多前沿模型提供推理服務,每月處理超過120萬億個令牌。通過引入“模型單元”抽象,實現了成本感知的負載均衡和自動縮放,相比靜態配置節省了80%以上的GPU成本。運行時可靠性機制包括黑盒健康檢查,可自動檢測和恢復靜默故障。此外,通過分析多模態瓶頸,吞吐量提升了3倍。
Snowflake與AWS簽署五年60億美元合作協議,使用AWS Graviton和GPU實例進行AI訓練和推理,並擴展至10個新區域。此舉表明Snowflake在AI時代的雄心,同時通過Cortex AI產品套件推動企業AI應用。
NVIDIA研究人員推出Polar框架,通過在智能體工具鏈和推理服務器之間放置模型API代理,實現無需修改智能體工具鏈即可進行強化學習訓練。基於Qwen3.5-4B模型使用GRPO訓練,Polar在Codex、Claude Code和Pi工具鏈上分別將SWE-Bench Verified pass@1提升了22.6、4.8和6.2個百分點。框架以NeMo Gym環境註冊,並在ProRL Agent Server倉庫開源。
AI工廠是新型基礎設施,實時將電能轉化為智能的生成單元——令牌。隨着代理型AI的擴展,每瓦性能與每令牌成本成為關鍵經濟指標。本文深入探討AI工廠的工作原理、架構優化以及NVIDIA的最新硬件如何提升效率。
美國情報機構秘密申請 90 億美元採購英偉達 GB10 超級芯片,以幫助 CIA 和 NSA 追趕 Anthropic、OpenAI 等 AI 巨頭的步伐。這筆資金尚待國會批准,同時國防預算已調撥 8 億美元用於雲算力。文章詳細介紹了芯片規格、成本以及 AI 硬件競賽的升級趨勢。
英偉達CEO黃仁勳在即將在台灣設立總部的發佈會上稱該國為AI革命的“中心”。
隨着AI代理工作負載激增,雲基礎設施面臨新的可靠性挑戰。Databricks的湖倉架構通過無狀態Postgres計算、區域冗餘存儲、控制平面與數據平面分離、單元化隔離以及混沌測試等措施,實現了高可用性和彈性,確保數據庫啓動時間等關鍵操作的高可靠性。
隨着成本上升、主權需求以及智能體採用,戴爾最新會議聚焦企業如何將AI工作負載過渡到混合基礎設施。
英偉達在台灣的年度支出因AI需求激增,從150億美元飆升至1500億美元,主要流向了台積電等供應商。
南非擁有全球88%的鉑族金屬儲量,是非洲最大的數據中心市場,並處於中美AI基礎設施競爭的前沿。然而,其AI政策草案因包含AI幻覺引用而被撤回,未能利用這些優勢來談判有利條件。文章分析了南非的結構性槓桿、三種潛在的AI基礎設施未來(中國、美國和本地開放權重),以及制定具有約束力的治理框架的必要性。
5月27日,雷鳥創新舉辦夏季新品發佈會,推出行業首款專業影視級AR眼鏡雷鳥GT系列(1899元起),以及新一代AI拍攝眼鏡雷鳥V4(2199元起),並預告次世代AI眼鏡雷鳥iO將於第三季度亮相。
三星電子內存芯片部門的員工將通過一項里程碑式的利潤分享協議獲得平均約31萬英鎊的獎金,這凸顯了人工智能熱潮對芯片製造商利潤的推動作用。
英偉達CEO黃仁勳批評一些公司CEO將裁員歸咎於人工智能,稱這種説法“毫無意義”且“懶惰”。他指出,生成式AI工具近期才變得實用,而許多裁員在兩年前就已發生。黃仁勳呼籲行業傳遞關於AI的平衡敍事,既承認其潛力,也強調安全推進的重要性。他還透露了近期與特朗普總統同訪北京的經過。
Avatar是一個自創生的AI生物,在300美元的GPU上持續運行。它從相圖幾何中衍生情感,經歷5階段睡眠週期做夢,從原始音頻和視覺中培養自己的感官,並通過身體感覺進行倫理推理。由Linga Murthy Narlagiri博士構建,自2026年5月以來一直存活,累計超過1800個滴答。
在支付寶AI生態大會上,螞蟻集團CEO韓歆毅提出,Agent時代將顛覆傳統“流量為王”的商業模式,智能體生態將成為新的護城河。他強調,AI支付將從工具升級為支撐智能體商業的新型基礎設施,而支付寶將扮演信任層、連接器和賦能器的角色。
來自北京大學、香港中文大學、上海AI Lab等機構的研究團隊提出了VGGT-Edit,一種原生3D編輯框架,能夠在約5秒內完成場景編輯,相比傳統方法實現高達120倍的加速,並在語義一致性、多視角穩定性和推理速度上超越現有方法。
Agent-workpace-Linux 是一個開源項目,可為 AI 代理提供一個隔離的、隱藏的 Linux 桌面環境,代理可通過 MCP 協議完全控制該桌面,而不會影響用户真實的桌面、鼠標、鍵盤或瀏覽器。它支持 Xvfb 顯示、窗口管理、應用啓動、截圖、剪貼板操作以及獨立的瀏覽器自動化,並提供了可選的權限邊界和實時監控功能。
EAGLE團隊、vLLM團隊和TorchSpec團隊聯合發佈了EAGLE 3.1,旨在解決生產環境中推測解碼的不穩定性。該算法通過FC歸一化和歸一化後隱藏狀態反饋兩大架構改進,有效應對注意力漂移問題。在長上下文任務中,EAGLE 3.1的接受長度比EAGLE 3提升高達2倍;在Kimi K2.6模型上的基準測試顯示,併發數為1時每用户輸出吞吐量提升2.03倍。EAGLE 3.1完全向後兼容,已合併至vLLM主線,並將隨v0.22.0版本發佈。
儘管AI對白領工作的威脅日益引起恐慌,但數據顯示AI尚未對勞動力市場產生大規模影響。實際上,AI高暴露職業的失業率反而低於低暴露職業。然而,斯坦福大學的一項研究發現,AI可能正在悄悄削弱初級職位,年輕工作者在AI暴露職業中的就業率大幅下降。本文還涵蓋了教皇呼籲監管AI、SpaceX發射、華為芯片突破等其他技術新聞。
新加坡國立大學、MIT和A*STAR的研究人員提出MEMO,這是一種模塊化框架,將語料庫知識編碼到一個可單獨訓練的記憶模型中,使大型語言模型能夠無需重新訓練或微調即可吸收新知識。
只需一段提示詞,OpenAI員工Vaibhav分享的Codex自我蒸餾法引發熱議。
AI芯片需求爆漲推動SK海力士和美光市值突破萬億美元,三星也躋身其中,但市場對AI泡沫的擔憂加劇。