2026-05-05 16:30 UTC+8站內改寫2 分鐘閱讀更新: 2026-06-30 21:03 UTC+8

上週AI #340 - OpenAI vs Musk + Microsoft, DeepSeek v4, 視覺香蕉

馬斯克訴奧特曼案第一週庭審結束，馬斯克證詞佔據主導；微軟與OpenAI重新談判合作關係，終止獨家權利；DeepSeek釋出V4預覽版，號稱縮小與前沿模型差距；谷歌DeepMind推出視覺香蕉模型，統一影像生成與視覺理解。

來源Last Week in AI作者: Last Week in AI

馬斯克訴奧特曼案第一週庭審在加利福尼亞州奧克蘭結束，埃隆·馬斯克連續三天出庭作證成為焦點。馬斯克的法律團隊尋求高達1340億美元的賠償，要求罷免奧特曼和布羅克曼，並撤銷OpenAI向營利性實體的轉型。馬斯克於2015年共同創立OpenAI作為非營利組織，並向該組織捐贈了約3800萬美元。

庭審關鍵事實包括：馬斯克反覆強調“你不能就這麼偷走一個慈善機構”，聲稱CEO薩姆·奧特曼和總裁格雷格·布羅克曼背叛了公司的創始使命，將其轉變為現在估值超過8500億美元的營利性實體。馬斯克作證稱，他創辦OpenAI是為了“制衡谷歌DeepMind”，並且“提出了創意、名字，招募了關鍵人員”。在交叉詢問中，馬斯克承認xAI“部分”使用了OpenAI的模型來訓練自己的模型（通常稱為蒸餾），但他淡化為“標準做法”。

庭審第二週，布羅克曼出庭作證，確認OpenAI正在探索進行史上最大規模的IPO之一，該公司私人估值達8500億美元。布羅克曼透露他持有近300億美元的OpenAI股份，這將使他躋身世界最富有者之列，此外還持有4.71億美元的Stripe股份。庭審在地區法院的YouTube頁面直播，僅提供音訊，不允許錄製。薩姆·奧特曼和希馮·齊利斯預計將於本月晚些時候作證。

微軟與OpenAI重新談判了合作協議，解決了因OpenAI與亞馬遜高達500億美元的交易而醞釀的法律糾紛。新條款取代了微軟的無限期獨家權利（此前持續到OpenAI實現AGI），改為2032年前的非排他性許可。微軟仍是OpenAI的“主要雲合作伙伴”，OpenAI產品將“首先在Azure上提供”，除非微軟無法支援所需能力——但關鍵的是，OpenAI現在可以在任何雲提供商上提供所有產品，包括AWS。

核心衝突源於OpenAI在2026年2月與亞馬遜的交易，該交易授予AWS獨家權利托管OpenAI的代理建立工具Frontier，並共同開發AWS Bedrock上的有狀態執行時技術。微軟之前的合同賦予其對所有OpenAI API訪問產品的獨家權利，包括Frontier，促使微軟公開反駁AWS獨家條款，並據報道考慮法律行動。根據新協議，微軟停止向OpenAI支付收入分成，而OpenAI繼續向微軟支付分成直到2030年（有上限）；微軟保留OpenAI營利實體約27%的股份；亞馬遜CEO安迪·賈西確認OpenAI模型將在AWS Bedrock上提供。

DeepSeek釋出了DeepSeek V4 Flash和V4 Pro的預覽版，兩者均為純文本混合專家模型，擁有100萬token的上下文視窗。V4 Pro總引數達1.6萬億，啟用引數490億；V4 Flash總引數2840億，啟用引數130億。與之前版本一樣，權重在Hugging Face上開源，並附有詳細的技術報告，解釋架構中的關鍵技術創新。DeepSeek聲稱相比V3.2在效率和效能上取得重大提升，推理和編碼結果在多項基準測試中接近或達到領先模型水平。

谷歌DeepMind發表了論文《影像生成器是通用視覺學習者》，並推出了視覺香蕉（Vision Banana）模型，該模型透過將感知視為影像生成，統一執行影像生成和視覺理解任務。透過對基礎影像生成器Nano Banana Pro進行輕量級指令微調，視覺香蕉可以處理語義分割、例項分割、單目度量深度估計和表面法線估計——所有這些都無需特定任務模組，只需改變提示即可。核心見解與LLM訓練正規化相似：正如文本的生成式預訓練能發展出豐富的語言表示，影像生成訓練能隱含地教會模型幾何、語義和深度，這些知識隨後可以以可解碼格式表達。在多個零樣本遷移基準測試中，視覺香蕉超越了專用模型，且訓練資料中不包含評估基準資料。關鍵的是，指令微調並未降低生成效能——視覺香蕉在GenAI-Bench文生圖評估中對抗Nano Banana Pro取得了53.5%的勝率。