AI News HubLIVE
站内改写

上週AI #340 - OpenAI vs Musk + Microsoft, DeepSeek v4, 視覺香蕉

馬斯克訴奧特曼案第一週庭審結束,馬斯克證詞佔據主導;微軟與OpenAI重新談判合作關係,終止獨家權利;DeepSeek釋出V4預覽版,號稱縮小與前沿模型差距;谷歌DeepMind推出視覺香蕉模型,統一影像生成與視覺理解。

文章情報

工程師進階

要點

  • 馬斯克訴奧特曼案庭審首周,馬斯克承認xAI部分使用了OpenAI模型進行蒸餾訓練。
  • 微軟與OpenAI修改合作協議,微軟失去獨家雲服務權利,OpenAI可自由選擇AWS等供應商。
  • DeepSeek釋出V4 Flash和V4 Pro預覽版,開源權重,上下文視窗達100萬token,效能接近前沿模型。
  • 谷歌DeepMind推出視覺香蕉模型,透過指令微調影像生成器實現多種視覺任務,零樣本超越專用模型。

為什麼重要

這條新聞值得關注,因為馬斯克訴奧特曼案庭審首周,馬斯克承認xAI部分使用了OpenAI模型進行蒸餾訓練。

技術影響

可能影響模型選型、推理成本、產品能力和評測基準。

馬斯克訴奧特曼案第一週庭審在加利福尼亞州奧克蘭結束,埃隆·馬斯克連續三天出庭作證成為焦點。馬斯克的法律團隊尋求高達1340億美元的賠償,要求罷免奧特曼和布羅克曼,並撤銷OpenAI向營利性實體的轉型。馬斯克於2015年共同創立OpenAI作為非營利組織,並向該組織捐贈了約3800萬美元。

庭審關鍵事實包括:馬斯克反覆強調“你不能就這麼偷走一個慈善機構”,聲稱CEO薩姆·奧特曼和總裁格雷格·布羅克曼背叛了公司的創始使命,將其轉變為現在估值超過8500億美元的營利性實體。馬斯克作證稱,他創辦OpenAI是為了“制衡谷歌DeepMind”,並且“提出了創意、名字,招募了關鍵人員”。在交叉詢問中,馬斯克承認xAI“部分”使用了OpenAI的模型來訓練自己的模型(通常稱為蒸餾),但他淡化為“標準做法”。

庭審第二週,布羅克曼出庭作證,確認OpenAI正在探索進行史上最大規模的IPO之一,該公司私人估值達8500億美元。布羅克曼透露他持有近300億美元的OpenAI股份,這將使他躋身世界最富有者之列,此外還持有4.71億美元的Stripe股份。庭審在地區法院的YouTube頁面直播,僅提供音訊,不允許錄製。薩姆·奧特曼和希馮·齊利斯預計將於本月晚些時候作證。

微軟與OpenAI重新談判了合作協議,解決了因OpenAI與亞馬遜高達500億美元的交易而醞釀的法律糾紛。新條款取代了微軟的無限期獨家權利(此前持續到OpenAI實現AGI),改為2032年前的非排他性許可。微軟仍是OpenAI的“主要雲合作伙伴”,OpenAI產品將“首先在Azure上提供”,除非微軟無法支援所需能力——但關鍵的是,OpenAI現在可以在任何雲提供商上提供所有產品,包括AWS。

核心衝突源於OpenAI在2026年2月與亞馬遜的交易,該交易授予AWS獨家權利托管OpenAI的代理建立工具Frontier,並共同開發AWS Bedrock上的有狀態執行時技術。微軟之前的合同賦予其對所有OpenAI API訪問產品的獨家權利,包括Frontier,促使微軟公開反駁AWS獨家條款,並據報道考慮法律行動。根據新協議,微軟停止向OpenAI支付收入分成,而OpenAI繼續向微軟支付分成直到2030年(有上限);微軟保留OpenAI營利實體約27%的股份;亞馬遜CEO安迪·賈西確認OpenAI模型將在AWS Bedrock上提供。

DeepSeek釋出了DeepSeek V4 Flash和V4 Pro的預覽版,兩者均為純文本混合專家模型,擁有100萬token的上下文視窗。V4 Pro總引數達1.6萬億,啟用引數490億;V4 Flash總引數2840億,啟用引數130億。與之前版本一樣,權重在Hugging Face上開源,並附有詳細的技術報告,解釋架構中的關鍵技術創新。DeepSeek聲稱相比V3.2在效率和效能上取得重大提升,推理和編碼結果在多項基準測試中接近或達到領先模型水平。

谷歌DeepMind發表了論文《影像生成器是通用視覺學習者》,並推出了視覺香蕉(Vision Banana)模型,該模型透過將感知視為影像生成,統一執行影像生成和視覺理解任務。透過對基礎影像生成器Nano Banana Pro進行輕量級指令微調,視覺香蕉可以處理語義分割、例項分割、單目度量深度估計和表面法線估計——所有這些都無需特定任務模組,只需改變提示即可。核心見解與LLM訓練正規化相似:正如文本的生成式預訓練能發展出豐富的語言表示,影像生成訓練能隱含地教會模型幾何、語義和深度,這些知識隨後可以以可解碼格式表達。在多個零樣本遷移基準測試中,視覺香蕉超越了專用模型,且訓練資料中不包含評估基準資料。關鍵的是,指令微調並未降低生成效能——視覺香蕉在GenAI-Bench文生圖評估中對抗Nano Banana Pro取得了53.5%的勝率。