AI News HubLIVE
站內改寫3 分鐘閱讀

蘋果會效仿SpaceX嗎?

蘋果正在開發自研AI推理晶片Baltra,但更值得關注的是其容量如何使用。文章分析了三種可能:內部使用、出售硬體、出租推理服務。借鑑SpaceX將過剩算力出租給Anthropic以及Meta的類似動向,作者認為蘋果最可能選擇出租其高度隱私保護的推理能力,將“信任”作為核心產品。

來源Hacker News AI作者: antrix

蘋果自主研發伺服器晶片的計劃,表面上看無非是又一家科技巨頭自建AI推理硬體:不再依賴輝達,而是像谷歌(TPU)、亞馬遜(Inferentia)、微軟(Maia)和Meta(MTIA)一樣,為自家AI負載定製晶片。據馬克·古爾曼報道,蘋果的這款晶片代號Baltra,採用臺積電3奈米工藝,由博通協助設計,專攻推理而非訓練,預計2027年問世。這聽起來中規中矩,不過是入局的標配。

但真正有趣的問題在晶片落地之後:蘋果將如何處理這些計算能力?

讓我們先看事實,因為這一傳言已有跡可循。在2024年的WWDC上,蘋果推出了私有云計算(Private Cloud Compute),這是執行在蘋果自研晶片上的真實資料中心伺服器,搭載專為LLM推理打造的硬化版iOS。據報道,這些機架最初基於M2 Ultra,未來將過渡到M5;而Baltra則是其專用後繼晶片。蘋果已經在執行AI資料中心,唯一懸而未決的是其規模。

而恰恰是規模問題,最近出現了新的變數。那些為自有需求建造龐大AI計算叢集的公司,開始將富餘算力對外出租。眼下最鮮明的例子來自SpaceX:它建成了Colossus 1叢集,功率超過300兆瓦,配備超過22萬塊輝達GPU,隨後竟將整個叢集以每月約12.5億美元的價格租給了Anthropic——這直接與馬斯克的所有AI專案形成競爭。背後的實際原因更是點明瞭趨勢:據彭博社報道,SpaceX出租叢集是因為自己的團隊難以充分利用它。先為使命建算力,卻發現算力過剩,於是轉身成為“房東”。

Meta也公開表露了類似想法。當被問及是否要成立雲業務時,扎克伯格表示這“肯定在考慮之中”,並指出“幾乎每週”都有外部公司請求Meta開放API或出售算力。將自有的AI容量對外出租——這已是亞馬遜和谷歌(透過Inferentia和TPU)正在做的事情——正迅速成為所有算力大戶的本能反應。

這一趨勢重新定義了蘋果的選擇。它面前有三條路。

第一條:內部專用。將Baltra完全用於蘋果智慧,絕不外租。這曾是不言自明的預設選擇,但現在連Meta都在說服自己放棄這條路,因為如此規模的閒置算力無異於燒錢。

第二條:出售硬體,將蘋果晶片在資料中心領域複製其在PC領域的成功。蘋果在筆記型電腦上並非靠原始速度取勝,而是憑藉每瓦效能讓英特爾顯得又熱又慢。而在電力與散熱成本佔據主導的機架環境中,每瓦效能恰恰是最關鍵的指標。戴爾一個季度的AI伺服器收入已達161億美元,超過其整個PC業務。一臺能效優異的蘋果推理伺服器確實能構成威脅。但問題在於,蘋果此前做過類似嘗試並最終放棄:2011年它砍掉了Xserve,因為向IT部門銷售硬體利潤微薄,不符合蘋果的風格,而如今AI買家大多需要CUDA,蘋果並不提供。

第三條:出租推理能力。這是SpaceX的做法,也是最值得押注的一條路,但蘋果的版本不會與Colossus雷同。SpaceX出租的是一種通用商品:一堆輝達GPU,你在其他地方也能租到。而蘋果將提供獨一無二的東西:私有云計算(Private Cloud Compute)的設計確保了即使蘋果自身也無法窺探其上執行的內容,並且該架構已公開供研究者檢驗。對於每一家希望使用前沿模型但因法律限制無法將資料送入黑盒雲的醫院、銀行和律師事務所而言,“天生具備隱私保護的推理”是一種沒有競爭對手的產品。SpaceX出租的是原始算力,而蘋果可以出租“信任”。

這項業務的形態堪稱最“蘋果”式的構想。它不是蘋果拒絕涉足的鬆散晶片元件交易,而是服務——服務如今正是蘋果的核心業務:蘋果年度服務收入剛剛突破1000億美元,毛利率約75%,而硬體毛利率僅為36%。一個私密推理雲是一種高利潤服務,執行在蘋果本已為自己打造的晶片之上。效率與隱私——蘋果在全球最擅長的兩件事——恰好是當前市場願意為之付出最高溢價的兩大要素。

那麼,蘋果會效仿SpaceX嗎?誠實的謹慎在於:內部需求必須首先到位,而蘋果智慧的起步確實緩慢。但SpaceX出租Colossus叢集正是因為建造的算力超出了自身需求;Meta出於同樣原因正盯著同一扇門。蘋果正朝著建造地球上最高效、最私密的推理算力艦隊的方向前進,而與此同時,Anthropic以及半數財富500強企業正在四處尋覓可信任的計算能力。問題不再是蘋果能否建成它,而是蘋果能否忍住不外租。