AI價值捕獲
代理式AI的快速採用導致代幣價值和需求大幅增長,AI實驗室如Anthropic捕獲了巨大價值。雖然終端使用者和推理提供商獲益,但臺積電和輝達尚未根據繁榮調整定價。
自2025年12月起,代理式AI真正開始發揮作用,改變了AI行業的價值格局。過去幾個月,代理式AI跨越了重要拐點,每個代幣的價值大幅提升,而同時硬體和軟體改進使代幣生成成本急劇下降。使用者從消費代幣中獲得巨大投資回報,推動了需求的爆發式增長,目前這還只是早期階段。例如,Anthropic的年化收入從90億美元飆升至超過440億美元,其推理基礎設施的毛利率從38%提升至70%。
終端使用者正享受生產力盛宴:過去需要數十人時、花費數千美元的任務,現在只需幾分鐘和幾美元的代幣即可完成。這種收入與利潤的激增源於代幣創造的價值大幅改善了業務。例如,SemiAnalysis在Anthropic Claude代幣上的年支出高達1095萬美元,但由此獲得的價值使其遠超競爭對手並佔據市場份額。
在供應端,新晶片如Blackwell每秒可生成比Hopper多30倍的代幣,ASIC如TPUv7和Trainium 3也有類似改進。推理提供商如Fireworks、Baseten、Fal的利潤率正在擴大,收入呈超高速增長。甚至硬體成本也在重新定價,記憶體價格過去一年上漲了6倍,GPU租賃價格也在飆升。
然而,行業中有兩家公司擁有驚人的定價能力卻尚未行動:臺積電和輝達沒有對最近的AI價值生成熱潮做出反應。它們仍基於舊假設運作,認為每單位計算力的支付意願會隨時間下降,但這一假設已不再成立。代理式AI使得需求不再是線性的,而是複合增長。
本文探討AI價值的流向——從終端使用者到推理提供商、Neocloud以及硬體提供商,並揭示臺積電和輝達如何將巨大價值釋放到生態系統的每個垂直領域。我們引入一個新框架:“一圖統御全圖”,分析GPU租賃經濟學,考察誰在AI生態系統中捕獲最多價值。
AI價值利潤池:從2023年到2025年,AI的所有價值都被基礎設施層捕獲。輝達在2023年5月首次財報電話會議後大漲25%,標誌著AI交易的開始。2024年,Vistra和GE Vernova成為標普500中表現最好的股票,因為電力成為關鍵瓶頸。2025年,記憶體表現搶眼,SanDisk、西部資料、希捷和美光均上漲超過200%。與此同時,模型建立者和推理提供商的毛利率卻很低迷,AI的實際效用似乎僅限於更好的搜尋和風格化自拍,懷疑論者認為AI無法實現數萬億美元的資本支出承諾。
代理式AI改變了遊戲規則:2025年12月,代理式AI開始真正發揮作用。SemiAnalysis大量使用Claude Code,代理不再侷限於程式設計,分析師每天使用代理將Excel模型轉化為儀表板、建立圖表、構建財務模型和分析公司收益。SemiAnalysis的年化代幣支出已達員工薪酬的30%,每人每月消耗近50億代幣,是Meta的5倍多。每個代幣的價值明顯增加,Opus 4.7在代理任務上的實際混合價格僅為每百萬代幣0.99美元,而標價為5/25美元。這是因為代理工作負載的輸入輸出比極高(約300:1),快取命中率超過90%,使得大部分代幣屬於最便宜層級。
代幣生產成本驟降:代幣生產成本的下降是推理提供商價值增長的最大驅動力。代幣生產成本急劇下降,因為加速器每代的價格上漲被更高的吞吐量所抵消。B300在軟體最佳化下吞吐量可提升14倍,結合硬體改進,GB300 NVL72配置在FP8下的吞吐量比H100高17倍,在FP4下高達32倍,而每GPU總擁有成本僅高出70%。
模型提供商利潤率將持續上升:儘管Anthropic降低了Opus 4.5的價格,但由於軟體改進和從Hopper切換到Blackwell,其利潤率實際上有所提高。Anthropic透過成本降低實現了利潤率擴張,並將需求轉移到更昂貴的SKU上。例如,Opus fast定價為常規Opus的6倍,Mythos為5倍,但AI重度使用者仍樂意支付,因為生產力收益超過成本。前沿模型提供商低毛利率的時代已經結束。
為什麼模型提供商利潤不會被競爭侵蝕:首先,前沿模型保持定價權,開源模型在真實知識工作上仍明顯落後。其次,計算限制意味著沒有單個實驗室能服務整個市場,代幣需求將遠超供應。
臺積電和輝達尚未調整:儘管黃仁勳在GTC上強調代理式AI,但輝達和臺積電尚未完全內化過去幾個月對代幣經濟的變革。它們仍基於每單位計算支付意願隨時間下降的舊假設,但這一假設已不再成立。市場需求呈複合增長,Anthropic的ARR已達440億美元以上,開放權重模型也在擴大計算基礎。這些公司正將巨大價值釋放到生態系統各垂直領域。