AI News HubLIVE
站内改写3 分钟阅读

AI价值捕获

代理式AI的快速采用导致代币价值和需求大幅增长,AI实验室如Anthropic捕获了巨大价值。虽然最终用户和推理提供商获益,但台积电和英伟达尚未根据繁荣调整定价。

来源Hacker News AI作者: nl

自2025年12月起,代理式AI真正开始发挥作用,改变了AI行业的价值格局。过去几个月,代理式AI跨越了重要拐点,每个代币的价值大幅提升,而同时硬件和软件改进使代币生成成本急剧下降。用户从消费代币中获得巨大投资回报,推动了需求的爆发式增长,目前这还只是早期阶段。例如,Anthropic的年化收入从90亿美元飙升至超过440亿美元,其推理基础设施的毛利率从38%提升至70%。

最终用户正享受生产力盛宴:过去需要数十人时、花费数千美元的任务,现在只需几分钟和几美元的代币即可完成。这种收入与利润的激增源于代币创造的价值大幅改善了业务。例如,SemiAnalysis在Anthropic Claude代币上的年支出高达1095万美元,但由此获得的价值使其远超竞争对手并占据市场份额。

在供应端,新芯片如Blackwell每秒可生成比Hopper多30倍的代币,ASIC如TPUv7和Trainium 3也有类似改进。推理提供商如Fireworks、Baseten、Fal的利润率正在扩大,收入呈超高速增长。甚至硬件成本也在重新定价,内存价格过去一年上涨了6倍,GPU租赁价格也在飙升。

然而,行业中有两家公司拥有惊人的定价能力却尚未行动:台积电和英伟达没有对最近的AI价值生成热潮做出反应。它们仍基于旧假设运作,认为每单位计算力的支付意愿会随时间下降,但这一假设已不再成立。代理式AI使得需求不再是线性的,而是复合增长。

本文探讨AI价值的流向——从最终用户到推理提供商、Neocloud以及硬件提供商,并揭示台积电和英伟达如何将巨大价值释放到生态系统的每个垂直领域。我们引入一个新框架:“一图统御全图”,分析GPU租赁经济学,考察谁在AI生态系统中捕获最多价值。

AI价值利润池:从2023年到2025年,AI的所有价值都被基础设施层捕获。英伟达在2023年5月首次财报电话会议后大涨25%,标志着AI交易的开始。2024年,Vistra和GE Vernova成为标普500中表现最好的股票,因为电力成为关键瓶颈。2025年,内存表现抢眼,SanDisk、西部数据、希捷和美光均上涨超过200%。与此同时,模型创建者和推理提供商的毛利率却很低迷,AI的实际效用似乎仅限于更好的搜索和风格化自拍,怀疑论者认为AI无法实现数万亿美元的资本支出承诺。

代理式AI改变了游戏规则:2025年12月,代理式AI开始真正发挥作用。SemiAnalysis大量使用Claude Code,代理不再局限于编程,分析师每天使用代理将Excel模型转化为仪表板、创建图表、构建财务模型和分析公司收益。SemiAnalysis的年化代币支出已达员工薪酬的30%,每人每月消耗近50亿代币,是Meta的5倍多。每个代币的价值明显增加,Opus 4.7在代理任务上的实际混合价格仅为每百万代币0.99美元,而标价为5/25美元。这是因为代理工作负载的输入输出比极高(约300:1),缓存命中率超过90%,使得大部分代币属于最便宜层级。

代币生产成本骤降:代币生产成本的下降是推理提供商价值增长的最大驱动力。代币生产成本急剧下降,因为加速器每代的价格上涨被更高的吞吐量所抵消。B300在软件优化下吞吐量可提升14倍,结合硬件改进,GB300 NVL72配置在FP8下的吞吐量比H100高17倍,在FP4下高达32倍,而每GPU总拥有成本仅高出70%。

模型提供商利润率将持续上升:尽管Anthropic降低了Opus 4.5的价格,但由于软件改进和从Hopper切换到Blackwell,其利润率实际上有所提高。Anthropic通过成本降低实现了利润率扩张,并将需求转移到更昂贵的SKU上。例如,Opus fast定价为常规Opus的6倍,Mythos为5倍,但AI重度用户仍乐意支付,因为生产力收益超过成本。前沿模型提供商低毛利率的时代已经结束。

为什么模型提供商利润不会被竞争侵蚀:首先,前沿模型保持定价权,开源模型在真实知识工作上仍明显落后。其次,计算限制意味着没有单个实验室能服务整个市场,代币需求将远超供应。

台积电和英伟达尚未调整:尽管黄仁勋在GTC上强调代理式AI,但英伟达和台积电尚未完全内化过去几个月对代币经济的变革。它们仍基于每单位计算支付意愿随时间下降的旧假设,但这一假设已不再成立。市场需求呈复合增长,Anthropic的ARR已达440亿美元以上,开放权重模型也在扩大计算基础。这些公司正将巨大价值释放到生态系统各垂直领域。