AI代币将使你的企业云账单再次飙升
AI使用正转向基于代币的定价模式,这比之前的固定费用模式昂贵得多。衡量AI带来的价值仍然是一个未解决的问题。在FinOps X 2026大会上,专家指出代币已成为生成式AI经济的基础单位,代币价格虽有所下降,但总支出因使用量激增而持续上升,企业面临类似早期云计算定价的挑战。
根据ZDNet报道,AI代币正在成为企业云账单的新痛点。在日前于圣地亚哥举行的FinOps X 2026大会上,专家们指出,AI定价已告别亏本吸引用户的时代,代币定价模式正成为整个生成式AI经济的基础,且成本远高于旧模式。许多企业客户对此感到不安,因为这让他们想起云计算早期不可预测的账单和商业模式变动。
代币:AI的“原子单位”
FinOps基金会执行董事J.R. Storment将代币称为“AI的原子单位”。他在主题演讲中表示,代币在现代经济中扮演的角色甚至可能超过20世纪的石油。代币同时是硬件和计算资源的输出单位、AI实验室的定价单位,以及企业寻求变现的价值单位。正是这种抽象性让AI实验室和超大规模云服务商青睐于此——他们不再直接按GPU类型、内存和功耗收费,而是通过一个统一的“每百万代币”价格来计费,并区分输入和输出代币价格。
那么代币究竟是什么?Storment解释,代币是大型语言模型处理文本时能够拆分的最小单位。对于英文,通常一个代币约等于四分之三个单词。但这个简单单位背后隐藏着巨大复杂性,包括模型选择、量化、缓存策略和代理使用等,这正是FinOps团队当前需要破解的难题。
“无限代币”时代终结
2023年至2025年初是AI实验的低成本时期,但过去18个月企业迎来了残酷的现实。Storment描述了三个不同阶段:ChatGPT之前的“旧AI时代”、聊天机器人可编写简单代码的“美好旧时光”,以及2025年11月后模型性能大幅提升的新世界。在“美好旧时光”里,企业曾享受无限代币订阅,甚至出现“代币最大化”竞赛。如今,代币排行榜已成往事,因为无人能浪费得起代币。亚马逊高级副总裁Dave Treadwell恳求企业“不要为了用AI而用AI”。
Storment指出,从2025年6月到11月,全球代币使用量呈线性增长,但新模型和代理模式的到来彻底改变了局面。上下文窗口从数千扩展至数百万代币,代理模式引入了循环、重试和纠正机制,导致使用量激增。企业曾乐于补贴这种行为,直到看到账单——有些月付200美元的用户实际产生了数万美元成本。例如,SemiAnalysis估计,Anthropic的200美元计划曾提供价值8000美元的Claude代币,而类似OpenAI计划提供14000美元的Codex代币。如今这些优惠已不复存在,企业必须为AI代币支付真实成本。
Storment强调:“现在最重要的是AI价值。我们必须将价值带回我们的工作。”代币已成为衡量一切的标准,驱动着全球代币经济。
代币价格为何不会崩盘
通常,摩尔定律和超大规模竞争应推动代币价格持续下降。事实上,自2023年以来代币价格确实大幅下降。SAP的数据显示其单位成本呈下降趋势。但两家机构都警告:价格底部可能已临近。Storment指出,自2025年11月以来主要实验室的代币价格基本持平,这直接归因于硬件和电力瓶颈:“我们无法获得足够的硬件和电力,面临积压、长承诺期和短缺。”英特尔CEO预计GPU及相关组件的供应要到2028年才能缓解。SAP副总裁Frederik Pohl也指出供应链限制和硬件价格上涨使前沿模型成本越来越高。
结果呈现经典的杰文斯悖论:单位成本下降,总支出却爆炸式增长。Pohl表示:“这是著名的悖论。在我们的规模上,单位成本在下降,但某些月份支出翻倍。”高盛预计,未来3.5年全球代币用量将从当前的6万亿增至120万亿。即使供应放松后代币价格进一步下跌,也很难跟上用量24倍的增长。
FinOps发现代币经济
对于习惯于云成本优化和预留实例的FinOps社区,代币定价既熟悉又陌生。熟悉的是其按用量计费、账单庞大、预测困难。陌生的是单位与语言而非基础设施挂钩,且随着模型发布快速变化。Pohl断言:“AI不仅扩展了云剧本,更打破了它。AI比云对数据中心的改变更大。”与CPU不同,AI模型各有独特优势和成本结构,替换LLM不仅是定价决策,更是输出质量决策。
SAP的经验是企业如何重构的典型案例。其业务AI平台运行多种LLM和超大规模平台。当SAP最初寻找AI成本数据时,立即遇到障碍。现有工具无法区分不同模型和用量。他们不得不手动提取数据、合并表格,才获得初步视图。这份数据直达CTO,几天内就从“有趣”变成“我需要定期报告”。Pohl总结FinOps教训:“如果CTO要求一个数字,那不是问题,而是命令。”
SAP由此建立了围绕三个支柱的内部AI FinOps框架:支出可见性(消费内容、方式和地点)、经济性(以代币级指标衡量效率,如输入输出比、缓存比、代币与支出漂移)和价值(连接AI支出与业务成果,通过“每用例成本”和“收入推理成本”判断AI功能经济可行性)。Pohl表示:“每个代币都必须赚回其成本。”这呼应了NVIDIA CEO黄仁勋的“代币工厂效能”。
代币经济学:超越计数
如果说FinOps关注成本控制和问责,那么代币经济学则关注代币作为经济商品的完整生命周期。Storment将其定义为“将能源和资本转化为代币和资源、消费这些代币以驱动高效智能、最终在后台创造价值的新兴学科”。这分为三个桶:生产(在云数据中心、边缘设备甚至太空数据中心创建代币)、消费(分配、预测和优化,类似FinOps for AI)和价值(代币货币化、基于成本调整定价、全公司劳动影响)。
最后一个桶直接冲击SaaS商业模式。Storment在采访中表示,代币定价正在改变财富100强公司的定价模式。他提到微软GitHub将Copilot转向更明确的按用量收费,引发开发者不满。AI实验室本身也在收紧政策,例如限制无限代币或调整价格。Storment最后强调,企业必须为代币价值建立可重复的衡量体系,否则将面临失控的支出。