AI代幣將使你的企業雲賬單再次飆升
AI使用正轉向基於代幣的定價模式,這比之前的固定費用模式昂貴得多。衡量AI帶來的價值仍然是一個未解決的問題。在FinOps X 2026大會上,專家指出代幣已成為生成式AI經濟的基礎單位,代幣價格雖有所下降,但總支出因使用量激增而持續上升,企業面臨類似早期雲計算定價的挑戰。
根據ZDNet報道,AI代幣正在成為企業雲賬單的新痛點。在日前於聖地亞哥舉行的FinOps X 2026大會上,專家們指出,AI定價已告別虧本吸引用户的時代,代幣定價模式正成為整個生成式AI經濟的基礎,且成本遠高於舊模式。許多企業客户對此感到不安,因為這讓他們想起雲計算早期不可預測的賬單和商業模式變動。
代幣:AI的“原子單位”
FinOps基金會執行董事J.R. Storment將代幣稱為“AI的原子單位”。他在主題演講中表示,代幣在現代經濟中扮演的角色甚至可能超過20世紀的石油。代幣同時是硬件和計算資源的輸出單位、AI實驗室的定價單位,以及企業尋求變現的價值單位。正是這種抽象性讓AI實驗室和超大規模雲服務商青睞於此——他們不再直接按GPU類型、內存和功耗收費,而是通過一個統一的“每百萬代幣”價格來計費,並區分輸入和輸出代幣價格。
那麼代幣究竟是什麼?Storment解釋,代幣是大型語言模型處理文本時能夠拆分的最小單位。對於英文,通常一個代幣約等於四分之三個單詞。但這個簡單單位背後隱藏着巨大複雜性,包括模型選擇、量化、緩存策略和代理使用等,這正是FinOps團隊當前需要破解的難題。
“無限代幣”時代終結
2023年至2025年初是AI實驗的低成本時期,但過去18個月企業迎來了殘酷的現實。Storment描述了三個不同階段:ChatGPT之前的“舊AI時代”、聊天機器人可編寫簡單代碼的“美好舊時光”,以及2025年11月後模型性能大幅提升的新世界。在“美好舊時光”裏,企業曾享受無限代幣訂閲,甚至出現“代幣最大化”競賽。如今,代幣排行榜已成往事,因為無人能浪費得起代幣。亞馬遜高級副總裁Dave Treadwell懇求企業“不要為了用AI而用AI”。
Storment指出,從2025年6月到11月,全球代幣使用量呈線性增長,但新模型和代理模式的到來徹底改變了局面。上下文窗口從數千擴展至數百萬代幣,代理模式引入了循環、重試和糾正機制,導致使用量激增。企業曾樂於補貼這種行為,直到看到賬單——有些月付200美元的用户實際產生了數萬美元成本。例如,SemiAnalysis估計,Anthropic的200美元計劃曾提供價值8000美元的Claude代幣,而類似OpenAI計劃提供14000美元的Codex代幣。如今這些優惠已不復存在,企業必須為AI代幣支付真實成本。
Storment強調:“現在最重要的是AI價值。我們必須將價值帶回我們的工作。”代幣已成為衡量一切的標準,驅動着全球代幣經濟。
代幣價格為何不會崩盤
通常,摩爾定律和超大規模競爭應推動代幣價格持續下降。事實上,自2023年以來代幣價格確實大幅下降。SAP的數據顯示其單位成本呈下降趨勢。但兩家機構都警告:價格底部可能已臨近。Storment指出,自2025年11月以來主要實驗室的代幣價格基本持平,這直接歸因於硬件和電力瓶頸:“我們無法獲得足夠的硬件和電力,面臨積壓、長承諾期和短缺。”英特爾CEO預計GPU及相關組件的供應要到2028年才能緩解。SAP副總裁Frederik Pohl也指出供應鏈限制和硬件價格上漲使前沿模型成本越來越高。
結果呈現經典的傑文斯悖論:單位成本下降,總支出卻爆炸式增長。Pohl表示:“這是著名的悖論。在我們的規模上,單位成本在下降,但某些月份支出翻倍。”高盛預計,未來3.5年全球代幣用量將從當前的6萬億增至120萬億。即使供應放鬆後代幣價格進一步下跌,也很難跟上用量24倍的增長。
FinOps發現代幣經濟
對於習慣於雲成本優化和預留實例的FinOps社區,代幣定價既熟悉又陌生。熟悉的是其按用量計費、賬單龐大、預測困難。陌生的是單位與語言而非基礎設施掛鈎,且隨着模型發佈快速變化。Pohl斷言:“AI不僅擴展了雲劇本,更打破了它。AI比雲對數據中心的改變更大。”與CPU不同,AI模型各有獨特優勢和成本結構,替換LLM不僅是定價決策,更是輸出質量決策。
SAP的經驗是企業如何重構的典型案例。其業務AI平台運行多種LLM和超大規模平台。當SAP最初尋找AI成本數據時,立即遇到障礙。現有工具無法區分不同模型和用量。他們不得不手動提取數據、合併表格,才獲得初步視圖。這份數據直達CTO,幾天內就從“有趣”變成“我需要定期報告”。Pohl總結FinOps教訓:“如果CTO要求一個數字,那不是問題,而是命令。”
SAP由此建立了圍繞三個支柱的內部AI FinOps框架:支出可見性(消費內容、方式和地點)、經濟性(以代幣級指標衡量效率,如輸入輸出比、緩存比、代幣與支出漂移)和價值(連接AI支出與業務成果,通過“每用例成本”和“收入推理成本”判斷AI功能經濟可行性)。Pohl表示:“每個代幣都必須賺回其成本。”這呼應了NVIDIA CEO黃仁勳的“代幣工廠效能”。
代幣經濟學:超越計數
如果説FinOps關注成本控制和問責,那麼代幣經濟學則關注代幣作為經濟商品的完整生命週期。Storment將其定義為“將能源和資本轉化為代幣和資源、消費這些代幣以驅動高效智能、最終在後台創造價值的新興學科”。這分為三個桶:生產(在雲數據中心、邊緣設備甚至太空數據中心創建代幣)、消費(分配、預測和優化,類似FinOps for AI)和價值(代幣貨幣化、基於成本調整定價、全公司勞動影響)。
最後一個桶直接衝擊SaaS商業模式。Storment在採訪中表示,代幣定價正在改變財富100強公司的定價模式。他提到微軟GitHub將Copilot轉向更明確的按用量收費,引發開發者不滿。AI實驗室本身也在收緊政策,例如限制無限代幣或調整價格。Storment最後強調,企業必須為代幣價值建立可重複的衡量體系,否則將面臨失控的支出。