AI News HubLIVE
站内改写2 分钟阅读

当前大语言模型成本为何不可持续

大型语言模型的成本正在飙升,但技术进步和市场竞争将推动价格下降。本文分析了性能瓶颈、开源模型、芯片改进、零切换成本和本地模型这五个关键因素。

来源Hacker News AI作者: adityapatadia

许多公司正被高昂的AI成本所困扰。优步(Uber)在短短4个月内就用完了全年的AI预算,而微软、Salesforce和GitHub也在采取措施减少员工的AI支出。

另一方面,AI让许多编程任务变得非常容易,并在数据解读、制作精美幻灯片、设计应用和网站等领域持续提供帮助。目前,大型AI实验室拥有所谓的“前沿模型”,这些模型在多种任务上表现卓越。前沿AI实验室既负责研究也自行托管模型,因此这些模型的成本最高。例如,GPT 5.5每百万输入令牌收费5美元,每百万输出令牌收费30美元,是目前OpenRouter上最贵的模型。我用该模型对50个文件进行TypeScript类型修复,就花费了54美元。

然而,模型性能的瓶颈、开源模型的发布、芯片与模型的改进、零切换成本以及本地模型的兴起,将可能使AI实验室难以维持当前的高昂定价。

模型性能瓶颈:尽管每次模型发布都有改进,但提升幅度越来越小。除非有全新的突破,否则现有学习和推理能力的扩展空间有限。训练数据方面,大多数AI实验室可能已耗尽了数字和印刷媒体中的所有可用内容,改进数据集将非常困难。这意味着模型价格因性能提升而持续上涨的趋势难以持续。例如,Claude Opus 4.8与Claude Opus 4.7价格相同,一旦模型改进停滞,价格将因竞争而下降。

开源模型:OpenAI在2022年推出ChatGPT时拥有巨大领先优势,但这一优势正在消失,Anthropic在2025-26年占据了首位。如今,像GLM-5.2这样的开源模型在编程基准测试中击败了GPT和Opus,而其成本仅为GPT 5.5的十分之一。前沿AI实验室的定价不仅包括推理成本,还涵盖研究、数据收集、模型训练(数千万甚至数亿美元)、员工薪资和营销费用。而开源模型发布后,任何推理提供商只需简单托管并加价即可,成本远低于运行前沿AI实验室。

芯片与模型改进:Cerebras、Groq、Google等公司意识到AI需要专用芯片,传统GPU已无法满足需求。专用芯片设计昂贵,但一旦架构就绪,大规模生产就容易得多,推理成本大幅降低。例如,TPU比英伟达H100 GPU便宜30%-70%。模型架构也在演变,缓存、MoE等技术在保持精度的同时提高了速度。

零切换成本:传统软件(如Windows、Office)和SaaS(如Salesforce、Hubspot)存在重要的护城河——不可互换性。更换CRM可能需要数月。而AI模型则不同。随着更多AI实验室和开源模型的出现,零切换成本将导致价格迅速崩溃。像OpenRouter.ai这样的AI网关提供商让模型切换变得极其简单,可在数秒内完成,甚至可以编程实现动态切换。

本地模型:用户运行本地模型的能力是最重要的因素。目前几乎所有人都在使用云端模型,本地模型要么太大、要么太慢。但随着芯片进步,四五年内情况将改变。新芯片将在本地运行模型,RAM价格暴跌将使得在电脑和手机上部署模型变得容易。我预测大多数操作系统将提供模型部署接口,本地应用可连接模型。届时,云端模型仅用于最复杂的任务,简单任务(如代码补全、校对、事实核查)将在本地完成,用户无需再支付20美元或200美元的订阅费。

总之,价格压力将因上述一个或多个因素而到来,最终对消费者有利。