2026-06-26 15:44 UTC+8站内改写2 分钟阅读更新: 2026-06-26 16:20 UTC+8

当前大语言模型成本为何不可持续

大型语言模型的成本正在飙升，但技术进步和市场竞争将推动价格下降。本文分析了性能瓶颈、开源模型、芯片改进、零切换成本和本地模型这五个关键因素。

来源Hacker News AI作者: adityapatadia

许多公司正被高昂的AI成本所困扰。优步（Uber）在短短4个月内就用完了全年的AI预算，而微软、Salesforce和GitHub也在采取措施减少员工的AI支出。

另一方面，AI让许多编程任务变得非常容易，并在数据解读、制作精美幻灯片、设计应用和网站等领域持续提供帮助。目前，大型AI实验室拥有所谓的“前沿模型”，这些模型在多种任务上表现卓越。前沿AI实验室既负责研究也自行托管模型，因此这些模型的成本最高。例如，GPT 5.5每百万输入令牌收费5美元，每百万输出令牌收费30美元，是目前OpenRouter上最贵的模型。我用该模型对50个文件进行TypeScript类型修复，就花费了54美元。

然而，模型性能的瓶颈、开源模型的发布、芯片与模型的改进、零切换成本以及本地模型的兴起，将可能使AI实验室难以维持当前的高昂定价。

模型性能瓶颈：尽管每次模型发布都有改进，但提升幅度越来越小。除非有全新的突破，否则现有学习和推理能力的扩展空间有限。训练数据方面，大多数AI实验室可能已耗尽了数字和印刷媒体中的所有可用内容，改进数据集将非常困难。这意味着模型价格因性能提升而持续上涨的趋势难以持续。例如，Claude Opus 4.8与Claude Opus 4.7价格相同，一旦模型改进停滞，价格将因竞争而下降。

开源模型：OpenAI在2022年推出ChatGPT时拥有巨大领先优势，但这一优势正在消失，Anthropic在2025-26年占据了首位。如今，像GLM-5.2这样的开源模型在编程基准测试中击败了GPT和Opus，而其成本仅为GPT 5.5的十分之一。前沿AI实验室的定价不仅包括推理成本，还涵盖研究、数据收集、模型训练（数千万甚至数亿美元）、员工薪资和营销费用。而开源模型发布后，任何推理提供商只需简单托管并加价即可，成本远低于运行前沿AI实验室。

芯片与模型改进：Cerebras、Groq、Google等公司意识到AI需要专用芯片，传统GPU已无法满足需求。专用芯片设计昂贵，但一旦架构就绪，大规模生产就容易得多，推理成本大幅降低。例如，TPU比英伟达H100 GPU便宜30%-70%。模型架构也在演变，缓存、MoE等技术在保持精度的同时提高了速度。

零切换成本：传统软件（如Windows、Office）和SaaS（如Salesforce、Hubspot）存在重要的护城河——不可互换性。更换CRM可能需要数月。而AI模型则不同。随着更多AI实验室和开源模型的出现，零切换成本将导致价格迅速崩溃。像OpenRouter.ai这样的AI网关提供商让模型切换变得极其简单，可在数秒内完成，甚至可以编程实现动态切换。

本地模型：用户运行本地模型的能力是最重要的因素。目前几乎所有人都在使用云端模型，本地模型要么太大、要么太慢。但随着芯片进步，四五年内情况将改变。新芯片将在本地运行模型，RAM价格暴跌将使得在电脑和手机上部署模型变得容易。我预测大多数操作系统将提供模型部署接口，本地应用可连接模型。届时，云端模型仅用于最复杂的任务，简单任务（如代码补全、校对、事实核查）将在本地完成，用户无需再支付20美元或200美元的订阅费。

总之，价格压力将因上述一个或多个因素而到来，最终对消费者有利。