2026-06-05 23:36 UTC+8站内改写2 分钟阅读更新: 2026-06-30 21:03 UTC+8

从.com时代的带宽危机看AI Token成本焦虑

作者以自己职业生涯初期经历的带宽成本危机为镜，类比当前AI token成本高涨的现象。通过回顾带宽从昂贵到廉价的历程，指出token成本也会随市场竞争、硬件优化和模型效率提升而下降，建议开发者们既要优化当前成本，也要以发展的眼光看待这一暂时性约束。

来源Hacker News AI作者: jhonovich

文章情报

工程师进阶

要点

90年代末，T1线路月费1000美元，带宽是产品设计的首要约束。十年后，带宽成本趋近于零，不再成为决策变量。
当前AI token成本高昂，类似早期带宽困境，通过缓存、模型选择、提示词优化等策略可有效降低成本。
市场竞争、定制芯片（如NVIDIA与微软合作）以及模型效率提升将推动token价格长期下降。
应理性优化现有成本，同时明白约束是暂时的，像成功过渡的企业一样，为无约束的未来架构产品。

为什么重要

这条新闻值得关注，因为90年代末，T1线路月费1000美元，带宽是产品设计的首要约束。十年后，带宽成本趋近于零，不再成为决策变量。

技术影响

可能影响模型选型、推理成本、产品能力和评测基准。

本面板由 AI 生成，经人工审核。

在我的职业生涯初期，互联网带宽极度昂贵。一条T1线路只能提供1.544 Mbps的带宽，月租却高达1000美元。而如今，千兆光纤入户的月费仅约60美元，容量却是T1的600倍以上。那时，带宽是每个产品团队必须面对的第一道坎：编码格式如何选？压缩比多少？功能每用户要消耗多少传输成本？如何更快获得更多容量？整个工程学科都围绕着这些约束运转——优化是真实的，焦虑也是真实的，而这一切在当时的经济条件下完全合理。

然而在随后的十年里，带宽价格暴跌。大规模基础设施建设、供应商竞争以及传输技术的持续进步，使得每兆比特的成本一路下滑。曾经最忧心的问题，现在不过是计算中的小数点后几位。如今几乎没有人会为带宽稀缺而设计产品：成本虽然在技术账面上依然存在，但相对于整个系统来说已低到可以忽略不计。

当前AI领域的Token成本正处在与当年带宽相似的阶段。Anthropic的收入在过去一年内增长了超过10倍，这直接反映了token消费的高速扩张，也是企业和开发者真实支出的镜像。对于认真构建基于大模型应用的人来说，这些成本是真实、显著且持续增长的。正确的应对方式与当年如出一辙：优化。缓存策略、模型选择、提示词效率、上下文窗口管理，以及NVIDIA与微软在定制芯片上的全力推进——所有这些都值得投入认真的工程精力。在当前的token成本下，精心设计的架构与粗放架构之间的差距巨大，节省的效果非常明显。

从带宽时代传承下来的真正经验并非技术层面，而是心态层面。那时候，许多人对互联网产品的经济性能否规模化持有实实在在的焦虑。成本看起来是结构性的、永久的。聪明的人建立了整套战略框架，认为带宽稀缺是永恒的风景线。但事实告诉我，市场有能力解决这个问题。模型提供商之间的竞争已在推动降价，NVIDIA、微软等公司的定制芯片努力正在加速，每一代模型的效率都在提升。方向毋庸置疑——只需三年还是十年需要等待，但轨迹已经确定。

有一天，花费数十亿token会像今天传输数十亿比特一样：成本还存在，但很微小，不再是你设计产品的核心约束。

所以，现在尽管优化，节省是真实的，工作有价值。但带着这样的信心构建：约束是暂时的，而非永久的。那些把带宽稀缺内化为第一性原则而非当前条件的团队，最终没能挺过转变。而那些在约束内优化、同时为超越约束的世界设计架构的团队，则建造了持久的东西。