深度求索让AI变便宜,现在却需要数十亿来维持低价
深度求索(DeepSeek)曾以低成本AI模型震惊业界,但现在美国评估显示其模型落后前沿约8个月,尽管价格更低。公司正进行大规模融资,估值高达600亿美元,以维持其在AI竞赛中的竞争力。
深度求索(DeepSeek)的故事曾简单明了:一家由中国量化交易公司高盈(High-Flyer)资助的小型AI实验室,发布了性能远超其资源基础的开源模型,让前沿AI从封闭的神秘领域转变为工程问题,降低了智能成本,也让开源再次显得危险。
但这个故事已不足以描述现在的局面。2026年5月1日,美国政府下属的AI标准与创新中心(CAISI)发布了DeepSeek V4 Pro的评估报告。结论具有两面性:CAISI称V4 Pro是其评估过的最强中国模型,但同时也估计该模型落后美国前沿约八个月。这听起来像是一次降级。
然而,评估还指出一个更具商业冲击力的事实:DeepSeek V4 Pro在类似能力水平上往往比美国参考模型更便宜。换句话说,DeepSeek可能没有达到前沿,但它正在改变接近前沿的价格。
接着是融资报道。路透社5月初报道,DeepSeek在首轮外部融资中估值可能高达500亿美元。6月3日,《南华早报》称DeepSeek正在敲定一轮超过500亿元人民币(约74亿美元)的融资,估值略低于600亿美元。阿克西奥斯引用彭博社报道类似,但估值约520亿美元。数字不完全一致,DeepSeek尚未确认交易。但方向难以忽视:让AI显得便宜的公司,现在可能需要数十亿美元来维持这一地位。
这就是DeepSeek真正的新故事:一个以研究为导向、开放权重、低成本AI实验室能否在它帮助创造的资本竞赛中生存?
错误的记分牌 大多数英文报道倾向于将DeepSeek归入简单的比较框架:中美对抗、开源对闭源、廉价对昂贵。这些框架并非无用,但过于扁平。CAISI评估的有用之处在于它让记分牌变得模糊。如果你只关心绝对前沿,结果很清楚:V4 Pro并非世界最强。CAISI的基准测试将其置于美国早期前沿层级,而非最新顶级系统。这很重要。DeepSeek自身公开基准测试显示V4 Pro接近最新的Opus和GPT模型,但独立评估表明差距确实存在。
错误在于止步于此。大多数用户和公司并非总购买绝对最强的智能。他们购买在可用价格下足够智能,且适应工作流程的产品。尤其是在代理工作流、编码助手、文档处理、路由系统、长上下文检索和高容量API调用中,当任务消耗大量令牌时,稍微弱一点的模型若便宜、开放且足够好,可能成为更明智的商业决策。这就是为什么“落后八个月”仍可能具有商业杀伤力。
前沿并非单一线条,而是一系列权衡:原始能力、价格、上下文长度、延迟、工具使用、部署灵活性、模型可用性、信任、生态系统支持和法律许可。DeepSeek的优势并非在每个维度都获胜,而是同时对多个维度施加压力。全球读者应关注这一点:DeepSeek无需在每个基准测试中成为最佳,只需让足够多的工作类别在闭源前沿模型上显得过于昂贵。
降价即产品 截至2026年6月5日,DeepSeek官方API定价页面显示V4 Pro的缓存输入令牌每百万0.003625美元,非缓存输入每百万0.435美元,输出每百万0.87美元。这些价格低于CAISI在5月1日成本比较中使用的开发者报告价格,且可能再次变化。但信息明确:DeepSeek试图让高上下文、代理就绪的模型使用变得足够便宜,成为常规操作。
这在AI行业中并非细节。价格常被视为市场进入杠杆,但DeepSeek的策略更有趣,因为它与技术身份相关。自V2时代起,创始人梁文峰就将低价定位为架构和系统工作的结果,而非补贴战争。这一说法不应全盘接受,但也非空洞。V4不仅仅是更便宜的API封装。DeepSeek的发布描述V4 Pro为1.6万亿参数的混合专家模型,490亿活跃参数,通过官方服务支持100万上下文长度,并具有更强的代理编码和推理能力。模型还通过开放权重渠道以宽松许可分发。
中国的技术讨论更关注工程机制而非地缘政治记分牌。在V4发布后的一次LateTalk讨论中,AI工程师将V4描述为“基础设施鲸鱼”:非另一个R1式的范式冲击,而是结合新注意力机制、Muon优化、FP4相关训练推理、TileLang内核和长上下文效率的系统级工程推进。关键点在于,100万上下文不仅是产品亮点,只有当使用长上下文的成本变得可承受时才起作用。
这就是DeepSeek工作的重要性所在。长上下文、代理和编码工作流消耗大量令牌。模型可宣称巨大上下文窗口,但若填充成本过高,该功能仍停留在理论层面。DeepSeek的战略性举措是让长上下文智能足够便宜,使得开发者实际使用。
简单来说,DeepSeek不仅出售模型,它出售的是使用更多智能的许可。
开放权重作为分销 DeepSeek的开放权重策略常被讨论为意识形态,但它也是分销。开放权重允许开发者以闭源API难以实现的方式检查、托管、修改、基准测试、微调、路由和集成模型。这也将部分集成负担从公司转移至生态系统。当模型开放且有用时,推理框架、云平台、本地部署工具、编码代理封装和模型路由器都有动力支持它。即使DeepSeek未捕获每一美元,这也具有真实商业价值。
这是悖论所在:开源比闭源商业产品更快传播模型,但也允许他人货币化而无需直接付费。云平台可托管DeepSeek,开发者可部署,企业可在内部堆栈运行。模型可成为基础设施,而原始实验室不必拥有每个客户关系。对普通初创公司而言,这像是泄漏。但对DeepSeek,这可能是策略的一部分。梁文峰认为闭源保密并非公司真正的护城河,真正的护城河是团队积累的知识、创新文化以及在限制下持续推动模型架构的能力。
这是一个高尚的答案,但代价高昂。如果商业模式不是从每个令牌中提取最大利润,那么公司需要另一种方式来资助下一轮计算、人才和实验。在DeepSeek的第一阶段,答案是高盈(High-Flyer)——梁文峰联合创立的量化交易公司。高盈的利润提供了罕见的内部资金基础,使DeepSeek避免了初创公司的正常流程:推介、融资、增长叙事、商业化压力。这种独立性成为神话的一部分。现在,神话正面临行业的下一个阶段。
为何廉价AI仍需资本 6月的融资报道并不意味着DeepSeek早期策略是虚假的,而是意味着游戏规则已改变。这里有一个简单但被低估的区别:在限制下制造一个突破性模型,与持续维持一个接近前沿的AI实验室进行多轮模型迭代,是不同的。DeepSeek的R1时刻证明了一个专注的中国团队能以远少于美国前沿实验室的可见资本生产出全球重要的模型。但2026年不仅是模型发布竞赛,更逐渐成为代理基础设施竞赛。
代理改变了能源需求。聊天机器人可回答提示然后停止,而代理可能规划、调用工具、编写代码、检查文件、浏览、重试、评估并从失败中恢复。这意味着更多令牌、更多上下文、更多推理、更多编码能力、更多产品反馈和更多真实世界失败数据。模型仍为核心,但周围循环变得更加重要。
中国媒体在V4之前的报道捕捉到了这一压力。《财经》将DeepSeek描绘为面临十字路口:能否保持研究导向的低频发布节奏,而OpenAI、Anthropic、谷歌、字节跳动、阿里巴巴、月之暗面、智谱AI、MiniMax等加速模型迭代、编码能力、代理产品和商业收入?另一篇中国模型市场文章用资本市场语言表达了同样观点:基础模型竞赛正成为“能源池”竞争,而非单模型冲刺。这不仅是媒体问题,也是公司问题。
DeepSeek也有人才问题,更准确地说,是人才定价问题。LatePost的组织报道将DeepSeek描绘为中国最奇怪的AI实验室之一:扁平、研究密集、异常抵制常规融资,节奏几乎反内卷。员工被描述为没有严格打卡文化,没有明显硬性截止日期,在70小时工作周常见的领域具有罕见的不加班节奏。这种文化是公司优势的一部分,但存在于一个激烈争夺顶尖AI研究者的市场中。竞争对手正在筹集巨额资金,提供更明确的薪酬基准。互联网巨头能提供庞大薪资包。前沿研究贡献者现在有外部选择。如果DeepSeek员工持有从未外部融资的公司的股权或期权,“这家公司值多少”的问题变得非常实际。
这就是为什么报道中梁文峰的个人出资很重要(如果准确)。SCMP和彭博相关报道均暗示梁可能向本轮投入大量个人资本。细节未确认,但逻辑清晰:这不会是普通创始人追加投资,而是一个控制信号。