DeepSeek-R1 发布 | DeepSeek API 文档
DeepSeek 于2025年1月20日发布 R1 模型,性能媲美 OpenAI-o1,完全开源并采用 MIT 许可证,同时提供蒸馏小模型和 API 服务。
DeepSeek 于 2025 年 1 月 20 日正式发布 DeepSeek-R1 模型,这一里程碑事件标志着开源 AI 领域迈出了重要一步。DeepSeek-R1 在数学、代码和推理任务上的表现与 OpenAI 的 o1 模型相当,为开发者和研究人员提供了一个强大且完全开放的替代方案。该模型的权重和技术报告均以 MIT 许可证发布,允许自由分发和商业化使用,这意味着任何个人或企业都可以在此基础上进行二次开发、蒸馏甚至直接商用。
除了主模型外,DeepSeek 还发布了基于 R1 蒸馏的六个小模型,参数规模从 1.5B 到 70B 不等。其中,32B 和 70B 版本在多项基准测试中与 OpenAI o1-mini 表现相当,进一步降低了高性能 AI 的准入门槛。这些小模型同样以 MIT 许可证开源,并附有详细的技术报告,为社区提供了丰富的资源和可复现性。
在技术层面,DeepSeek-R1 采用了后训练阶段的大规模强化学习策略。与传统依赖大量人工标注数据的方法不同,DeepSeek-R1 通过强化学习在少量标注数据上实现了显著的性能提升,这种高效训练方式有望推动 AI 研发的范式转变。模型在编码竞赛、数学推理和复杂逻辑任务中均展现出顶尖水平,具体细节可在官方技术论文中查阅。
DeepSeek 还同步更新了 API 服务与授权政策。用户现在可以通过设置 model=deepseek-reasoner 来调用 R1 模型,API 定价透明:缓存命中时输入 token 价格为每百万 token 0.14 美元,缓存未命中时每百万 token 0.55 美元,输出 token 统一为每百万 token 2.19 美元。此外,新许可证明确允许将 API 输出用于微调和蒸馏模型,这为研究人员和企业提供了更大的灵活性。
总的来说,DeepSeek-R1 的发布不仅提供了性能强大的开源模型,还通过开放的技术细节和灵活的 API 策略,赋能了整个 AI 社区。无论是学术研究还是商业应用,DeepSeek-R1 都将成为一个重要的里程碑。