2026-05-06 07:33 UTC+8站内改写1 分钟阅读更新: 2026-06-27 08:25 UTC+8

DeepSeek-R1 发布 | DeepSeek API 文档

DeepSeek 于2025年1月20日发布 R1 模型，性能媲美 OpenAI-o1，完全开源并采用 MIT 许可证，同时提供蒸馏小模型和 API 服务。

DeepSeek 于 2025 年 1 月 20 日正式发布 DeepSeek-R1 模型，这一里程碑事件标志着开源 AI 领域迈出了重要一步。DeepSeek-R1 在数学、代码和推理任务上的表现与 OpenAI 的 o1 模型相当，为开发者和研究人员提供了一个强大且完全开放的替代方案。该模型的权重和技术报告均以 MIT 许可证发布，允许自由分发和商业化使用，这意味着任何个人或企业都可以在此基础上进行二次开发、蒸馏甚至直接商用。

除了主模型外，DeepSeek 还发布了基于 R1 蒸馏的六个小模型，参数规模从 1.5B 到 70B 不等。其中，32B 和 70B 版本在多项基准测试中与 OpenAI o1-mini 表现相当，进一步降低了高性能 AI 的准入门槛。这些小模型同样以 MIT 许可证开源，并附有详细的技术报告，为社区提供了丰富的资源和可复现性。

在技术层面，DeepSeek-R1 采用了后训练阶段的大规模强化学习策略。与传统依赖大量人工标注数据的方法不同，DeepSeek-R1 通过强化学习在少量标注数据上实现了显著的性能提升，这种高效训练方式有望推动 AI 研发的范式转变。模型在编码竞赛、数学推理和复杂逻辑任务中均展现出顶尖水平，具体细节可在官方技术论文中查阅。

DeepSeek 还同步更新了 API 服务与授权政策。用户现在可以通过设置 model=deepseek-reasoner 来调用 R1 模型，API 定价透明：缓存命中时输入 token 价格为每百万 token 0.14 美元，缓存未命中时每百万 token 0.55 美元，输出 token 统一为每百万 token 2.19 美元。此外，新许可证明确允许将 API 输出用于微调和蒸馏模型，这为研究人员和企业提供了更大的灵活性。

总的来说，DeepSeek-R1 的发布不仅提供了性能强大的开源模型，还通过开放的技术细节和灵活的 API 策略，赋能了整个 AI 社区。无论是学术研究还是商业应用，DeepSeek-R1 都将成为一个重要的里程碑。