2026-05-06 07:33 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

DeepSeek-R1 發佈 | DeepSeek API 文檔

DeepSeek 於2025年1月20日發佈 R1 模型，性能媲美 OpenAI-o1，完全開源並採用 MIT 許可證，同時提供蒸餾小模型和 API 服務。

DeepSeek 於 2025 年 1 月 20 日正式發佈 DeepSeek-R1 模型，這一里程碑事件標誌着開源 AI 領域邁出了重要一步。DeepSeek-R1 在數學、代碼和推理任務上的表現與 OpenAI 的 o1 模型相當，為開發者和研究人員提供了一個強大且完全開放的替代方案。該模型的權重和技術報告均以 MIT 許可證發佈，允許自由分發和商業化使用，這意味着任何個人或企業都可以在此基礎上進行二次開發、蒸餾甚至直接商用。

除了主模型外，DeepSeek 還發布了基於 R1 蒸餾的六個小模型，參數規模從 1.5B 到 70B 不等。其中，32B 和 70B 版本在多項基準測試中與 OpenAI o1-mini 表現相當，進一步降低了高性能 AI 的准入門檻。這些小模型同樣以 MIT 許可證開源，並附有詳細的技術報告，為社區提供了豐富的資源和可復現性。

在技術層面，DeepSeek-R1 採用了後訓練階段的大規模強化學習策略。與傳統依賴大量人工標註數據的方法不同，DeepSeek-R1 通過強化學習在少量標註數據上實現了顯著的性能提升，這種高效訓練方式有望推動 AI 研發的範式轉變。模型在編碼競賽、數學推理和複雜邏輯任務中均展現出頂尖水平，具體細節可在官方技術論文中查閲。

DeepSeek 還同步更新了 API 服務與授權政策。用户現在可以通過設置 model=deepseek-reasoner 來調用 R1 模型，API 定價透明：緩存命中時輸入 token 價格為每百萬 token 0.14 美元，緩存未命中時每百萬 token 0.55 美元，輸出 token 統一為每百萬 token 2.19 美元。此外，新許可證明確允許將 API 輸出用於微調和蒸餾模型，這為研究人員和企業提供了更大的靈活性。

總的來説，DeepSeek-R1 的發佈不僅提供了性能強大的開源模型，還通過開放的技術細節和靈活的 API 策略，賦能了整個 AI 社區。無論是學術研究還是商業應用，DeepSeek-R1 都將成為一個重要的里程碑。