2026-05-06 07:33 UTC+8站內改寫1 分鐘閱讀更新: 2026-06-27 08:25 UTC+8

DeepSeek-R1 釋出 | DeepSeek API 文件

DeepSeek 於2025年1月20日釋出 R1 模型，效能媲美 OpenAI-o1，完全開源並採用 MIT 許可證，同時提供蒸餾小模型和 API 服務。

DeepSeek 於 2025 年 1 月 20 日正式釋出 DeepSeek-R1 模型，這一里程碑事件標誌著開源 AI 領域邁出了重要一步。DeepSeek-R1 在數學、程式碼和推理任務上的表現與 OpenAI 的 o1 模型相當，為開發者和研究人員提供了一個強大且完全開放的替代方案。該模型的權重和技術報告均以 MIT 許可證釋出，允許自由分發和商業化使用，這意味著任何個人或企業都可以在此基礎上進行二次開發、蒸餾甚至直接商用。

除了主模型外，DeepSeek 還發布了基於 R1 蒸餾的六個小模型，引數規模從 1.5B 到 70B 不等。其中，32B 和 70B 版本在多項基準測試中與 OpenAI o1-mini 表現相當，進一步降低了高效能 AI 的准入門檻。這些小模型同樣以 MIT 許可證開源，並附有詳細的技術報告，為社群提供了豐富的資源和可復現性。

在技術層面，DeepSeek-R1 採用了後訓練階段的大規模強化學習策略。與傳統依賴大量人工標註資料的方法不同，DeepSeek-R1 透過強化學習在少量標註資料上實現了顯著的效能提升，這種高效訓練方式有望推動 AI 研發的正規化轉變。模型在編碼競賽、數學推理和複雜邏輯任務中均展現出頂尖水平，具體細節可在官方技術論文中查閱。

DeepSeek 還同步更新了 API 服務與授權政策。使用者現在可以透過設定 model=deepseek-reasoner 來呼叫 R1 模型，API 定價透明：快取命中時輸入 token 價格為每百萬 token 0.14 美元，快取未命中時每百萬 token 0.55 美元，輸出 token 統一為每百萬 token 2.19 美元。此外，新許可證明確允許將 API 輸出用於微調和蒸餾模型，這為研究人員和企業提供了更大的靈活性。

總的來說，DeepSeek-R1 的釋出不僅提供了效能強大的開源模型，還透過開放的技術細節和靈活的 API 策略，賦能了整個 AI 社群。無論是學術研究還是商業應用，DeepSeek-R1 都將成為一個重要的里程碑。