DeepSeek-R1 發佈 | DeepSeek API 文檔
DeepSeek 於2025年1月20日發佈 R1 模型,性能媲美 OpenAI-o1,完全開源並採用 MIT 許可證,同時提供蒸餾小模型和 API 服務。
DeepSeek 於 2025 年 1 月 20 日正式發佈 DeepSeek-R1 模型,這一里程碑事件標誌着開源 AI 領域邁出了重要一步。DeepSeek-R1 在數學、代碼和推理任務上的表現與 OpenAI 的 o1 模型相當,為開發者和研究人員提供了一個強大且完全開放的替代方案。該模型的權重和技術報告均以 MIT 許可證發佈,允許自由分發和商業化使用,這意味着任何個人或企業都可以在此基礎上進行二次開發、蒸餾甚至直接商用。
除了主模型外,DeepSeek 還發布了基於 R1 蒸餾的六個小模型,參數規模從 1.5B 到 70B 不等。其中,32B 和 70B 版本在多項基準測試中與 OpenAI o1-mini 表現相當,進一步降低了高性能 AI 的准入門檻。這些小模型同樣以 MIT 許可證開源,並附有詳細的技術報告,為社區提供了豐富的資源和可復現性。
在技術層面,DeepSeek-R1 採用了後訓練階段的大規模強化學習策略。與傳統依賴大量人工標註數據的方法不同,DeepSeek-R1 通過強化學習在少量標註數據上實現了顯著的性能提升,這種高效訓練方式有望推動 AI 研發的範式轉變。模型在編碼競賽、數學推理和複雜邏輯任務中均展現出頂尖水平,具體細節可在官方技術論文中查閲。
DeepSeek 還同步更新了 API 服務與授權政策。用户現在可以通過設置 model=deepseek-reasoner 來調用 R1 模型,API 定價透明:緩存命中時輸入 token 價格為每百萬 token 0.14 美元,緩存未命中時每百萬 token 0.55 美元,輸出 token 統一為每百萬 token 2.19 美元。此外,新許可證明確允許將 API 輸出用於微調和蒸餾模型,這為研究人員和企業提供了更大的靈活性。
總的來説,DeepSeek-R1 的發佈不僅提供了性能強大的開源模型,還通過開放的技術細節和靈活的 API 策略,賦能了整個 AI 社區。無論是學術研究還是商業應用,DeepSeek-R1 都將成為一個重要的里程碑。