AI News HubLIVE
站內改寫1 分鐘閱讀

DeepSeek-R1 釋出 | DeepSeek API 文件

DeepSeek 於2025年1月20日釋出 R1 模型,效能媲美 OpenAI-o1,完全開源並採用 MIT 許可證,同時提供蒸餾小模型和 API 服務。

DeepSeek 於 2025 年 1 月 20 日正式釋出 DeepSeek-R1 模型,這一里程碑事件標誌著開源 AI 領域邁出了重要一步。DeepSeek-R1 在數學、程式碼和推理任務上的表現與 OpenAI 的 o1 模型相當,為開發者和研究人員提供了一個強大且完全開放的替代方案。該模型的權重和技術報告均以 MIT 許可證釋出,允許自由分發和商業化使用,這意味著任何個人或企業都可以在此基礎上進行二次開發、蒸餾甚至直接商用。

除了主模型外,DeepSeek 還發布了基於 R1 蒸餾的六個小模型,引數規模從 1.5B 到 70B 不等。其中,32B 和 70B 版本在多項基準測試中與 OpenAI o1-mini 表現相當,進一步降低了高效能 AI 的准入門檻。這些小模型同樣以 MIT 許可證開源,並附有詳細的技術報告,為社群提供了豐富的資源和可復現性。

在技術層面,DeepSeek-R1 採用了後訓練階段的大規模強化學習策略。與傳統依賴大量人工標註資料的方法不同,DeepSeek-R1 透過強化學習在少量標註資料上實現了顯著的效能提升,這種高效訓練方式有望推動 AI 研發的正規化轉變。模型在編碼競賽、數學推理和複雜邏輯任務中均展現出頂尖水平,具體細節可在官方技術論文中查閱。

DeepSeek 還同步更新了 API 服務與授權政策。使用者現在可以透過設定 model=deepseek-reasoner 來呼叫 R1 模型,API 定價透明:快取命中時輸入 token 價格為每百萬 token 0.14 美元,快取未命中時每百萬 token 0.55 美元,輸出 token 統一為每百萬 token 2.19 美元。此外,新許可證明確允許將 API 輸出用於微調和蒸餾模型,這為研究人員和企業提供了更大的靈活性。

總的來說,DeepSeek-R1 的釋出不僅提供了效能強大的開源模型,還透過開放的技術細節和靈活的 API 策略,賦能了整個 AI 社群。無論是學術研究還是商業應用,DeepSeek-R1 都將成為一個重要的里程碑。