AI News HubLIVE
サイト内リライト2 分で読了

DeepSeek-R1 リリース | DeepSeek API ドキュメント

DeepSeek は2025年1月20日に R1 モデルを公開。性能は OpenAI-o1 と同等で、完全オープンソース(MIT ライセンス)、さらに蒸留済み小モデルと API を提供開始。

ソースDeepSeek News

DeepSeek は 2025 年 1 月 20 日、DeepSeek-R1 モデルを正式にリリースしました。このモデルは、数学、コード、推論タスクにおいて OpenAI の o1 モデルと同等の性能を達成し、オープンソース AI の大きな進歩を示しています。モデルのウェイトと技術レポートは MIT ライセンスの下で公開され、自由な配布と商用利用が可能です。これにより、個人や企業はこのモデルを基に二次開発、蒸留、さらには直接的な商用利用を行うことができます。

さらに、DeepSeek は R1 から蒸留された 6 つの小規模モデルも公開しました。パラメータサイズは 1.5B から 70B まで多岐にわたり、特に 32B と 70B バージョンは OpenAI o1-mini と同等の性能を複数のベンチマークで示しています。これらの小モデルも MIT ライセンスでオープンソース化されており、詳細な技術レポートが添付されているため、コミュニティはリソースを活用して再現性を検証できます。

技術面では、DeepSeek-R1 はポストトレーニング段階で大規模な強化学習を採用しています。従来の大量のラベル付きデータに依存する手法とは異なり、わずかなラベルデータで大幅な性能向上を実現しており、この効率的な学習方法は AI 研究のパラダイムシフトを促進する可能性があります。モデルはコーディングコンテスト、数学的推論、複雑な論理タスクで最先端の結果を示しており、詳細は公式の技術論文を参照してください。

DeepSeek は API サービスとライセンスポリシーも更新しました。ユーザーは model=deepseek-reasoner を設定することで R1 モデルを呼び出せます。API 価格は明確で、キャッシュヒット時は入力トークン 100 万トークンあたり 0.14 ドル、キャッシュミス時は 0.55 ドル、出力トークンは一律 100 万トークンあたり 2.19 ドルです。新しいライセンスでは、API 出力をファインチューニングや蒸留に使用することが明示的に許可されており、研究者や企業にとって大きな柔軟性を提供します。

総じて、DeepSeek-R1 のリリースは、高性能なオープンソースモデルを提供するだけでなく、オープンな技術詳細と柔軟な API 戦略を通じて AI コミュニティ全体を強化するものです。学術研究から商業応用に至るまで、DeepSeek-R1 は重要なマイルストーンとなるでしょう。