AI News HubLIVE
サイト内リライト1 分で読了

🚀 DeepSeek-V3発表:最新のオープンソースAIモデル

DeepSeek-V3は同社最大の飛躍であり、671BのMoEパラメータ(37B活性化)、毎秒60トークン(V2比3倍速)、14.8Tの高品質トークンで学習。API価格は2月8日までV2と同額、その後は入力(キャッシュミス)0.27ドル/Mトークン、キャッシュヒット0.07ドル/Mトークン、出力1.10ドル/Mトークン。モデルと論文は完全オープンソースで、包括的AGIへの長期主義を表明。

ソースDeepSeek News

2024年12月26日、DeepSeekは最新のAIモデル「DeepSeek-V3」を正式に発表しました。これは同社にとって最大の進歩であり、671Bパラメータの混合専門家(MoE)アーキテクチャを採用し、推論時には37Bパラメータのみを活性化します。処理速度は毎秒60トークンで、前世代のV2と比較して3倍高速化しています。トレーニングには14.8Tの高品質トークンが使用され、性能が大幅に向上しました。

APIの価格設定について、DeepSeekは2025年2月8日まではV2と同じ料金を維持します。それ以降は、入力(キャッシュミス)が100万トークンあたり0.27ドル、キャッシュヒットが同0.07ドル、出力が同1.10ドルとなります。同社は、これでも市場で最もコストパフォーマンスに優れた価格だと述べています。

DeepSeek-V3は、モデルウェイトと論文が完全にオープンソースとして公開されます。これは、DeepSeekがオープンソース精神と長期主義を堅持し、包括的な人工汎用知能(AGI)の実現を目指すという使命を反映しています。同社は、これは始まりに過ぎず、今後DeepSeekエコシステムにマルチモーダルサポートなどの最先端機能を導入していくとしています。

モデルと論文はGitHubで公開されており、コミュニティは自由にアクセスして利用できます。DeepSeekは世界中の開発者とともにAIイノベーションを推進することを期待しています。