AI News HubLIVE
站內改寫1 分鐘閱讀

🚀 深度求索發佈DeepSeek-V3:新一代開源AI模型

DeepSeek-V3是深度求索迄今為止最大的飛躍,擁有671B MoE參數(37B激活),每秒處理60個token(比V2快3倍),並在14.8T高質量token上訓練。API定價在2月8日前保持與V2相同,之後輸入(緩存未命中)0.27美元/M token,緩存命中0.07美元/M token,輸出1.10美元/M token。模型和論文完全開源,體現了公司推動包容性AGI的長期主義使命。

2024年12月26日,深度求索(DeepSeek)正式發佈了其最新一代AI模型——DeepSeek-V3。這被認為是該公司迄今為止最大的飛躍,模型採用了671B參數的混合專家(MoE)架構,每次推理僅激活37B參數,實現了每秒60個token的處理速度,相比上一代V2提升了3倍。訓練數據量達到了驚人的14.8T高質量token,使得模型在多個基準測試上展現出了卓越的性能。

在API定價方面,深度求索宣佈在2025年2月8日之前,DeepSeek-V3的API費用將與V2保持一致。此後,新的定價方案為:每百萬token的輸入(緩存未命中)費用為0.27美元,緩存命中時僅為0.07美元,輸出費用為1.10美元。公司強調,這仍然是市場上最具性價比的選擇。

DeepSeek-V3的另一大亮點是完全開源。模型權重和相關的技術論文均已發佈在GitHub上,任何人都可以自由獲取和使用。這一舉措體現了深度求索長期以來的開源精神和對包容性人工通用智能(AGI)的追求。公司表示,他們很高興看到開源模型與閉源模型之間的差距正在不斷縮小。

此外,深度求索還透露,這僅僅是一個開始。未來,他們將在DeepSeek生態系統中引入多模態支持和其他前沿功能,繼續推動AI技術的創新。公司邀請全球開發者一起加入,共同突破創新的邊界。