AI News HubLIVE
站内改写1 分钟阅读

🚀 深度求索发布DeepSeek-V3:新一代开源AI模型

DeepSeek-V3是深度求索迄今为止最大的飞跃,拥有671B MoE参数(37B激活),每秒处理60个token(比V2快3倍),并在14.8T高质量token上训练。API定价在2月8日前保持与V2相同,之后输入(缓存未命中)0.27美元/M token,缓存命中0.07美元/M token,输出1.10美元/M token。模型和论文完全开源,体现了公司推动包容性AGI的长期主义使命。

2024年12月26日,深度求索(DeepSeek)正式发布了其最新一代AI模型——DeepSeek-V3。这被认为是该公司迄今为止最大的飞跃,模型采用了671B参数的混合专家(MoE)架构,每次推理仅激活37B参数,实现了每秒60个token的处理速度,相比上一代V2提升了3倍。训练数据量达到了惊人的14.8T高质量token,使得模型在多个基准测试上展现出了卓越的性能。

在API定价方面,深度求索宣布在2025年2月8日之前,DeepSeek-V3的API费用将与V2保持一致。此后,新的定价方案为:每百万token的输入(缓存未命中)费用为0.27美元,缓存命中时仅为0.07美元,输出费用为1.10美元。公司强调,这仍然是市场上最具性价比的选择。

DeepSeek-V3的另一大亮点是完全开源。模型权重和相关的技术论文均已发布在GitHub上,任何人都可以自由获取和使用。这一举措体现了深度求索长期以来的开源精神和对包容性人工通用智能(AGI)的追求。公司表示,他们很高兴看到开源模型与闭源模型之间的差距正在不断缩小。

此外,深度求索还透露,这仅仅是一个开始。未来,他们将在DeepSeek生态系统中引入多模态支持和其他前沿功能,继续推动AI技术的创新。公司邀请全球开发者一起加入,共同突破创新的边界。