网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

DeepSeek-V3重磅开源!6710亿参数自研MoE模型引领国产AI新高度

2024-12-27来源:ITBEAR编辑:瑞雪

近日,“深度求索”官方公众号揭晓了一项重要进展,其DeepSeek-V3模型已正式上线并同步开放源代码。用户只需访问chat.deepseek.com官网,便能与这一最新版本的模型进行互动。

据官方介绍,DeepSeek-V3是一个具备6710亿参数的专家混合(MoE)模型,通过多个专家网络将问题空间精细划分为多个同质区域,有效提升了模型的处理能力。该模型在预训练阶段处理了高达14.8万亿的token,并激活了370亿参数。

DeepSeek-V3在多项评测中的表现尤为亮眼,不仅超越了Qwen2.5-72B和Llama-3.1-405B等开源模型的性能,还与世界顶尖的闭源模型GPT-4o和Claude-3.5-Sonnet等相媲美。

在知识、长文本处理、代码生成、数学计算以及中文理解等多个方面,DeepSeek-V3均取得了显著进步。尤其在算法代码和数学问题的处理上,其表现尤为突出。DeepSeek-V3的生成速度也大幅提升至60 TPS,相较于V2.5版本,速度提高了3倍。

为了让更多开发者能够轻松适配和应用DeepSeek-V3,官方不仅开源了原生FP8权重,还提供了BF16转换脚本。目前,SGLang、LMDeploy、TensorRT-LLM和MindIE等多个平台已支持V3模型的推理。

与此同时,DeepSeek还对API服务价格进行了调整。新的定价策略为:每百万输入tokens的价格为0.5元(缓存命中)或2元(缓存未命中),每百万输出tokens的价格为8元。为了让更多用户能够体验到新模型的强大功能,DeepSeek特别设置了长达45天的优惠价格体验期。

从即日起至2025年2月8日,无论是已注册的老用户还是在此期间内注册的新用户,均可享受DeepSeek-V3 API服务的优惠价格,即每百万输入tokens的价格为0.1元(缓存命中)或1元(缓存未命中),每百万输出tokens的价格为2元。

阿里通义App焕新升级更名千问 5.0.0版本携三大核心能力强势登场
今日,阿里旗下通义App今日发布更新,名称正式变更为千问App,版本号为5.0.0。 在版本 5.0.0中,千问强调其核心能力包括:“对话问答”“智能写作”“全能相机”三大模块。 据知情人士透露,阿里巴巴计…

2025-11-15

谷歌前工程师再创业!AI数据分析新锐WisdomAI获英伟达等3.55亿融资
WisdomAI面向企业客户推出了AI驱动的对话式商业智能(BI)平台,提供AI数据分析业务,用户只需用自然语言提问便可获取分析后的答案。 WisdomAI称:“过去的BI只提供被动的、静态的仪表板,而Ag…

2025-11-15

百度世界大会发布AI新成果:文心5.0、昆仑芯升级,萝卜快跑领跑全球
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

百度世界大会亮点频出:文心5.0等成果发布,AI重构业务引领生产力革新
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

乌镇峰会:前沿科技碰撞,共绘网络空间命运共同体数智新蓝图
“非洲互联网之父”、加纳科网董事长尼·奎诺表示,像乌镇峰会这样的平台为发展中国家提供了宝贵的发声机会和参与空间;世界知识产权组织总干事邓鸿森表示,乌镇峰会为我们提供全球对话与合作的契机,这种对话与合作不仅是…

2025-11-13