网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

DeepSeek连发大招:开源优化策略,英伟达R1模型推理速度飙升25倍

2025-02-27来源:证券时报e公司编辑:瑞雪

近期,人工智能领域迎来了一系列重要进展,其中DeepSeek公司的动作尤为引人注目。该公司宣布了一项重大决定——将其优化并行策略(Optimized Parallelism Strategies)进行开源,这一策略旨在提升计算效率,减少资源浪费,并最大化系统性能。

据DeepSeek介绍,该优化并行策略是一套精心设计的并行计算方案,适用于多核、分布式或异构系统。它通过合理分配任务、协调资源利用以及减少通信开销,实现了高效并行执行,为人工智能模型的训练和推理提供了强有力的支持。

不仅如此,DeepSeek还宣布了其另一项重要成果——与英伟达合作,在Blackwell架构上优化的DeepSeek-R1模型。这一新模型在推理速度上实现了25倍的提升,同时每token成本降低了20倍,标志着英伟达在人工智能领域的又一次重大突破。

DeepSeek的开源行动并未止步于此。在此之前,该公司已经将DeepEP向公众开放,这一Expert Parallelism通信基础专为MoE模型的训练和推理而设计。DeepEP能够实现高效优化的全到全通信,支持低精度计算,并对非对称带宽转发场景进行了深度优化,从而在训练和推理任务中展现出卓越的性能。

为了进一步提升用户体验,DeepSeek还推出了错峰优惠活动。在北京时间每日00:30至08:30的夜间空闲时段,DeepSeek开放平台的API调用价格大幅下调,DeepSeek-V3降至原价的50%,DeepSeek-R1更是降至25%。DeepSeek鼓励用户充分利用这一时段,享受更经济、更流畅的服务。

此次优惠活动正值DeepSeek的“开源周”。在这一周内,DeepSeek连续开源了多个重要代码库。首个开源的是针对Hopper GPU优化的FlashMLA,随后是用于MoE模型训练和推理的开源EP通信库DeepEP,以及一个支持密集和MoE GEMM的FP8 GEMM库,为V3/R1的训练和推理提供了有力支持。

英伟达也在这一领域取得了显著进展。通过应用TensorRT DeepSeek优化,英伟达在Blackwell架构上实现了具有FP4生产级精度的模型,该模型在MMLU通用智能基准测试中达到了FP8模型性能的99.8%。目前,英伟达基于FP4优化的DeepSeek-R1检查点已经在Hugging Face上开源,用户可以通过相关链接访问这一模型。

在后训练量化方面,DeepSeek也取得了重要突破。该模型将Transformer模块内的线性算子的权重和激活量化到了FP4,适用于TensorRT-LLM推理。这一优化不仅减少了每个参数的位数,从8位降低到4位,还使得磁碟空间和GPU显存的需求减少了约1.6倍,为人工智能模型的部署和应用提供了更加经济、高效的选择。

阿里通义App焕新升级更名千问 5.0.0版本携三大核心能力强势登场
今日,阿里旗下通义App今日发布更新,名称正式变更为千问App,版本号为5.0.0。 在版本 5.0.0中,千问强调其核心能力包括:“对话问答”“智能写作”“全能相机”三大模块。 据知情人士透露,阿里巴巴计…

2025-11-15

谷歌前工程师再创业!AI数据分析新锐WisdomAI获英伟达等3.55亿融资
WisdomAI面向企业客户推出了AI驱动的对话式商业智能(BI)平台,提供AI数据分析业务,用户只需用自然语言提问便可获取分析后的答案。 WisdomAI称:“过去的BI只提供被动的、静态的仪表板,而Ag…

2025-11-15

百度世界大会发布AI新成果:文心5.0、昆仑芯升级,萝卜快跑领跑全球
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

百度世界大会亮点频出:文心5.0等成果发布,AI重构业务引领生产力革新
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

乌镇峰会:前沿科技碰撞,共绘网络空间命运共同体数智新蓝图
“非洲互联网之父”、加纳科网董事长尼·奎诺表示,像乌镇峰会这样的平台为发展中国家提供了宝贵的发声机会和参与空间;世界知识产权组织总干事邓鸿森表示,乌镇峰会为我们提供全球对话与合作的契机,这种对话与合作不仅是…

2025-11-13