网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

DeepSeek开源新动作:DeepGEMM高效矩阵乘法库震撼登场

2025-02-26来源:ITBEAR编辑:瑞雪

近期,科技界迎来了一项令人瞩目的新进展——DeepSeek公司在其预定的“开源周”活动中,正式揭晓了其最新研发成果:DeepGEMM开源项目。该项目一经发布,便迅速在网络上引发了热烈反响,累计浏览量迅速攀升至2.1万次,彰显了其在全球技术领域的影响力。

DeepGEMM是一款专为FP8高效通用矩阵乘法(GEMM)设计的库,旨在满足广泛矩阵计算需求,特别是在混合专家(MoE)分组场景中展现出卓越性能。通过动态优化资源分配,DeepGEMM能够显著提升计算效率,为深度学习等应用场景提供强有力的支持。

据悉,DeepGEMM基于CUDA架构开发,融入了先进的轻量级即时编译(JIT)技术。这一创新设计使得DeepGEMM能够在运行时动态编译内核,无需繁琐的预编译和安装过程,为用户提供了极大的便利。

DeepGEMM的推出,不仅彰显了DeepSeek在高性能计算领域的深厚实力,更体现了其致力于技术开放与合作的坚定信念。该项目是DeepSeek“开源周”活动的第三项重要成果,此前已相继发布了FlashMLA(高效解码内核)和DeepEP(专家并行通信库)两个开源项目。

此次“开源周”活动自2月24日启动,将持续至2月28日。活动期间,DeepSeek计划发布多项开源项目,旨在通过共享技术成果,推动整个行业的创新与发展。DeepGEMM作为其中的佼佼者,更是备受瞩目。

DeepGEMM特别针对Hopper架构GPU(如H800)进行了深度优化,不仅确保了高性能表现,还有效控制了成本。这一优化策略无疑为DeepSeek-V3/R1模型的训练与推理提供了更为简洁高效的底层支持。

阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13