网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

DeepSeek发布V3.2-Exp实验模型:优化长文本效率 同步开源并降API调用成本

2025-09-30来源:互联网编辑:瑞雪

DeepSeek 今日推出了一款实验性版本模型——DeepSeek-V3.2-Exp,标志着其向新一代架构迈出了关键一步。该模型在继承 V3.1-Terminus 核心能力的基础上,首次引入了名为 DeepSeek Sparse Attention(DSA)的细粒度稀疏注意力机制,重点针对长文本场景下的训练与推理效率展开技术探索。

据技术团队介绍,DSA 机制通过创新性的注意力分配策略,在保持模型输出质量稳定的前提下,显著提升了长文本处理的计算效率。这一突破使得模型在处理超长文本时,既能维持原有的理解与生成能力,又能大幅降低算力消耗。为确保技术验证的严谨性,研发团队将 V3.2-Exp 的训练参数配置与 V3.1-Terminus 完全对齐,经多领域公开评测集测试,两者性能表现基本一致。

伴随模型升级,DeepSeek 同步调整了 API 服务策略。开发者调用接口的成本将下降超过 50%,这一调整旨在降低技术接入门槛,促进更广泛的生态应用。目前,用户可通过官方 App、网页端及小程序直接体验新模型,同时为便于对比测试,V3.1-Terminus 的 API 接口仍保留临时访问权限。

技术开源方面,DeepSeek-V3.2-Exp 已完成在 Huggingface 与魔搭平台的代码与权重文件发布。研发团队特别强调,尽管新模型在标准测试中表现达标,但仍需通过更大规模的真实场景验证来完善技术细节。此次更新不仅体现了架构优化的技术进展,也反映了平台推动 AI 技术普惠化的战略方向。

“AI引擎+全球航道”双驱动,阿里专有云擘画未来十年增长新蓝图
据介绍,阿里专有云面向国际市场主要包括三种服务方式:一是主权云,基于专有云构建本地的公共云,比如与当地运营商合作,构建当地的“专有公共云”,像泰国、南非都采用这种方式,在满足当地合规要求的同时支持客户本地…

2025-09-29

SAP与阿里云携手破局:AI赋能下软件价值凸显,共拓企业服务新蓝海
近日,21世纪经济报道记者采访了SAP行业与全球化首席产品官、SAP Business Suite首席营销官Eric vanRossum,他回应了行业对“AI与软件关系”的争议等话题。 对于“AI是否会颠…

2025-09-29

互联网商标保护新视角:“抖海音”案下驰名商标认定规则解析
某网络公司于2022年1月4日以诉争商标违反《中华人民共和国商标法》第十三条关于不得摹仿他人驰名商标的规定为由提出无效宣告请求,国家知识产权局经审查认定某网络公司主张驰名的“抖音”商标使用时间较短,不足以证明…

2025-09-29

象屿集团携手钉钉,借AI之力开启数智化新篇,3万员工共赴转型新程
象屿集团此次与钉钉合作,不仅是AI技术平台的引入,更是双方对未来发展方向的高度共识。 值得一提的是,象屿集团此次全面引入钉钉One、DingTalk A1、AI听记、AI搜问、AI表格等钉钉AI新品,聚焦用…

2025-09-29

云天励飞加入OISA生态,以“算力积木”助力国产AI算力突破MoE大模型瓶颈
凭借在 AI 推理芯片与算力架构的长期积累,云天励飞成为 OISA 生态的重要一员。 未来,云天励飞将继续秉持“AI时代的加速器”愿景,持续迭代芯片技术与架构创新,携手 OISA 生态伙伴,共同推动智能算…

2025-09-29