网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

DeepSeek发布V3.2-Exp实验模型:优化长文本效率 同步开源并降API调用成本

2025-09-30来源:互联网编辑:瑞雪

DeepSeek 今日推出了一款实验性版本模型——DeepSeek-V3.2-Exp,标志着其向新一代架构迈出了关键一步。该模型在继承 V3.1-Terminus 核心能力的基础上,首次引入了名为 DeepSeek Sparse Attention(DSA)的细粒度稀疏注意力机制,重点针对长文本场景下的训练与推理效率展开技术探索。

据技术团队介绍,DSA 机制通过创新性的注意力分配策略,在保持模型输出质量稳定的前提下,显著提升了长文本处理的计算效率。这一突破使得模型在处理超长文本时,既能维持原有的理解与生成能力,又能大幅降低算力消耗。为确保技术验证的严谨性,研发团队将 V3.2-Exp 的训练参数配置与 V3.1-Terminus 完全对齐,经多领域公开评测集测试,两者性能表现基本一致。

伴随模型升级,DeepSeek 同步调整了 API 服务策略。开发者调用接口的成本将下降超过 50%,这一调整旨在降低技术接入门槛,促进更广泛的生态应用。目前,用户可通过官方 App、网页端及小程序直接体验新模型,同时为便于对比测试,V3.1-Terminus 的 API 接口仍保留临时访问权限。

技术开源方面,DeepSeek-V3.2-Exp 已完成在 Huggingface 与魔搭平台的代码与权重文件发布。研发团队特别强调,尽管新模型在标准测试中表现达标,但仍需通过更大规模的真实场景验证来完善技术细节。此次更新不仅体现了架构优化的技术进展,也反映了平台推动 AI 技术普惠化的战略方向。

阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13