网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

DeepSeek新动向:MODEL1代码现端倪,新架构或融合最新成果2月将至?

2026-01-21来源:互联网编辑:瑞雪

近日,AI领域传来新动态,有消息指出DeepSeek或将在农历新年期间,也就是今年2月中旬,推出新一代旗舰AI模型DeepSeek V4,该模型在写代码能力方面将有显著提升。这一消息最初由The Information在月初爆料,引发了行业内的广泛关注。

1月20日,恰逢DeepSeek - R1发布一周年,开发者们在GitHub上有了新发现。DeepSeek更新了一系列FlashMLA代码,在横跨114个文件中,有28处都出现了未知的“MODEL1”大模型标识符。这一标识符与已知的现有模型“V32”(即DeepSeek - V3.2)在代码中被并列或区别提及,让开发者们敏锐地察觉到新模型的存在。

通过对代码上下文的深入分析,开发者们推测“MODEL1”很可能代表着一个与现有架构截然不同的新模型。在关键技术层面,“MODEL1”与“V32”存在明显区别。具体体现在键值(KV)缓存的布局、稀疏性处理方式以及对FP8数据格式的解码支持等方面。这些差异暗示着新架构可能在内存优化和计算效率上进行了专门的设计,有望带来更出色的性能表现。

值得一提的是,在前几天,DeepSeek研究团队还陆续发布了两篇技术论文。其中一篇介绍了名为“优化残差连接(mHC)”的新训练方法,另一篇则介绍了一种受生物学启发的“AI记忆模块(Engram)”。技术社区据此推测,正在开发中的新模型极有可能会整合这些最新的研究成果,从而进一步提升模型的综合能力。这一系列动作表明DeepSeek在AI领域的探索从未停止,不断推动着技术的进步与创新。

DeepSeek“降本”开路,MiniMax“增效”领航:中国大模型双轨并进展新篇
DeepSeek聚焦底层大模型研发,MiniMax则从成立之初就瞄准海外,在闫俊杰身后,是一家成立四年、产品正被2.12亿用户使用的AI公司。 视觉生成平台海螺AI于2024年推出,集成了MiniMax的H…

2026-01-20

王腾新公司12天获数千万融资 智元入局小米系缺席 睡眠赛道能否再造爆款?
月 20 日消息,王腾今天自己发微博确认了个大消息,他的新公司今日宜休,成立刚满 12 天就搞定了数千万种子轮融资。 这事儿也在评论区引发了不少讨论,有人猜测是不是和他去年因违规被小米辞退的过往有关,担心双方…

2026-01-20

电子书阅读器怎么选?科大讯飞X3等主流品牌对比,助你找到理想之选
我们将重点对比科大讯飞X3与以下几款产品:亚马逊KindleOasis、掌阅iReader、BOOXNoteAir和小米米读。通过对比这些产品的功能、设计、性能和性价比,帮助你找到最适合自己的电子书阅读器。如…

2026-01-20

萝卜快跑全球化再进一步!阿布扎比全无人驾驶服务落地,未来出行新选择来了
你是否想过,有一天在迪拜或阿布扎比街头,一辆没有司机的车就能带你去景点?这背后,是萝卜快跑首次在海外推出面向公众的全无人驾驶出行服务。 2025年3月进入阿布扎比市场,2026年部署百台以上车辆,这是萝卜快跑…

2026-01-20