网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

DeepSeek V4与姚顺雨领衔混元新模型或于4月发布,聚焦长期记忆与国产适配

2026-03-14来源:互联网编辑:瑞雪

近日,科技领域传来多个关于大模型的重要动态,引发行业广泛关注。其中,DeepSeek V4和由姚顺雨主导的混元新模型备受瞩目,二者均预计在2026年4月正式发布,这一消息让众多科技爱好者和从业者充满期待。

DeepSeek V4作为梁文锋精心打造的多模态大模型,有着诸多亮点。它不仅在代码能力上实现了显著提升,更在长期记忆方面取得重大突破。这一突破方向与DeepSeek团队近几个月的公开研究紧密相关。回顾过去半年,梁文锋在学术研究上成果颇丰。2026年1月,他署名的论文《Conditional Memory via Scalable Lookup》提出了“条件记忆”机制;2025年12月,另一篇论文《mHC: Manifold-Constrained Hyper-Connections》则聚焦于底层架构优化。这两篇论文均致力于解决Transformer在记忆、训练稳定性和长上下文方面存在的瓶颈问题。

除了在技术层面的深耕,梁文锋还在积极补齐DeepSeek的短板。过去半年,他着重提升DeepSeek在视觉内容处理和AI搜索方面的能力。为强化AI搜索能力,DeepSeek早在去年就与百度展开合作,借助百度在搜索领域的技术和资源优势,不断完善自身功能。

值得一提的是,DeepSeek V4还将深度适配国产芯片,有望成为首个完全运行在国产算力生态上的大模型,这一举措对于推动国产大模型和国产芯片的协同发展具有重要意义。

与此同时,3月11日,OpenRouter新上线了两个神秘模型——Healer Alpha与Hunter Alpha。OpenRouter页面介绍,Healer Alpha是一款具备视觉、听觉、推理与行动能力的前沿全模态模型。这一特性使其在社区中引发了热烈讨论,大家迅速将其与尚未发布的国产新一代模型联系起来。有消息称,在Healer Alpha的系统提示词中,明确要求严格遵守中国法律法规,这也体现了模型开发过程中对合规性的重视。

随着这些大模型发布时间的临近,科技行业的竞争愈发激烈。各团队都在不断探索创新,力求在技术上取得领先优势,为用户带来更优质、更强大的模型产品。未来,这些大模型将在各个领域发挥怎样的作用,值得我们持续关注。

荣耀PC产品总经理晒新机,神秘笔记本配置曝光,是新款游戏本吗?
IT之家 3 月 13 日消息,荣耀 PC 产品总经理朱臣才今天在微博发文,晒出一款笔记本神秘新机。 根据图片我们可以看到,这款笔记本 C 面上拥有英特尔、英伟达贴纸,键盘上带有数字键以及全高方向键,屏幕比例…

2026-03-14

第十六批境内深度合成服务算法备案信息发布,未备案者请尽快申请
任何单位或个人如有疑议,请发送邮件至pingguchu@cac.gov.cn,提出疑议应以事实为依据,并提供相关证据材料。 《互联网信息服务深度合成管理规定》第十九条明确规定,具有舆论属性或者社会动员能力的深…

2026-03-14

2026北京:市民热情参与 百度OpenClaw开源AI助手安装活动火热开启
2026年3月11日,北京,工程师(前排)在百度总部安装并调试开源AI助手。图片来源:视觉中国2026年3月11日,北京,市民排队等待为笔记本电脑安装开源人工智能助手 2026年3月11日,北京,工程…

2026-03-14

GIIC联盟携手华为海尔等企业发布新标 推动智家设备互联互通新发展
便捷配网:用户可通过鸿蒙手机、路由网关、小屏中控三类不同的配网终端,自动发现设备,一键免密完成便捷配网; 互联互通:使能无屏、小屏、中屏不同中枢,通过开放统一的物模型,让不同类型、乃至不同厂家的智能终端能…

2026-03-14