网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

浪潮YuanLab.ai开源40B参数源Yuan 3.0 Flash大模型,多任务表现优成本低

2025-12-31来源:快讯编辑:瑞雪

浪潮旗下YuanLab.ai团队近日宣布开源发布多模态基础大模型Yuan 3.0 Flash,该模型凭借400亿参数规模与创新的稀疏混合专家(MoE)架构,在推理效率与成本控制方面实现突破性进展。单次推理仅需激活约37亿参数,显著降低了算力需求,为企业级应用提供了更经济的解决方案。

模型核心创新在于引入强化学习训练方法RAPO,通过反思抑制奖励机制(RIRM)优化训练流程。这一设计有效减少了无效反思行为,在提升推理准确性的同时,将token消耗压缩至行业领先水平的1/4至1/2。语言主干网络采用局部过滤增强注意力结构(LFA)与MoE架构的双重优化,既保证了注意力精度,又进一步降低了训练与推理的算力开销。

多模态处理能力方面,Yuan 3.0 Flash构建了视觉编码器、语言主干网络与多模态对齐模块的协同体系。视觉信号经编码器转化为token后,与语言token共同输入主干网络,通过跨模态对齐模块实现特征高效融合。特别设计的自适应图像分割机制,在支持高分辨率图像理解的同时,将显存需求降低30%以上,为复杂场景应用扫清硬件障碍。

实测数据显示,在企业场景的RAG(ChatRAG)、多模态检索(Docmatix)、表格理解(MMTab)及摘要生成(Summeval)等任务中,Yuan 3.0 Flash的表现已超越GPT-5.1。在多模态推理与语言推理评测中,其400亿参数版本精度接近2350亿参数的Qwen3-VL235B-A22B与6710亿参数的DeepSeek-R1-0528,但token消耗仅为后两者的1/4至1/2,展现出极高的性价比优势。

目前,Yuan 3.0 Flash已全面开源,全系列模型参数与训练代码均开放免费下载。开发团队表示,此举旨在推动多模态大模型在工业界的普及应用,通过降低技术门槛与使用成本,加速AI技术向实体经济渗透。开源地址已同步公布,供全球开发者与研究机构自由使用。

2025砥砺奋进绘就华章,2026勇毅前行再启新程——共赴智能化新征程
在生态伙伴的支持下,鸿蒙生态体验加速从“可用”到“好用”,鸿蒙5.0以上终端设备超过3600万; …… 这就是我们在2025年的点滴片段,在世界的每个角落,我们用坚韧克服困难,用专业创造价值,用热爱激励彼此…

2025-12-31

背包里的新伙伴!稚晖君发布小尺寸人形机器人启元Q1,开启具身智能新玩法
就在刚刚,上纬新材董事长、智元机器人联合创始人、CTO、B 站百大 up主稚晖君(彭志辉)正式公布了并购后新公司的第一款「小尺寸全身力控人形机器人」产品:启元 Q1 。 另外,Q1 尺寸缩小意味着它的体积…

2025-12-31

千元价位新选择!MOVA TPEAK Clip Pro耳夹耳机,以实力重塑市场格局
2025 年 12 月 30 日,MOVA TPEAK 在深圳举办了其旗舰自研耳夹耳机 MOVA TPEAK Clip Pro(下文简称Clip Pro)的发布会,雷科技受邀现场参加了此次活动。 从发布会…

2025-12-31