网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

蚂蚁开源全球首个万亿参数混合线性思考模型 性能跃升达IMO金牌水准

2026-02-14来源:天脉网编辑:瑞雪

蚂蚁集团近日宣布开源全球首个基于混合线性架构的万亿参数思考模型Ring-2.5-1T,标志着AI大模型领域在长文本处理与复杂任务规划能力上取得突破性进展。该模型在生成效率、推理深度和长时程任务执行能力三大核心指标上实现显著提升,尤其在数学竞赛、代码生成和智能体任务执行等场景中展现出开源模型领先水平。

在数学推理能力验证中,Ring-2.5-1T在国际数学奥林匹克竞赛(IMO 2025)自测中取得35分(满分42分),中国数学奥林匹克(CMO 2025)自测中更以105分远超金牌线78分和国家队集训队选拔线87分。对比前代模型Ring-1T,新模型在推理逻辑严谨性、高级数学证明技术应用和答案完整性方面均有显著优化。在编程能力测试中,该模型在LiveCodeBench-v6代码生成基准中超越所有对比模型,展现出强大的工程化落地潜力。

技术架构层面,Ring-2.5-1T基于创新的Ling 2.5混合线性注意力架构,通过将传统GQA(分组查询注意力)升级为MLA(多头线性注意力)与Lightning Linear结构的1:7混合比例,在保持63B激活参数规模的同时,将内存访问开销降低至前代的1/10。实验数据显示,在32K以上长文本生成场景中,模型生成吞吐量提升超3倍,且随着序列长度增加,效率优势持续扩大。在配备8块H200 GPU的测试环境中,当生成长度超过16K tokens时,其解码吞吐量较传统架构模型高出40%以上。

针对复杂任务执行场景,研究人员通过大规模完全异步智能体强化学习训练,使模型具备跨应用工具协作能力。在智能体搜索任务Gaia2-search中,Ring-2.5-1T在规划生成和多步工具调用准确率上达到开源模型最优水平,较Kimi-K2.5-Thinking等竞品提升23%。该模型已实现与Claude Code智能体编程框架和OpenClaw个人AI助手的快速适配,支持多步骤工具调用与动态规划生成。

在开源生态建设方面,蚂蚁集团同步在Hugging Face、ModelScope等平台发布模型权重与推理代码,并计划于近期上线官方Chat体验页和API服务。对比测试显示,在AIME 26数学推理、HMMT 25竞赛数学等高难度基准测试中,Ring-2.5-1T均实现开源模型最佳性能,在SWE-Bench Verified软件工程任务执行基准中更以87.6%的通过率领先第二名14个百分点。这些突破为金融、科研、工业等领域处理超长文档、复杂业务流程提供了新的技术路径。

13.88万起售!现代菲斯塔轿跑来袭,能否让性能实用“握手言和”?
在15万元级运动紧凑型轿跑市场,竞争激烈,但真正能兼顾多方需求的车型却凤毛麟角。尽管是轿跑,菲斯塔在空间上却给出了**“超出预期”的答卷。从性能到智能,从颜值到实用,现代菲斯塔似乎在15万元级轿跑市场树立了一…

2026-02-14

小米17 Ultra价格下探至新低,影像升级配置强,米粉入手好时机
去年12月份小米17 Ultra正式发布,它也是小米旗下的“新机皇”,不过上一代的小米15 Ultra定价6499元起,而这一代的小米17 Ultra起步价竟然上涨到了6999元,虽然这几年小米高端旗舰越卖…

2026-02-13

小米17 Ultra价格下调显诚意,大底主摄+2亿长焦,米粉入手好时机
去年12月份小米17 Ultra正式发布,它也是小米旗下的“新机皇”,不过上一代的小米15 Ultra定价6499元起,而这一代的小米17 Ultra起步价竟然上涨到了6999元,虽然这几年小米高端旗舰越卖…

2026-02-13

石头科技新专利落地:清洗组件创新助力清洁机器人迈向高效新时代
2026年2月13日,石头科技(688169)获得了一项实用新型专利授权,专利名称为“清洗组件、基站和清洁机器人系统”,该专利申请号为CN202520016227.9。这一巨额的研发投入不仅显示出公司对技术创…

2026-02-13

节后新机潮来袭!vivo X300 Max与小米17 Max大屏长续航旗舰正面交锋
同时超大屏策略已在小米17 Pro Max上获得成功,因此,核心配置上,小米17 Max也将配备一块6.9英寸华星RGB超大屏,搭载第五代骁龙8至尊版处理器,电池容量也将增至8000mAh,续航能力更上一层…

2026-02-13