网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

蚂蚁集团开源Ring-1T-preview大模型,AIME等多测试中表现亮眼

2025-09-30来源:快讯编辑:瑞雪

蚂蚁集团旗下蚂蚁百灵研发团队近日宣布,正式开源全球首个万亿参数级别的自然语言推理大模型——Ring-1T-preview。该模型作为万亿参数推理大模型Ring-1T的预览版本,在自然语言处理领域展现出突破性能力,标志着开源社区迎来首个具备万亿级参数的推理专用大模型。

在权威评测中,Ring-1T-preview的表现引发行业关注。该模型在AIME 25数学推理测试中取得92.6分,不仅超越所有已知开源模型,更超过闭源模型Gemini 2.5 Pro,与GPT-5(无工具辅助)94.6分的成绩仅差2分。在编程能力评估平台CodeForces测试中,其94.69分的成绩直接超越GPT-5,显示出强大的代码生成与逻辑推演能力。在LiveCodeBench编程基准测试和ARC-AGI-v1通用人工智能评估中,该模型均位居开源模型榜首。

研发团队透露,Ring-1T-preview的推理能力已通过国际奥林匹克数学竞赛(IMO)的实战检验。在模拟测试中,模型成功一次性完整解答第三题,并在第一、二、四、五题中部分推导出正确答案,展现出对复杂数学问题的分层解析能力。这一成果得益于团队对Ling2.0家族1T语言基座模型的持续优化,通过后训练技术充分释放了万亿参数模型的推理潜能。

目前,蚂蚁百灵团队正全力推进Ring-1T正式版的训练工作。该版本将在预览版基础上进一步优化模型架构,预计将带来更强的逻辑推演、多步推理和跨领域知识迁移能力。随着正式版训练的推进,开源社区有望获得一个更完善的万亿参数推理大模型,为自然语言处理、数学推理、代码生成等领域的研究提供全新工具。

阿里云峰会聚焦AI时代中企出海,携成功案例与服务体系共探全球新机遇
峰会汇聚了财经作家吴晓波,阿里云智能集团资深副总裁、公共云事业部总裁刘伟光,以及安克创新、禾观科技、多点数智等出海领军企业代表及专家,共同探讨在智能时代全球化趋势下,中国企业如何借助云计算和AI技术拓展海外机…

2025-09-30

汽车之家携三大AI成果首登云栖大会 赋能“人工智能+汽车”生态建设
第一个阶段是基于汽车之家产品和运营团队的实际业务场景进行监督学习,引导大模型聚焦到具体的需求中;第二阶段是利用内部数据构建一个虚拟训练场,让AI智能助手和模拟用户的智能体进行“左右互搏”,在场景模拟对话中学习…

2025-09-29