网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

蚂蚁Ling-1T开源引热议,全球AI大模型竞争升级,万亿参数新征程开启

2025-10-09来源:快讯编辑:瑞雪

全球通用语言模型领域迎来重要突破——蚂蚁集团正式发布并开源其首个万亿参数大模型Ling-1T。作为蚂蚁百灵大模型Ling 2.0系列的首款旗舰产品,该模型凭借1.2万亿参数规模,成为当前非思考类大模型中的性能标杆。

基准测试显示,Ling-1T在有限输出Token条件下展现出显著优势。在竞赛数学基准AIME 25测试中,该模型以平均4000+ Token消耗达到70.42%准确率,超越消耗5000+ Token、准确率70.10%的Gemini-2.5-Pro。在代码生成、专业数学推理等12项高难度任务中,Ling-1T均取得开源模型领先成绩,特别是在前端开发能力基准ArtifactsBench上以59.31分位居榜首。

技术架构方面,Ling-1T延续Ling 2.0架构,在20万亿Tokens的高质量推理语料上完成预训练。模型支持128K上下文窗口,通过"中训练+后训练"的演进式思维链技术,显著提升复杂推理效率。值得关注的是,该模型全程采用FP8混合精度训练,成为已知规模最大的FP8训练基座模型,显存节省达30%,训练速度提升15%以上。

蚂蚁百灵团队创新提出的LPO策略优化算法(LingPO),以句子为粒度进行参数更新,有效解决了万亿参数模型的训练稳定性问题。同时,团队开发的混合奖励机制在确保代码正确性的基础上,显著提升了模型对视觉美学的理解能力。这些技术突破使Ling-1T在保持高性能的同时,降低了对高端GPU的依赖。

在AI军备竞赛持续升级的背景下,蚂蚁集团的技术路线引发行业关注。与依赖高性能GPU的混合专家(MoE)模型不同,Ling-1T通过优化异构计算框架,实现了在普通加速器上的高效训练。这种技术路径与蚂蚁集团CTO何征宇的布局密切相关——这位佐治亚理工学院博士、前谷歌gVisor项目负责人,正带领团队探索生活服务、金融、医疗等场景的AI应用。

全球AI投资格局也在发生深刻变化。据PitchBook统计,今年AI领域初创公司已吸引1927亿美元风险投资,占全球风投总额的53%。美国市场表现尤为突出,62.7%的风投资金流向AI企业。OpenAI以5000亿美元估值领跑行业,其ChatGPT周活跃用户达8亿,年收入预计突破120亿美元,并签下近1万亿美元的算力采购协议。

蚂蚁集团同步推进的深度思考大模型Ring-1T已进入关键阶段,其preview版于9月30日开源。这款万亿参数模型将聚焦复杂逻辑推理能力,与Ling-1T形成技术互补。随着两大模型体系的完善,蚂蚁百灵团队正在构建覆盖从快速响应到深度思考的全场景AI能力。

行业观察人士指出,当前AI发展呈现明显分化趋势。英伟达CEO黄仁勋透露,过去六个月AI计算需求激增,新一代Blackwell架构芯片需求"异常高涨"。这种技术需求与资本流向的双重驱动,正在重塑全球科技产业格局。而蚂蚁集团选择的技术路径,为资源受限环境下的AI发展提供了新的可能性。

阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13