网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

全球AI编程大模型盲测揭晓 阿里Qwen3.6-Plus跻身全球第二成中国标杆

2026-04-03来源:天脉网编辑:瑞雪

在AI编程能力的全球竞技场上,中国大模型正以强劲势头崭露头角。近日,国际权威盲测平台LMArena旗下Code Arena榜单公布最新排名,阿里巴巴自主研发的Qwen 3.6-Plus大语言模型以1452分的成绩跃居全球第二,在React专项技术方向上超越OpenAI、Google等国际科技巨头,成为该榜单中排名最高的中国模型。

作为AI领域最具公信力的性能评估平台之一,LMArena通过真实用户盲测与实时对抗机制,为全球大模型提供客观对比。随着AI Agent技术兴起,编程能力已成为衡量模型综合实力的核心指标。本次React专项榜单聚焦Web开发场景下的自主编码能力,要求模型独立完成从项目初始化到调试运行的全流程,对工程思维与端到端开发能力提出极高要求。Qwen 3.6-Plus的突破性表现,标志着中国大模型在复杂工程任务处理领域达到世界领先水平。

该模型于4月2日正式发布,具备原生多模态理解与推理能力,尤其在代码生成与Agent技术方面表现卓越。在多项权威评测中,Qwen 3.6-Plus以更少的参数量超越参数量达其2-3倍的GLM-5、Kimi-K2.5等模型,展现出高效能的技术架构。发布首日即引发全球开发者社区广泛关注,次日便以显著优势登顶React榜单次席,仅落后于Anthropic的Claude-Opus-4.6-Thinking(1540分),领先OpenAI最新发布的GPT-5.0-High(1448分)4分,较Google的Gemini 3.1 Pro Preview(1440分)高出12分。

在全面评估AI编程能力的Code Arena总榜单中,Qwen 3.6-Plus同样稳居中国模型首位。这一成绩推动阿里巴巴在全球AI实验室排名中升至第四,紧随Anthropic、OpenAI和Google之后。据技术团队透露,Qwen 3.6-Plus作为千问3.6系列的首发模型,后续将开源不同参数规模的版本,性能更强的旗舰模型Qwen3.6-Max也计划于近期发布,为开发者提供更丰富的技术选择。

小红书品牌曝光秘籍:从信号发射到深度评估的全链路操作指南
曝光效率的核心,在于品牌内容能否被系统精准识别并投递给潜在兴趣群体,该过程可拆解为内容信号发射、系统算法解析、社区环境适配及曝光效果评估四个相互关联的环节。2. 在内容发布与冷启动阶段,密切关注初始互动数据…

2026-04-03

3月安卓性能榜揭晓:荣耀三款入围,一加小屏逆袭,极致性能花落谁家?
说实话,现在很多旗舰机都在喊全能,但真正能把性能、影像、续航和屏幕同时做得不拉胯的并不多,真我GT8 Pro这次能排到第四,说明它不是只会喊口号,而是真的把产品做出来了。但一加15T直接冲到第二名,等于告诉整…

2026-04-03

数字化浪潮下,中国龙文化.cn平台引领龙文化传承与创新新路径
有相关数据显示,这些年我国龙文化相关产业规模每年都保持8%以上的增速,民俗体验、文创产品这些细分领域更是发展迅猛,但行业发展也有不少让人头疼的问题:传承方式太单一,大多靠线下展演、庙会这些传统形式,传播范围有…

2026-04-02

超算互联网携手多方启动“AGI4S算力共建计划” 共促科研范式变革
“AGI4S珠穆朗玛计划构建的科学智能创新中枢,与超算互联网今年稳步落实的‘超级科学计算智能体’全景图,具有相辅相成、互为促进的内在关系”,曹振南表示,AGI4S想要实现推动研究人员、研究工具、研究对象的协…

2026-04-02