网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

阿里发布Qwen3-Max-Thinking模型:超万亿参数,太空部署与开源成绩亮眼

2026-01-27来源:快讯编辑:瑞雪

阿里巴巴正式推出其最新旗舰推理模型——千问Qwen3-Max-Thinking,标志着公司在人工智能领域迈出重要一步。这款模型拥有超过万亿参数,预训练数据量达到36T Tokens,是目前阿里旗下规模最大、性能最强的推理模型,为开发者、企业和普通用户提供了强大的智能支持。

开发者可通过QwenChat平台免费体验这一新模型,企业用户则能借助阿里云百炼获取API服务。千问PC端和网页端也已开放试用,千问APP也即将接入该模型,届时所有用户均可免费体验其强大功能。这一举措进一步降低了大模型的使用门槛,推动了AI技术的普及。

在性能方面,Qwen3-Max-Thinking表现尤为突出。预览版模型已在数学推理领域取得突破,斩获AIME 25和HMMT 25国内首个双满分。正式版模型在此基础上进行了更大规模的强化学习后训练,性能得到全面提升。其采用的测试时扩展机制,通过“经验提取”和多轮自我迭代,实现了更高效的推理计算,避免了传统方法中冗余推理的问题,显著提升了推理效率和结果质量。

在“人类最后的测试”HLE中,Qwen3-Max-Thinking以58.3分的成绩超越GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分,创下当前所有模型的最高分。这一成绩充分证明了其在复杂推理任务中的卓越能力,为智能体Agent时代的应用奠定了坚实基础。

面向未来,Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力,使其能够更灵活地应对多样化场景需求。这一改进不仅提升了模型的实用性,也为智能体技术的发展提供了新的方向。

在应用拓展方面,千问大模型已迈出重要一步。2025年11月,国星宇航成功将千问Qwen3大模型部署至“星算”计划01组太空计算中心,实现了全球首次通用大模型在轨运行。该模型在太空中成功完成多次端到端推理任务,从地面接收问题,在卫星上完成推理,并将结果回传地面,全程耗时不到2分钟。这一突破为太空计算和智能应用开辟了新的可能性。

在开源领域,千问系列模型同样表现亮眼。全球最大AI开源社区Hugging Face数据显示,阿里千问衍生模型数量已突破20万个,成为全球首个达成此目标的开源大模型。同时,千问系列模型下载量超过10亿次,日均下载量达110万次,全面超越美国Llama模型,稳居开源大模型全球第一。这一成就不仅体现了千问模型的广泛影响力,也彰显了中国在人工智能开源领域的领先地位。

微博×益普索:2026冬奥热点趋势洞察,社交互动与消费新机遇并存
2026年米兰科尔蒂纳冬奥会开幕在即,微博与益普索联合发布的《2026冬奥热点趋势洞察白皮书》上篇,基于社交大数据与消费者调研,揭示了冬奥相关的社交热点趋势与消费机遇。 调研显示,60.1%的用户会通过社交…

2026-01-27

国产小众厂商“复活”4.7寸mini手机,致敬iPhone8,配置能否打动你?
近日,蓝狐BLUEFOX在社交平台上宣布,旗下代号为“蓝狐 β”的4.7英寸mini新机,首批主板已经制造完成,该机预计在6月初正式上市。 此前蓝狐BLUEFOX的官方预热,揭晓了该机的一些参数:屏幕为4.…

2026-01-27

2026款大众朗逸自动得逸版登场!1.5L动力+丰富配置,入门之选的新标杆
2026款大众朗逸自动得逸版上市,提供1.5L自然吸气发动机,指导价12.09万元,配置丰富,兼顾实用性与科技感,是入门级大众车型的新选择。

2026-01-27

2026折叠屏新机潮来袭 华为OPPO荣耀2月底至3月竞相亮剑
据数码博主爆料,华为、OPPO、荣耀三大品牌的主力折叠屏旗舰——华为Pura X2、OPPO Find N6、荣耀MagicV6——已锁定2月底至3月的发布窗口。据报道,它将搭载高通骁龙8 Elite Ge…

2026-01-27

360研究团队提出HyperGLLM框架 被AAAI 2026收录助力终端安全防护
但在真实安全场景中,其落地仍面临双重考验:一是终端事件规模庞大、实时性要求极高;二是攻击行为往往交错复杂,隐蔽而零散的恶意操作藏在海量正常行为中,对系统的长上下文建模与威胁行为检测提出了严峻挑战。 为此,36…

2026-01-27