网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

阿里Qwen3-Max-Thinking预览版亮相,数学满分却成token“大户”

2025-11-05来源:快讯编辑:瑞雪

在AIME 2025数学竞赛中,该模型以满分成绩通过测试,其解题过程展现出独特的验证机制。面对压轴题时,模型不仅反复验证答案,还主动调用代码解释器从多角度论证结果。整个推理过程持续4-5分钟,消耗1.2万至1.5万个token,这种深度思考模式显著区别于传统模型。

编程任务测试中,模型开发开源项目分享网站的HTML原型时,虽然生成1417行代码,但网页设计完全符合功能需求。对比测试显示,DeepSeek-V3.2完成相同任务仅需787行代码,这种差异反映出Qwen3-Max-Thinking在代码优化方面仍有提升空间。不过其输出的网页结构清晰,基础功能完整,仅在样式细节上稍显不足。

该模型在常识推理测试中同样表现优异,能准确识别逻辑陷阱。测试人员发现,其回复风格简洁直接,完全聚焦问题核心,这种"去人性化"的交互方式在商务场景中颇具优势。有用户评价称,模型的回复风格更接近专业顾问,避免了情感化表达可能带来的干扰。

目前用户可通过Qwen Chat和阿里云API体验该模型,但需注意其仅支持文本到文本的单一模态。API服务采用限时免费策略,用户可在1024至81920个token的思考预算范围内自主调节,这种设计既控制了计算成本,又保证了推理深度。测试显示,复杂任务消耗的token数量明显高于常规模型,这可能成为大规模应用的主要限制因素。

行业观察者指出,Qwen3-Max-Thinking的定位可能更偏向专业领域,其强大的推理能力在科研、金融分析等场景具有应用潜力。虽然尚未公布完整基准测试结果,但现有表现已引发广泛期待。社交媒体上,用户纷纷询问模型开源时间,特别是能否登陆Hugging Face平台,反映出开发者社区的高度关注。

这款模型作为Qwen3系列的新成员,延续了阿里在大模型领域的技术积累。此前发布的Qwen3系列最大模型参数量已突破万亿规模,此次推理专项模型的推出,标志着阿里在AI技术布局上更加精细化。随着训练进程推进,后续版本有望在效率优化和场景适配方面带来更多突破。

百度“文心杯”第三届落幕!8支团队获千万投资,李彦宏盼AI应用星火燎原
李彦宏表示,我们看到越来越多的创业者在各种场景发现AI的新能力、新效果,希望更多的人能够加入这个发现之旅,也正基于此,百度连续三年举办“文心杯”创业大赛。 第三届“文心杯”创业大赛8支优胜团队共获得数千万元…

2025-11-14

MIT四名00后辍学生创业Cursor:两年冲刺300亿估值 获谷歌英伟达重投
两年前,在完成种子轮融资后,创始人曾写了这样的期待—— Cursor的诞生,推动了「氛围编程」(vibe coding)在全球兴起。 他还在创纪录的时间内,完成了一份手写编程测试,给早期Facebook投资…

2025-11-14

百度AI成果爆发:从智能到效果涌现,重构产业开启全球化新篇
百度搜索富媒体结果覆盖率已达70%,萝卜快跑全球出行服务超1700万次,文心大模型5.0亮相——百度AI成果集中爆发,标志着AI从“智能涌现”迈向“效果涌现”的临界点已至。 百度AI业务的集体出海,代表了中国…

2025-11-14

百度发布新一代昆仑芯与天池超节点 未来持续加码AI云建设
在近日举办的百度世界大会上,百度公司重磅推出新一代昆仑芯及超节点产品“天池”,并宣布未来五年将每年发布创新产品,致力于构建顶尖AI云服务生态,赋能企业深度融合AI技术。

2025-11-14

李彦宏2025百度世界大会发声:搜索结果AI主导,AI搜索能力开放合作
11 月 13 日消息,在今日的 2025 百度世界大会上,百度创始人李彦宏表示,百度搜索绝大部分的搜索结果由 AI生成,而首条结果的富媒体覆盖率已达 70%。 IT之家从大会获悉,百度还通过 AI API…

2025-11-13

李彦宏2025百度世界大会演讲:AI内化驱动产业变革 开启智能生产力新纪元
“当下非常重要的问题是,企业如何内化AI能力”——李彦宏介绍,这有三个代表性的应用方向: 李彦宏指出,百度是全球所有搜索引擎中AI化改造最激进的,用AI重构搜索结果页,而非简单插入AI摘要,“把搜索从一个以…

2025-11-13