阿里发布Qwen3-Max-Thinking：性能比肩国际顶尖，推理能力创新高-网界

阿里近日正式推出其最新一代千问旗舰推理模型——Qwen3-Max-Thinking，该模型在多项权威评测中创下全球新纪录，性能比肩国际顶尖的GPT-5.2和Gemini 3 Pro，成为国内AI大模型领域的新标杆。

作为阿里目前规模最大、能力最强的推理模型，Qwen3-Max-Thinking的总参数量超过万亿级别，预训练数据量高达36T Tokens。通过大规模扩展总参数、强化学习以及推理计算，新模型在科学知识、数学推理、代码编程等关键性能基准测试中刷新了全球纪录，展现了强大的技术实力。

在推理能力提升方面，Qwen3-Max-Thinking引入了一种创新的测试时扩展（Test-time Scaling）机制。这一机制通过提炼此前推理的“经验”，并进行多轮自我迭代，在相同上下文中实现更高效的推理计算，从而获得更智能的结果。相比业界普遍采用的冗余推理方式，该机制显著提升了推理效率和性能。例如，在“人类最后的测试”（HLE）中，Qwen3-Max-Thinking以58.3分的成绩超越了GPT-5.2-Thinking的45.5分和Gemini 3 Pro的45.8分，成为当前所有模型中的最高分。

针对即将到来的智能体Agent时代，Qwen3-Max-Thinking还大幅增强了自主调用工具的原生Agent能力。通过基于规则奖励与模型奖励的联合强化学习训练，模型能够更智能地结合工具进行思考。这种自适应的工具调用能力已在QwenChat上实现，用户可以体验到模型自主选用搜索、个性化记忆和代码解释器等核心Agent工具功能，获得更专业、更贴合需求的回答，同时模型幻觉问题也显著减少，为解决复杂任务奠定了基础。

目前，开发者可以在QwenChat上免费体验Qwen3-Max-Thinking模型，企业用户则可通过阿里云百炼获取新模型的API服务。普通用户也可以通过千问的PC端和网页端试用该模型。据悉，千问App即将接入这一新模型，届时所有用户均可免费体验这款国内最强的AI大模型。

英特尔Ultra7 265K装机优选！技嘉B860M电竞雕主板性能与性价比兼具

还有一点值得一提的就是技嘉 B860M主板也直接给我们准备了一个PCIe5.0x4通道的固态硬盘位，当下满血的Gen5固态硬盘虽然价格略贵，但是预算充足的小伙伴，我觉得还是值得升级的，已经满血最高14000M…

2026-01-27

现代名图N Line深度体验：运动基因加持，家庭用户也能畅享驾驶乐趣之选

在竞争激烈的中型轿车领域，现代名图NLine凭借独特定位脱颖而出，成为兼具运动性能与日常实用性的热门选择。在大众速腾、本田思域等竞品面前，名图NLine凭借更高的配置水平和更具竞争力的价格，展现出突出的性价比…

2026-01-27

周鸿祎：2026年迈入“百亿智能体”时代，中国有望引领智能体经济新变革

周鸿祎在演讲中构建了“电力—算力—智力+人力—生产力”的“五力模型”。这一转化过程必须依赖行业专家将特有的“隐性知识”与“潜规则”注入模型，在人的设定与监督下，让智能体具备解决实际痛点的能力，从而真正打通从…

2026-01-26

周鸿祎展望2026“百亿智能体”时代 360“短剧智能体”助力影视创作降门槛

2026-01-26

小宇宙播客大赏：以对话为钥开启年轻人精神共鸣新体验

穹顶外场的探索开放区，延续小宇宙播客漫游日的“活泼”，小宇宙搭建了一个用好奇心浇筑的创作探索体验互动区，用各类装置、展陈分享创作者充满创作热情的过程，而同样充满好奇心的听众从“来听”变成“来参与”，在即时互…

2026-01-26

百万特斯拉化身“数字打工人”？xAI人类模拟器计划引全球科技圈热议

人类模拟器所做的也是同样的事情，但针对的是人类在数字世界中完成的任何任务，也就是任何需要人类通过键盘和鼠标输入，并看着屏幕做出决策的工作。报道称其“罕见地从内部视角揭示了如何将白领工作自动化”，并赞赏xAI利…

2026-01-26

小米vivo新机发布日期敲定荣耀OPPO官博“隐身”或藏大招

在REDMI Turbo 5系列发布会官宣的同时，iQOO 15 Ultra的发布日期也官宣了。vivo X300系列以及vivo S50系列，这两款vivo当下最当家的机型都有优惠，喜欢的朋友可以亲自查询…

2026-01-26

董明珠再卸任重要职务：方祥建接棒，格力芯片业务布局持续推进

2026-01-26

思特威2025年业绩亮眼：营收与净利润双增，多领域布局成效显著

2026-01-26