阿里千问Qwen3-Coder-Next发布：以低推理成本解锁高效编程智能体新可能-网界

阿里巴巴旗下千问团队近日正式发布全新语言模型Qwen3-Coder-Next，这款专为编码代理和本地开发场景设计的开放权重模型，通过创新架构与训练方法在编程智能体领域展现出显著优势。该模型基于Qwen3-Next-80B-A3B-Base构建，采用混合注意力机制与专家混合（MoE）架构，在保持低推理成本的同时实现了强大的编程能力。

在训练方法上，研究团队突破传统参数扩展模式，重点强化智能体训练信号的扩展性。通过构建包含大规模可验证编程任务和可执行环境的训练体系，模型能够直接从环境反馈中学习优化。具体训练流程涵盖四个阶段：首先在代码与智能体相关数据上进行持续预训练，随后利用高质量智能体轨迹数据进行监督微调，接着针对软件工程、QA测试、Web/UX设计等领域开展专家训练，最终将多领域专家能力蒸馏整合到单一可部署模型中。这种训练范式特别强化了长程推理、工具调用和错误恢复能力，这些特性对现实编程场景至关重要。

性能评估显示，该模型在多个权威编程智能体基准测试中表现突出。在SWE-Bench系列测试中，使用SWE-Agent框架时模型在Verified版本上取得超过70%的准确率，在多语言版本和更具挑战性的Pro版本中仍保持竞争力。特别值得注意的是，尽管激活参数规模仅30亿，其性能已可媲美激活参数多10-20倍的开源模型。在TerminalBench 2.0和Aider等基准测试中，模型同样展现出优异表现。

效率分析图表揭示，Qwen3-Coder-Next在性能与资源消耗间实现了更优平衡。在SWE-Bench-Pro测试中，30亿激活参数版本的性能与参数量大数十倍的模型相当，展现出显著的成本优势。虽然全注意力架构的专有模型在绝对性能上仍占优势，但该模型在低成本智能体部署场景中已处于领先位置，特别适合资源受限环境下的编程任务处理。

技术文档显示，模型开发团队将持续优化推理决策能力，计划扩展对更多编程任务类型的支持，并建立快速迭代机制根据用户反馈持续改进。目前该模型已通过ModelScope和Hugging Face平台开源，开发者可自由获取模型权重及训练代码进行二次开发。

马斯克拟发射百万卫星建太空数据中心，此举能否开启AI计算新篇章？

2026-02-04

AMD2025年营收净利双创新高，2026年首季销售额展望超分析师预期

2026-02-04

科创人工智能ETF汇添富（589560）开盘微涨，重仓股多股飘红澜起科技领涨

来源：新浪基金∞工作室 2月3日，科创人工智能ETF汇添富（589560）开盘涨0.47%，报1.065元。科创人工智能ETF汇添富（589560）重仓股方面，金山办公开盘涨1.04%，澜起科技涨3.86%，…

2026-02-04

小米17：小屏旗舰新标杆，续航性能双在线，3598元入手超值之选

2026-02-04

三星显示5月启动8代OLED屏量产苹果MacBook Pro或成首批受益者

2026-02-03

绿地张玉良擘画2026新蓝图：锚定“十五五”目标，以“五新”方略推动高质量发展

2026-02-03

马斯克再出“神操作”！SpaceX收购xAI

美国科技界近日迎来一则震撼消息：太空探索技术公司SpaceX宣布全资收购人工智能企业xAI。这场价值2500亿美元的并购案，不仅刷新了AI领域企业收购的金额纪录，更标志着马斯克商业版图进入"天地融合"的新阶段。据知情人士透露，合并后企业总估值将突破1.25万亿美元，被华尔街分析师称为"太空AI帝国"的诞生。

2026-02-03

马斯克再布局：SpaceX收购xAI，融合多领域打造宇宙探索新引擎

在内部通知中，马斯克则明说了他的考量，“全球对AI的电力需求无法通过地面数据中心来满足，从长远来看，天基技术将是扩大AI规模的唯一途径。” 有知情人士透露，在本次交易中，SpaceX以2500亿美元的估值完…

2026-02-03