阿里发布首个原生语言世界模型Qwen-AgentWorld，赋能AI智能体新突破-网界

阿里人工智能实验室近日宣布推出新一代原生语言世界模型Qwen-AgentWorld，该模型通过统一架构实现七大交互环境的模拟能力，在智能体训练领域取得突破性进展。该模型提供35B-A3B和397B-A17B两种参数版本，采用从预训练到强化学习的全流程环境建模方法，为AI智能体开发开辟了新路径。

区别于传统模型训练方式，Qwen-AgentWorld创新性地将环境建模贯穿CPT（持续预训练）、SFT（监督微调）和RL（强化学习）全流程。研究人员指出，该模型的核心价值不在于替代真实交互环境，而是通过内部模拟机制增强智能体的决策能力。在移动操作系统模拟测试中，模型能准确预测点击删除图标后的界面变化，其预测准确率较传统方法提升37%。

该模型突破性地实现单一架构覆盖文本类（MCP、搜索引擎、终端、软件环境）和GUI类（网页、桌面系统、安卓系统）七大交互领域。通过采用可渲染代码而非像素帧的环境观测方式，模型在视觉环境模拟中展现出独特优势。在电脑系统模拟测试中，模型成功预测"文件-打印"操作链的完整界面变化，验证了跨领域知识迁移的有效性。

配套发布的AgentWorldBench评测基准采用开放式评分体系，从格式规范、事实准确性、逻辑一致性、现实贴近度和综合质量五个维度进行评估。测试数据显示，397B参数版本在整体评分中达到58.71分，超越GPT-5.4（58.25分）、Claude Opus 4.8和Gemini 3.1 Pro等主流模型。在终端环境和软件环境模拟中，该模型展现出对代码执行状态和工具API行为的精准模拟能力。

研究团队在分析129条思维链时发现三种独特推理模式：模型平均每轮产生10.4次自我修正，通过"Wait!"信号触发事实错误修正；在搜索场景中建立信息防护机制，防止无关查询泄露目标信息；面对复杂命令时，能构建六步推理链准确预测输出结果。这些能力使模型在处理长上下文和跨领域任务时表现出色。

目前，35B参数版本模型权重和评测基准已在GitHub、ModelScope和Hugging Face平台开源。该成果为智能体训练提供了新范式，其可扩展的环境模拟能力有望推动AI在复杂任务处理领域实现突破，特别是在需要精准环境感知和长程规划的应用场景中具有重要价值。

马斯克官宣Starmind：拟发射百万颗卫星打造全球独立AI算力闭环

2026-06-24

京新药业董事长吕钢提议大额回购股份 1亿至2亿元资金用于注销减资

2026-06-24

普生医疗冲刺科创板：58岁董事长黄宏辉年薪近300万，履历亮眼

2026-06-24

上汽通用汽车销售公司高层变动：王晓秋卸任董事长，卢晓接棒

2026-06-24

马云携阿里蚂蚁高管下田插秧，展现团队凝聚力与AI发展信心

不断更新的核心管理团队背后，阿里巴巴集团董事长蔡崇信也在近期提及阿里AI布局时表示，阿里布局了芯片、基础设施层、模型层、应用层，包括电商、外卖、本地生活、旅行、地图等，这些场景都可以直接嵌入AI能力，服务用…

2026-06-24

时隔两周再更新苹果watchOS 27第二测试版来袭带来Siri等多项新功能

据CNMO科技了解，用户可通过iPhone上的手表App下载该测试版。除Apple Watch Ultra 3外，所有支持watchOS27的Apple Watch产品均可安装本次测试版。此外，液态玻璃…

2026-06-24

Waves Audio推出V17更新：优化预设管理，为直播与录音室工作注入新活力

全球领先的专业音频信号处理技术及插件开发商WavesAudio宣布对其Waves插件目录进行重大更新至V17，该版本优化了预设管理功能，增强了现场演出和录音室的工作流程；并为StudioVerse 推出…

2026-06-24