千问大模型团队今日宣布推出全球首个原生语言世界模型Qwen-AgentWorld,该模型通过突破性技术架构实现了跨领域智能体交互环境的统一建模。与传统方案不同,其核心创新在于将环境建模深度融入模型训练全流程,从初始的继续预训练阶段便确立为关键目标,并贯穿后续的监督微调(SFT)与强化学习(RL)阶段,形成完整的建模闭环。
在应用场景覆盖方面,Qwen-AgentWorld展现出前所未有的广度。该模型通过单一架构同时支持四大文本交互环境(多轮对话MCP、网络搜索Search、终端操作Terminal、软件工程SWE)与三大图形界面环境(网页交互Web、操作系统OS、移动应用Android),实现跨模态知识的高效迁移。这种设计突破了传统模型需要针对不同场景单独训练的局限,显著提升了开发效率与场景适应性。
为确保模型评估的可靠性,研究团队同步发布了AgentWorldBench评测基准。该基准覆盖七大核心领域,每条测试样本均包含真实环境执行产生的观测数据,构建起从虚拟仿真到现实落地的评估闭环。目前,模型本体与评测工具集已通过Hugging Face和ModelScope平台开放下载,为全球开发者提供完整的智能体开发解决方案。
技术文档显示,Qwen-AgentWorld在环境感知、任务规划与执行反馈三个维度实现关键突破。通过动态环境建模机制,模型能够实时感知交互环境的变化并调整策略;在跨领域任务处理时,可自动识别场景特征并调用对应的知识模块。这种自适应能力使其在复杂任务处理中展现出接近人类水平的灵活性。


