SuperCLUE中文通用大模型评测基准近日公布了手机助手GUI智能体6月测评榜单,中兴通讯推出的gui手机智能体以91.29分的绝对优势登顶总成绩榜首,在全部评测维度中均斩获第一。此次测评覆盖了6款具备智能体架构及配套模型的手机助手产品,通过统一ADB交互与纯视觉输入环境,构建了标准化任务集与评分体系,重点考察智能体在复杂任务场景下的综合能力。
从具体得分来看,第二至第六名分别为智谱AI Open-AutoGLM(73.11分)、阿里巴巴Mobile-Agent-3.5(67.74分)、阿里巴巴MAI-U1(65.91分)、阶跃星辰GELab-Zero(54.26分)和字节跳动UI-TARS(30.19分)。中兴gui手机智能体不仅总分领先,在分项测试中同样表现突出,尤其在复杂意图拆解与动态规划、多模态GUI感知与理解、跨应用全链路执行三个核心维度均获最高分,展现出对用户任务目标理解、界面信息识别及多应用协同操作等关键能力的全面领先。
据评测方介绍,本次评估通过标准化任务集模拟真实使用场景,重点考察智能体在意图解析、视觉感知和长链路执行任务中的决策质量。例如在跨应用执行测试中,系统要求智能体完成"预订机票并同步至日历"的复合任务,涉及航班查询、支付操作、日程添加等多个步骤,中兴gui手机智能体凭借精准的界面元素识别与动态路径规划能力,在效率与准确性上显著优于其他产品。
评测报告指出,大模型与端侧AI的深度融合正在重塑手机助手的技术范式。传统语音助手主要依赖指令响应,而新一代智能体需具备GUI自动化操作与复杂任务规划能力。此次测评采用的纯视觉输入方案,更贴近人类真实操作逻辑,对智能体的环境理解与决策能力提出更高要求。中兴gui手机智能体的领先表现,标志着我国在端侧智能体领域已形成技术突破,为手机交互方式的革新提供了重要参考。



