网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

中文大模型SuperCLUE测评:豆包紧追海外顶尖模型 小米两款模型入榜国产开源亮眼

2026-03-30来源:快讯编辑:瑞雪

在最新发布的中文大模型基准测评SuperCLUE中,22款国内外主流模型展开激烈竞争,测评结果引发行业广泛关注。本次测评围绕数学推理、科学推理、代码生成等六大核心任务展开,全面评估模型的综合能力,为技术发展提供了重要参考依据。

海外闭源模型在总分排名中继续占据优势地位。Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)包揽前三名,展现出强大的技术实力。值得注意的是,字节跳动旗下豆包(Doubao-Seed-2.0-pro-260215(high))以71.53分的成绩紧随其后,与第三名GPT-5.4仅相差0.95分,成功跻身全球第一梯队。该模型在智能体任务规划维度表现尤为突出,甚至反超部分海外竞争对手,位列全球前五。

国内科技企业在此次测评中表现亮眼。小米集团推出的MiMo-V2系列两款模型均成功入围榜单,其中MiMo-V2-Pro以60.67分的成绩在闭源模型中名列前茅,特别是在数学推理任务中取得84.03分的高分。另一款开源版本MiMo-V2-Flash虽然总分49.97分排名相对靠后,但在代码生成等特定场景中展现出独特潜力,为开发者提供了新的选择。

开源赛道成为本次测评的一大亮点。Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模型包揽开源榜单前三名,在性能表现上大幅领先海外同类开源模型。这一成果不仅体现了国内企业在开源技术领域的积累,也为全球开发者社区贡献了重要力量,推动了行业技术的共同进步。

GoPro官宣4月发布新相机:GP3处理器加持,专业性能与续航散热全面升级
IT之家 3 月 30 日消息,GoPro 上周(3 月 25 日)宣布将在 4 月 19 日-22 日的 NAB Show 2026展会上发布新一代相机产品,搭载下一代 GP3 影像处理器。 据介绍,新系…

2026-03-30

2026中关村论坛AI圆桌:杨植麟罗福莉等共探大模型未来12个月新走向
舞台上,月之暗面创始人杨植麟、小米MiMo大模型负责人罗福莉、智谱华章CEO张鹏、无问芯穹CEO夏立雪、香港大学助理教授黄超聚在一起,从时下最流行的“养龙虾”聊到智能体、大模型训练,又回归到支撑AI运转的…

2026-03-29

京东“异狼”机械臂升级:双臂协同发力,具身智能引领仓储自动化新潮流
这款专为包裹抓取和码垛设计的具身智能设备,实现了从“单臂”到“双臂”的进化,标志着仓储自动化效率的又一次飞跃。“异狼”机械臂之所以能攻克非标准化包裹码垛这一世界级难题,核心在于其深厚的技术底座: 具身模型…

2026-03-29