网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

多模态视觉语言测评:Gemini-3-pro登顶 国内多款大模型表现亮眼

2025-12-31来源:互联网编辑:瑞雪

近日,SuperCLUE-VLM多模态视觉语言基准测评12月总榜正式揭晓,全球多款主流大模型在基础认知、视觉推理、视觉应用三大核心维度展开激烈角逐,最终谷歌Gemini-3-pro以绝对优势登顶榜首,国内多款模型凭借技术突破跻身前列,展现出中国人工智能领域的强劲实力。

谷歌Gemini-3-pro以83.64分的总成绩领跑全场,其在三项细分指标中均表现卓越:基础认知得分89.01分,视觉推理82.82分,视觉应用79.09分,三项数据均远超其他竞品。这一成绩不仅巩固了谷歌在多模态领域的领先地位,也为行业树立了新的技术标杆。

国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,成为榜单中排名最高的国产模型。字节跳动旗下两款模型表现亮眼:豆包大模型以73.15分跻身前三,其视觉版在基础认知环节得分82.70分,甚至超越部分国际竞品,仅在视觉推理环节稍显不足;另一款模型则凭借均衡表现稳居前列。百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等模型也成功进入前五,其中Qwen3-vl作为榜单中首个开源且总分超70分的模型,为开源社区贡献了重要技术资产。

国际头部模型在此次测评中表现分化。Anthropic的Claude-opus-4-5以71.44分位列第六,而OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。这一结果反映出,尽管国际巨头在通用人工智能领域占据先发优势,但国内模型通过针对性优化和垂直场景深耕,正在逐步缩小技术差距。

据测评机构介绍,本次评估从基础认知能力、复杂视觉推理、实际应用场景适配性三个维度展开,覆盖图像理解、逻辑推断、跨模态交互等关键技术指标。评测数据显示,国内模型在中文语境下的语义理解、文化相关视觉内容处理等方面表现突出,而国际模型则在多语言支持、通用场景泛化能力上保持优势。随着技术迭代加速,多模态大模型正从实验室走向实际应用,在医疗、教育、工业检测等领域展现出巨大潜力。

百度港股开盘劲涨超7%,AI技术突破与全球拓展双轮驱动未来增长
这不仅证明了百度在AI技术上的领先地位,也为其在市场中的竞争力增添了砝码。这一计划将为企业提供更为丰富的AI解决方案,助力各行业的数字化转型。未来,随着AI技术的不断进步,百度将有机会进一步释放其潜力,推动企…

2025-12-31

Manus加入Meta生态:技术积淀赋能 持续拓展AI应用新边界
据介绍,自今年3月Manus推出全球首款通用Agent以来,公司专注于构建能够执行研究、自动化与复杂任务的通用型AI Agent。我们期待在Meta平台上为更广泛的用户与企业提供服务,并继续迭代产品,坚守以…

2025-12-31

清华华科联合快手破局:AI视觉系统实现理解与生成“双精通”
研究团队创造性地提出了VQRAE技术,它能够同时产生两种类型的"视觉语言":一种是连续的语义特征用于理解任务,另一种是离散的精细标记用于生成任务。通过两阶段训练,VQRAE不仅保持了与原始视觉基础模型相当的语…

2025-12-31

数字经济新引擎:云端国际AI7.0大模型工具,助力个体团队双跃升
列,以八大核心服务项目、六大突出服务优势,为个体成长、团队扩张、产业升级提供全链条赋能,在行业内掀起一股创新发展的热凭借对行业趋势的精准把握和用户需求的深刻洞察,团队打造的AI7.0大模型应用工具系列,打破…

2025-12-31

红魔11Pro+与电竞平板3 Pro臻金版来袭,限量典藏预约将启
今年初红魔曾为自家的红魔10 Pro系列带来一个特殊版本——「红魔XGoldenSaga臻金传奇限量典藏版」,有许多“黄金细节”设计,现据最新消息,红魔11 Pro+和红魔电竞平板3 Pro也将带来“臻金版…

2025-12-31

2699元电竞新标杆!荣耀WIN RT携1万mAh电池登场 性能续航双王炸
同样的表现也延续到了《原神》上,最高画质跑图20分钟,平均帧数达到了60.2FPS,稳帧指数同样是0,1%low帧达到了60.1,可以说整个游戏流程几乎不存在掉帧这一说法。从实测表现来看,荣耀WIN RT…

2025-12-31

奥睿科分控小胖条插排实测:多设备充电无忧,安全便携一步到位!
更难得的是,这款插排在多口同时充电时,依旧能保持稳定的充电效率,没有出现明显的功率衰减。 五、总结:多场景刚需神器,值得入手经过多维度实测,奥睿科分控小胖条插排凭借简约精致的外观、极致的便携性、全能的12口…

2025-12-31