网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

GLM-4-Plus登顶两大评测,国内大模型实力再获验证!

2024-11-18来源:ITBEAR编辑:瑞雪

近期,中文大模型领域的竞争格局再度迎来新变动。据最新发布的《中文大模型基准测评2024年10月报告》显示,智谱科技自主研发的GLM-4-Plus模型在SuperCLUE测评中脱颖而出,成为国内外43个大模型中的佼佼者。

SuperCLUE测评旨在全面评估大模型的综合性能,通过对国内外具有代表性的模型进行多维度、多层次的测试,实时跟踪其发展趋势。在本次测评中,GLM-4-Plus凭借在基础能力和应用能力上的出色表现,不仅在国内大模型中位列第一,而且与国际顶尖模型ChatGPT-4的差距也缩小至2分以内。这一成绩充分展示了智谱科技在大模型领域的深厚积累和持续创新能力。

值得注意的是,GLM-4-Plus的优异表现并非偶然。作为智谱全自研GLM大模型的最新版本,该模型在语言理解、逻辑推理、指令遵循以及长文本输出等方面均实现了显著突破。这些能力的提升,使得GLM-4-Plus在代码计算、数据分析、图像/视频特征识别等多个领域都展现出了强大的性能,同时大幅降低了成本。

GLM-4-Plus在司南OpenCompass公布的大语言模型对战榜单Compass Arena中也表现出色。据榜单显示,GLM-4-Plus的竞技场评级分数位居榜首,超越了包括GPT-4在内的众多国际知名模型。这一成绩进一步证明了GLM-4-Plus在真实用户场景中的卓越表现,也体现了智谱科技在大模型技术领域的领先地位。

据悉,Compass Arena榜单致力于构建一个公正、开放、透明的竞争环境,通过用户真实反馈和大模型间的对战数据,采用Elo评分系统对大模型进行排名。GLM-4-Plus能够在如此激烈的竞争中脱颖而出,无疑是对其技术实力和用户体验的双重肯定。

目前,GLM-4-Plus已经正式上线智谱开放平台bigmodel.cn,供广大开发者和用户试用。随着技术的不断进步和应用的持续拓展,相信GLM-4-Plus将在未来为更多领域带来创新和变革。

阿里巴巴“通义”App升级更名“千问”,AI战略转向消费级市场新布局
根据官方消息,“千问”定位为阿里旗下最重要的大模型应用入口,其核心能力基于阿里自研的大模型体系Qwen(千问)。 分析人士指出,阿里此前在To B市场和模型研发侧拥有技术基础,但在消费端应用分发层面还未形成…

2025-11-15

Dexmal原力灵机获近10亿融资 阿里蔚来资本助力具身智能研发落地
IT之家 11 月 14 日消息,具身智能公司 Dexmal 原力灵机今日宣布完成数亿元 A+ 轮融资,阿里巴巴为独家投资方。IT之家注意到,该公司 A 轮融资由蔚来资本领投,洪泰基金、联想创投、锡创投和正…

2025-11-14

百度世界大会发布文心大模型5.0 参数量2.4万亿能力达全球领先
文心5.0基础能力全面升级,在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出,拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式,文心5.0的技术路…

2025-11-13