网界科技
网络资讯 产业经济 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 热点资讯

谁说国产AI不行了?清华大模型报告最新评测出炉!

2024-04-24来源:互联网编辑:汪淼

由清华大学基础模型研究中心联合中关村实验室研制的SuperBench大模型综合能力评测框架,正式对外发布2024年3月版《SuperBench大模型综合能力评测报告》。评测共包含了14个海内外具有代表性的模型,结果显示:文心一言4.0中文理解、数学等多能力全球第一。

图片

评测显示,文心一言4.0表现优异,在中文推理、中文语言等评测上遥遥领先,和其他模型拉开明显差距。中文理解上,文心一言4.0领先优势明显,领先第二名GLM-4 0.41分,GPT-4系列模型表现较差,排在中下游,并且和第一名文心一言4.0分差超过1分。

在语义理解中的数学能力上,文心一言4.0与Claude-3并列全球第一; GPT-4系列模型位列第四五,其他模型得分在55分附近较为集中,明显落后第一梯队;而在语义理解中的阅读理解能力上,文心一言4.0超过GPT-4 Turbo、Claude-3以及GLM-4拿下榜首。

在企业选择大模型最看重的安全性评测上,国内模型文心一言4.0表现亮眼,力压国际一流模型GPT-4系列模型和Claude-3拿下最高分(89.1分),Claude-3仅列第四。

特斯拉全球裁员风波后 马斯克致歉低遣散费并承诺纠正
【网界】4月18日消息,特斯拉CEO埃隆·马斯克在本周三向公司内部员工发送了一封邮件,对部分被解雇员工收到的遣散费过低表示歉意。马斯克在邮件中承诺将立即纠正这一错误,确保被解雇的员工能够得到合理的补偿。据网界了解,此前特斯拉已经宣布将在全球范围内进行大规模

2024-04-18

AgentBuilder、AppBuilder、ModelBuilder分不清?这份宝典请收好!
距离大湾区最潮流最前沿的AI大会还有7天!4月16日,深圳国际会展中心(宝安)2024百度Create AI开发者大会将带来开发者的三大神器:智能体开发工具AgentBuilder无代码编程工具AppBuilder模型定制工具ModelBuilderBuilder太多被绕晕?Agent App看花眼?别担心,我们准备了一份

2024-04-09

小米汽车回应退订潮 订单仍爆满 提车周期有所调整
【网界】4月3日消息,特斯拉公布了其2024年第一季度的汽车交付数据,该数字显示了这家电动车巨头的市场表现出现了一定程度的下滑。据特斯拉报告,本季度公司共交付了386,810辆汽车,较去年同期下降了8.5%,为自2020年新冠疫情导致生产中断以来的首次同比下降。同时,特

2024-04-03

特斯拉领跑5G时代 计划全面升级车载与机器人网络
【网界】3月28日消息,据特斯拉IT制造解决方案工程首席工程师Pat Ruelke在领英上的动态透露,特斯拉目前正忙于开发自家的“私有5G”网络基础设施。这一创新举措旨在为特斯拉的电动汽车以及Optimus人形机器人提供更为稳定、高速的网络连接。特斯拉一直以来都是汽车网络连

2024-03-28

集多年创新之大成,卡萨帝致境软风空调硬核上市掀起智慧软风潮流
导语:卡萨帝致境空调新品上市,双塔双系统实现自然舒适体感“可变软风”新体验,还同时集成了除湿、除醛、净化等多项健康功能,一机顶七机,一步到位营造舒适品质生活现代生活的压力和快节奏,让人们渴望在家中也能享受到更加舒适、更加智能化的生活环境。不同于早前消

2024-03-27