网界科技
网络资讯 产业经济 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 热点资讯

16家央企联手发布,通用大模型评测有了新标准!

2024-10-12来源:ITBEAR编辑:瑞雪

在2024中国移动全球合作伙伴大会上,中国移动携手电子标准院及16家重点央企,共同推进大模型评测体系建设,并发布了《通用大模型评测标准》。这一标准被视为评测体系建设的重要里程碑,旨在为产业界筛选优质大模型提供有力参考。

据透露,该标准的建设工作将围绕通用领域及四个重点行业领域展开,涵盖评测标准制定、评测基地建设、评测试点应用等多个方面。通用大模型评测标准基于“2-4-6”框架构建,具体而言,“2”代表两类评测视角,即以重点行业实际需求为导向,与国家标准对模型能力的要求相协调,将评测任务分为理解和生成两大视角;“4”表示四类评测要素,从评测全生命周期中提取评测工具、评测数据、评测方式和评测指标等关键要素,确保评测工作的可实施性;“6”则指六大评测维度,综合考虑大模型应用过程中的核心能力,包括功能性、准确性、可靠性、安全性、交互性和应用性。

本田Passport 2026款亮相,越野SUV市场再掀波澜?
10月12日消息,汽车媒体carscoops今天(10月12日)发布博文,报道称2026款本田Passport现身RebelleRally女子越野拉力赛,展示了全新的设计和强大的越野能力。本田员工Ad…

2024-10-12

阿斯顿·马丁新动向!DB12灵感源自《金手指》?
10月12日消息,汽车媒体Autocar昨日(10月11日)发布博文,报道称阿斯顿・马丁为庆祝詹姆斯・邦德电影上映60周年,将于10月14日展示推出一款灵感来自《007:金手指》电影的DB12汽车。阿…

2024-10-12

紫金山-阿特拉斯彗星今晚最接近!肉眼观测窗口期仅10-20分钟
日落后约一小时,它将变得肉眼可见,并可能显示出一条长而美丽的尾巴,但肉眼观测时间很短,只有 10 到 20分钟的窗口期。在近日点,彗星的估计亮度约为 2 星等,因此 C / 2023 A3 只需增加 1 …

2024-10-12

极氪刷新纪录!上海F1赛道最速量产车是它?
快科技10月12日消息,极氪汽车官宣,极氪001FR以2分16秒39的成绩刷新了上海国际赛车场F1赛道的量产车圈速纪录,成为该赛道上最快的量产车型。值得一提的是,极氪001FR也成为株洲国际赛车场、珠海国际赛…

2024-10-12