人工智能安全新基准：两项国际标准问世-网界

【网界】4月17日消息，近日，全球人工智能领域迎来重要里程碑。世界数字技术院(WDTA)正式发布了《生成式人工智能应用安全测试标准》与《大语言模型安全测试方法》两项国际标准，这标志着国际组织首次针对大模型安全领域推出具体的国际标准，为全球人工智能的安全评估和测试设定了新的标杆。

据网界深入了解，这两项标准汇聚了全球顶尖的科技力量。OpenAI、蚂蚁集团、科大讯飞、谷歌、微软、英伟达、百度、腾讯等科技巨头的专家学者联手，共同为这两项标准贡献了智慧。其中，《生成式人工智能应用安全测试标准》以WDTA为主导，为使用大语言模型(LLM)的应用程序的安全性测试和验证提供了全面框架。该标准详细规定了AI应用程序架构各层的测试和验证内容，确保其从基础模型选择到运行时安全的每一个环节都能经过严格的安全性和合规性评估。

而由蚂蚁集团主导的《大语言模型安全测试方法》则为大模型的安全评估提供了实操性强的解决方案。它不仅提出了大语言模型的安全风险及攻击的分类方法，还首次明确了四种攻击强度的分类标准，为开发人员和组织提供了有力的工具，以识别和缓解潜在的安全漏洞，从而显著提升大语言模型构建的人工智能系统的安全性和可靠性。

WDTA人工智能安全可信负责任工作组组长黄连金在会议上强调，随着大语言模型在社会各领域的广泛应用，制定全面标准以应对安全挑战显得尤为重要。这两项标准的发布不仅填补了相关领域的空白，更为业界提供了明确的测试指南，对于提升AI系统的整体安全性、推动AI技术的健康发展以及增强公众对AI技术的信任具有深远意义。

在全球范围内，各国政府对大模型安全的监管和研究也在不断加强。中国政府就相继发布了多项相关政策和倡议，积极推动生成式人工智能的安全可信发展，同时也在全球人工智能治理领域寻求合作与共识，共同应对AI技术带来的挑战与机遇。

百度世界大会发布文心大模型5.0 多项能力达全球领先水平

文心5.0基础能力全面升级，在多模态理解、指令遵循、创意写作、事实性、智能体规划与工具应用等方面表现突出，拥有强大的理解、逻辑、记忆和说服力。不同于业界多数的多模态模型采用后期融合的方式，文心5.0的技术路…

2025-11-15

富士胶片2025上半财年业绩全线飘红，影像事业领涨上调全年预期

2025-11-14

《全球城市产业创新指数报告2025》发布深圳跻身全球创新“第一梯队”

2025-11-14

2025陆海物博会重庆启幕聚焦物流融合助力西部产业新发展

2025-11-14

李彦宏2025百度世界大会发声：AI跨越临界点，百度成果引领产业新变革

李彦宏在大会上表示，“我们用AI重构搜索结果页，不是简单地在搜索结果中插入AI摘要，而是把搜索从一个以文字内容和链接为主的互联网应用，转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来，AI数字…

2025-11-14

百度智能云发布新芯与超节点，持续布局AI算力助力企业AI能力内化

百度智能云今年已经点亮了昆仑芯三万卡集群，可同时支撑多个千亿参数大模型训练，打造了国产AI算力集群的一大里程碑。未来，百度智能云将持续优化软硬件协同效果，通过百舸AI计算平台，将昆仑芯单一集群的规模从三万卡进…

2025-11-13

最低4.99万起售，京东首推“国民好车”意在构建汽车生态闭环？

2025-11-13

李彦宏2025百度世界大会发声：AI迈向效果涌现产业构建倒金字塔生态

11月13日举办的2025百度世界大会上，百度创始人李彦宏围绕 AI 技术发展阶段与产业生态发表观点，指出 AI正从技术演示走向实际应用，产业结构也在发生根本性转变。在 AI 产业结构层面，李彦宏表示该领…

2025-11-13

AI从“智能涌现”迈向“效果涌现”，李彦宏：百度引领AI产业结构新变革

2025-11-13