OpenAI公开AI模型安全评估，透明度再升级！-网界

OpenAI近期宣布了一项旨在提升透明度的重大举措：将更频繁地公开其内部人工智能模型的安全评估详情。这一决定伴随着“安全评估中心”网页的正式上线，该网页于本周三正式对公众开放。

该安全评估中心将作为一个持续更新的平台，展示OpenAI模型在多个关键安全领域的表现，包括有害内容的生成、模型越狱风险以及幻觉现象等。OpenAI在一份官方博客文章中阐述，此举意在随着人工智能评估科学的进步，分享其在提升模型可扩展性和安全评估方法方面的最新进展。

OpenAI承诺，未来将在每次重大模型更新后，及时更新安全评估中心的内容，确保用户能够实时了解OpenAI系统的安全性能变化。公司强调，此举不仅是为了提升用户对自身系统的信任度，更是为了推动整个行业在透明度方面的共同进步。OpenAI还透露，未来可能会在安全评估中心增加更多评估项目，以全面覆盖模型的各种潜在风险。

此前，OpenAI曾因其部分旗舰模型的安全测试流程过快以及未发布其他模型的技术报告而受到伦理学家的批评。公司首席执行官山姆·奥尔特曼也一度因被指在模型安全审查问题上误导公司高管而引发争议。这些事件无疑对OpenAI的声誉造成了一定影响。

值得注意的是，就在上个月末，OpenAI不得不撤回对ChatGPT默认模型GPT-4o的一次更新。原因是用户反馈称，更新后的模型回应方式过于“谄媚”，甚至对一些有问题的、危险的决策和想法表示赞同。这一事件引发了广泛关注和讨论，也促使OpenAI采取了一系列修复和改进措施。

为了预防类似事件的再次发生，OpenAI决定为部分模型引入一个可选的“alpha阶段”。在这一阶段，部分ChatGPT用户将有机会在模型正式发布前进行测试并提供反馈。这一举措旨在通过用户的实际使用经验，及时发现并修复模型可能存在的问题，从而提升模型的稳定性和安全性。

百度AI成果井喷：从智能涌现到效果涌现，产业结构迈向健康倒金字塔

李彦宏在大会上表示，“我们用AI重构搜索结果页，不是简单地在搜索结果中插入AI摘要，而是把搜索从一个以文字内容和链接为主的互联网应用，转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来，AI数字…

2025-11-15

中芯国际全年销售收入或超90亿美元，2025年业绩增长态势强劲

2025-11-15

百度世界大会：李彦宏携AI“军火库”全面开放，开启应用新篇章

现场演示连线数字人罗永浩环节上，出现了“翻车”这一尴尬现象时，李彦宏的情绪也并没有太多波动，而是感觉“有点遗憾”，并表示“其实我们在之前演练的过程当中觉得这个效果还是非常令人惊艳的”。还有大模型层面上的文…

2025-11-15

上海国际贸易中心建设加速：外贸新动能集聚，制度型开放亮点频现

2025-11-14

铠侠2025财年第二财季营收环比大增，未来业绩与新品规划前景向好

2025-11-14

百度世界大会发布AI新成果：文心5.0等亮相，李彦宏畅谈AI内化生产力变革

2025-11-13

百度“文心杯”第三届落幕：8支团队获千万投资，李彦宏力推AI应用普及

李彦宏表示，我们看到越来越多的创业者在各种场景发现AI的新能力、新效果，希望更多的人能够加入这个发现之旅，也正基于此，百度连续三年举办“文心杯”创业大赛。第三届“文心杯”创业大赛8支优胜团队共获得数千万元…

2025-11-13

涅槃重生！瑞幸积极推进重返美国上市，全球门店近3万营收将破500亿

2025-11-13

2025百度世界大会聚焦AI发展：成果发布，内化能力引领新质生产力变革

本届大会以“效果涌现”为主题，聚焦国产芯片最新进展、大模型升级、AI应用创新与全球出海，呈现了百度作为中国人工智能领军企业，如何将AI技术内化为产业发展的原生动能，为加快形成新质生产力提供可落地的“百度方案”…

2025-11-13