网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

谷歌DeepMind发布AGI安全框架:前瞻布局技术保障,助力负责任研发与部署

2025-12-11来源:快讯编辑:瑞雪

谷歌DeepMind近日发布了一份重要报告,题为《An Approach to Technical AGI Safety and Security》。该报告深入探讨了通用人工智能(AGI)可能带来的重大风险,并提出了全面的技术安全框架,旨在为AGI的负责任研发和部署提供核心指导。

报告指出,AGI具有变革性的潜力,但同时也伴随着严重的风险。这些风险被划分为四大领域:误用风险,即用户故意利用AGI造成伤害;错位风险,指AGI在明知违背开发者意图的情况下仍造成伤害;失误风险,即AGI无意识中导致的伤害;以及结构性风险,涉及多主体互动引发的非主观伤害。报告特别强调了误用和错位风险的技术应对策略。

在误用风险的应对上,报告提出了一系列策略,旨在切断恶意主体获取危险能力的途径。这包括通过危险能力评估预判风险阈值,以及利用模型级防护、系统级管控和安全防护等多层防御措施。模型级防护涵盖安全训练和能力抑制,系统级管控则包括行为监测和访问限制,而安全防护则涉及模型权重加密和环境加固。报告还强调了通过红队测试验证防护有效性,并加强社会防御能力以降低潜在伤害。

针对错位风险,报告构建了双重防御体系。第一防线是训练对齐模型,通过增强监督、引导模型行为和稳健训练等手段,确保模型目标与人类意图一致。第二防线是系统级管控,借鉴网络安全思路,通过访问控制、沙箱隔离和层级监控等措施,即便模型错位也能阻断严重伤害。同时,报告还提出了不确定性量化、可解释性研究和更安全的设计模式等支撑措施。

报告基于五大关键假设展开,包括当前AI研发范式的持续性、AGI能力无人类天花板、研发时间线的不确定性、AI能力加速增长的可能性以及AI能力提升的平滑演进。这些假设为报告的技术方案提供了理论基础。

报告还强调了技术方案与治理机制互补的重要性,呼吁形成行业共识与标准,以避免因竞争压力导致安全底线下降。同时,报告也指出了当前研究的局限性,包括未充分覆盖结构性风险和聚焦短期可落地技术等,并呼吁未来持续推进基础研究与跨领域协作。

EPFL与OpenAI创新研究:不打扰动物,如何验证AI翻译真实性?
ShufflEval的工作原理可以这样理解:假设你有一段鲸鱼母子之间的对话录音,AI翻译器将其翻译成了几个英语句子,描述了它们关于潜水时间的讨论。即使在这种极端情况下,ShufflEval方法仍然能够有效区…

2025-12-11

十年磨一剑:网易数智以AI为翼,在企服赛道开启新长跑征程
用阮良的话说,“AI驱动下,需要将价值链条上的东西组合成解决方案,让AI在企业内部更好落地。”网易数智的产品,多是这样,从自家业务“长出来”的实战派——对外输出给行业前,已经历千锤百炼。 阮良提到,丁磊对…

2025-12-11

抖音旗下全资子公司于呼和浩特成立火山引擎科技公司 注册资本达百万
天眼查工商信息显示,近日,呼和浩特火山引擎科技有限公司成立,法定代表人为王宁,注册资本100万人民币,经营范围含互联网数据服务、信息系统集成服务、数据处理服务、数据处理和存储支持服务、信息技术咨询服务、计算机…

2025-12-11

移动云携手中国石油,以3000亿参数大模型赋能能源化工新未来
目前,3000亿参数昆仑大模型已发布43个创新应用,涵盖了智能客服、装备工程设计、财务共享等众多场景:对内提供专业应用和员工助手,在油气生产、炼化生产、运营管理、经营决策、综合办公等方面开展AI场景建设;对…

2025-12-11

红米Turbo5 Pro来袭!9000mAh大电池+100W快充,性价比新标杆
据悉,小米17Ultra将会在12月底发布,首发全新2亿像素1/1.12英寸大底的索尼LYTIA-901,仍然是后置4摄,实力有望超过一众对手,成为春节期间最值得选择的超大杯影像旗舰。 红米Turbo系列…

2025-12-11

一加Ace 6T发布前瞻:性能续航双突破,配置价格全揭秘
首先从产品线来看,一加Ace6T并非简单迭代,它选择在性能、续航和游戏体验上进行重点突破,特别是其8300mAh的电池容量,直接突破了当前主流旗舰的电池上限。然后一加Ace 6T配备了一块6.83英寸的…

2025-12-11

索尼发布Alpha 7 V全画幅无反相机 17999元起售 性能全面升级
该相机还搭载索尼最新影像处理器 BIONZ XR2,集成 AI处理单元,具备低功耗长续航,在自动对焦识别精度、实时追踪、连拍速度与色彩还原方面均有提升。 Alpha 7 V 支持最高每秒 30 张的高速连…

2025-12-11