在世界互联网大会乌镇峰会期间,360数字安全集团正式推出《大模型安全白皮书》,为人工智能行业安全发展提供系统性解决方案。该白皮书聚焦大模型运行中的复杂安全挑战,首次梳理出五大核心风险,并提出“动态防御+原生安全”的双轨防护理念,通过实战验证的技术框架为AI应用构建全链路安全屏障。
随着大模型技术深度融入政务、金融、医疗等关键领域,其引发的安全威胁呈现指数级增长。白皮书以2025年全球多起AI安全事件为样本,归纳出五大风险维度:基础设施层面存在设备控制漏洞、供应链攻击及算力滥用问题;内容安全领域面临价值观偏离、虚假信息传播及模型幻觉等挑战;数据与知识库环节凸显隐私泄露、越权访问及知识产权纠纷;智能体自主性增强导致插件调用、数据流转等边界模糊;用户端则存在API滥用、恶意脚本执行等风险。这些风险相互叠加,形成传统安全方案难以破解的威胁矩阵。
针对上述挑战,360提出“外挂式安全+平台原生安全”的协同防御体系。前者作为AI系统的“动态护盾”,通过“以模治模”技术对算力主机、软件生态及输入输出内容进行实时监测,可在毫秒级识别并阻断异常算力消耗、恶意内容注入等威胁。其优势在于适配性强、部署成本低,能快速接入不同企业环境。后者则作为“基因级防护”,将安全能力嵌入数据、知识库、智能体等核心组件,通过企业级知识库、智能体运营平台及客户端产品,从底层架构解决数据泄露、行为失控等内生性问题。
该防护体系通过七大核心产品实现纵深防御。在外部防护层面,大模型卫士算力主机安全系统、检测系统、防护系统及幻觉检测系统构成四道防线,重点应对算力劫持、供应链投毒及内容违规等风险。在内部防护层面,企业级知识库保障数据全生命周期安全,智能体运营平台实现行为全程可追溯,客户端产品筑牢终端入口防线。这种“外防内固”的组合策略,使安全检测能力具备主动发现与动态演进特性,有效应对多变的安全威胁。
目前,360已将该安全框架应用于政务、金融、制造等多个行业,将理论方案转化为可落地的实战能力。通过与产学研机构合作,集团正推动AI安全标准建设与技术共享,致力于构建安全、可信的AI生态体系。
免责声明:本文内容仅供参考,不构成任何投资建议。


