今天分享的是:2025前沿人工智能风险管理框架报告
报告共计:53页
《前沿人工智能风险管理框架(1.0版)》由上海人工智能实验室联合安远AI发布,聚焦通用型人工智能(GPAI)的风险管理,旨在为研发者提供全面指导,以识别、评估、缓解和治理相关风险,保障公共与国家安全。
当前AI技术快速发展,既带来科学发现、医疗提升等机遇,也伴随诸多风险,建立风险管理机制成当务之急。框架借鉴安全攸关行业经验,涵盖六大核心流程。风险识别明确滥用、失控、意外及系统性四类风险,涉及网络攻击、生物威胁等多个领域。风险阈值设定“黄线”(预警)与“红线”(不可接受),针对网络攻击等关键领域设定具体阈值。
风险分析需贯穿AI全生命周期,涵盖研发前、部署前及部署后,采用威胁建模等多种技术。风险评价建立绿、黄、红三级体系,对应不同处理方式与部署决策。风险缓解构建全生命周期纵深防御策略,包括安全训练、部署缓解及模型安保措施。风险治理提出四维体系,结合模型风险等级实施分级管理。
框架强调AI安全是全球公共产品,倡导各方采用兼容框架,通过协同共治应对风险与机遇,且将持续迭代更新,以适应技术发展与风险变化。
以下为报告节选内容