7月28日消息,世界人工智能大会(WAIC)期间,上海人工智能实验室、信通院、蚂蚁、IIFAA联盟联合发布《终端智能体安全2025》白皮书(下称“白皮书”),系统梳理了智能体(AI Agent)风险分类、如何发现风险、如何防御风险,并覆盖了单智能体设备、多智能体协同,以及AI终端生态的全面挑战,成为终端智能体安全提供风险评估指南。
白皮书指出,随着模型越来越懂用户、操作越来越自动,终端智能体的风险边界也在拓展:不再只是“数据泄露”这么简单,而是向模型行为、身份伪造、环境感知误导,甚至算法伦理等深层问题蔓延。
《终端智能体安全2025》白皮书首次提出终端智能体安全体系
白皮书中首次提出终端智能体安全体系,在技术生态体系的支撑下,单智能体安全技术包括安全护栏、数据去毒、基座对齐和柔性管理,多智能体可信互连技术则包括可信数据流转、可信服务流转、可信身份认证和可信记忆共享,AI 终端安全技术可信隐私沙箱、跨设备可信连接等,共同支撑AI/AR眼镜、智能手机助手、智能座驾等行业应用。
白皮书中显示,智能体可信互连的核心,在于构建“可信”的智能体协作环境,体现在可信连接、可信鉴权、可信意图、可信授权等四个维度。