智能体或带来灾难性风险,图灵奖得主Bengio指明新路径Scientist AI:世界模型+推理机

智能体或带来灾难性风险,图灵奖得主Bengio指明新路径Scientist AI:世界模型+推理机

编辑丨coisini

领先的人工智能公司越来越专注于构建通用 AI 智能体,旨在让系统能够自主规划、行动并追求目标,几乎涵盖人类能够执行的所有任务。虽然这些系统可能非常有用,但不受约束的 AI 智能体对人类安全构成了重大风险。

一些学者认为我们迫切需要一种更安全且仍具实用性的替代方案,以取代当前以智能体为导向的发展路径。

最近,图灵奖得主 Yoshua Bengio 以第一作者身份发表了一篇论文 ——《Superintelligent Agents Pose Catastrophic Risks: Can Scientist AI Offer a Safer Path?》。该论文提出了一种在设计上可信且安全的非智能体 AI 系统 ——Scientist AI。

论文地址:https://arxiv.org/abs/2502.15657

Scientist AI 旨在通过观察来解释世界,而不是在其中采取行动以模仿或取悦人类。它包含一个生成理论以解释数据的世界模型,以及一个问答推理机。这两个组件在操作时都明确考虑了不确定性,以减少过度自信预测的风险。

Scientist AI 可用于协助人类研究人员加速科学进步。特别地,Scientist AI 可以作为防范 AI 智能体的护栏,最终使我们能够在享受人工智能创新带来的好处的同时,避免当前发展路径所带来的风险。

Scientist AI 简介

受柏拉图式理想化科学家形象的启发,研究团队提出了 Scientist AI 的设计与构建方案。Scientist AI 基于 SOTA 概率深度学习技术,并借鉴科学过程的方法论,即首先理解或建模世界,然后基于这些知识进行概率推断。

图灵奖得主 Yoshua Bengio

Scientist AI 展示了如何将概率预测转化为实验设计,从而消除科学发现中对强化学习智能体的需求。与旨在追求目标的自主 AI 不同,Scientist AI 的训练目标是提供对事件的解释及其估计概率。研究团队还提出了确保 Scientist AI 保持非自主性的策略。

Scientist AI 没有内置的情境意识,也没有能够驱动行动或长期计划的持久目标。它包含一个世界模型和一个概率推理机。世界模型根据从世界中观察到的一组数据生成解释性理论,推理机则基于世界模型进行无状态输入到输出的概率估计。

更准确地说,世界模型根据观察数据输出解释性理论的后验分布,推理机随后将后验分布与高效的概率推理机制结合起来,估计任何问题 X 的答案 Y 的概率。形式上,推理机接收一对输入(X, Y),也称为查询,输出在给定与问题 X 相关的条件下 Y 的概率。

Scientist AI 具有以下特性:

1. 世界模型生成的理论和推理机处理的查询都使用逻辑语句表达,这些语句可以用自然语言或形式语言表示。世界模型采样的语句形成因果模型,即以因果关系的形式提供解释。

2. 根据世界模型,任何查询都有一个唯一的正确概率,这是通过全局优化 AI 的贝叶斯训练目标得到的结果。推理机的输出近似于这个唯一的正确概率。

3. Scientist AI 可以生成涉及潜在或未观察变量的解释,从而对其进行概率预测。

最后,研究团队还预见了 Scientist AI 的三大主要应用场景:

1. 作为一种工具,帮助人类科学家显著加速科学进步,包括医疗等高回报领域;

2. 作为一种防护机制,通过双重检查自主 AI 提议的行动并确保其安全部署,从而防范自主 AI 的风险;

3. 作为一种 AI 研究工具,帮助更安全地构建未来更智能(甚至超级智能)的 AI。

感兴趣的读者可以阅读论文原文,了解更多研究内容。

特别声明:[智能体或带来灾难性风险,图灵奖得主Bengio指明新路径Scientist AI:世界模型+推理机] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

激活珠宝服务的 “感官密码” 与 “抗干扰基因”(珠宝暗访)(激活珠宝服务的方法)

市场调研显示,调动三种以上感官的服务,能让顾客的 “价值感知度” 提升 2-3 倍,但 75% 的珠宝门店仅停留在 “看与说” 的层面。当珠宝品牌能让顾客在触摸、聆听、感受中感知价值,在突发状况中体会可靠,在…

激活珠宝服务的 “感官密码” 与 “抗干扰基因”(珠宝暗访)(激活珠宝服务的方法)

超300万用户力荐!2025外企面试好用榜8大AI英语口语app揭秘(300万玩家)

-专业性强:企业疯抢的真相在于它能让员工「用英语赚钱」,拥有行业垂直场景库,覆盖400+主流行业的专业词汇和表达;全球商务模拟器能模拟高压商务场景;职业晋升语言包根据职业阶段提供针对性提升方案。- 性价…

超300万用户力荐!2025外企面试好用榜8大AI英语口语app揭秘(300万玩家)

40集生活大剧来袭!佟大为领衔主演,女主女配都很惊艳,爱了(生活剧电视剧大全集)

不过话说回来,张小斐的好运家我还是比较期待的,看了剧里面一共有三对CP,应该会有很多的故事,预告一开始就是女主角🎭️跟男主说我们离婚吧! 隋俊波是剧中的女二号,参演了很多电视剧,比如说天涯赤子心,喋血孤岛,夜幕…

40集生活大剧来袭!佟大为领衔主演,女主女配都很惊艳,爱了(生活剧电视剧大全集)

杀疯米兰!『白鹿』暗黑精灵、『鞠婧祎』甜酷星光、张婧仪松弛优雅,中国女星把东方美穿成艺术

当米兰的秋日微风掠过大教堂的哥特式尖顶,带着文艺复兴的艺术余韵撞上东方审美,中国女星们用三场截然不同的造型,把米兰『时装周』变成了“东方美展示台”—— 『白鹿』的暗黑丝绒裙像从暗夜走来的精灵,『鞠婧祎』的粉色亮片裙缀满…

杀疯米兰!『白鹿』暗黑精灵、『鞠婧祎』甜酷星光、张婧仪松弛优雅,中国女星把东方美穿成艺术

表面演技好,实则毫无观感,那些“戏混子”们,是该好好反思了!(演技流于表面)

更令人失望的是,面对下属牺牲的场景时,她的反应仅仅是握拳、低头、抿唇,眼神依旧飘忽,这种表演不仅没有传达出角色应有的悲伤,反而给人一种在&34演悲伤&34的感觉。 这些争议作品的存在,成为了让观众失望的关键…

表面演技好,实则毫无观感,那些“戏混子”们,是该好好反思了!(演技流于表面)