当下AI 技术迭代的速度可谓越来越快,就拿谷歌来说,其Genie 3能实时生成物理规则自洽的虚拟世界,水龙头流水、镜面倒影皆如现实;DeepThink斩获数学奥赛金牌🥇,复杂推理能力直逼人类专家......
但背后,“参差型智能"”的悖论也愈发凸显 ——AI 能精准模拟流体力学,却会在国际象棋中违规落子;能解高难度数学题,却可能在基础逻辑题上翻车。这种能力的不均衡,恰是通用人工智能(AGI)进化的核心谜题。
前不久,谷歌 DeepMind 首席执行官德米斯・哈萨比斯做客播客《Release Notes》,以一场深度对话解开了这一谜题。
作为 AlphaGo、AlphaFold 的缔造者,哈萨比斯不仅解密了Genie 3的世界模型突破,更系统阐述了从 "思考型模型" 到 "全能模型" 的 AGI 进化路径。
哈萨比斯在访谈中跳出单一技术突破的视角,为 AI 从专项能力走向通用智能指明了方向 —— 从虚拟世界生成到动态推理修正,真正的智能革命正悄然发生。
01 思考型模型:AGI 演进的必由之路哈萨比斯在访谈中表示:“过去两个月,我们推出了包括Deep Think、Genie 3在内的近50个项目,进展快到连内部团队都快跟不上节奏了。”
这种技术爆发并非偶然,而是DeepMind多年积累的集中释放。在他看来,当前AI的核心突破,正在于从早期的专项智能体向"思考型模型"跨越。
回溯DeepMind的发展轨迹,这条逻辑一脉相承。从征服围棋的AlphaGo到自学棋类的AlphaZero,早期游戏AI已展现出"规划能力"的雏形——在明确目标下,通过推演多种可能性找到最优解。
哈萨比斯强调,游戏AI给我们的最大启示是,必须在模型之上叠加“思考”或“规划”能力,这是通往AGI的必由之路。
如今,这种能力已从单一游戏领域扩展至多模态场景,形成了能处理语言、整合信息、修正推理的"思考型系统"。
DeepThink正是这一理念的实践。作为向Gemini订阅用户开放的模型,它的核心价值不仅在于解数学、写代码,更在于"深度思考"——能并行规划多条思路、持续修正推理,而非简单输出第一反应。"
思考型系统的本质,是模拟人类解复杂题的思维:不断质疑、优化、调整路径,直到接近真相。"哈萨比斯解释道。
这种能力的背后,是DeepMind对强化学习的长期坚守。早在2010年,团队就将强化学习与深度学习并列为核心方向,Atari项目的成功验证了其潜力——系统能直接从屏幕像素中学会玩数十种游戏,表现甚至超越人类。
"强化学习的价值在于通用性,"哈萨比斯说,"它让AI能从经验中学习、在动态环境中优化策略,这和人类智能的形成机制高度相似。"
02 Genie 3:世界模型的突破性进展如果说思考型模型是AGI的"思维引擎",那么世界模型就是其"认知基石"。访谈中,DeepMind最新的世界模型Genie 3成了焦点——它生成的虚拟世界因物理一致性令人震撼:打开水龙头会流水,镜子能映出倒影,转身离开再回头,世界依然原样。
哈萨比斯将世界模型定义为"AGI 理解并作用于物理世界的前提"。"我们要建的世界模型,不仅得懂物理结构、材料特性、液体流动,还得理解生物和人类行为。毕竟AGI得先懂世界,才能在里面好好干活。"
这种理解直接关系到机器人️技术突破——只有精准把握物理规律,机器人️才能在现实中安全移动、操作物体;也关系到通用助理的实用性,比如Project Astra(Gemini Live)需要理解用户场景的上下文逻辑。
Genie 3的创新在于"生成式世界构建"。不同于传统虚拟环境依赖人工建模,它能凭简单提示自主生成完整、一致的虚拟世界。
哈萨比斯透露,这一突破源于多条研究路径的融合:我们一直把游戏当挑战场,既推算法进步,也合成训练数据。让系统在逼真虚拟环境里学物理规律,最终实现从“理解”到“创造”的跨越。
这种能力的应用价值已开始显现。内部测试中,DeepMind把游戏智能体SIMA放进Genie 3生成的虚拟世界,SIMA按目标(比如找钥匙)发指令,Genie 3就实时生成对应的世界变化。
"这等于造出了无限训练数据,"哈萨比斯说,"对机器人️训练或AGI通用能力培养太重要了——我们能在虚拟世界模拟各种极端场景,让AI在安全环境里攒经验。"
除了技术价值,Genie 3还带来了产业新想象。哈萨比斯认为,它可能催生"介于电影与游戏之间的新娱乐形式"——用户不仅能体验虚拟世界,还能参与创造、改规则。
更深远的是,这种虚拟生成能力让人忍不住思考:"当AI能造出这么逼真的世界,现实世界的本质又是什么?这正是AI服务科学的深层意义。"
03 参差型智能:AGI 进化的核心悖论尽管AI已能造虚拟宇宙,却仍会在国际象棋中违规;尽管Deep Think在AIME数学测试中拿了99.2%的成绩,却可能在基础逻辑题上出错——这种"参差型智能"的悖论,成了哈萨比斯分析当前AI阶段的关键切入点。
"这种能力不均衡,说明我们离完全AGI还差关键一步。"哈萨比斯直言,理想的通用智能得有"一致性"——普通人不该轻易发现系统的低级缺陷。
当前AI的问题在于,推理、规划、记忆等核心认知能力仍有短板,导致某些维度强得惊人,另一些却弱得明显。
"我们或许解决了'数strawberry里的R'这类细节问题,但还有小学生能轻松搞定、模型却翻车的任务,这背后是基础认知机制的缺失。"
为解决这一问题,DeepMind正从两方面突破。一方面是重设评测基准。哈萨比斯指出,现有评测如AIME已近饱和,"几乎没提升空间,说明它失去了区分力"。新基准得更全面考察物理直觉、世界理解、安全性等。
另一方面是推出"游戏竞技场"——让模型在各类游戏中对战测试。"游戏是干净的测试场,有客观分数,能随系统能力提升自动加难度,甚至能让AI自己编新游戏对战,避免数据泄露或过拟合。"
这种以游戏为测试场的思路,延续了DeepMind的传统。从AlphaGo到Genie 3,游戏始终是验证AI能力的理想环境——既有明确规则,又需灵活策略;既考短期反应,又验长期规划。
哈萨比斯强调,游戏竞技场的价值,在于建一个动态进化的评测体系,让AI在同类竞争中暴露弱点、持续进步,这和自然界的生存竞争逻辑很像。
04 工具与系统:AI 能力扩展的新维度当模型从"静态权重"进化成能调用工具的"动态系统",AI的能力边界正被重新定义。访谈中,哈萨比斯深入分析了工具使用对AI发展的核心价值,以及"主模型"与"外部工具"的边界原则。
"工具使用是AI系统最重要的能力之一。"哈萨比斯明确表示,思考型系统的核心竞争力,在于推理时能主动调工具——搜索引擎、数学程序、编程环境等,再根据工具反馈调整规划。
这种能力让AI突破自身参数限制,处理超出训练范围的问题。比如Deep Think解复杂数学题时,会自动调计算器验中间步骤;处理实时信息时,会联网搜最新数据。
但关键问题来了:哪些能力该内置"主脑",哪些该当外部工具?
哈萨比斯认为这是"经验性问题":"对人类来说,身体外的都是工具;但AI的界限模糊——下棋能力是内置,还是调Stockfish?数学能力是自己掌握,还是靠外部程序?"
实践表明,若某项能力(如基础数学、逻辑推理)能提升整体认知,就该内置;若可能削弱通用性(如高度专业的领域知识),则更适合当工具。
05 全能模型:AGI 的终极形态构想访谈最后,哈萨比斯揭开了DeepMind的终极目标——建融合语言、多媒体、物理推理与生成能力的"全能模型"(Omni Model)。"Genie、Veo、Gemini这些目前相对独立的模型,正慢慢融合,这才是AGI该有的综合能力。"
全能模型的核心是"一体化智能"。不同于当前单一功能模型,它得同时具备:语言理解与生成(如Gemini)、物理世界建模与推理(如Genie 3)、复杂问题规划解决(如Deep Think),以及工具调用与系统整合能力。"
AGI的价值在于通用——能在不同场景、任务间无缝切换,用统一认知框架处理多样问题,就像人类智能一样。"哈萨比斯解释道。
要实现这一目标,需突破两大挑战。一是保持世界生成的一致性——某个提示生成虚拟世界后,怎么确保其他人能复现?这涉及模型稳定性与可复现性的核心难题。
二是目标函数的动态优化——现实世界没有单一目标,多目标并存且权重随环境、情绪等变化。哈萨比斯指出:"未来通用系统得学会理解用户真实意图,转成可优化的奖励函数,这需要元认知或'元强化学习'的突破。"
这种元强化学习思路,早在AlphaGo时代就已萌芽——在主系统上建元系统,推测最优目标函数。哈萨比斯透露,这一方向正成研究重点:"十年前我们在游戏AI里试的理念,如今可能成AGI突破的关键。"
至于用户关心的Genie 3开放时间,哈萨比斯说团队正提效,计划靠社区模式让用户分享虚拟世界、互相体验投票。而他个人的"终极梦想",是AGI安全落地后,用这些技术造"史上最伟大的游戏"——一个融无限可能的虚拟宇宙。
从AlphaGo到Genie 3,从思考型模型到全能模型,DeepMind的技术演进始终围着一个核心:让AI像人类一样理解、思考、创造。
哈萨比斯的分享揭示了清晰逻辑——AGI的实现不是单一技术突破,而是认知机制、世界模型、工具系统的协同进化。过程中,"参差型智能"的悖论恰是进步的阶梯,每一次能力拓展、每一次缺陷修正,都在把通用人工智能的梦想推得更近。
正如哈萨比斯所说,我们正站在AI新纪元的转折点,这条路的终点,是让智能服务人类的无限可能。