Genie 3:让XR世界从“平替”进化为“贵替”的世界模型

上周,谷歌Deep Mind发布了新的通用世界模型Genie 3。

它引发了非常热烈的讨论,其中有包括看好和质疑。一部分人认为,它的广泛应用能够给虚拟世界建设“解放生产力”,而另一方面则认为这只是谷歌的营销,实际上并没有什么真正的用途。

但无论如何,这个能够实时生成虚拟世界的模型,仍然值得XR行业关注。

什么是Genie 3 Not only see, but also in...teractive

Genie 3是可在实时交互中生成动态环境的通用世界模型。

它能根据文本提示,生成720p、24fps的可导航场景,并保持几分钟内的物理与视觉一致性。这意味着,从前需要依赖手工建模、游戏引擎预构建的虚拟世界,如今可以直接由模型实时生成。

用大白话来说,它更3D、更拟真、更细腻。

更3D就是指在Genie生成的视频中,人是可以跟环境产生互动的。你可以操作人在视频里行走,移动的维度也有了前后左右上上下下。而在普通的AI视频里,只能够拖进度条。

我们也用谷歌案例的提示词,在Sora里生成了一段视频:

而这是Genie 3的同样提示词的视频:

可以看到,Genie 3的视频是像玩游戏一样,可以进行移动,甚至走进蘑菇屋里面去。

Genie在拟真方面也有了长足的进步,也就是谷歌官方所说的,几分钟内的物理与视觉一致性。

比如这段案例,在罗马风格的大理石建筑面前移动,前面的树会根据你的移动和现实世界的物理特性,呈现出近大远小的空间感,并且在你“回头”的时候,也会出现在真实世界中会出现的位置上。

一些其他视频很可能会在你回头时,重新生成一段你从来没见过的画面。

这个特性就有点像GPT的上下文记忆,不过Genie 3的“记忆”是视觉和空间状态,包括场景里物体的位置、外观、状态,比如门开着还是关着、涂了什么颜色等等。可以理解为AI更加进化了,已经拥有了打造“世界连续性”的能力。

更细腻,也是Genie体现在“物理”上的能力。比如海浪拍打到水岸,下雨后泥泞的街道和水坑,阳光随着你的行走而变换角度等等,一切都更加贴近真实世界。

像这段雨林树叶就非常典型:

除了近大远小之外,能够看到上层的叶子更嫩绿(因为是新长出来的),下层的叶子颜色更深。此外,也能感受到叶片的肥厚,正好符合一种雨林感。

此外,Genie 3还支持实时互动,根据你新增的提示词即时生成内容。

比如在滑雪🎿视频里生成一个Genie 3滑雪🎿爱好者:

或者一根坐着滑翔伞的香蕉:

可以看到,画面基本上是没有太大变动的,整体主世界比较稳定,生成的事件也是出现在相对真实的位置。

Genie 3就像本段标题所说,不止是AI生成的平面视频——用来看的,更是能够“生活”在其中,身临其境,并与环境产生交互,也能看到环境因为你的存在、你视角变化而产生变化。

对XR来说有什么用?

创造一个虚拟世界,本质上是现实世界的替代品,在未来也许是从平替向贵替的进化。

为了让我们更快适应虚拟世界,尽可能的拟真是必不可少的追求。因为XR和视频、图片最大的不同在于,它是隔着屏幕看,而是让我们沉浸其中。在这种情况下,如果你背后的物体突然变样,光影跟你习惯的反着移动,你的大脑会立刻察觉“这是假的”,沉浸感瞬间崩塌不说,还可能会引发毛骨悚然的想象(倒是很适合做惊悚类的……)

Genie 3这种高度的世界型AI,也许会极大催生XR世界的内容繁荣。

在最初的报道中,就有媒体提到,Genie 3对教育行业会产生有效帮助。我们都知道那句『互联网』名梗“妈妈啊,人生是旷野”——有些风景看过,就是比没看更印象深刻、更能理解其中深意。

Genie 3 能让学生进入一个可交互、可探索的虚拟环境,比如在生物课里走进细胞世界观察细胞器的结构;在历史课里漫步古罗马广场,和当时的市民擦肩而过;在地理课里穿越不同的气候带,观察环境与动植物的变化。这种体验不仅记忆更深,也能让学生通过交互获得更加深刻的“参与感”——而且成本非常低。

在游戏领域,Genie 3 也有想象空间。在Reddit上就有玩家提到,如果足够灵活,Genie 3可以用来玩D&D。

与剧本杀大家共用一个剧本不同,这种游戏通常由一个DM来担任主要剧情叙述,甚至可以说大家进行的游戏世界,完全依赖于DM的口述和想象。当然这在线下面对面玩非常有趣,但也不乏有更多人希望能够“看到”。

接入 Genie 3 后,DM 可以即时输入提示词,在世界中创造一扇门、一座城堡,或一条蜿蜒的地道,让玩家“所说即所见”,把口述想象变成可探索的空间。

在这个基础上,AIGC也会在游戏里获得更广泛的应用。比如接入Genie 3的API后,一个单纯的房间会变得更有互动感,每个人进入后得到的内容也许会不太一样、更加灵活。

此外,未来,当Genie 3与云渲染和AR眼镜👓结合,用户可能随时将周围环境换成另一种景象,也可能会随机触发一个赛博涂鸦艺术家的彩蛋——就像漫步在Bristol街头寻找Banksy一样,让虚拟与现实的交织变成一种日常惊喜。

从长远看,Genie 3 这种具备高拟真、强交互、长时一致性的世界模型,可能会成为 XR 内容生态的“底座技术”。它不只是让我们能看见更多虚拟风景,而是让虚拟世界开始像现实一样拥有秩序、记忆和可预期性。

一旦这种能力被普及,XR 应用的形态就会从一次性的“项目体验”,转向持续演进的“生活空间”。它甚至可能是全球共享的“公共休息室”,也是永远开放、动态更新的游戏世界。

到那时,我们可能不再区分“真实”和“虚拟”,而是习惯在两者之间无缝切换——就像今天的我们习惯在现实和线上社交之间穿梭一样。

特别声明:[Genie 3:让XR世界从“平替”进化为“贵替”的世界模型] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

国标GB28181算法算力平台EasyGBS筑牢公共场所视频监控智能化防线(gb28181-2016国家标准)

视频监控作为公共场所智能化管理的“智慧之眼”,EasyGBS平台以标准化接入破解设备异构难题,以智能算力调度适配多元场景需求,以开放接口实现多系统联动,为公共场所构建全域覆盖、智能高效、安全可靠的视频监控体系…

国标GB28181算法算力平台EasyGBS筑牢公共场所视频监控智能化防线(gb28181-2016国家标准)

51岁拉尔萨怒怼假新闻:不认二球,31岁男友超亮眼(nba拉尔萨)

到这里,你会发现,拉尔萨的每一段感情,虽然鲜有顺利,都是真实发生过的,而且每段感情都留下了清晰的时间节点。很简单,媒体为了获取点击量,选择了一个省力的故事模板;读者看到熟悉的模式,脑袋自动补全,便不再需要证据…

51岁拉尔萨怒怼假新闻:不认二球,31岁男友超亮眼(nba拉尔萨)

李亚鹏被骂多年,杜子建突然道歉,善事终于被看见(李亚鹏回应质疑)

在这段视频里,他没有提到李亚鹏演过哪些经典的角色,也没有谈及他的婚姻生活,只专注于说了一件事:李亚鹏连续十六年来,一直默默为那些患有唇腭裂的孩子们提供免费的治疗。医护人员的工资并不高,医院的设备也并不完备,但…

李亚鹏被骂多年,杜子建突然道歉,善事终于被看见(李亚鹏回应质疑)

红外发热护膝真的能暖膝盖吗?揭秘背后的科技原理(红外线自发热护膝真的是在发热?)

红外发热护膝近年来逐渐成为护具市场的新宠。它通过红外线技术,有效促进血液循环,缓解关节疼痛。但你知道其背后的工作原理吗?本文将深入解读,帮你了解如何挑选合适的产品。适合长期受关节炎困扰的上班族,还能助你抵御2026年冬季寒潮。

红外发热护膝真的能暖膝盖吗?揭秘背后的科技原理(红外线自发热护膝真的是在发热?)

王祖蓝全家回流香港,身家升级当老板签约百位艺人(王祖蓝现居)

王祖蓝不仅是一位演员,还是一家经纪公司的老板,他手下签约了数百位新人。前段时间,另一位好友也提到类似的经历:为了拍戏,他常常需要往返于北京和深圳之间,孩子要么在线上上课,要么频繁转学,最后他们还是回到老…

王祖蓝全家回流香港,身家升级当老板签约百位艺人(王祖蓝现居)