Genie 3:让XR世界从“平替”进化为“贵替”的世界模型

Genie 3:让XR世界从“平替”进化为“贵替”的世界模型

上周,谷歌Deep Mind发布了新的通用世界模型Genie 3。

它引发了非常热烈的讨论,其中有包括看好和质疑。一部分人认为,它的广泛应用能够给虚拟世界建设“解放生产力”,而另一方面则认为这只是谷歌的营销,实际上并没有什么真正的用途。

但无论如何,这个能够实时生成虚拟世界的模型,仍然值得XR行业关注。

什么是Genie 3 Not only see, but also in...teractive

Genie 3是可在实时交互中生成动态环境的通用世界模型。

它能根据文本提示,生成720p、24fps的可导航场景,并保持几分钟内的物理与视觉一致性。这意味着,从前需要依赖手工建模、游戏引擎预构建的虚拟世界,如今可以直接由模型实时生成。

用大白话来说,它更3D、更拟真、更细腻。

更3D就是指在Genie生成的视频中,人是可以跟环境产生互动的。你可以操作人在视频里行走,移动的维度也有了前后左右上上下下。而在普通的AI视频里,只能够拖进度条。

我们也用谷歌案例的提示词,在Sora里生成了一段视频:

而这是Genie 3的同样提示词的视频:

可以看到,Genie 3的视频是像玩游戏一样,可以进行移动,甚至走进蘑菇屋里面去。

Genie在拟真方面也有了长足的进步,也就是谷歌官方所说的,几分钟内的物理与视觉一致性。

比如这段案例,在罗马风格的大理石建筑面前移动,前面的树会根据你的移动和现实世界的物理特性,呈现出近大远小的空间感,并且在你“回头”的时候,也会出现在真实世界中会出现的位置上。

一些其他视频很可能会在你回头时,重新生成一段你从来没见过的画面。

这个特性就有点像GPT的上下文记忆,不过Genie 3的“记忆”是视觉和空间状态,包括场景里物体的位置、外观、状态,比如门开着还是关着、涂了什么颜色等等。可以理解为AI更加进化了,已经拥有了打造“世界连续性”的能力。

更细腻,也是Genie体现在“物理”上的能力。比如海浪拍打到水岸,下雨后泥泞的街道和水坑,阳光随着你的行走而变换角度等等,一切都更加贴近真实世界。

像这段雨林树叶就非常典型:

除了近大远小之外,能够看到上层的叶子更嫩绿(因为是新长出来的),下层的叶子颜色更深。此外,也能感受到叶片的肥厚,正好符合一种雨林感。

此外,Genie 3还支持实时互动,根据你新增的提示词即时生成内容。

比如在滑雪视频里生成一个Genie 3滑雪爱好者:

或者一根坐着滑翔伞的香蕉:

可以看到,画面基本上是没有太大变动的,整体主世界比较稳定,生成的事件也是出现在相对真实的位置。

Genie 3就像本段标题所说,不止是AI生成的平面视频——用来看的,更是能够“生活”在其中,身临其境,并与环境产生交互,也能看到环境因为你的存在、你视角变化而产生变化。

对XR来说有什么用?

创造一个虚拟世界,本质上是现实世界的替代品,在未来也许是从平替向贵替的进化。

为了让我们更快适应虚拟世界,尽可能的拟真是必不可少的追求。因为XR和视频、图片最大的不同在于,它是隔着屏幕看,而是让我们沉浸其中。在这种情况下,如果你背后的物体突然变样,光影跟你习惯的反着移动,你的大脑会立刻察觉“这是假的”,沉浸感瞬间崩塌不说,还可能会引发毛骨悚然的想象(倒是很适合做惊悚类的……)

Genie 3这种高度的世界型AI,也许会极大催生XR世界的内容繁荣。

在最初的报道中,就有媒体提到,Genie 3对教育行业会产生有效帮助。我们都知道那句互联网名梗“妈妈啊,人生是旷野”——有些风景看过,就是比没看更印象深刻、更能理解其中深意。

Genie 3 能让学生进入一个可交互、可探索的虚拟环境,比如在生物课里走进细胞世界观察细胞器的结构;在历史课里漫步古罗马广场,和当时的市民擦肩而过;在地理课里穿越不同的气候带,观察环境与动植物的变化。这种体验不仅记忆更深,也能让学生通过交互获得更加深刻的“参与感”——而且成本非常低。

在游戏领域,Genie 3 也有想象空间。在Reddit上就有玩家提到,如果足够灵活,Genie 3可以用来玩D&D。

与剧本杀大家共用一个剧本不同,这种游戏通常由一个DM来担任主要剧情叙述,甚至可以说大家进行的游戏世界,完全依赖于DM的口述和想象。当然这在线下面对面玩非常有趣,但也不乏有更多人希望能够“看到”。

接入 Genie 3 后,DM 可以即时输入提示词,在世界中创造一扇门、一座城堡,或一条蜿蜒的地道,让玩家“所说即所见”,把口述想象变成可探索的空间。

在这个基础上,AIGC也会在游戏里获得更广泛的应用。比如接入Genie 3的API后,一个单纯的房间会变得更有互动感,每个人进入后得到的内容也许会不太一样、更加灵活。

此外,未来,当Genie 3与云渲染和AR眼镜结合,用户可能随时将周围环境换成另一种景象,也可能会随机触发一个赛博涂鸦艺术家的彩蛋——就像漫步在Bristol街头寻找Banksy一样,让虚拟与现实的交织变成一种日常惊喜。

从长远看,Genie 3 这种具备高拟真、强交互、长时一致性的世界模型,可能会成为 XR 内容生态的“底座技术”。它不只是让我们能看见更多虚拟风景,而是让虚拟世界开始像现实一样拥有秩序、记忆和可预期性。

一旦这种能力被普及,XR 应用的形态就会从一次性的“项目体验”,转向持续演进的“生活空间”。它甚至可能是全球共享的“公共休息室”,也是永远开放、动态更新的游戏世界。

到那时,我们可能不再区分“真实”和“虚拟”,而是习惯在两者之间无缝切换——就像今天的我们习惯在现实和线上社交之间穿梭一样。

特别声明:[Genie 3:让XR世界从“平替”进化为“贵替”的世界模型] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

五角大楼命名新一代“末日飞机” E-130J“凤凰II”亮相(五角大楼是)

根据五角大楼的设想,在未来世界大战中,如果地面指挥设施被摧毁,美国总统、国防部长和战略司令部将通过特别加固的战略通信中继飞机,指挥剩余的核导弹部队实施反击。这种空中平台被称为“末日飞机”

五角大楼命名新一代“末日飞机” E-130J“凤凰II”亮相(五角大楼是)

疯了?“机器生娃”一年内上线,以后没有婚内强奸、婆媳不和了!

“人造机器人子宫”或许就很快会面临,可以代替我们人类,帮我们生孩子,这个机器人只要10万块钱就可以搞定,估计未来一年内会面世,这样的定价人人都可以能力拥有。 十年前你信不出门都可以买到东西,不信刷脸就可以支…

疯了?“机器生娃”一年内上线,以后没有婚内强奸、婆媳不和了!

怀旧80年代港星:港风女神刘嘉玲,凭3次转折改变了一生(80年代港片明星)

鲜有人知道,在这位明星背后,隐藏着一段充满艰辛与挑战的“辛酸史”。 与梁朝伟一起度过的岁月,让她更加坚信,人生的终极幸福并非来自名利,而是来自一个懂自己、陪伴一生的人。她的坚韧与努力,不仅让她在事业上取得了骄…

怀旧80年代港星:港风女神刘嘉玲,凭3次转折改变了一生(80年代港片明星)

黑松信令级信号屏蔽器:重塑校园通信管理的新范式

下行链路定向干扰:仅针对基站下行频段(如5G的3400-3600MHz、4800-5000MHz)发射微功率信号(≤1W),阻断手机接收基站指令,使其持续处于“网络搜索”状态; 结语黑松信令级信号屏蔽器以协…

黑松信令级信号屏蔽器:重塑校园通信管理的新范式

都说wifi7比wifi6厉害,但是具体强多少呢?(wifi6比wifi5提升多少)

通过16×16 MIMO和增强型OFDMA技术,WiFi 7单信道可支持多达384台设备并发,较WiFi 6的约50台,提升近7倍。并且在测试中,即使有300台设备同时在线,WiFi 7仍保持12ms平均…

都说wifi7比wifi6厉害,但是具体强多少呢?(wifi6比wifi5提升多少)