Genie 3:让XR世界从“平替”进化为“贵替”的世界模型

Genie 3:让XR世界从“平替”进化为“贵替”的世界模型

上周,谷歌Deep Mind发布了新的通用世界模型Genie 3。

它引发了非常热烈的讨论,其中有包括看好和质疑。一部分人认为,它的广泛应用能够给虚拟世界建设“解放生产力”,而另一方面则认为这只是谷歌的营销,实际上并没有什么真正的用途。

但无论如何,这个能够实时生成虚拟世界的模型,仍然值得XR行业关注。

什么是Genie 3 Not only see, but also in...teractive

Genie 3是可在实时交互中生成动态环境的通用世界模型。

它能根据文本提示,生成720p、24fps的可导航场景,并保持几分钟内的物理与视觉一致性。这意味着,从前需要依赖手工建模、游戏引擎预构建的虚拟世界,如今可以直接由模型实时生成。

用大白话来说,它更3D、更拟真、更细腻。

更3D就是指在Genie生成的视频中,人是可以跟环境产生互动的。你可以操作人在视频里行走,移动的维度也有了前后左右上上下下。而在普通的AI视频里,只能够拖进度条。

我们也用谷歌案例的提示词,在Sora里生成了一段视频:

而这是Genie 3的同样提示词的视频:

可以看到,Genie 3的视频是像玩游戏一样,可以进行移动,甚至走进蘑菇屋里面去。

Genie在拟真方面也有了长足的进步,也就是谷歌官方所说的,几分钟内的物理与视觉一致性。

比如这段案例,在罗马风格的大理石建筑面前移动,前面的树会根据你的移动和现实世界的物理特性,呈现出近大远小的空间感,并且在你“回头”的时候,也会出现在真实世界中会出现的位置上。

一些其他视频很可能会在你回头时,重新生成一段你从来没见过的画面。

这个特性就有点像GPT的上下文记忆,不过Genie 3的“记忆”是视觉和空间状态,包括场景里物体的位置、外观、状态,比如门开着还是关着、涂了什么颜色等等。可以理解为AI更加进化了,已经拥有了打造“世界连续性”的能力。

更细腻,也是Genie体现在“物理”上的能力。比如海浪拍打到水岸,下雨后泥泞的街道和水坑,阳光随着你的行走而变换角度等等,一切都更加贴近真实世界。

像这段雨林树叶就非常典型:

除了近大远小之外,能够看到上层的叶子更嫩绿(因为是新长出来的),下层的叶子颜色更深。此外,也能感受到叶片的肥厚,正好符合一种雨林感。

此外,Genie 3还支持实时互动,根据你新增的提示词即时生成内容。

比如在滑雪🎿视频里生成一个Genie 3滑雪🎿爱好者:

或者一根坐着滑翔伞的香蕉:

可以看到,画面基本上是没有太大变动的,整体主世界比较稳定,生成的事件也是出现在相对真实的位置。

Genie 3就像本段标题所说,不止是AI生成的平面视频——用来看的,更是能够“生活”在其中,身临其境,并与环境产生交互,也能看到环境因为你的存在、你视角变化而产生变化。

对XR来说有什么用?

创造一个虚拟世界,本质上是现实世界的替代品,在未来也许是从平替向贵替的进化。

为了让我们更快适应虚拟世界,尽可能的拟真是必不可少的追求。因为XR和视频、图片最大的不同在于,它是隔着屏幕看,而是让我们沉浸其中。在这种情况下,如果你背后的物体突然变样,光影跟你习惯的反着移动,你的大脑会立刻察觉“这是假的”,沉浸感瞬间崩塌不说,还可能会引发毛骨悚然的想象(倒是很适合做惊悚类的……)

Genie 3这种高度的世界型AI,也许会极大催生XR世界的内容繁荣。

在最初的报道中,就有媒体提到,Genie 3对教育行业会产生有效帮助。我们都知道那句『互联网』名梗“妈妈啊,人生是旷野”——有些风景看过,就是比没看更印象深刻、更能理解其中深意。

Genie 3 能让学生进入一个可交互、可探索的虚拟环境,比如在生物课里走进细胞世界观察细胞器的结构;在历史课里漫步古罗马广场,和当时的市民擦肩而过;在地理课里穿越不同的气候带,观察环境与动植物的变化。这种体验不仅记忆更深,也能让学生通过交互获得更加深刻的“参与感”——而且成本非常低。

在游戏领域,Genie 3 也有想象空间。在Reddit上就有玩家提到,如果足够灵活,Genie 3可以用来玩D&D。

与剧本杀大家共用一个剧本不同,这种游戏通常由一个DM来担任主要剧情叙述,甚至可以说大家进行的游戏世界,完全依赖于DM的口述和想象。当然这在线下面对面玩非常有趣,但也不乏有更多人希望能够“看到”。

接入 Genie 3 后,DM 可以即时输入提示词,在世界中创造一扇门、一座城堡,或一条蜿蜒的地道,让玩家“所说即所见”,把口述想象变成可探索的空间。

在这个基础上,AIGC也会在游戏里获得更广泛的应用。比如接入Genie 3的API后,一个单纯的房间会变得更有互动感,每个人进入后得到的内容也许会不太一样、更加灵活。

此外,未来,当Genie 3与云渲染和AR眼镜👓结合,用户可能随时将周围环境换成另一种景象,也可能会随机触发一个赛博涂鸦艺术家的彩蛋——就像漫步在Bristol街头寻找Banksy一样,让虚拟与现实的交织变成一种日常惊喜。

从长远看,Genie 3 这种具备高拟真、强交互、长时一致性的世界模型,可能会成为 XR 内容生态的“底座技术”。它不只是让我们能看见更多虚拟风景,而是让虚拟世界开始像现实一样拥有秩序、记忆和可预期性。

一旦这种能力被普及,XR 应用的形态就会从一次性的“项目体验”,转向持续演进的“生活空间”。它甚至可能是全球共享的“公共休息室”,也是永远开放、动态更新的游戏世界。

到那时,我们可能不再区分“真实”和“虚拟”,而是习惯在两者之间无缝切换——就像今天的我们习惯在现实和线上社交之间穿梭一样。

特别声明:[Genie 3:让XR世界从“平替”进化为“贵替”的世界模型] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

注射用盐酸氨溴索是否存在不良反应(注射用盐酸氨溴索用盐水还是糖水)

注射用盐酸氨溴索为药物通用名,商品名称一般为奥古丽。注射用盐酸氨溴索是一种黏液溶解剂,能够增加呼吸道黏膜浆液腺的分泌,减少黏液腺的分泌,从而降低痰液粘度,促进排痰。该药主要用于缓解急、慢性呼吸道疾病的症状,包括急、慢性支气管哮喘、支气管扩张

注射用盐酸氨溴索是否存在不良反应(注射用盐酸氨溴索用盐水还是糖水)

表哥62万买『机器人』️照顾舅舅,跟真人一样,6个月后拆开『机器人』️泪目了(表哥62万买机器多少钱)

当舅舅提到舅妈时,『机器人』️会说:"王老先生,您的妻子一定是个很棒的人,她会希望看到您健康快乐地生活。"舅舅擦着眼泪说,"我知道你们会担心我太沉浸在回忆里,但这是我唯一能和你舅妈&#

表哥62万买『机器人』️照顾舅舅,跟真人一样,6个月后拆开『机器人』️泪目了(表哥62万买机器多少钱)

科幻美术展燃爆校园!北航×石油分校跨界联动解锁科技与艺术融合新玩法(科幻美术作品一等奖)

外人说》作者杨新星带来充满想象力的“宇宙节目”创作故事,她以独特视角勾勒宇宙场景,让听众仿佛置身轻松愉悦的科幻空间,感受星际间的奇妙魅力;《星球车 嘲风》作者陆伟(资深算法『工程师』)则结合自身技术背景,分享…

科幻美术展燃爆校园!北航×石油分校跨界联动解锁科技与艺术融合新玩法(科幻美术作品一等奖)

蔡国庆:两次情断异国恋后,娶亿万富婆为妻,现在儿子是他的骄傲(蔡国庆履历)

连天后『那英』都按捺不住,当众向他表白这操作简直是把观众的下巴都惊掉了! 这简直就是命中注定的缘分啊,两人一见面就擦出了爱的火花❇️。 这简直是像中了彩票一样的惊喜啊,令人忍不住想大喊一声:&34老天爷,你终于开眼…

蔡国庆:两次情断异国恋后,娶亿万富婆为妻,现在儿子是他的骄傲(蔡国庆履历)

1000流明凯瑞兹P2手电:医生EDC玩家都爱的全能装备(凯瑞兹g20测评)

凯瑞兹P2手电用“小身材”承载了“大能量”——1000流明峰值亮度、270米远射能力,满足性能需求;143.8mm笔形设计、91.3克重量,兼顾便携体验;单键操控、双供电模式、IPX8防水,打造“简单可靠”…

1000流明凯瑞兹P2手电:医生EDC玩家都爱的全能装备(凯瑞兹g20测评)