今日Nature:AI游戏『设计师』问世,自学成才,无需任何先前知识

在当今『数字化』时代,创意产业正经历着一场由生成式人工智能(AI)引发的变革。从文本、图像到音频、视频,AI 正以前所未有的速度和规模生成各种内容,为创意工作者提供了全新的工具和思路。

然而,将这些技术无缝融入创意实践并非易事,尤其是在游戏开发这一复杂且富有创意的领域。

游戏开发不仅需要生成新颖的内容,更需要在保持游戏世界一致性、多样性和用户修改持续性方面达到高度平衡。

近日,一篇发表在Nature 上的研究论文World and Human Action Models towards Gameplay Ideation 揭示了如何利用生成式 AI 模型推动游戏玩法创意的生成。

今日霍州(www.jrhz.info)©️

论文链接:

https://www.nature.com/articles/s41586-025-08600-3

论文报道了一个由微软研究院领导的研究团队,开发的可协助电子游戏『设计师』迭代设计游戏的生成式 AI 模型——世界与人类行动模型(World and Human Action Model,WHAM),其生成的鲁棒 3D 世界能遵循设计用于电子游戏的机制

他们认为,考虑到由于 WHAM 无需任何先前知识,仅通过玩游戏的训练就能学会生成序列,这个工具或能轻松转换用于生成来自其他电子游戏的关卡,为游戏开发行业带来新的可能。

AI 还可以做好游戏创意开发?

电子游戏在娱乐产业中占最大份额,全球有数十亿人玩和购买电子游戏。然而,游戏开发是一个涉及多学科、多技能的复杂过程,从概念设计、角色建模到关卡设计、游戏机制编程,每一个环节都需要创意人员投入大量的时间和精力。传统的游戏开发流程往往受限于人力和时间成本,难以快速迭代和生成多样化的游戏内容。

生成式 AI 为解决这一问题提供了可能。通过训练 AI 模型学习大量的游戏数据,理论上可以生成新的游戏玩法序列、关卡设计甚至角色行为,从而辅助创意人员更高效地进行游戏开发。

然而,现有的生成式 AI 模型在游戏开发领域的应用仍面临诸多挑战,如生成内容的一致性、多样性以及对用户修改的持续性支持不足等。

因此,在这项工作中,研究团队旨在开发一种能够更好地支持游戏开发创意实践的生成式 AI 模型

为了深入了解游戏开发创意人员的实际需求,研究团队邀请了来自不同游戏工作室创意团队的 27 名电子游戏『设计师』,开展了半结构化访谈,这些电子游戏『设计师』涵盖了游戏开发的多个领域,包括工程、设计和艺术等。

在访谈过程中,研究团队使用了一种名为“设计探针”的工具,通过模拟一个虚构但具体的游戏开发场景,激发参与者对生成式 AI 在游戏创意中的潜在应用的思考。

参与者们积极分享了他们对 AI 辅助游戏创意的看法和期望,认为当前用于打造电子游戏的 AI 方案缺乏生成许多不同创意(发散性思维)的能力,并强调在保持游戏世界一致性的同时,实现多样化创意的重要性,以及通过设计过程来持续微调游戏各方面(迭代实践)的重要性。

具体来说,参与者们认为,生成式 AI 应该能够帮助他们在游戏开发过程中实现以下几个目标:

  • 提供多样化的内容:AI 模型应该能够生成多种不同的游戏玩法序列和关卡设计,以激发创意人员的灵感;
  • 保持一致性:生成的内容应该与游戏的整体风格和机制保持一致,避免出现与游戏世界不协调的元素;
  • 支持迭代实践:创意人员希望能够通过直接修改生成的内容来进行迭代,而不是仅仅依赖于文本提示;
  • 持续性:用户对生成内容的修改应该能够持续地保留,而不是在后续生成过程中消失。

基于用户需求调研的结果,研究团队开发了 WHAM。

今日霍州(www.jrhz.info)©️

图|WHAM 模型(来源:论文)

WHAM 模型使用了 3D 多玩家战斗模拟器《嗜血边缘》中大量的人类玩家玩法数据,包括游戏视觉画面和控制器动作。采用 Transformer 架构作为其序列预测的骨干网络,并使用 VQGAN 图像编码器将图像编码为离散的 token 序列,通过对真实人类游戏玩法数据的训练,WHAM 能够准确预测游戏环境的 3D 结构、控制器动作的效果以及游戏的时空结构

为游戏开发提供一种全新工具

研究团队发现,WHAM 能够设计出符合《嗜血边缘》预存在机制的复杂 3D 电子游戏序列,其关卡设计也具有明显的多样性,且创意人员可对输出进行迭代调整。他们还开发了 WHAM 示范器,作为供用户操作和自定义 WHAM 输出的一个可视化界面。

为了评估 WHAM 的性能,他们还提出了一套针对生成式 AI 模型的评估方法,重点关注模型在一致性、多样性和持续性这三个关键能力上的表现。

今日霍州(www.jrhz.info)©️

在一致性评估方面,他们使用 Fréchet Video Distance(FVD)指标来衡量生成的游戏玩法与真实游戏玩法在视觉和时空动态上的一致性。通过将 WHAM 生成的游戏画面与真实玩家的游戏画面进行对比,发现随着模型规模的增大和计算资源的增加,FVD 分数逐渐降低,表明模型生成的内容与真实游戏数据的一致性不断提高。

在多样性评估方面,他们采用 Wasserstein 距离来衡量模型生成的动作分布与真实玩家动作分布之间的差异。结果表明,WHAM 能够生成与真实玩家行为相似的动作序列,且在训练过程中,Wasserstein 距离逐渐减小,说明模型在保持一致性的同时,能够生成多样化的游戏玩法。

今日霍州(www.jrhz.info)©️

图|WHAM 模型的多样性评估

在持续性评估方面,研究人员通过手动编辑游戏图像,插入不同的游戏元素(如道具、角色和地图元素),并让 WHAM 在这些编辑后的图像条件下生成新的游戏画面,来评估模型对用户修改的持续性支持。实验结果显示,当模型基于更多的编辑后的图像进行生成时,插入的元素在生成画面中持续存在的比例显著提高,表明 WHAM 能够较好地将用户的修改融入到生成的游戏内容中。

总体而言,研究团队通过深入的用户需求调研和严谨的模型开发与评估,成功开发出了一种能够支持游戏开发创意实践的生成式 AI 模型。该模型在一致性、多样性和持续性这三个关键能力上表现出色,能够生成与真实游戏玩法高度一致且多样化的游戏内容,并有效地支持用户对生成内容的修改和迭代。

研究团队指出,WHAM 的出现为游戏开发行业提供了一种全新的工具,能够生成多样化、一致性强的游戏内容,激发创意人员的灵感,有望在未来的游戏中创造出更加丰富、创新的游戏体验。同时,该研究也为生成式 AI 在其他创意领域的应用提供了有益的借鉴和启示,推动了 AI 技术与人类创意的深度融合。

虽然 WHAM 在游戏开发领域的应用已经取得了显著的成果,但也存在着一些局限性和挑战。例如,收集和处理大量真实人类游戏玩法数据是一项复杂且耗时的任务,需要投入大量的时间和资源;而且,训练和优化生成式 AI 模型需要大量的计算资源和专业知识,对研究团队的技术能力也提出了较高的要求。

不过,研究团队也指出,随着 AI 技术的不断发展,WHAM 的模型架构和训练方法也可以进一步改进,不仅能够低成本高效率地以生成更加复杂、智能的游戏内容,还可以探索如何将 WHAM 与其他游戏开发工具和流程更好地集成,以提高整个游戏开发流程的效率和创意性。

我们有理由相信,在不久的将来,AI 将在游戏开发乃至整个创意产业中发挥更加重要的作用。

特别声明:[今日Nature:AI游戏『设计师』问世,自学成才,无需任何先前知识] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

江苏恒德力化工设备制造有限公司:搪瓷反应罐盘管搪瓷反应釜搪玻璃设备反应釜行业技术标杆(江苏恒德力化工设备厂怎么样)

公司现有员工650名,两个厂区共占地80000m²,年产能达5000台(套),产品覆盖搪瓷反应罐、盘管搪瓷反应釜、搪玻璃设备反应釜、耐腐蚀搪瓷反应釜及搪瓷加热反应釜等全系列型号。 无论是标准型号的搪瓷反应罐,…

江苏恒德力化工设备制造有限公司:搪瓷反应罐盘管搪瓷反应釜搪玻璃设备反应釜行业技术标杆(江苏恒德力化工设备厂怎么样)

何赛飞独撑家 27 年!与刘嘉玲分享,家务属看不下的人(何赛飞综艺)

她不是不计较,而是选择把精力用在更重要的地方——让生活顺下去,而不是赢一场对错。她与刘嘉玲分享的那句“家务属于看不下的那个人”,说的不是谁该多做,而是谁更懂得与生活和解。真正撑起一段长久关系的,从来不是计较公…

何赛飞独撑家 27 年!与刘嘉玲分享,家务属看不下的人(何赛飞综艺)

eSIM产业爆发背后,紫光同芯的“中国方案”(esim产业链)

值得一提的是,紫光同芯凭借多年在这一领域的积累与深耕,已成为率先突围的中国力量,逐步将其“一芯连天地、一芯通全球”的愿景转变为现实:不仅率先推出了首款实现商用的手机eSIM中国芯,海外出货量突破千万级;还将…

eSIM产业爆发背后,紫光同芯的“中国方案”(esim产业链)

自曝怀孕三个月后,高调示爱『陈晓』的赵樱子,没给自己留一点后路(怀孕三个月自己知道吗)

赵樱子和『陈晓』之间的互动一直比较少见,而现在却突然高调示爱,这不禁让人猜测,背后是否隐藏着某些其他的动机。她的每一个选择,都在影响着她的未来,而她的经历也促使我们思考,作为公众人物,如何在复杂多变的环境中保持真…

自曝怀孕三个月后,高调示爱『陈晓』的赵樱子,没给自己留一点后路(怀孕三个月自己知道吗)

手机前置后置摄像头及红外点阵面部识别镜头防护解决方案解析(手机前置摄像头和后置哪个更真实)

本文全面解析手机前置和后置摄像头以及红外点阵面部识别摄像头的维修与防护解决方案。包括防护贴纸的应用场景、工作原理、优劣势及行业现状等内容,帮助读者深入了解相关技术和应用实践。

手机前置后置摄像头及红外点阵面部识别镜头防护解决方案解析(手机前置摄像头和后置哪个更真实)