今日Nature:AI游戏『设计师』问世,自学成才,无需任何先前知识

在当今『数字化』时代,创意产业正经历着一场由生成式人工智能(AI)引发的变革。从文本、图像到音频、视频,AI 正以前所未有的速度和规模生成各种内容,为创意工作者提供了全新的工具和思路。

然而,将这些技术无缝融入创意实践并非易事,尤其是在游戏开发这一复杂且富有创意的领域。

游戏开发不仅需要生成新颖的内容,更需要在保持游戏世界一致性、多样性和用户修改持续性方面达到高度平衡。

近日,一篇发表在Nature 上的研究论文World and Human Action Models towards Gameplay Ideation 揭示了如何利用生成式 AI 模型推动游戏玩法创意的生成。

今日霍州(www.jrhz.info)©️

论文链接:

https://www.nature.com/articles/s41586-025-08600-3

论文报道了一个由微软研究院领导的研究团队,开发的可协助电子游戏『设计师』迭代设计游戏的生成式 AI 模型——世界与人类行动模型(World and Human Action Model,WHAM),其生成的鲁棒 3D 世界能遵循设计用于电子游戏的机制

他们认为,考虑到由于 WHAM 无需任何先前知识,仅通过玩游戏的训练就能学会生成序列,这个工具或能轻松转换用于生成来自其他电子游戏的关卡,为游戏开发行业带来新的可能。

AI 还可以做好游戏创意开发?

电子游戏在娱乐产业中占最大份额,全球有数十亿人玩和购买电子游戏。然而,游戏开发是一个涉及多学科、多技能的复杂过程,从概念设计、角色建模到关卡设计、游戏机制编程,每一个环节都需要创意人员投入大量的时间和精力。传统的游戏开发流程往往受限于人力和时间成本,难以快速迭代和生成多样化的游戏内容。

生成式 AI 为解决这一问题提供了可能。通过训练 AI 模型学习大量的游戏数据,理论上可以生成新的游戏玩法序列、关卡设计甚至角色行为,从而辅助创意人员更高效地进行游戏开发。

然而,现有的生成式 AI 模型在游戏开发领域的应用仍面临诸多挑战,如生成内容的一致性、多样性以及对用户修改的持续性支持不足等。

因此,在这项工作中,研究团队旨在开发一种能够更好地支持游戏开发创意实践的生成式 AI 模型

为了深入了解游戏开发创意人员的实际需求,研究团队邀请了来自不同游戏工作室创意团队的 27 名电子游戏『设计师』,开展了半结构化访谈,这些电子游戏『设计师』涵盖了游戏开发的多个领域,包括工程、设计和艺术等。

在访谈过程中,研究团队使用了一种名为“设计探针”的工具,通过模拟一个虚构但具体的游戏开发场景,激发参与者对生成式 AI 在游戏创意中的潜在应用的思考。

参与者们积极分享了他们对 AI 辅助游戏创意的看法和期望,认为当前用于打造电子游戏的 AI 方案缺乏生成许多不同创意(发散性思维)的能力,并强调在保持游戏世界一致性的同时,实现多样化创意的重要性,以及通过设计过程来持续微调游戏各方面(迭代实践)的重要性。

具体来说,参与者们认为,生成式 AI 应该能够帮助他们在游戏开发过程中实现以下几个目标:

  • 提供多样化的内容:AI 模型应该能够生成多种不同的游戏玩法序列和关卡设计,以激发创意人员的灵感;
  • 保持一致性:生成的内容应该与游戏的整体风格和机制保持一致,避免出现与游戏世界不协调的元素;
  • 支持迭代实践:创意人员希望能够通过直接修改生成的内容来进行迭代,而不是仅仅依赖于文本提示;
  • 持续性:用户对生成内容的修改应该能够持续地保留,而不是在后续生成过程中消失。

基于用户需求调研的结果,研究团队开发了 WHAM。

今日霍州(www.jrhz.info)©️

图|WHAM 模型(来源:论文)

WHAM 模型使用了 3D 多玩家战斗模拟器《嗜血边缘》中大量的人类玩家玩法数据,包括游戏视觉画面和控制器动作。采用 Transformer 架构作为其序列预测的骨干网络,并使用 VQGAN 图像编码器将图像编码为离散的 token 序列,通过对真实人类游戏玩法数据的训练,WHAM 能够准确预测游戏环境的 3D 结构、控制器动作的效果以及游戏的时空结构

为游戏开发提供一种全新工具

研究团队发现,WHAM 能够设计出符合《嗜血边缘》预存在机制的复杂 3D 电子游戏序列,其关卡设计也具有明显的多样性,且创意人员可对输出进行迭代调整。他们还开发了 WHAM 示范器,作为供用户操作和自定义 WHAM 输出的一个可视化界面。

为了评估 WHAM 的性能,他们还提出了一套针对生成式 AI 模型的评估方法,重点关注模型在一致性、多样性和持续性这三个关键能力上的表现。

今日霍州(www.jrhz.info)©️

在一致性评估方面,他们使用 Fréchet Video Distance(FVD)指标来衡量生成的游戏玩法与真实游戏玩法在视觉和时空动态上的一致性。通过将 WHAM 生成的游戏画面与真实玩家的游戏画面进行对比,发现随着模型规模的增大和计算资源的增加,FVD 分数逐渐降低,表明模型生成的内容与真实游戏数据的一致性不断提高。

在多样性评估方面,他们采用 Wasserstein 距离来衡量模型生成的动作分布与真实玩家动作分布之间的差异。结果表明,WHAM 能够生成与真实玩家行为相似的动作序列,且在训练过程中,Wasserstein 距离逐渐减小,说明模型在保持一致性的同时,能够生成多样化的游戏玩法。

今日霍州(www.jrhz.info)©️

图|WHAM 模型的多样性评估

在持续性评估方面,研究人员通过手动编辑游戏图像,插入不同的游戏元素(如道具、角色和地图元素),并让 WHAM 在这些编辑后的图像条件下生成新的游戏画面,来评估模型对用户修改的持续性支持。实验结果显示,当模型基于更多的编辑后的图像进行生成时,插入的元素在生成画面中持续存在的比例显著提高,表明 WHAM 能够较好地将用户的修改融入到生成的游戏内容中。

总体而言,研究团队通过深入的用户需求调研和严谨的模型开发与评估,成功开发出了一种能够支持游戏开发创意实践的生成式 AI 模型。该模型在一致性、多样性和持续性这三个关键能力上表现出色,能够生成与真实游戏玩法高度一致且多样化的游戏内容,并有效地支持用户对生成内容的修改和迭代。

研究团队指出,WHAM 的出现为游戏开发行业提供了一种全新的工具,能够生成多样化、一致性强的游戏内容,激发创意人员的灵感,有望在未来的游戏中创造出更加丰富、创新的游戏体验。同时,该研究也为生成式 AI 在其他创意领域的应用提供了有益的借鉴和启示,推动了 AI 技术与人类创意的深度融合。

虽然 WHAM 在游戏开发领域的应用已经取得了显著的成果,但也存在着一些局限性和挑战。例如,收集和处理大量真实人类游戏玩法数据是一项复杂且耗时的任务,需要投入大量的时间和资源;而且,训练和优化生成式 AI 模型需要大量的计算资源和专业知识,对研究团队的技术能力也提出了较高的要求。

不过,研究团队也指出,随着 AI 技术的不断发展,WHAM 的模型架构和训练方法也可以进一步改进,不仅能够低成本高效率地以生成更加复杂、智能的游戏内容,还可以探索如何将 WHAM 与其他游戏开发工具和流程更好地集成,以提高整个游戏开发流程的效率和创意性。

我们有理由相信,在不久的将来,AI 将在游戏开发乃至整个创意产业中发挥更加重要的作用。

特别声明:[今日Nature:AI游戏『设计师』问世,自学成才,无需任何先前知识] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

缎面单肩带褶皱包臀裙,褶皱可以掩盖小肚腩让人更自信,瘦子穿不会有土气感!(酸碱共轭理论)

浅卡其缎面单肩带包臀裙带着细腻的光泽感,单肩设计露出一侧肩颈线条,领口的扭结细节添了几分柔媚,裙身的褶皱肌理从胸腰处自然散开,贴合身形却不紧绷,缎面的垂坠感随着动作轻晃,无需多余装饰就自带高级质感。裙身的褶皱…

缎面单肩带褶皱包臀裙,褶皱可以掩盖小肚腩让人更自信,瘦子穿不会有土气感!(酸碱共轭理论)

年少有为》腾讯开播:反套路创业笑疯!彭昱畅『林允』反差感拉满(mv年少有为)

彭昱畅、『林允』领衔主演,刘冠麟、何瑞贤等实力演员加盟,这部改编自爆款小说《亏成首富从游戏开始》的作品,跳出传统职场剧的内卷套路,以“反向创业”为核心,上演了一场“求亏反赚”的荒诞闹剧,笑点与共鸣点齐飞,让观众直…

《<strong>年少有为</strong>》腾讯开播:反套路创业笑疯!彭昱畅『林允』反差感拉满(mv年少有为)

通用电气申请推进系统架构专利,将第二空气流分为核心流和风扇流(通用电气吧)

国家知识产权局信息显示,通用电气公司申请一项名为“推进系统架构”的专利,公开号CN121382464A,申请日期为2025年10月。 专利摘要显示,一种推进系统,该推进系统包括旋转元件,固定元件以及旋转元件和…

通用电气申请推进系统架构专利,将第二空气流分为核心流和风扇流(通用电气吧)

杀疯了!『虞书欣』红衣骑射plog封神,重生主母的腊八节也太爽了(『虞书欣』 刺杀小说家)

云初令》里的红衣骑射主母上线,既飒又甜的日常简直把我的期待值拉满,看完之后我就想大喊:重生后的我,居然能在古代当主母,过得如此爽快! 说到『虞书欣』这次的主母造型,真的是超乎我的想象,简直杀疯了!休息时,她…

杀疯了!『虞书欣』红衣骑射plog封神,重生主母的腊八节也太爽了(『虞书欣』 刺杀小说家)

罗德与施瓦茨FSH30FSH20FSH3手持式频谱分析仪2026年的性价比如何?(罗德与施瓦茨FSH3手持频谱分析仪)

2026年选择罗德与施瓦茨FSH系列手持式频谱分析仪?本文为你深度解读性能特点、应用场景、配置差异、预算分配等关键要素。从复杂电信系统维护到高校实验室测试,FSH系列究竟值不值得入手?预算有限时该如何选型?帮你找到最合适的方案。

罗德与施瓦茨FSH30FSH20FSH3手持式频谱分析仪2026年的性价比如何?(罗德与施瓦茨FSH3手持频谱分析仪)