近日,微软在《自然》杂志上发表了一项关于游戏生成式AI的突破性研究成果,介绍了其名为“Muse”的世界和人类行为模型(WHAM),能够生成游戏视觉效果及对应玩家操作的反应。在公告中提到的各种Muse应用场景中,最引人注目的是游戏现代化机制——Muse能够研究经典游戏目录中的大量作品,并针对现代硬件进行优化,展现出通过新设备和新方式让未来一代玩家体验老游戏的潜力,同时增强创作者和玩家的能力,开创新的可能性。目前,他们正在Copilot Labs上提供简短的人工智能互动游戏体验。
然而,这一被称为“突破性”的技术进展似乎并未获得游戏开发者和各大社区的热烈欢迎。许多人在评论区表示“没人想要这个”,甚至有资深游戏开发者如The Outsiders的创始人David Goldfarb直接称其为“狗屎”。
据介绍,作为人工智能生成模型,Muse是首个在Ninja Theory的多人战斗竞技场游戏《Bleeding Edge》上训练的生成式AI模型,由Microsoft Research与位于英国剑桥的Xbox Game Studios的Ninja Theory合作开发。其突破性在于对3D游戏世界的全面了解,包括游戏物理学以及游戏对玩家控制器动作的反应。这使得该模型能够创建由AI渲染的一致且多样化的游戏玩法,向能够增强游戏创作者能力的生成式人工智能模型迈出了重要一步。
由Muse(基于WHAM-1.6B)生成的游戏序列示例显示,该模型可以在几分钟内生成一致的复杂游戏序列。所有示例都是通过向模型提示10个初始帧(1秒)的人类游戏和整个游戏序列的控制器动作生成的。Muse在“世界模型模式”下使用,即用来预测游戏将如何从初始提示序列演变而来。生成的游戏序列与实际游戏的相似度越高,说明Muse对游戏动态的捕捉越准确。
微软Xbox团队表示,尽管这项技术还处于早期阶段,但已突破了他们的想象。如今,与老化硬件相关的无数经典游戏已不再为大多数人所玩。得益于这一突破,他们正在探索Muse的潜力,可以从旧目录游戏中获取较旧的标题并针对任何设备进行优化。“我们相信,这可能会从根本上改变我们未来保存和体验经典游戏的方式,让更多玩家能够使用它们。”
此外,Xbox团队正在探索Muse如何帮助游戏团队在创作过程中设计新的游戏体验原型并引入新内容。他们正在开发一款“具备玩乐属性的实时AI模型”,在微软第一方游戏上进行训练。生成式AI有望在游戏开发的某些环节中发挥作用。在原型设计阶段,开发人员可以创建游戏的基础和迭代版本以实现自己的想法并制定最终愿景。微软表示,“我们期待这项工作最终能使玩家和游戏创作者都受益:从重振怀旧游戏到更快地进行创意构思。”
为了帮助其他研究人员探索这一模型并在其基础上更进一步,Xbox团队开放了Muse的权重和样本数据的来源,并为WHAM演示器提供了可执行文件。WHAM演示器概念原型提供了与WHAM模型交互的可视化界面和多种提示模型的方法,开发人员可以在Azure AI Foundry上学习和实验权重、样本数据和WHAM演示器。
对于Muse,Microsoft Research从一开始就探索生成式AI模型如何支持新体验,重点是开发人工智能能力使游戏开发人员能够以新的方式构思和扩展他们的作品。为了实现这一目标,他们采访了27位全球游戏创作者(从公司到AAA级游戏工作室),以确保研究是由使用它的人决定的。高级首席研究经理兼Microsoft Research Game Intelligence团队负责人Katja Hofmann表示,从一开始他们就让用户参与了进来。其与Teachable AI Experiences团队就工作的各个方面进行了几个月的讨论,并由Cecily、设计研究员Linda Wen和首席研究软件开发工程师Martin Grayson推动与游戏创作者合作调查这些创作者希望如何在他们的创作实践中使用生成式人工智能功能。
Cecily说:“这是一个很好的机会,我们可以在早期阶段联合起来,从一开始就塑造模型能力以满足创作者的需求而不是试图改造已经开发出来的技术。”Linda称:“我们已经看到技术驱动的AI创新经常让创作者措手不及让许多人感到被排斥。这就是为什么我们从一开始就邀请游戏创作者来帮助我们塑造这项技术。”微软还表示在工作中遇到了扩大模型训练规模等关键挑战。开始使用的是V100集群在该集群上他们证明了如何在多达100个GPU上进行扩展训练这最终为在H100上进行大规模训练铺平了道路。其早期做出的关键设计决定主要集中在如何更好地利用大型语言模型(LLM)社区的见解包括如何有效地表示对应玩家控制器操作尤其是图像等选择。
据了解当前的Muse实例是根据Xbox游戏《Bleeding Edge》中的人类游戏数据(视觉效果和控制器动作)进行训练的。训练当前模型时采用的分辨率为300×180 px。Muse(使用WHAM-1.6B)已在超过10亿张图像和对应玩家控制器操作上进行了训练相当于人类连续7年多的游戏时间。
尽管反馈迅速但开发者对Muse的评价并不积极甚至遭到抵制。一位开发者回应称“这类工具的涌现在为一部分人迅速赋能的同时却根本不在乎对其他人造成的巨大冲击。”David Goldfarb表示他觉得生成式AI对于电子游戏没什么好处。“因为无论是有意为之还是无心之举AI背后的推动者实际上都是在削减资本支出进而剥夺并贬低数百万游戏开发者和艺术家们所付出的汗水与心力。”他还提到“主要问题在于我们赖以生存的开发手艺正在消散。随着从业者越来越依赖AI技术这类工具的涌现在为一部分人迅速赋能的同时却根本不在乎对其他人造成的巨大冲击。”根据此前WIRED发起的一项调查发现AI技术正将人类从业者剥离出创作流程;而与此同时整个游戏行业也正在经历大规模收缩。过去几年间成千上万的开发人员遭到解雇且这一趋势将在2025年持续存在。虽然一部分开发者认为AI无法取代游戏中的纯创意部分但多数从业人士仍然担心随着AI新工具的迅速发展自己将无法在这个本就竞争激烈的行业中继续生存。微软的游戏部门似乎同样存在这种现象。一位3A游戏开发者(因未获准公开谈论Muse而要求保持匿名)透露“Xbox团队一边不断加大对生成式AI的投入另一方面却无视开发人才流失的关键问题属于典型的‘只见树木却不见森林’。他们没有意识到开发者们根本就不想要什么AI。”但之所以计划还能推进得下去就是因为大家不敢在内部讨论中表示反对不敢在这个行业动荡的关键时期因成为‘出头鸟’而失去工作。”另一家同样要求匿名的游戏开发商对此表示赞同称他们同样担心反对Muse会影响自己的工作和生计。“虽然只能匿名发言但这种东西真的太恶心了面对如今的游戏行业现状特别是考虑到我们还得求着微软提供游戏出版许可我实在不敢拿自己的身家性命来冒险。”这家开发商还提到“在我看来这种全面推广AI的模式绝不是为了帮助游戏开发者而是想取悦股东表明微软正在全力投入AI。”可与此同时他们却只字不提AI从未开发出任何广受好评的游戏作品。”英国游戏开发商Creative Assembly的开发总监Marc Burrage表示即便有大模型的加持计算机也无法在训练过程中获得与人类相同的知识。在Burrage看来“原型设计既关注过程也关注结果必须亲身体验才能把握可玩性这个近乎玄学的概念。”快速原型设计是一项宝贵的技能哪怕是提前做好一切准备也不存在百分百通往成功的捷径。”
在Muse的项目公告中Xbox团队方面称“我们认为最重要的是确保这波生成式AI技术突破能够以协作且负责任的方式支持我们的行业和游戏创作社区。”而从实际反馈来看微软要想说服游戏从业者们接下这张AI增效的“大饼”还有很多工作要做。一位网友直言“如果我们都失业了没有人会买你的游戏。”