Muse是什么?一文让你看懂Muse的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

Muse概述简介

Muse是微软推出的首个用在游戏创意生成的生成式AI大模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习人类玩家的游戏数据(如图像和操作指令)模拟真实的游戏玩法序列。核心能力包括生成连贯一致的游戏画面、展现多样化的游戏路径以及将用户修改融入生成内容中。Muse基于WHAM Demonstrator提供交互界面,支持创意探索和迭代。微软已开源Muse的权重和样本数据,推动游戏创意生成的研究和创新,为未来的AI驱动游戏开发提供支持。

Muse的功能特色

生成连贯的游戏视觉和玩法:根据初始的游戏画面和控制器操作,生成长达数分钟的连贯游戏玩法序列,模拟真实的游戏动态。

支持多样化的游戏路径:在相同的初始提示下,生成多种不同的游戏玩法和视觉效果,展现丰富的行为和视觉多样性。

持久化用户修改:将用户对游戏画面的修改(如添加角色)融入生成的内容中,生成合理的后续玩法。

创意迭代支持:基于WHAM Demonstrator界面,用户能加载初始画面、调整生成内容,并基于控制器操作引导角色,实现创意的快速迭代。

Muse的技术原理

VQ-GAN:用在将游戏视觉(如游戏画面)编码为离散的表示形式。VQ-GAN基于量化的方式将图像转换为离散的标记(tokens),便于模型处理。

Transformer架构:作为模型的主干网络,用于预测下一步的标记。Transformer能处理离散的视觉和操作序列,捕捉它们之间的复杂关系。

自回归生成:模型基于给定的初始提示(如初始游戏画面或控制器操作),逐步生成后续的视觉和操作序列。每一步的输出都依赖于前面的上下文,确保生成的序列具有连贯性和一致性。

训练数据:Muse基于《Bleeding Edge》游戏的玩家操作和视觉数据进行训练。数据包括玩家的控制器操作和对应的游戏画面,模型基于学习这些数据生成新的游戏序列。

Muse项目介绍

项目官网:https://www.microsoft.com/en-us/research/blog/introducing-muse

HuggingFace模型库:https://huggingface.co/microsoft/wham

技术论文:https://www.nature.com/articles/s41586-025-08600-3

Muse能做什么?

游戏创意探索:快速生成游戏玩法和关卡设计,帮助开发者验证新创意。

自动化游戏测试:生成多样化的测试序列,检测游戏漏洞和优化体验。

内容生成:自动生成新的关卡、地图或角色动作,丰富游戏内容。

玩家行为预测:模拟玩家操作,分析行为模式,优化游戏设计。

AI驱动体验:开发动态剧情和AI对手,提升游戏的个性化和沉浸感。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • ChessGPT
    ChessGPT 国际象棋GPT是一个基于OpenAI最新GPT模型的AI国际象棋对弈平台。用户可以和 ChatGPT下国际象棋,体验人机对弈的乐趣。平台提供多种难度级...
  • Pond5 Lullab.AI
    Pond5 Lullab.AI Pond5是全球最大的高清和4K库存视频库,同时还提供数百万音乐曲目、SFX、动态图形和图片。无论您是制作电影、广告、音乐视频还是其他创意项目,Pon...
  • Resume Worded
    Resume Worded 我们的在线简历和LinkedIn评估工具可以即时为您的简历和LinkedIn个人资料评分,并提供详细反馈,帮助您获得更多的机会和面试邀约。...
  • Strella
    Strella Strella是一个利用人工智能技术进行客户研究的平台,它通过AI主持的访谈和即时综合分析,帮助企业和研究人员快速做出更明智的决策。该产品的主要优点包...
  • Miniflow
    Miniflow Miniflow是一个AI工作流程自动化平台,它允许用户无需编写代码即可轻松创建和自动化各种AI工具的工作流程。该平台通过直观的拖放界面,提供了大量内...
  • DataMorf
    DataMorf DataMorf是一个B2B SaaS平台,专注于自动化数据管道和工作流程。它帮助企业无缝集成数据,执行实时数据转换,并减少手动流程。无论是数据增强、...
  • Sonix
    Sonix Sonix是一款在线音频和视频转录软件,采用行业领先的语音识别算法,能在几分钟内将音频和视频文件转换为文本。Sonix适用于转录播客、采访、演讲等各种...
  • PDDON
    PDDON 一款开源的在线画图工具,提供低代码和 AI 智能辅助工具。可用于绘制流程图、架构图、思维导图、UML、BPMN、网络拓扑图、ER图、数据库模型图、韦恩...