Muse是什么?一文让你看懂Muse的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

Muse概述简介

Muse是微软推出的首个用在游戏创意生成的生成式AI大模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习人类玩家的游戏数据(如图像和操作指令)模拟真实的游戏玩法序列。核心能力包括生成连贯一致的游戏画面、展现多样化的游戏路径以及将用户修改融入生成内容中。Muse基于WHAM Demonstrator提供交互界面,支持创意探索和迭代。微软已开源Muse的权重和样本数据,推动游戏创意生成的研究和创新,为未来的AI驱动游戏开发提供支持。

Muse的功能特色

生成连贯的游戏视觉和玩法:根据初始的游戏画面和控制器操作,生成长达数分钟的连贯游戏玩法序列,模拟真实的游戏动态。

支持多样化的游戏路径:在相同的初始提示下,生成多种不同的游戏玩法和视觉效果,展现丰富的行为和视觉多样性。

持久化用户修改:将用户对游戏画面的修改(如添加角色)融入生成的内容中,生成合理的后续玩法。

创意迭代支持:基于WHAM Demonstrator界面,用户能加载初始画面、调整生成内容,并基于控制器操作引导角色,实现创意的快速迭代。

Muse的技术原理

VQ-GAN:用在将游戏视觉(如游戏画面)编码为离散的表示形式。VQ-GAN基于量化的方式将图像转换为离散的标记(tokens),便于模型处理。

Transformer架构:作为模型的主干网络,用于预测下一步的标记。Transformer能处理离散的视觉和操作序列,捕捉它们之间的复杂关系。

自回归生成:模型基于给定的初始提示(如初始游戏画面或控制器操作),逐步生成后续的视觉和操作序列。每一步的输出都依赖于前面的上下文,确保生成的序列具有连贯性和一致性。

训练数据:Muse基于《Bleeding Edge》游戏的玩家操作和视觉数据进行训练。数据包括玩家的控制器操作和对应的游戏画面,模型基于学习这些数据生成新的游戏序列。

Muse项目介绍

项目官网:https://www.microsoft.com/en-us/research/blog/introducing-muse

HuggingFace模型库:https://huggingface.co/microsoft/wham

技术论文:https://www.nature.com/articles/s41586-025-08600-3

Muse能做什么?

游戏创意探索:快速生成游戏玩法和关卡设计,帮助开发者验证新创意。

自动化游戏测试:生成多样化的测试序列,检测游戏漏洞和优化体验。

内容生成:自动生成新的关卡、地图或角色动作,丰富游戏内容。

玩家行为预测:模拟玩家操作,分析行为模式,优化游戏设计。

AI驱动体验:开发动态剧情和AI对手,提升游戏的个性化和沉浸感。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • ai jinglemaker
    ai jinglemaker 使用AI Jinglemaker在几秒钟内为广播或播客介绍创建专业质量的叮当声。选择您的介绍,背景声音,然后使用AURO,然后使用AI来制作配音。 J...
  • Applio
    Applio Applio是一个开源生态系统,主要提供先进的AI语音克隆技术。它的主要优点是创新性、开放源代码和先进的AI语音克隆技术。Applio的背景信息是作为...
  • ComfyUI-GGUF
    ComfyUI-GGUF ComfyUI-GGUF是一个为ComfyUI原生模型提供GGUF量化支持的项目。它允许模型文件以GGUF格式存储,这种格式由llama.cpp推广。...
  • GiantCampaign
    GiantCampaign GiantCampaign是一款旨在帮助用户扩大受众并增加收入的数字营销工具。我们的工具可以帮助您提升销售,将邮件广告转化为真实销售。通过选择多个可定...
  • Coho AI
    Coho AI Coho AI 是一款专注于用户旅程优化和客户留存管理的人工智能平台。它通过分析用户数据,自动发现最有价值的客户,个性化他们的体验,并自动增加每个用户...
  • 法唠AI
    法唠AI 法唠AI,也称为法律人工智能,是一种结合了人工智能和法律领域的技术。它利用大语言模型预训练的机器人对法律知识和案例进行深度学习和分析,以提供法律咨询、...
  • OutfitAI.co
    OutfitAI.co OutfitAI.co是一个AI驱动的虚拟试衣间,专注于圣诞节服装。用户可以上传照片来试穿不同的圣诞节服装,体验AI技术的魅力。该网站处于早期测试阶段...
  • palette fm
    palette fm Palette.fm的AI图片彩色工具使您的照片带有鲜艳的色彩。只需几秒钟,您的图片就可以立即着色,而无需注册,节省您的时间和麻烦。立即开始以全彩方式...