Muse是什么?一文让你看懂Muse的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

Muse概述简介

Muse是微软推出的首个用在游戏创意生成的生成式AI大模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习人类玩家的游戏数据(如图像和操作指令)模拟真实的游戏玩法序列。核心能力包括生成连贯一致的游戏画面、展现多样化的游戏路径以及将用户修改融入生成内容中。Muse基于WHAM Demonstrator提供交互界面,支持创意探索和迭代。微软已开源Muse的权重和样本数据,推动游戏创意生成的研究和创新,为未来的AI驱动游戏开发提供支持。

Muse的功能特色

生成连贯的游戏视觉和玩法:根据初始的游戏画面和控制器操作,生成长达数分钟的连贯游戏玩法序列,模拟真实的游戏动态。

支持多样化的游戏路径:在相同的初始提示下,生成多种不同的游戏玩法和视觉效果,展现丰富的行为和视觉多样性。

持久化用户修改:将用户对游戏画面的修改(如添加角色)融入生成的内容中,生成合理的后续玩法。

创意迭代支持:基于WHAM Demonstrator界面,用户能加载初始画面、调整生成内容,并基于控制器操作引导角色,实现创意的快速迭代。

Muse的技术原理

VQ-GAN:用在将游戏视觉(如游戏画面)编码为离散的表示形式。VQ-GAN基于量化的方式将图像转换为离散的标记(tokens),便于模型处理。

Transformer架构:作为模型的主干网络,用于预测下一步的标记。Transformer能处理离散的视觉和操作序列,捕捉它们之间的复杂关系。

自回归生成:模型基于给定的初始提示(如初始游戏画面或控制器操作),逐步生成后续的视觉和操作序列。每一步的输出都依赖于前面的上下文,确保生成的序列具有连贯性和一致性。

训练数据:Muse基于《Bleeding Edge》游戏的玩家操作和视觉数据进行训练。数据包括玩家的控制器操作和对应的游戏画面,模型基于学习这些数据生成新的游戏序列。

Muse项目介绍

项目官网:https://www.microsoft.com/en-us/research/blog/introducing-muse

HuggingFace模型库:https://huggingface.co/microsoft/wham

技术论文:https://www.nature.com/articles/s41586-025-08600-3

Muse能做什么?

游戏创意探索:快速生成游戏玩法和关卡设计,帮助开发者验证新创意。

自动化游戏测试:生成多样化的测试序列,检测游戏漏洞和优化体验。

内容生成:自动生成新的关卡、地图或角色动作,丰富游戏内容。

玩家行为预测:模拟玩家操作,分析行为模式,优化游戏设计。

AI驱动体验:开发动态剧情和AI对手,提升游戏的个性化和沉浸感。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • Mistral-Large-Instruct-2407
    Mistral-Large-Instruct-2407 Mistral-Large-Instruct-2407是一个拥有123B参数的先进大型语言模型(LLM),具备最新的推理、知识和编程能力。它支持多语言...
  • OpenAI o1 API
    OpenAI o1 API OpenAI o1 是一个高性能的AI模型,旨在处理复杂的多步骤任务,并提供先进的准确性。它是o1-preview的后继产品,已经用于构建代理应用程序...
  • bubble
    bubble Bubble是一个无代码平台,可有效地构建数字产品。它使用户能够快速,轻松地创建应用程序而无需编写任何代码。气泡是可用的最强大的无代码平台,使您可以比...
  • Audeus
    Audeus Audeus for Chrome是一款文本转语音的Chrome浏览器扩展程序,它通过使用人工智能技术,将网页、文档等文本内容转化为语音,帮助用户在阅...
  • DTiQ
    DTiQ DTiQ是全球领先的智能视频监控和损失预防解决方案提供商,为餐厅、便利店和零售商提供服务。产品结合了智能视频、高级分析和专业服务,帮助客户提高绩效和改...
  • Apply
    Apply Apply是一个招聘流程优化平台,提供招聘方案构建和职业指导服务,帮助企业快速找到合适的候选人,同时帮助求职者脱颖而出。...
  • CopyWeb
    CopyWeb CopyWeb 是一款创新的 AI 驱动的网页设计转换工具,能够将网页设计截图、网站 URL 或 Figma 设计直接转换为生产就绪的代码。它通过智能...
  • PDF Flex | AI Chat with PDF
    PDF Flex | AI Chat with PDF PDF Flex是一款能够帮助用户转换PDF文件格式并与PDF进行即时聊天的工具。它可以将PDF文件转换成多种格式,并且可以向PDF提问问题并立即获得...