Muse是什么?一文让你看懂Muse的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

Muse概述简介

Muse是微软推出的首个用在游戏创意生成的生成式AI大模型,基于“World and Human Action Model”(WHAM)。Muse能生成游戏视觉效果和控制器操作,基于学习人类玩家的游戏数据(如图像和操作指令)模拟真实的游戏玩法序列。核心能力包括生成连贯一致的游戏画面、展现多样化的游戏路径以及将用户修改融入生成内容中。Muse基于WHAM Demonstrator提供交互界面,支持创意探索和迭代。微软已开源Muse的权重和样本数据,推动游戏创意生成的研究和创新,为未来的AI驱动游戏开发提供支持。

Muse的功能特色

生成连贯的游戏视觉和玩法:根据初始的游戏画面和控制器操作,生成长达数分钟的连贯游戏玩法序列,模拟真实的游戏动态。

支持多样化的游戏路径:在相同的初始提示下,生成多种不同的游戏玩法和视觉效果,展现丰富的行为和视觉多样性。

持久化用户修改:将用户对游戏画面的修改(如添加角色)融入生成的内容中,生成合理的后续玩法。

创意迭代支持:基于WHAM Demonstrator界面,用户能加载初始画面、调整生成内容,并基于控制器操作引导角色,实现创意的快速迭代。

Muse的技术原理

VQ-GAN:用在将游戏视觉(如游戏画面)编码为离散的表示形式。VQ-GAN基于量化的方式将图像转换为离散的标记(tokens),便于模型处理。

Transformer架构:作为模型的主干网络,用于预测下一步的标记。Transformer能处理离散的视觉和操作序列,捕捉它们之间的复杂关系。

自回归生成:模型基于给定的初始提示(如初始游戏画面或控制器操作),逐步生成后续的视觉和操作序列。每一步的输出都依赖于前面的上下文,确保生成的序列具有连贯性和一致性。

训练数据:Muse基于《Bleeding Edge》游戏的玩家操作和视觉数据进行训练。数据包括玩家的控制器操作和对应的游戏画面,模型基于学习这些数据生成新的游戏序列。

Muse项目介绍

项目官网:https://www.microsoft.com/en-us/research/blog/introducing-muse

HuggingFace模型库:https://huggingface.co/microsoft/wham

技术论文:https://www.nature.com/articles/s41586-025-08600-3

Muse能做什么?

游戏创意探索:快速生成游戏玩法和关卡设计,帮助开发者验证新创意。

自动化游戏测试:生成多样化的测试序列,检测游戏漏洞和优化体验。

内容生成:自动生成新的关卡、地图或角色动作,丰富游戏内容。

玩家行为预测:模拟玩家操作,分析行为模式,优化游戏设计。

AI驱动体验:开发动态剧情和AI对手,提升游戏的个性化和沉浸感。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • AISmartCube
    AISmartCube AISmartCube是一个低代码AI工具平台,提供图形化操作界面和丰富的官方模板,支持用户轻松实现工作场景自动化,提升工作效率。平台集成了全球多家大...
  • Taloflow
    Taloflow Taloflow是一个旨在简化技术供应商选择流程的在线平台,它通过使用AI和专家协作工具,帮助企业在云数据库管理、数据集成、ERP、CRM等多个领域快...
  • Tipsy
    Tipsy Tipsy Chat是一个人工智能酒馆,通过与AI伙伴对话,让您的聊天体验更加有趣和富有创造力。它可以用于休闲娱乐、创造艺术、玩AI游戏等,提供多种角...
  • Awesome-LLM-Post-training
    Awesome-LLM-Post-training Awesome-LLM-Post-training 是一个专注于大型语言模型(LLM)后训练方法的资源库。它提供了关于 LLM 后训练的深入研究,包括...
  • Affirm
    Affirm Affirm是一款通过最新的自然语言处理技术生成正能量肯定语句的工具。无论是心碎、挫折还是失败,生活总是充满挑战。Affirm通过生成积极肯定的语句来...
  • Crackerjack Resume
    Crackerjack Resume Crackerjack Resume是一款专业的简历定制插件,帮助您将最合适的经验置于每份求职申请的核心。采用人工智能技术,Crackerjack R...
  • Stable Audio Open
    Stable Audio Open Stable Audio Open是一个开源的文本到音频模型,专为生成短音频样本、音效和制作元素而优化。它允许用户通过简单的文本提示生成高达47秒的高...
  • 天工
    天工 天工是昆仑万维基于自研双千亿级大语言模型的人工智能产品,提供六大能力,六大领域数百种功能,包括生成创作、知识问答、规划决策、语言理解、代码能力和逻辑能...