MEMO是什么?一文让你看懂MEMO的技术原理、主要功能、应用场景
MEMO概述简介
MEMO(Memory-Guided EMOtionaware diffusion)是Skywork AI、南洋理工大学和新加坡国立大学推出的音频驱动肖像动画框架,用在生成具有身份一致性和表现力的说话视频。MEMO围绕两个核心模块构建:记忆引导的时间模块和情感感知音频模块。记忆引导模块通存储更长期的运动信息增强身份一致性和运动平滑性,情感感知模块用多模态注意力机制提升音频与视频的交互,根据音频中的情感来细化面部表情。MEMO在多种图像和...
AI工具评测
2025-04-05