LanDiff是什么?一文让你看懂LanDiff的技术原理、主要功能、应用场景
LanDiff概述简介
LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言大模型(LLM)和扩散模型(Diffusion Model)的优势,通过粗到细的生成方式,有效克服了单一方法在语义理解和视觉质量上的局限性。在VBench T2V基准测试中取得了85.43的高分,超越了包括13B的Hunyuan Video在内的多个开源和商业模型。LanDiff的功能特色高效语义压缩:通过语义标记器将3D视觉特征压缩为1D离散表示...
AI工具评测
2025-04-05