收集全球10,000⁺个好用的AI软件
-
SRMSRM是一种基于去噪生成模型的空间推理框架,用于处理连续变量集合的推理任务。它通过为每个未观测变量分配独立的噪声水平,逐步推断出这些变量的连续表示。该...
-
SV4DStable Video 4D (SV4D) 是基于 Stable Video Diffusion (SVD) 和 Stable Video 3D (...
-
Stable Video Diffusion 1.1 Image-to-VideoStable Video Diffusion (SVD) 1.1 Image-to-Video 是一个扩散模型,通过将静止图像作为条件帧,生成相应的视...
-
SV4DStable Video 4D (SV4D) 是基于 Stable Video Diffusion (SVD) 和 Stable Video 3D (...
-
Stable Diffusion 3.5 MediumStable Diffusion 3.5 Medium是一个基于文本到图像的生成模型,由Stability AI开发,具有改进的图像质量、排版、复杂提...
-
MusenetMuseNet是一个深度神经网络模型,可以生成4分钟的音乐作品,使用10种不同的乐器,并且可以结合多种音乐风格,从乡村到莫扎特再到披头士。MuseNe...
-
StemGenStemGen是一款端到端音乐生成模型,训练成能够聆听音乐背景并做出适当回应的模型。它建立在非自回归语言模型类型的架构上,类似于SoundStorm和...
-
FluxMusicFluxMusic是一个基于PyTorch实现的文本到音乐生成模型,它通过扩散式修正流变换器探索了一种简单的文本到音乐生成方法。这个模型可以生成根据文...
-
MaskVATMaskVAT是一种视频到音频(V2A)生成模型,它利用视频的视觉特征来生成与场景匹配的逼真声音。该模型特别强调声音的起始点与视觉动作的同步性,以避免...
-
FlexRAGFlexRAG是一个用于检索增强生成(RAG)任务的灵活且高性能的框架。它支持多模态数据、无缝配置管理和开箱即用的性能,适用于研究和原型开发。该框架使...
-
豆包3D生成模型是什么?一文让你看懂豆包3D生成模型的技术原理、主要功能、应用场景豆包3D生成模型概述简介 豆包3D生成模型是豆包推出的3D生成模型,属于豆包大模型家族。模型基于3D-DiT 架构,能生成高质量 3D 模块。与火山...
-
豆包3D生成模型是什么?一文让你看懂豆包3D生成模型的技术原理、主要功能、应用场景豆包3D生成模型概述简介 豆包3D生成模型是豆包推出的3D生成模型,属于豆包大模型家族。模型基于3D-DiT 架构,能生成高质量 3D 模块。与火山...