收集全球10,000⁺个好用的AI软件
-
VideoPrism是什么?一文让你看懂VideoPrism的技术原理、主要功能、应用场景VideoPrism概述简介 VideoPrism是一个由谷歌研究团队开发的通用视频编码器,旨在通过一个单一的预训练模型来处理多种视频理解任务。该模... -
GPT-SoVITS是什么?一文让你看懂GPT-SoVITS的技术原理、主要功能、应用场景GPT-SoVITS概述简介 GPT-SoVITS是一个开源的声音克隆项目,由B站UP主、RVC变声器创始人花儿不哭推出,该语音合成工具结合了GPT... -
Snap Video是什么?一文让你看懂Snap Video的技术原理、主要功能、应用场景Snap Video概述简介 Snap Video是由Snap(社交媒体Snapchat所属的公司)研究团队开发的一个AI视频生成模型,目标是通过文... -
AtomoVideo是什么?一文让你看懂AtomoVideo的技术原理、主要功能、应用场景AtomoVideo概述简介 AtomoVideo是由阿里巴巴的研究团队提出的一个高保真图像到视频(Image-to-Video, I2V)生成框架... -
VLOGGER是什么?一文让你看懂VLOGGER的技术原理、主要功能、应用场景VLOGGER概述简介 VLOGGER AI是谷歌的研究团队开发的一个多模态扩散模型,专门用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频... -
Stable Video 3D (SV3D)是什么?一文让你看懂Stable Video 3D (SV3D)的技术原理、主要功能、应用场景Stable Video 3D概述简介 Stable Video 3D(简称SV3D)是由Stability AI公司开发的一个多视角合成和3D生成... -
StreamingT2V是什么?一文让你看懂StreamingT2V的技术原理、主要功能、应用场景StreamingT2V概述简介 StreamingT2V是由PicsArt AI研究团队推出的一个文本到视频的生成模型,旨在解决现有模型仅能生成1... -
VoiceCraft是什么?一文让你看懂VoiceCraft的技术原理、主要功能、应用场景VoiceCraft概述简介 VoiceCraft是一个由德克萨斯大学奥斯汀分校研究团队开源的神经编解码器语言大模型,专注于零样本语音编辑和文本到语... -
Voice Engine是什么?一文让你看懂Voice Engine的技术原理、主要功能、应用场景Voice Engine概述简介 Voice Engine是OpenAI最新公布的一项AI语音合成和声音克隆技术,能够利用简短的15秒音频样本和文本... -
VASA-1是什么?一文让你看懂VASA-1的技术原理、主要功能、应用场景VASA-1概述简介 VASA-1是由微软亚洲研究院提出的一个将静态照片转换为对口型动态视频的生成框架,能够根据单张静态人脸照片和一段语音音频,实时... -
IDM-VTON是什么?一文让你看懂IDM-VTON的技术原理、主要功能、应用场景IDM-VTON概述简介 IDM-VTON(Improved Diffusion Models for Virtual Try-ON)是由韩国科学技... -
VideoGigaGAN是什么?一文让你看懂VideoGigaGAN的技术原理、主要功能、应用场景VideoGigaGAN概述简介 VideoGigaGAN是由Adobe和马里兰大学的开发人员提出的一种新型的生成式视频超分辨率(VSR)模型,最高... -
Veo是什么?一文让你看懂Veo的技术原理、主要功能、应用场景Veo概述简介 Veo是由Google DeepMind开发的一款视频生成模型,用户可以通过文本、图像或视频提示来指导其生成所需的视频内容,能够生成... -
CogVLM2是什么?一文让你看懂CogVLM2的技术原理、主要功能、应用场景CogVLM2概述简介 CogVLM2是由智谱AI推出的新一代多模态大模型,在视觉和语言理解方面实现了显著的性能提升,支持高达8K的文本长度和134... -
ExVideo是什么?一文让你看懂ExVideo的技术原理、主要功能、应用场景ExVideo概述简介 ExVideo是由阿里巴巴和华东师大的开发人员推出的一种视频合成模型的后调优技术,能够扩展现有视频合成模型的时间尺度,以生成... -
MOFA-Video是什么?一文让你看懂MOFA-Video的技术原理、主要功能、应用场景MOFA-Video概述简介 MOFA-Video是由腾讯AI实验室和东京大学的开发人员开源的一个可控性的图像生成视频的模型,该技术利用生成运动场适... -
CogVideoX是什么?一文让你看懂CogVideoX的技术原理、主要功能、应用场景CogVideoX概述简介 CogVideoX是智谱AI最新推出的开源AI视频生成模型,与智谱AI的商业产品“清影”同源。CogVideoX支持英文... -
PhotoMaker V2是什么?一文让你看懂PhotoMaker V2的技术原理、主要功能、应用场景PhotoMaker V2概述简介PhotoMaker V2是腾讯推出的AI图像生成框架,能在极短的时间内生成逼真的人物照片。与初代相比,V2版本在... -
MiniCPM-V是什么?一文让你看懂MiniCPM-V的技术原理、主要功能、应用场景MiniCPM-V概述简介 MiniCPM-V是面壁智能推出的开源多模态大模型,拥有80亿参数,擅长图像和视频理解。MiniCPM-V在单图像理解上... -
VideoDoodles是什么?一文让你看懂VideoDoodles的技术原理、主要功能、应用场景VideoDoodles概述简介 VideoDoodles是Adobe公司联合多所大学推出的AI视频编辑框架。支持用户在视频中轻松插入手绘动画,实现...