V

首页 > V

VideoPrism是什么？一文让你看懂VideoPrism的技术原理、主要功能、应用场景

VideoPrism概述简介 VideoPrism是一个由谷歌研究团队开发的通用视频编码器，旨在通过一个单一的预训练模型来处理多种视频理解任务。该模...
GPT-SoVITS是什么？一文让你看懂GPT-SoVITS的技术原理、主要功能、应用场景

GPT-SoVITS概述简介 GPT-SoVITS是一个开源的声音克隆项目，由B站UP主、RVC变声器创始人花儿不哭推出，该语音合成工具结合了GPT...
Snap Video是什么？一文让你看懂Snap Video的技术原理、主要功能、应用场景

Snap Video概述简介 Snap Video是由Snap（社交媒体Snapchat所属的公司）研究团队开发的一个AI视频生成模型，目标是通过文...
AtomoVideo是什么？一文让你看懂AtomoVideo的技术原理、主要功能、应用场景

AtomoVideo概述简介 AtomoVideo是由阿里巴巴的研究团队提出的一个高保真图像到视频（Image-to-Video, I2V）生成框架...
VLOGGER是什么？一文让你看懂VLOGGER的技术原理、主要功能、应用场景

VLOGGER概述简介 VLOGGER AI是谷歌的研究团队开发的一个多模态扩散模型，专门用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频...
Stable Video 3D (SV3D)是什么？一文让你看懂Stable Video 3D (SV3D)的技术原理、主要功能、应用场景

Stable Video 3D概述简介 Stable Video 3D（简称SV3D）是由Stability AI公司开发的一个多视角合成和3D生成...
StreamingT2V是什么？一文让你看懂StreamingT2V的技术原理、主要功能、应用场景

StreamingT2V概述简介 StreamingT2V是由PicsArt AI研究团队推出的一个文本到视频的生成模型，旨在解决现有模型仅能生成1...
VoiceCraft是什么？一文让你看懂VoiceCraft的技术原理、主要功能、应用场景

VoiceCraft概述简介 VoiceCraft是一个由德克萨斯大学奥斯汀分校研究团队开源的神经编解码器语言大模型，专注于零样本语音编辑和文本到语...
Voice Engine是什么？一文让你看懂Voice Engine的技术原理、主要功能、应用场景

Voice Engine概述简介 Voice Engine是OpenAI最新公布的一项AI语音合成和声音克隆技术，能够利用简短的15秒音频样本和文本...
VASA-1是什么？一文让你看懂VASA-1的技术原理、主要功能、应用场景

VASA-1概述简介 VASA-1是由微软亚洲研究院提出的一个将静态照片转换为对口型动态视频的生成框架，能够根据单张静态人脸照片和一段语音音频，实时...
IDM-VTON是什么？一文让你看懂IDM-VTON的技术原理、主要功能、应用场景

IDM-VTON概述简介 IDM-VTON（Improved Diffusion Models for Virtual Try-ON）是由韩国科学技...
VideoGigaGAN是什么？一文让你看懂VideoGigaGAN的技术原理、主要功能、应用场景

VideoGigaGAN概述简介 VideoGigaGAN是由Adobe和马里兰大学的开发人员提出的一种新型的生成式视频超分辨率（VSR）模型，最高...
Veo是什么？一文让你看懂Veo的技术原理、主要功能、应用场景

Veo概述简介 Veo是由Google DeepMind开发的一款视频生成模型，用户可以通过文本、图像或视频提示来指导其生成所需的视频内容，能够生成...
CogVLM2是什么？一文让你看懂CogVLM2的技术原理、主要功能、应用场景

CogVLM2概述简介 CogVLM2是由智谱AI推出的新一代多模态大模型，在视觉和语言理解方面实现了显著的性能提升，支持高达8K的文本长度和134...
ExVideo是什么？一文让你看懂ExVideo的技术原理、主要功能、应用场景

ExVideo概述简介 ExVideo是由阿里巴巴和华东师大的开发人员推出的一种视频合成模型的后调优技术，能够扩展现有视频合成模型的时间尺度，以生成...
MOFA-Video是什么？一文让你看懂MOFA-Video的技术原理、主要功能、应用场景

MOFA-Video概述简介 MOFA-Video是由腾讯AI实验室和东京大学的开发人员开源的一个可控性的图像生成视频的模型，该技术利用生成运动场适...
CogVideoX是什么？一文让你看懂CogVideoX的技术原理、主要功能、应用场景

CogVideoX概述简介 CogVideoX是智谱AI最新推出的开源AI视频生成模型，与智谱AI的商业产品“清影”同源。CogVideoX支持英文...
PhotoMaker V2是什么？一文让你看懂PhotoMaker V2的技术原理、主要功能、应用场景

PhotoMaker V2概述简介PhotoMaker V2是腾讯推出的AI图像生成框架，能在极短的时间内生成逼真的人物照片。与初代相比，V2版本在...
MiniCPM-V是什么？一文让你看懂MiniCPM-V的技术原理、主要功能、应用场景

MiniCPM-V概述简介 MiniCPM-V是面壁智能推出的开源多模态大模型，拥有80亿参数，擅长图像和视频理解。MiniCPM-V在单图像理解上...
VideoDoodles是什么？一文让你看懂VideoDoodles的技术原理、主要功能、应用场景

VideoDoodles概述简介 VideoDoodles是Adobe公司联合多所大学推出的AI视频编辑框架。支持用户在视频中轻松插入手绘动画，实现...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL