V

首页 > V

书生·筑梦2.0（Vchitect 2.0）是什么？一文让你看懂书生·筑梦2.0（Vchitect 2.0）的技术原理、主要功能、应用场景

书生·筑梦2.0概述简介书生·筑梦2.0（Vchitect 2.0）是由上海人工智能实验室推出的升级版视频生成开源大模型，旨在生成符合中国文化和东...
SwiftBrush V2是什么？一文让你看懂SwiftBrush V2的技术原理、主要功能、应用场景

SwiftBrush V2概述简介 SwiftBrush V2 是文本到图像的单步扩散模型，通过改进训练方法和模型融合技术，实现与多步Stable ...
FineVideo是什么？一文让你看懂FineVideo的技术原理、主要功能、应用场景

FineVideo概述简介 FineVideo是由Hugging Face推出的一个大型多模态视频数据集，专注于视频理解领域中的复杂任务，如情绪分析...
Void是什么？一文让你看懂Void的技术原理、主要功能、应用场景

Void概述简介 Void 是基于 Visual Studio Code 构建的开源AI辅助编程工具，集成AI技术增强编程体验。Void支持代码自动...
CogVideoX-5B-I2V是什么？一文让你看懂CogVideoX-5B-I2V的技术原理、主要功能、应用场景

CogVideoX-5B-I2V概述简介 CogVideoX-5B-I2V 是智谱 AI 开源的一款图生视频模型，通过一张图片和文本提示词生成视频。...
CogVideoX-Fun是什么？一文让你看懂CogVideoX-Fun的技术原理、主要功能、应用场景

CogVideoX-Fun概述简介 CogVideoX-Fun是一个基于CogVideoX结合EasyAnimate修改的AI视频生成整合包，提供了...
LVCD是什么？一文让你看懂LVCD的技术原理、主要功能、应用场景

LVCD概述简介 LVCD（Large Video Color Diffusion）是一个专为动画视频线稿上色设计的视频扩散框架，能将黑白线稿自动转...
I2VEdit是什么？一文让你看懂I2VEdit的技术原理、主要功能、应用场景

I2VEdit概述简介 I2VEdit是一个先进的视频编辑框架，通过图像到视频的扩散模型实现首帧引导的视频编辑。用户只需编辑视频的第一帧，I2VEd...
Seed-VC是什么？一文让你看懂Seed-VC的技术原理、主要功能、应用场景

Seed-VC概述简介 Seed-VC 是一种零样本声音转换技术，基于上下文学习实现高质量的音频输出和音色相似度。用户无需进行特定训练，只需提供1到...
Mini-LLaVA是什么？一文让你看懂Mini-LLaVA的技术原理、主要功能、应用场景

Mini-LLaVA概述简介 Mini-LLaVA是一款轻量级的多模态大语言大模型，由清华大学和北京航空航天大学的研究团队联合开发。能处理图像、文本...
CogView3是什么？一文让你看懂CogView3的技术原理、主要功能、应用场景

CogView3概述简介 CogView3是清华大学联合智谱AI推出的开源AI图像生成模型，采用中继扩散技术。模型分阶段生成图像，首先创建低分辨率图...
VirtualWife是什么？一文让你看懂VirtualWife的技术原理、主要功能、应用场景

VirtualWife概述简介 VirtualWife是一个创新的虚拟数字人项目，专注于开发具有AI的虚拟角色。角色设计用于在B站等直播平台上进行互...
VideoLingo是什么？一文让你看懂VideoLingo的技术原理、主要功能、应用场景

VideoLingo概述简介 VideoLingo 是一款一键全自动视频翻译工具，能将视频进行字幕切割、翻译、对齐和配音，最终生成 Netflix ...
CatVTON是什么？一文让你看懂CatVTON的技术原理、主要功能、应用场景

CatVTON概述简介 CatVTON是一种先进的虚拟试衣技术，由中山大学和Pixocial联合推出。基于轻量化的架构和高效的训练策略，实现高质量的...
Boow-VTON是什么？一文让你看懂Boow-VTON的技术原理、主要功能、应用场景

Boow-VTON概述简介 Boow-VTON是阿里巴巴推出的一种先进的虚拟试衣技术。能在野外场景中实现高质量的虚拟试衣效果，无需依赖精确的遮罩或修...
TinyVLA是什么？一文让你看懂TinyVLA的技术原理、主要功能、应用场景

TinyVLA概述简介 TinyVLA是一种面向机器人操控的视觉-语言-动作（VLA）模型，由华东师范大学和上海大学团队推出。针对现有VLA模型的不...
ScriptViz是什么？一文让你看懂ScriptViz的技术原理、主要功能、应用场景

ScriptViz概述简介 ScriptViz是由斯坦福大学开发人员推出的一款剧本可视化辅助工具，基于大型电影数据库MovieNet，根据剧本文本和...
T2V-Turbo是什么？一文让你看懂T2V-Turbo的技术原理、主要功能、应用场景

T2V-Turbo概述简介 T2V-Turbo是一种先进的文本到视频生成模型，由Google、UC Santa Barbara（加利福尼亚大学圣塔芭...
VideoAgent是什么？一文让你看懂VideoAgent的技术原理、主要功能、应用场景

VideoAgent概述简介 VideoAgent是一种自改进的视频生成系统，由斯坦福大学、滑铁卢大学、DeepMind等机构的开发人员一起推出。根...
GLM-4-Voice是什么？一文让你看懂GLM-4-Voice的技术原理、主要功能、应用场景

GLM-4-Voice概述简介 GLM-4-Voice是智谱AI推出的端到端情感语音模型，能直接理解和生成中英文语音，支持实时语音对话，能根据用户指...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL