收集全球10,000⁺个好用的AI软件
-
书生·筑梦2.0(Vchitect 2.0)是什么?一文让你看懂书生·筑梦2.0(Vchitect 2.0)的技术原理、主要功能、应用场景书生·筑梦2.0概述简介 书生·筑梦2.0(Vchitect 2.0)是由上海人工智能实验室推出的升级版视频生成开源大模型,旨在生成符合中国文化和东... -
SwiftBrush V2是什么?一文让你看懂SwiftBrush V2的技术原理、主要功能、应用场景SwiftBrush V2概述简介 SwiftBrush V2 是文本到图像的单步扩散模型,通过改进训练方法和模型融合技术,实现与多步Stable ... -
FineVideo是什么?一文让你看懂FineVideo的技术原理、主要功能、应用场景FineVideo概述简介 FineVideo是由Hugging Face推出的一个大型多模态视频数据集,专注于视频理解领域中的复杂任务,如情绪分析... -
Void是什么?一文让你看懂Void的技术原理、主要功能、应用场景Void概述简介 Void 是基于 Visual Studio Code 构建的开源AI辅助编程工具,集成AI技术增强编程体验。Void支持代码自动... -
CogVideoX-5B-I2V是什么?一文让你看懂CogVideoX-5B-I2V的技术原理、主要功能、应用场景CogVideoX-5B-I2V概述简介 CogVideoX-5B-I2V 是智谱 AI 开源的一款图生视频模型,通过一张图片和文本提示词生成视频。... -
CogVideoX-Fun是什么?一文让你看懂CogVideoX-Fun的技术原理、主要功能、应用场景CogVideoX-Fun概述简介 CogVideoX-Fun是一个基于CogVideoX结合EasyAnimate修改的AI视频生成整合包,提供了... -
LVCD是什么?一文让你看懂LVCD的技术原理、主要功能、应用场景LVCD概述简介 LVCD(Large Video Color Diffusion)是一个专为动画视频线稿上色设计的视频扩散框架,能将黑白线稿自动转... -
I2VEdit是什么?一文让你看懂I2VEdit的技术原理、主要功能、应用场景I2VEdit概述简介 I2VEdit是一个先进的视频编辑框架,通过图像到视频的扩散模型实现首帧引导的视频编辑。用户只需编辑视频的第一帧,I2VEd... -
Seed-VC是什么?一文让你看懂Seed-VC的技术原理、主要功能、应用场景Seed-VC概述简介 Seed-VC 是一种零样本声音转换技术,基于上下文学习实现高质量的音频输出和音色相似度。用户无需进行特定训练,只需提供1到... -
Mini-LLaVA是什么?一文让你看懂Mini-LLaVA的技术原理、主要功能、应用场景Mini-LLaVA概述简介 Mini-LLaVA是一款轻量级的多模态大语言大模型,由清华大学和北京航空航天大学的研究团队联合开发。能处理图像、文本... -
CogView3是什么?一文让你看懂CogView3的技术原理、主要功能、应用场景CogView3概述简介 CogView3是清华大学联合智谱AI推出的开源AI图像生成模型,采用中继扩散技术。模型分阶段生成图像,首先创建低分辨率图... -
VirtualWife是什么?一文让你看懂VirtualWife的技术原理、主要功能、应用场景VirtualWife概述简介 VirtualWife是一个创新的虚拟数字人项目,专注于开发具有AI的虚拟角色。角色设计用于在B站等直播平台上进行互... -
VideoLingo是什么?一文让你看懂VideoLingo的技术原理、主要功能、应用场景VideoLingo概述简介 VideoLingo 是一款一键全自动视频翻译工具,能将视频进行字幕切割、翻译、对齐和配音,最终生成 Netflix ... -
CatVTON是什么?一文让你看懂CatVTON的技术原理、主要功能、应用场景CatVTON概述简介 CatVTON是一种先进的虚拟试衣技术,由中山大学和Pixocial联合推出。基于轻量化的架构和高效的训练策略,实现高质量的... -
Boow-VTON是什么?一文让你看懂Boow-VTON的技术原理、主要功能、应用场景Boow-VTON概述简介 Boow-VTON是阿里巴巴推出的一种先进的虚拟试衣技术。能在野外场景中实现高质量的虚拟试衣效果,无需依赖精确的遮罩或修... -
TinyVLA是什么?一文让你看懂TinyVLA的技术原理、主要功能、应用场景TinyVLA概述简介 TinyVLA是一种面向机器人操控的视觉-语言-动作(VLA)模型,由华东师范大学和上海大学团队推出。针对现有VLA模型的不... -
ScriptViz是什么?一文让你看懂ScriptViz的技术原理、主要功能、应用场景ScriptViz概述简介 ScriptViz是由斯坦福大学开发人员推出的一款剧本可视化辅助工具,基于大型电影数据库MovieNet,根据剧本文本和... -
T2V-Turbo是什么?一文让你看懂T2V-Turbo的技术原理、主要功能、应用场景T2V-Turbo概述简介 T2V-Turbo是一种先进的文本到视频生成模型,由Google、UC Santa Barbara(加利福尼亚大学圣塔芭... -
VideoAgent是什么?一文让你看懂VideoAgent的技术原理、主要功能、应用场景VideoAgent概述简介 VideoAgent是一种自改进的视频生成系统,由斯坦福大学、滑铁卢大学、DeepMind等机构的开发人员一起推出。根... -
GLM-4-Voice是什么?一文让你看懂GLM-4-Voice的技术原理、主要功能、应用场景GLM-4-Voice概述简介 GLM-4-Voice是智谱AI推出的端到端情感语音模型,能直接理解和生成中英文语音,支持实时语音对话,能根据用户指...