收集全球10,000⁺个好用的AI软件
-
PaddleSpeech是什么?一文让你看懂PaddleSpeech的技术原理、主要功能、应用场景PaddleSpeech概述简介 PaddleSpeech 是百度飞桨团队开源的语音处理工具,提供全面的语音处理功能,包括语音识别、语音合成、声纹识...
-
ChatAnyone是什么?一文让你看懂ChatAnyone的技术原理、主要功能、应用场景ChatAnyone概述简介 ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入,生成具有丰富表情和上半身动作的...
-
Animate Anyone是什么?一文让你看懂Animate Anyone的技术原理、主要功能、应用场景Animate Anyone是由阿里巴巴智能计算研究院推出的一款将静态图像中的角色或人物进行动态化的开源框架,已在GitHub上斩获了近1.3万个星...
-
ReplaceAnything是什么?一文让你看懂ReplaceAnything的技术原理、主要功能、应用场景ReplaceAnything是由阿里巴巴智能计算研究院推出的一款开源AI图像内容替换框架,利用先进的人工智能技术,能够实现对照片或图像中物体的智能...
-
Outfit Anyone是什么?一文让你看懂Outfit Anyone的技术原理、主要功能、应用场景Outfit Anyone是由阿里巴巴智能计算研究院推出的一个高质量服装虚拟试穿的开源项目,借助该技术,用户或模特无需亲自试穿衣服即可预览上身效果。...
-
PhotoMaker是什么?一文让你看懂PhotoMaker的技术原理、主要功能、应用场景PhotoMaker V2概述简介PhotoMaker V2是腾讯推出的AI图像生成框架,能在极短的时间内生成逼真的人物照片。与初代相比,V2版本在...
-
FaceChain是什么?一文让你看懂FaceChain的技术原理、主要功能、应用场景FaceChain是阿里巴巴达摩院推出的一个开源的人物写真和个人数字形象的AI生成框架(类似于免费开源版的妙鸭相机),用户仅需要提供最少一张照片即可...
-
I2VGen-X是什么?一文让你看懂I2VGen-X的技术原理、主要功能、应用场景I2VGen-XL概述简介 I2VGen-XL 是阿里巴巴达摩院推出的一款开源的图像到视频的生成模型,通过创新的级联扩散方法,将文本视频数据与视频结...
-
MagicVideo-V2是什么?一文让你看懂MagicVideo-V2的技术原理、主要功能、应用场景MagicVideo-V2概述简介 MagicVideo-V2 是字节跳动公司团队开发的一款AI视频生成模型和框架,通过将文本到图像模型、视频运动生...
-
Motionshop是什么?一文让你看懂Motionshop的技术原理、主要功能、应用场景Motionshop概述简介 Motionshop是阿里巴巴智能计算研究院(XR实验室和TIDE三维渲染团队)推出的一个AI角色动画框架,可将视频中...
-
AnyText是什么?一文让你看懂AnyText的技术原理、主要功能、应用场景AnyText概述简介 AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型,专注于在图像中渲染准确和连贯的...
-
InstantID是什么?一文让你看懂InstantID的技术原理、主要功能、应用场景InstantID是一种基于扩散模型的图像生成技术,专注于实现零次(zero-shot)身份保留(Identity-Preserving)的个性化图...
-
VideoCrafter2是什么?一文让你看懂VideoCrafter2的技术原理、主要功能、应用场景VideoCrafter2 是什么? VideoCrafter2是一个由腾讯AI实验室开发的视频生成模型,旨在克服高质量视频数据获取的局限性,训练出...
-
Screenshot to Code是什么?一文让你看懂Screenshot to Code的技术原理、主要功能、应用场景Screenshot to Code概述简介 Sscreenshot to Code是一个开源的项目,利用人工智能技术(GPT-4V 和 DALL-...
-
DDColor是什么?一文让你看懂DDColor的技术原理、主要功能、应用场景DDColor概述简介 DDColor是阿里达摩院的开发人员推出的一个开源的AI图像着色框架,可以一键将黑白图片上色变为全彩图像。该方法通过使用双解...
-
Real-ESRGAN是什么?一文让你看懂Real-ESRGAN的技术原理、主要功能、应用场景Real-ESRGAN概述简介 Real-ESRGAN(Real-World Blind Super-Resolution with Pure Sy...
-
DemoFusion是什么?一文让你看懂DemoFusion的技术原理、主要功能、应用场景DemoFusion概述简介 DemoFusion是一个旨在低成本进行高分辨率图像生成的技术框架,通过扩展现有的开源生成人工智能模型(如Stable...
-
ActAnywhere是什么?一文让你看懂ActAnywhere的技术原理、主要功能、应用场景ActAnywhere概述简介 ActAnywhere是一个由斯坦福大学和Adobe Research的开发人员共同开发的视频生成模型,旨在解决视频...
-
Vary-toy是什么?一文让你看懂Vary-toy的技术原理、主要功能、应用场景Vary-toy概述简介 Vary-toy是一个小型的视觉语言大模型(LVLM),由来自旷视、国科大、华中大的开发人员共同提出,旨在解决大型视觉语言...
-
Lepton Search是什么?一文让你看懂Lepton Search的技术原理、主要功能、应用场景Lepton Search概述简介 Lepton Search是由原阿里巴巴技术副总裁和AI科学家贾扬清创办的Lepton AI应用构建平台开源的一...