收集全球10,000⁺个好用的AI软件
-
GPT-SoVITS是什么?一文让你看懂GPT-SoVITS的技术原理、主要功能、应用场景GPT-SoVITS概述简介 GPT-SoVITS是一个开源的声音克隆项目,由B站UP主、RVC变声器创始人花儿不哭推出,该语音合成工具结合了GPT...
-
OpenCodeInterpreter是什么?一文让你看懂OpenCodeInterpreter的技术原理、主要功能、应用场景OpenCodeInterpreter概述简介 OpenCodeInterpreter是一个开源的代码解释器系统,旨在通过利用大模型结合代码生成、执...
-
ChatMusician是什么?一文让你看懂ChatMusician的技术原理、主要功能、应用场景ChatMusician概述简介 ChatMusician是由Multimodal Art Projection Research Communit...
-
EMO是什么?一文让你看懂EMO的技术原理、主要功能、应用场景EMO概述简介 EMO(Emote Portrait Alive)是一个由阿里集团智能计算研究院的开发人员开发的框架,一个音频驱动的AI肖像视频生成...
-
StarCoder 2是什么?一文让你看懂StarCoder 2的技术原理、主要功能、应用场景StarCoder 2概述简介 StarCoder 2是由BigCode项目(Hugging Face和ServiceNow支持)联合Nvidia的...
-
MeloTTS是什么?一文让你看懂MeloTTS的技术原理、主要功能、应用场景MeloTTS概述简介 MeloTTS 是一个由 MyShell AI 开发的开源的高质量多语言文本转语音(TTS)库,能够将文本转换成自然流畅的语...
-
Snap Video是什么?一文让你看懂Snap Video的技术原理、主要功能、应用场景Snap Video概述简介 Snap Video是由Snap(社交媒体Snapchat所属的公司)研究团队开发的一个AI视频生成模型,目标是通过文...
-
LayerDiffusion是什么?一文让你看懂LayerDiffusion的技术原理、主要功能、应用场景LayerDiffusion概述简介 LayerDiffusion(现已更名为LayerDiffuse)是由来自斯坦福大学的开发人员 Lvmin Z...
-
TextDiffuser-2是什么?一文让你看懂TextDiffuser-2的技术原理、主要功能、应用场景TextDiffuser-2概述简介 Text-Diffuser 2是由来自微软研究院、香港科技大学和中山大学的开发人员最新推出的一个基于扩散模型的...
-
UniEdit是什么?一文让你看懂UniEdit的技术原理、主要功能、应用场景UniEdit概述简介 UniEdit是由浙江大学、微软研究院和北京大学的开发人员推出的一个创新的视频编辑框架,允许用户在不需要进行模型微调的情况下...
-
DUSt3R是什么?一文让你看懂DUSt3R的技术原理、主要功能、应用场景DUSt3R概述简介 DUSt3R(Dense and Unconstrained Stereo 3D Reconstruction,密集无约束立体...
-
ScreenAI是什么?一文让你看懂ScreenAI的技术原理、主要功能、应用场景ScreenAI概述简介 ScreenAI是一个由谷歌的开发人员推出的可读屏AI视觉语言大模型,专门设计用于理解和处理用户界面(UI)和信息图表。该...
-
ResAdapter是什么?一文让你看懂ResAdapter的技术原理、主要功能、应用场景ResAdapter概述简介 ResAdapter是由字节跳动的开发人员推出的一种为扩散模型(如Stable Diffusion)设计的分辨率适配器...
-
AtomoVideo是什么?一文让你看懂AtomoVideo的技术原理、主要功能、应用场景AtomoVideo概述简介 AtomoVideo是由阿里巴巴的研究团队提出的一个高保真图像到视频(Image-to-Video, I2V)生成框架...
-
Moondream是什么?一文让你看懂Moondream的技术原理、主要功能、应用场景Moondream概述简介 Moondream是一个免费开源的小型的人工智能视觉语言大模型,虽然参数量小(Moondream1仅16亿,Moondr...
-
PixArt-Σ是什么?一文让你看懂PixArt-Σ的技术原理、主要功能、应用场景PixArt-Σ概述简介 PixArt-Σ是由来自华为诺亚方舟实验室、大连理工大学和香港大学的开发人员推出的一个基于扩散Transformer架构(...
-
ELLA是什么?一文让你看懂ELLA的技术原理、主要功能、应用场景ELLA概述简介 ELLA(Efficient Large Language Model Adapter,高效的大模型适配器)是由腾讯的开发人员推出...
-
Transformer Debugger是什么?一文让你看懂Transformer Debugger的技术原理、主要功能、应用场景Transformer Debugger概述简介 Transformer Debugger (TDB) 是由 OpenAI 的对齐团队(Supera...
-
Pix2Gif是什么?一文让你看懂Pix2Gif的技术原理、主要功能、应用场景Pix2Gif概述简介 Pix2Gif是由微软研究院的开发人员提出的一个基于运动引导的扩散模型,专门用于将静态图像转换成动态的GIF动画/视频。该模...
-
ComflowySpace是什么?一文让你看懂ComflowySpace的技术原理、主要功能、应用场景ComflowySpace概述简介 ComflowySpace是一款专为简化和增强AI图像及视频生成工具使用体验而设计的开源软件,基于ComfyUI...