收集全球10,000⁺个好用的AI软件
-
Fish Speech是什么?一文让你看懂Fish Speech的技术原理、主要功能、应用场景Fish Speech概述简介 Fish Speech是一款由Fish Audio开发的开源的文本到语音(TTS)工具,支持中文、英文和日文。通过约...
-
Moshi是什么?一文让你看懂Moshi的技术原理、主要功能、应用场景Moshi概述简介 Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI大模型,拥有听、说、看的能力,并能模拟70...
-
EchoMimic是什么?一文让你看懂EchoMimic的技术原理、主要功能、应用场景EchoMimic概述简介 EchoMimic是阿里蚂蚁集团推出的AI数字人开源项目,赋予静态图像以生动语音和表情。通过深度学习模型结合音频和面部标...
-
MimicMotion是什么?一文让你看懂MimicMotion的技术原理、主要功能、应用场景MimicMotion概述简介 MimicMotion是腾讯的开发人员推出的一个高质量的人类动作视频生成框架,利用置信度感知的姿态引导技术,确保视频...
-
FunAudioLLM是什么?一文让你看懂FunAudioLLM的技术原理、主要功能、应用场景FunAudioLLM概述简介 FunAudioLLM是阿里巴巴通义实验室推出的开源语音大模型项目,包含SenseVoice和CosyVoice两个...
-
Chameleon是什么?一文让你看懂Chameleon的技术原理、主要功能、应用场景Chameleon概述简介 Chameleon 是 Meta(Facebook 的母公司)的人工智能研究团队 FAIR(Facebook AI Re...
-
Mem0是什么?一文让你看懂Mem0的技术原理、主要功能、应用场景Mem0 概述简介 Mem0 是一款开源的大语言大模型记忆增强工具,能够让 AI 拥有长期、适应性强的记忆。通过自适应记忆系统,AI能实现跨应用记住...
-
STORM AI是什么?一文让你看懂STORM AI的技术原理、主要功能、应用场景STORM AI 概述简介 STORM AI 是斯坦福大学推出的开源AI写作工具,可在几秒钟内将一个主题转换为长篇文章/研究论文,完全免费,是 Pe...
-
DCLM-7B是什么?一文让你看懂DCLM-7B的技术原理、主要功能、应用场景DCLM-7B 概述简介 DCLM-7B是由苹果公司联合研究团队推出的70亿参数开源小模型,性能超越Mistral-7B,接近Llama 3和Gem...
-
LivePortrait是什么?一文让你看懂LivePortrait的技术原理、主要功能、应用场景LivePortrait概述简介 LivePortrait是快手推出的开源人像动画生成框架,专注于高效、可控地将驱动视频的表情和姿态迁移至静态或动态...
-
Llama3.1是什么?一文让你看懂Llama3.1的技术原理、主要功能、应用场景Llama3.1概述简介 Llama 3.1是Meta最新发布的开源AI大模型,包括8B、70B和405B三个版本,其中405B版本以其4050亿参...
-
GPT-4o Long Output模型是什么?一文让你看懂GPT-4o Long Output模型的技术原理、主要功能、应用场景GPT-4o Long Output模型概述简介 GPT-4o Long Output模型是OpenAI最新推出的超长输出AI大模型,支持高达64k...
-
MindSearch是什么?一文让你看懂MindSearch的技术原理、主要功能、应用场景MindSearch概述简介 MindSearch是上海人工智能实验室联合研发团队推出的开源AI搜索框架,结合了大规模信息搜集和整理能力。利用Int...
-
Diffree是什么?一文让你看懂Diffree的技术原理、主要功能、应用场景Diffree概述简介Diffree是由OpenGVLab推出的AI贴图框架,能根据用户的文字描述,在图片中自动找到合适的位置添加新对象。通过智能掩...
-
FLUX.1是什么?一文让你看懂FLUX.1的技术原理、主要功能、应用场景FLUX.1概述简介 FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,拥有12B参数,是迄今为止最大的文生图模型...
-
Stable Fast 3D是什么?一文让你看懂Stable Fast 3D的技术原理、主要功能、应用场景Stable Fast 3D概述简介 Stable Fast 3D(SF3D)是Stability AI推出的一种创新3D网格重建技术,能在0.5秒...
-
Tora是什么?一文让你看懂Tora的技术原理、主要功能、应用场景Tora概述简介 Tora是阿里推出的AI视频生成框架,基于轨迹导向的扩散变换器(DiT)技术,将文本、视觉和轨迹条件融合,生成高质量且符合物理世界...
-
Whisper-Medusa是什么?一文让你看懂Whisper-Medusa的技术原理、主要功能、应用场景Whisper-Medusa概述简介 Whisper-Medusa是aiOla推出的开源AI语音识别模型,结合了OpenAI的Whisper技术与a...
-
FoleyCrafter是什么?一文让你看懂FoleyCrafter的技术原理、主要功能、应用场景FoleyCrafter概述简介 FoleyCrafter是上海人工智能实验室和香港中文大学(深圳)一起推出的AI视频配音框架,FoleyCraft...
-
MinerU是什么?一文让你看懂MinerU的技术原理、主要功能、应用场景MinerU概述简介 MinerU是上海人工智能实验室OpenDataLab团队推出的开源智能数据提取工具,专注于复杂PDF文档的高效解析与提取。M...