功能

首页 > 功能

Fish Speech是什么？一文让你看懂Fish Speech的技术原理、主要功能、应用场景

Fish Speech概述简介 Fish Speech是一款由Fish Audio开发的开源的文本到语音（TTS）工具，支持中文、英文和日文。通过约...
Moshi是什么？一文让你看懂Moshi的技术原理、主要功能、应用场景

Moshi概述简介 Moshi是由法国的的人工智能研究实验室Kyutai推出的一款端到端实时音频多模态AI大模型，拥有听、说、看的能力，并能模拟70...
EchoMimic是什么？一文让你看懂EchoMimic的技术原理、主要功能、应用场景

EchoMimic概述简介 EchoMimic是阿里蚂蚁集团推出的AI数字人开源项目，赋予静态图像以生动语音和表情。通过深度学习模型结合音频和面部标...
MimicMotion是什么？一文让你看懂MimicMotion的技术原理、主要功能、应用场景

MimicMotion概述简介 MimicMotion是腾讯的开发人员推出的一个高质量的人类动作视频生成框架，利用置信度感知的姿态引导技术，确保视频...
FunAudioLLM是什么？一文让你看懂FunAudioLLM的技术原理、主要功能、应用场景

FunAudioLLM概述简介 FunAudioLLM是阿里巴巴通义实验室推出的开源语音大模型项目，包含SenseVoice和CosyVoice两个...
Chameleon是什么？一文让你看懂Chameleon的技术原理、主要功能、应用场景

Chameleon概述简介 Chameleon 是 Meta（Facebook 的母公司）的人工智能研究团队 FAIR（Facebook AI Re...
Mem0是什么？一文让你看懂Mem0的技术原理、主要功能、应用场景

Mem0 概述简介 Mem0 是一款开源的大语言大模型记忆增强工具，能够让 AI 拥有长期、适应性强的记忆。通过自适应记忆系统，AI能实现跨应用记住...
STORM AI是什么？一文让你看懂STORM AI的技术原理、主要功能、应用场景

STORM AI 概述简介 STORM AI 是斯坦福大学推出的开源AI写作工具，可在几秒钟内将一个主题转换为长篇文章/研究论文，完全免费，是 Pe...
DCLM-7B是什么？一文让你看懂DCLM-7B的技术原理、主要功能、应用场景

DCLM-7B 概述简介 DCLM-7B是由苹果公司联合研究团队推出的70亿参数开源小模型，性能超越Mistral-7B，接近Llama 3和Gem...
LivePortrait是什么？一文让你看懂LivePortrait的技术原理、主要功能、应用场景

LivePortrait概述简介 LivePortrait是快手推出的开源人像动画生成框架，专注于高效、可控地将驱动视频的表情和姿态迁移至静态或动态...
Llama3.1是什么？一文让你看懂Llama3.1的技术原理、主要功能、应用场景

Llama3.1概述简介 Llama 3.1是Meta最新发布的开源AI大模型，包括8B、70B和405B三个版本，其中405B版本以其4050亿参...
GPT-4o Long Output模型是什么？一文让你看懂GPT-4o Long Output模型的技术原理、主要功能、应用场景

GPT-4o Long Output模型概述简介 GPT-4o Long Output模型是OpenAI最新推出的超长输出AI大模型，支持高达64k...
MindSearch是什么？一文让你看懂MindSearch的技术原理、主要功能、应用场景

MindSearch概述简介 MindSearch是上海人工智能实验室联合研发团队推出的开源AI搜索框架，结合了大规模信息搜集和整理能力。利用Int...
Diffree是什么？一文让你看懂Diffree的技术原理、主要功能、应用场景

Diffree概述简介Diffree是由OpenGVLab推出的AI贴图框架，能根据用户的文字描述，在图片中自动找到合适的位置添加新对象。通过智能掩...
FLUX.1是什么？一文让你看懂FLUX.1的技术原理、主要功能、应用场景

FLUX.1概述简介 FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型，拥有12B参数，是迄今为止最大的文生图模型...
Stable Fast 3D是什么？一文让你看懂Stable Fast 3D的技术原理、主要功能、应用场景

Stable Fast 3D概述简介 Stable Fast 3D（SF3D）是Stability AI推出的一种创新3D网格重建技术，能在0.5秒...
Tora是什么？一文让你看懂Tora的技术原理、主要功能、应用场景

Tora概述简介 Tora是阿里推出的AI视频生成框架，基于轨迹导向的扩散变换器（DiT）技术，将文本、视觉和轨迹条件融合，生成高质量且符合物理世界...
Whisper-Medusa是什么？一文让你看懂Whisper-Medusa的技术原理、主要功能、应用场景

Whisper-Medusa概述简介 Whisper-Medusa是aiOla推出的开源AI语音识别模型，结合了OpenAI的Whisper技术与a...
FoleyCrafter是什么？一文让你看懂FoleyCrafter的技术原理、主要功能、应用场景

FoleyCrafter概述简介 FoleyCrafter是上海人工智能实验室和香港中文大学（深圳）一起推出的AI视频配音框架，FoleyCraft...
MinerU是什么？一文让你看懂MinerU的技术原理、主要功能、应用场景

MinerU概述简介 MinerU是上海人工智能实验室OpenDataLab团队推出的开源智能数据提取工具，专注于复杂PDF文档的高效解析与提取。M...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL