收集全球10,000⁺个好用的AI软件
-
Universal-1是什么?一文让你看懂Universal-1的技术原理、主要功能、应用场景Universal-1概述简介 Universal-1是AI语音初创公司AssemblyAI推出的一款多语言语音识别和转录模型,经过超过1250万小...
-
Codestral是什么?一文让你看懂Codestral的技术原理、主要功能、应用场景Codestral概述简介 Codestral是法国人工智能初创公司Mistral AI推出的一款代码生成AI大模型,专为提高软件开发效率而设计,支...
-
ChatTTS是什么?一文让你看懂ChatTTS的技术原理、主要功能、应用场景ChatTTS概述简介 ChatTTS是一款专为对话场景设计的支持中英文的文本转语音(TTS)模型,基于约10万小时的中英文数据进行训练,能够生成高...
-
Seed-TTS是什么?一文让你看懂Seed-TTS的技术原理、主要功能、应用场景Seed-TTS概述简介 Seed-TTS是由字节跳动开发的高级文本到语音(Text to Speech,TTS)模型,能够生成与人类语音极为相似的...
-
Qwen2是什么?一文让你看懂Qwen2的技术原理、主要功能、应用场景Qwen2概述简介 Qwen2是由阿里云通义千问团队开源的新一代大语言大模型,该系列涵盖了从0.5B到72B不等的五个规模模型,在中文和英文基础上增...
-
Follow-Your-Emoji是什么?一文让你看懂Follow-Your-Emoji的技术原理、主要功能、应用场景Follow-Your-Emoji概述简介 Follow-Your-Emoji是由香港科技大学、腾讯混元和清华大学的开发人员推出的一个基于扩散模型的...
-
ToonCrafter是什么?一文让你看懂ToonCrafter的技术原理、主要功能、应用场景ToonCrafter概述简介 ToonCrafter是由腾讯AI实验室、香港中文大学和香港城市大学的开发人员开源的卡通动画视频中间帧生成工具,突破...
-
Stability AI是什么?一文让你看懂Stability AI的技术原理、主要功能、应用场景6月12日晚间消息,人工智能初创公司Stability AI宣布正式开源发布其最新的文本到图像生成模型——Stable Diffusion 3 Me...
-
MimicBrush是什么?一文让你看懂MimicBrush的技术原理、主要功能、应用场景MimicBrush概述简介 MimicBrush是由阿里巴巴、香港大学和蚂蚁集团的开发人员推出的AI图像编辑融合框架,允许用户通过简单的操作,在源...
-
Hallo是什么?一文让你看懂Hallo的技术原理、主要功能、应用场景Hallo概述简介 Hallo是由复旦大学、百度公司、苏黎世联邦理工学院和南京大学的开发人员共同提出的一个AI对口型肖像图像动画技术,可基于语音音频...
-
Unique3D是什么?一文让你看懂Unique3D的技术原理、主要功能、应用场景Unique3D概述简介 Unique3D是清华大学团队开源的一个单张图像到3D模型转换的框架,通过结合多视图扩散模型和法线扩散模型,以及一种高效的...
-
琴乐大模型是什么?一文让你看懂琴乐大模型的技术原理、主要功能、应用场景琴乐大模型概述简介 琴乐大模型是由腾讯AI Lab与腾讯TME天琴实验室共同研发的人工智能音乐创作大模型,该模型通过输入中英文关键词、描述性语句或音...
-
Diffutoon是什么?一文让你看懂Diffutoon的技术原理、主要功能、应用场景Diffutoon概述简介 Diffutoon是由阿里巴巴和华东师大的开发人员推出的一个将视频转换为卡通动漫风格的AI框架,基于扩散模型的可编辑卡通...
-
ExVideo是什么?一文让你看懂ExVideo的技术原理、主要功能、应用场景ExVideo概述简介 ExVideo是由阿里巴巴和华东师大的开发人员推出的一种视频合成模型的后调优技术,能够扩展现有视频合成模型的时间尺度,以生成...
-
Toucan TTS是什么?一文让你看懂Toucan TTS的技术原理、主要功能、应用场景Toucan TTS概述简介 Toucan TTS是由德国斯图加特大学自然语言处理研究所(IMS)开发的文本到语音合成工具箱,支持超过7000种语言...
-
MOFA-Video是什么?一文让你看懂MOFA-Video的技术原理、主要功能、应用场景MOFA-Video概述简介 MOFA-Video是由腾讯AI实验室和东京大学的开发人员开源的一个可控性的图像生成视频的模型,该技术利用生成运动场适...
-
CriticGPT是什么?一文让你看懂CriticGPT的技术原理、主要功能、应用场景CriticGPT概述简介 CriticGPT是OpenAI发布的一个新型人工智能模型,基于GPT-4构建,专门用于审查和识别大型语言大模型(如Ch...
-
Gemma 2是什么?一文让你看懂Gemma 2的技术原理、主要功能、应用场景Gemma 2概述简介 Gemma 2是谷歌DeepMind推出的新一代开源人工智能模型,包含90亿和270亿参数版本。该模型以卓越的性能、高效的推...
-
MimicMotion是什么?一文让你看懂MimicMotion的技术原理、主要功能、应用场景MimicMotion概述简介 MimicMotion是腾讯的开发人员推出的一个高质量的人类动作视频生成框架,利用置信度感知的姿态引导技术,确保视频...
-
FreeAskInternet是什么?一文让你看懂FreeAskInternet的技术原理、主要功能、应用场景FreeAskInternet概述简介 FreeAskInternet是一个免费开源的本地AI搜索引擎,整合了GPT-3.5等先进的大型语言大模型(...