收集全球10,000⁺个好用的AI软件
-
Bailing-TTSBailing-TTS是由Giant Network的AI Lab开发的大型文本到语音(TTS)模型系列,专注于生成高质量的中文方言语音。该模型采用持...
-
TikTok Voice GeneratorTikTok Voice Generator是一个基于最新TikTok文本到语音技术的工具,能够生成多种有趣且逼真的AI语音效果,如Jessie语音、...
-
OpenVoiceChatOpenVoiceChat是一个开源项目,旨在提供一个与大型语言模型(LLM)进行自然语音对话的平台。它支持多种语音识别(STT)、文本到语音(TTS...
-
OptiSpeechOptiSpeech是一个高效、轻量级且快速的文本到语音模型,专为设备端文本到语音转换设计。它利用了先进的深度学习技术,能够将文本转换为自然听起来的语...
-
Fish AudioFish Audio是一个提供文本到语音转换服务的平台,利用生成式AI技术,用户可以将文本转换为自然流畅的语音。该平台支持声音克隆技术,允许用户创建和...
-
VALL-E 2VALL-E 2 是微软亚洲研究院推出的一款语音合成模型,它通过重复感知采样和分组编码建模技术,大幅提升了语音合成的稳健性与自然度。该模型能够将书面文...
-
PDF2AudioPDF2Audio是一个利用OpenAI的GPT模型将PDF文档转换成音频内容的工具。它能够将文本生成和文本到语音转换技术结合起来,为用户提供一个可以...
-
pdf-to-podcastpdf-to-podcast是一个基于人工智能技术的生产力工具,能够将PDF文档转换成播客节目。它使用OpenAI的文本到语音模型和Google Ge...
-
Open NotebookLMOpen NotebookLM是一个利用开源语言模型和文本到语音模型的工具,它可以处理PDF内容,生成适合音频播客的自然对话,并将其输出为MP3文件。...
-
F5-TTSF5-TTS是由SWivid团队开发的一个文本到语音合成(TTS)模型,它利用深度学习技术将文本转换为自然流畅、忠实于原文的语音输出。该模型在生成语音...
-
ElevenLabs Voice DesignElevenLabs Voice Design是一个在线平台,允许用户通过简单的文本提示来设计和生成定制的声音。这项技术的重要性在于它能够快速创建出符...
-
MaskGCTMaskGCT是一个创新的零样本文本到语音转换(TTS)模型,它通过消除显式对齐信息和音素级持续时间预测的需求,解决了自回归和非自回归系统中存在的问题...
-
MaskGCT TTS DemoMaskGCT TTS Demo 是一个基于MaskGCT模型的文本到语音(TTS)演示,由Hugging Face平台上的amphion提供。该模型...
-
Fish Agent V0.1 3BFish Agent V0.1 3B是一个开创性的语音转语音模型,能够以前所未有的精确度捕捉和生成环境音频信息。该模型采用了无语义标记架构,消除了传统...
-
Fish SpeechFish Speech是一款专注于语音合成的产品,它通过使用先进的深度学习技术,能够将文本转换为自然流畅的语音。该产品支持多种语言,包括中文、英文等,...
-
OuteTTS-0.1-350MOuteTTS-0.1-350M是一款基于纯语言模型的文本到语音合成技术,它不需要外部适配器或复杂架构,通过精心设计的提示和音频标记实现高质量的语音合...
-
OuteTTSOuteTTS是一个使用纯语言建模方法生成语音的实验性文本到语音模型。它的重要性在于能够通过先进的语言模型技术,将文本转换为自然听起来的语音,这对于语...
-
OuteTTS-0.2-500MOuteTTS-0.2-500M是基于Qwen-2.5-0.5B构建的文本到语音合成模型,它在更大的数据集上进行了训练,实现了在准确性、自然度、词汇量...
-
AuralisAuralis是一个文本到语音(TTS)引擎,能够将文本快速转换为自然语音,支持语音克隆,并且处理速度极快,可以在几分钟内处理完整本小说。该产品以其高...
-
Paper-to-PodcastPaper-to-Podcast是一个将学术论文转换成播客形式的工具,通过模拟三个人的讨论来让听众以更自然和人性化的方式理解论文内容。它不仅使复杂的信...