AI音频-AI声音生成-AI录音转文字-免费AI音频合成软件[92]

首页 > AI音频生成

全部所有文字转语音语音转文字 AI音乐创作 AI语音识别 AI声音降噪 AI声音克隆 AI音频编辑

Wav2Lip

Wav2Lip 是一个开源项目，旨在通过深度学习技术实现视频中人物的唇形与任意目标语音高度同步。该项目提供了完整的训练代码、推理代码和预训练模型，支持...
TEN Agent

TEN Agent 是基于 TEN 框架构建的实时对话 AI引擎，为开发者提供快速、高效的工具来构建实时对话式 AI Agent，如AI虚拟客服、AI...
Spirit LM

Spirit LM是一个基础多模态语言模型，能够自由混合文本和语音。该模型基于一个7B预训练的文本语言模型，通过持续在文本和语音单元上训练来扩展到语音...
Whispo

Whispo是一款利用人工智能技术的语音听写工具，它能够将用户的语音实时转换成文字。这款工具使用了OpenAI Whisper技术进行语音识别，并支持...
ElevenLabs Voice Design

ElevenLabs Voice Design是一个在线平台，允许用户通过简单的文本提示来设计和生成定制的声音。这项技术的重要性在于它能够快速创建出符...
Say It So

Say It So是一个Chrome扩展程序，允许用户在Google Docs文档中添加语音评论，使反馈、解释和协作更加清晰和个性化。这个工具特别适合...
Dictate Buddy

Dictate Buddy是一款利用人工智能技术将语音转换为文字的应用程序。它支持99种语言，并且能够自动检测语言。该应用使用OpenAI Whisp...
GPTS4O.SO

GPT-4o是OpenAI推出的先进多模态AI平台，它在GPT-4的基础上进一步扩展，实现了真正的多模态方法，涵盖文本、图像和音频。GPT-4o设计上...
MaskGCT

MaskGCT是一个创新的零样本文本到语音转换（TTS）模型，它通过消除显式对齐信息和音素级持续时间预测的需求，解决了自回归和非自回归系统中存在的问题...
GLM-4-Voice

GLM-4-Voice是由清华大学团队开发的端到端语音模型，能够直接理解和生成中英文语音，进行实时语音对话。它通过先进的语音识别和合成技术，实现了语音...
MaskGCT TTS Demo

MaskGCT TTS Demo 是一个基于MaskGCT模型的文本到语音（TTS）演示，由Hugging Face平台上的amphion提供。该模型...
Moonshine

Moonshine 是一系列为资源受限设备优化的语音转文本模型，非常适合实时、设备上的应用程序，如现场转录和语音命令识别。在 HuggingFace ...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL