AI音频-AI声音生成-AI录音转文字-免费AI音频合成软件[90]

首页 > AI音频生成

全部所有文字转语音语音转文字 AI音乐创作 AI语音识别 AI声音降噪 AI声音克隆 AI音频编辑

PDF2Audio

PDF2Audio是一个利用OpenAI的GPT模型将PDF文档转换成音频内容的工具。它能够将文本生成和文本到语音转换技术结合起来，为用户提供一个可以...
pdf-to-podcast

pdf-to-podcast是一个基于人工智能技术的生产力工具，能够将PDF文档转换成播客节目。它使用OpenAI的文本到语音模型和Google Ge...
Outspeed

Outspeed是一个为构建快速、实时语音和视频AI应用提供网络和推理基础设施的平台。它由Google和MIT的工程师开发，旨在为实时AI应用提供直观...
Llama 3.2 3b Voice

Llama 3.2 3b Voice 是基于Hugging Face平台的一款语音合成模型，能够将文本转换为自然流畅的语音。该模型采用了先进的深度学习...
EMOVA

EMOVA（EMotionally Omni-present Voice Assistant）是一个多模态语言模型，它能够进行端到端的语音处理，同时保...
Open NotebookLM

Open NotebookLM是一个利用开源语言模型和文本到语音模型的工具，它可以处理PDF内容，生成适合音频播客的自然对话，并将其输出为MP3文件。...
Whisper large-v3-turbo

Whisper large-v3-turbo是OpenAI提出的一种先进的自动语音识别(ASR)和语音翻译模型。它在超过500万小时的标记数据上进行训...
AI-Powered Meeting Summarizer

AI-Powered Meeting Summarizer是一个基于Gradio的网站应用，能够将会议录音转换为文本，并使用whisper.cpp进行...
LiveKit Agents

LiveKit Agents 是一个端到端框架，它使开发者能够构建能够通过语音、视频和数据通道与用户互动的智能多模态语音助手（AI代理）。它通过集成O...
Rev AI

Rev AI提供高精度的语音转录服务，支持58种以上语言，能够将视频和语音应用中的语音转换为文本。它通过使用世界上最多样化的声音集合进行训练，为视频和...
Reverb

Reverb 是一个开源的语音识别和说话人分割模型推理代码，使用 WeNet 框架进行语音识别 (ASR) 和 Pyannote 框架进行说话人分割。...
voice-chat-pdf

voice-chat-pdf是一个基于LlamaIndex项目，使用Next.js构建的示例，它通过简单的RAG系统，允许用户通过语音与PDF文档进行...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL