收集全球10,000⁺个好用的AI软件
-
Open NotebookLMOpen NotebookLM是一个利用开源语言模型和文本到语音模型的工具,它可以处理PDF内容,生成适合音频播客的自然对话,并将其输出为MP3文件。...
-
Whisper large-v3-turboWhisper large-v3-turbo是OpenAI提出的一种先进的自动语音识别(ASR)和语音翻译模型。它在超过500万小时的标记数据上进行训...
-
AI-Powered Meeting SummarizerAI-Powered Meeting Summarizer是一个基于Gradio的网站应用,能够将会议录音转换为文本,并使用whisper.cpp进行...
-
LiveKit AgentsLiveKit Agents 是一个端到端框架,它使开发者能够构建能够通过语音、视频和数据通道与用户互动的智能多模态语音助手(AI代理)。它通过集成O...
-
Rev AIRev AI提供高精度的语音转录服务,支持58种以上语言,能够将视频和语音应用中的语音转换为文本。它通过使用世界上最多样化的声音集合进行训练,为视频和...
-
ReverbReverb 是一个开源的语音识别和说话人分割模型推理代码,使用 WeNet 框架进行语音识别 (ASR) 和 Pyannote 框架进行说话人分割。...
-
voice-chat-pdfvoice-chat-pdf是一个基于LlamaIndex项目,使用Next.js构建的示例,它通过简单的RAG系统,允许用户通过语音与PDF文档进行...
-
Ola FriendOla Friend是字节跳动豆包推出的首款AI智能体耳机,它通过接入豆包大模型,与豆包APP深度结合,实现了无需打开手机即可通过语音唤醒AI助手的功...
-
FineVoiceFineVoice是一个多功能的AI配音平台,它使用先进的人工智能技术,为用户提供逼真的个性化语音服务。这个平台不仅可以将文本转换为自然逼真的声音,还...
-
PraisesPraises是一款文本转语音(TTS)工具,它通过将文本转换为语音输出,帮助用户更轻松地获取信息。这款工具支持多种API,包括Azure API、E...
-
EchoEcho是一款结合了人工智能技术的语音和文本笔记应用,它通过AI技术帮助用户组织和提炼思考。Echo利用GPT-4o大型语言模型进行转录、回忆和洞察力...
-
F5-TTSF5-TTS是由SWivid团队开发的一个文本到语音合成(TTS)模型,它利用深度学习技术将文本转换为自然流畅、忠实于原文的语音输出。该模型在生成语音...