音频剪辑软件-音频编辑软件-免费音频剪辑软件-AI音频剪辑软件[65]

首页 > AI音频生成

全部所有文字转语音语音转文字 AI音乐创作 AI语音识别 AI声音降噪 AI声音克隆 AI音频编辑

Paper-to-Podcast

Paper-to-Podcast是一个将学术论文转换成播客形式的工具，通过模拟三个人的讨论来让听众以更自然和人性化的方式理解论文内容。它不仅使复杂的信...
Shortcut by Poised

Shortcut by Poised是一个基于语音的AI助手，旨在通过自然对话的方式提升用户的工作效率。它允许用户通过语音输入快速获得答案、整理思路、...
Desk-Emoji

Desk-Emoji是一个真正的开源AI桌面机器人，它集成了表情屏幕、双轴控制台和大型语言模型（LLM）的语音聊天功能。这款产品以其独特的设计和开源特...
CosyVoice语音生成大模型2.0-0.5B

CosyVoice语音生成大模型2.0-0.5B是一个高性能的语音合成模型，支持零样本、跨语言的语音合成，能够根据文本内容直接生成相应的语音输出。该模...
Megrez-3B-Omni

Megrez-3B-Omni是由无问芯穹研发的端侧全模态理解模型，基于大语言模型Megrez-3B-Instruct扩展，具备图片、文本、音频三种模态...
OmniAudio-2.6B

OmniAudio-2.6B是一个2.6B参数的多模态模型，能够无缝处理文本和音频输入。该模型结合了Gemma-2B、Whisper turbo和一个...
CosyVoice 2

CosyVoice 2是由阿里巴巴集团的SpeechLab@Tongyi团队开发的语音合成模型，它基于监督离散语音标记，并结合了两种流行的生成模型：语...
Cartesia

Cartesia提供实时多模态智能技术，旨在为各种设备提供服务。产品包括Sonic和On-Device两大核心功能。Sonic是快速、超逼真的生成性语...
Moonshine Web

Moonshine Web是一个基于React和Vite构建的简单应用，它运行了Moonshine Base，这是一个针对快速准确自动语音识别（ASR...
Robo Blogger

Robo Blogger是一个专注于将语音转换为博客文章的人工智能助手。它通过捕捉自然语言中的创意，将其结构化为有条理的博客内容，同时可以结合参考资料...
Gemini 2.0 Flash Experimental

Gemini 2.0 Flash Experimental是Google DeepMind开发的最新AI模型，旨在提供低延迟和增强性能的智能代理体验。...
ElevenLabs Flash

Flash是ElevenLabs最新推出的文本转语音(Text-to-Speech, TTS)模型，它以75毫秒加上应用和网络延迟的速度生成语音，是低...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL