音频生成

收集全球10,000⁺个好用的AI软件

首页 > 音频生成

OptimizerAI

OptimizerAI专注于使用人工智能技术生成各种声音效果，旨在为游戏、视频、短片、广告等多媒体内容增添活力。该平台提供了高质量的音频生成服务，并计...
Wookeys AI

Ultimate AI Assistant是一款综合AI助手，可帮助您简化任务，提高工作效率。它提供了生成文本、图像、代码、视频、音频等多种功能，具有...
LocalAI

LocalAI 是一个自托管的开源 OpenAI 替代品，可在消费级硬件上运行，支持本地或本地部署的文本、音频、图像生成。它提供了 GPT 等模型的文...
Wavflow.io

wavflow是一款最终的AI文本转语音生成器，无需订阅，积分不过期。它使用人工智能技术将文本转换为逼真的语音，适用于将文档、书籍和课程转换为语音。w...
Stable Audio Open

Stable Audio Open是一个开源的文本到音频模型，专为生成短音频样本、音效和制作元素而优化。它允许用户通过简单的文本提示生成高达47秒的高...
AudioLCM

AudioLCM是一个基于PyTorch实现的文本到音频生成模型，它通过潜在一致性模型来生成高质量且高效的音频。该模型由Huadai Liu等人开发，...
Resona V2A

Resona V2A是一款AI驱动的视频到音频生成技术产品，它能够仅通过视频数据自动生成与场景、动画或电影完美匹配的声音设计、效果、拟音和环境音。该技...
GenAU

GenAU是一个由Snap Research开发的音频生成模型，它通过AutoCap自动字幕生成模型和GenAu音频生成架构，显著提升了音频生成的质量...
vta-ldm

vta-ldm是一个专注于视频到音频生成的深度学习模型，能够根据视频内容生成语义和时间上与视频输入对齐的音频内容。它代表了视频生成领域的一个新突破，特...
Stable Audio Open demo

Stable Audio Open 是一个能够从文本提示生成长达47秒的立体声音频的技术。它包含三个主要组件：一个将波形压缩到可管理序列长度的自编码器...
Bark

Bark是由Suno开发的基于Transformer的文本到音频模型，能够生成逼真的多语言语音以及其他类型的音频，如音乐、背景噪声和简单音效。它还支持...
Stability AI

Stability AI是一个专注于生成式人工智能技术的公司，提供多种AI模型，包括文本到图像、视频、音频、3D和语言模型。这些模型能够处理复杂提示，...
PDF2Audio

PDF2Audio是一个利用OpenAI的GPT模型将PDF文档转换成音频内容的工具。它能够将文本生成和文本到语音转换技术结合起来，为用户提供一个可以...
PodCastLM

PodCastLM是一个创新的智能播客生成平台，它利用先进的人工智能技术，让用户能够快速生成个性化的音频内容。用户只需上传PDF文件，选择问题、语气、...
NotebookLlama

NotebookLlama是一个开源项目，旨在通过一系列教程和笔记本指导用户构建从PDF到Podcast的工作流。该项目涵盖了从文本预处理到使用文本到...
SoundStorm

SoundStorm是由Google Research开发的一种音频生成技术，它通过并行生成音频令牌来大幅减少音频合成的时间。这项技术能够生成高质量、...
AudioLM

AudioLM是由Google Research开发的一个框架，用于高质量音频生成，具有长期一致性。它将输入音频映射到离散标记序列，并将音频生成视为这...
Sound Effect Generator

Sound Effect Generator是一个利用AI技术为用户提供个性化音频创作的平台。它结合了专业的声音设计和前沿的AI技术，让用户能够快速将...
AI Podcast Generator

AI Podcast Generator是一个在线服务，能够将PDF文件和网页内容快速转换成高质量的音频格式，使用专业的AI语音和可定制的说话风格，以...
Sketch2Sound

Sketch2Sound是一个生成音频的模型，能够从一组可解释的时间变化控制信号（响度、亮度、音高）以及文本提示中创建高质量的声音。该模型能够在任何文...

«
1
2
3
»

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们