收集全球10,000⁺个好用的AI软件
-
OptimizerAIOptimizerAI专注于使用人工智能技术生成各种声音效果,旨在为游戏、视频、短片、广告等多媒体内容增添活力。该平台提供了高质量的音频生成服务,并计...
-
Wookeys AIUltimate AI Assistant是一款综合AI助手,可帮助您简化任务,提高工作效率。它提供了生成文本、图像、代码、视频、音频等多种功能,具有...
-
LocalAILocalAI 是一个自托管的开源 OpenAI 替代品,可在消费级硬件上运行,支持本地或本地部署的文本、音频、图像生成。它提供了 GPT 等模型的文...
-
Wavflow.iowavflow是一款最终的AI文本转语音生成器,无需订阅,积分不过期。它使用人工智能技术将文本转换为逼真的语音,适用于将文档、书籍和课程转换为语音。w...
-
Stable Audio OpenStable Audio Open是一个开源的文本到音频模型,专为生成短音频样本、音效和制作元素而优化。它允许用户通过简单的文本提示生成高达47秒的高...
-
AudioLCMAudioLCM是一个基于PyTorch实现的文本到音频生成模型,它通过潜在一致性模型来生成高质量且高效的音频。该模型由Huadai Liu等人开发,...
-
Resona V2AResona V2A是一款AI驱动的视频到音频生成技术产品,它能够仅通过视频数据自动生成与场景、动画或电影完美匹配的声音设计、效果、拟音和环境音。该技...
-
GenAUGenAU是一个由Snap Research开发的音频生成模型,它通过AutoCap自动字幕生成模型和GenAu音频生成架构,显著提升了音频生成的质量...
-
vta-ldmvta-ldm是一个专注于视频到音频生成的深度学习模型,能够根据视频内容生成语义和时间上与视频输入对齐的音频内容。它代表了视频生成领域的一个新突破,特...
-
Stable Audio Open demoStable Audio Open 是一个能够从文本提示生成长达47秒的立体声音频的技术。它包含三个主要组件:一个将波形压缩到可管理序列长度的自编码器...
-
BarkBark是由Suno开发的基于Transformer的文本到音频模型,能够生成逼真的多语言语音以及其他类型的音频,如音乐、背景噪声和简单音效。它还支持...
-
Stability AIStability AI是一个专注于生成式人工智能技术的公司,提供多种AI模型,包括文本到图像、视频、音频、3D和语言模型。这些模型能够处理复杂提示,...
-
PDF2AudioPDF2Audio是一个利用OpenAI的GPT模型将PDF文档转换成音频内容的工具。它能够将文本生成和文本到语音转换技术结合起来,为用户提供一个可以...
-
PodCastLMPodCastLM是一个创新的智能播客生成平台,它利用先进的人工智能技术,让用户能够快速生成个性化的音频内容。用户只需上传PDF文件,选择问题、语气、...
-
NotebookLlamaNotebookLlama是一个开源项目,旨在通过一系列教程和笔记本指导用户构建从PDF到Podcast的工作流。该项目涵盖了从文本预处理到使用文本到...
-
SoundStormSoundStorm是由Google Research开发的一种音频生成技术,它通过并行生成音频令牌来大幅减少音频合成的时间。这项技术能够生成高质量、...
-
AudioLMAudioLM是由Google Research开发的一个框架,用于高质量音频生成,具有长期一致性。它将输入音频映射到离散标记序列,并将音频生成视为这...
-
Sound Effect GeneratorSound Effect Generator是一个利用AI技术为用户提供个性化音频创作的平台。它结合了专业的声音设计和前沿的AI技术,让用户能够快速将...
-
AI Podcast GeneratorAI Podcast Generator是一个在线服务,能够将PDF文件和网页内容快速转换成高质量的音频格式,使用专业的AI语音和可定制的说话风格,以...
-
Sketch2SoundSketch2Sound是一个生成音频的模型,能够从一组可解释的时间变化控制信号(响度、亮度、音高)以及文本提示中创建高质量的声音。该模型能够在任何文...