收集全球10,000⁺个好用的AI软件
        
        
        
       
        
        
        
        
    - 
                    
                         ComfyUI-StableAudioSamplerComfyUI-StableAudioSampler 是一款集成在 ComfyUI 节点中的音频采样器插件,它允许用户生成音频并输出原始字节和采样率,... ComfyUI-StableAudioSamplerComfyUI-StableAudioSampler 是一款集成在 ComfyUI 节点中的音频采样器插件,它允许用户生成音频并输出原始字节和采样率,...
- 
                    
                         QA-MDTQA-MDT是一个开源的音乐生成模型,集成了最先进的模型用于音乐生成。它基于多个开源项目,如AudioLDM、PixArt-alpha、MDT、Aud... QA-MDTQA-MDT是一个开源的音乐生成模型,集成了最先进的模型用于音乐生成。它基于多个开源项目,如AudioLDM、PixArt-alpha、MDT、Aud...
- 
                    
                         智趣AI甄选智趣AI甄选是一个专注于人工智能领域的综合性平台,旨在洞察行业发展前景,精选并展示国内外的AI产品与应用。平台提供丰富的学习资源,行业融合案例分析,助... 智趣AI甄选智趣AI甄选是一个专注于人工智能领域的综合性平台,旨在洞察行业发展前景,精选并展示国内外的AI产品与应用。平台提供丰富的学习资源,行业融合案例分析,助...
- 
                    
                         YuEYuE 是由香港科技大学和多模态艺术投影团队开发的开源音乐生成模型。它能够根据给定的歌词生成长达 5 分钟的完整歌曲,包括人声和伴奏部分。该模型通过多... YuEYuE 是由香港科技大学和多模态艺术投影团队开发的开源音乐生成模型。它能够根据给定的歌词生成长达 5 分钟的完整歌曲,包括人声和伴奏部分。该模型通过多...
- 
                    
                         YuE-s1-7B-anneal-en-cotYuE是一个开创性的开源基础模型系列,专为音乐生成设计,能够将歌词转化为完整的歌曲。它能够生成包含吸引人的主唱和配套伴奏的完整歌曲,支持多种音乐风格。... YuE-s1-7B-anneal-en-cotYuE是一个开创性的开源基础模型系列,专为音乐生成设计,能够将歌词转化为完整的歌曲。它能够生成包含吸引人的主唱和配套伴奏的完整歌曲,支持多种音乐风格。...
- 
                    
                         InspireMusicInspireMusic 是一个专注于音乐、歌曲和音频生成的 AIGC 工具包和模型框架,采用 PyTorch 开发。它通过音频标记化和解码过程,结合... InspireMusicInspireMusic 是一个专注于音乐、歌曲和音频生成的 AIGC 工具包和模型框架,采用 PyTorch 开发。它通过音频标记化和解码过程,结合...
- 
                    
                         stable-audio-toolsstable-audio-tools是一个开源的PyTorch库,提供了用于条件音频生成的生成模型的训练和推理代码。包括自动编码器、隐式扩散模型、Mu... stable-audio-toolsstable-audio-tools是一个开源的PyTorch库,提供了用于条件音频生成的生成模型的训练和推理代码。包括自动编码器、隐式扩散模型、Mu...
- 
                    
                         LocalAILocalAI 是一个自托管的开源 OpenAI 替代品,可在消费级硬件上运行,支持本地或本地部署的文本、音频、图像生成。它提供了 GPT 等模型的文... LocalAILocalAI 是一个自托管的开源 OpenAI 替代品,可在消费级硬件上运行,支持本地或本地部署的文本、音频、图像生成。它提供了 GPT 等模型的文...
- 
                    
                         Stable Audio OpenStable Audio Open是一个开源的文本到音频模型,专为生成短音频样本、音效和制作元素而优化。它允许用户通过简单的文本提示生成高达47秒的高... Stable Audio OpenStable Audio Open是一个开源的文本到音频模型,专为生成短音频样本、音效和制作元素而优化。它允许用户通过简单的文本提示生成高达47秒的高...
- 
                    
                         ComfyUI-StableAudioSamplerComfyUI-StableAudioSampler 是一款集成在 ComfyUI 节点中的音频采样器插件,它允许用户生成音频并输出原始字节和采样率,... ComfyUI-StableAudioSamplerComfyUI-StableAudioSampler 是一款集成在 ComfyUI 节点中的音频采样器插件,它允许用户生成音频并输出原始字节和采样率,...
- 
                    
                         PandratorPandrator 是一个基于开源软件的工具,能够将文本、PDF、EPUB 和 SRT 文件转换成多种语言的语音音频,包括语音克隆、基于LLM的文本预... PandratorPandrator 是一个基于开源软件的工具,能够将文本、PDF、EPUB 和 SRT 文件转换成多种语言的语音音频,包括语音克隆、基于LLM的文本预...
- 
                    
                         Mini-OmniMini-Omni是一个开源的多模态大型语言模型,能够实现实时的语音输入和流式音频输出的对话能力。它具备实时语音到语音的对话功能,无需额外的ASR或T... Mini-OmniMini-Omni是一个开源的多模态大型语言模型,能够实现实时的语音输入和流式音频输出的对话能力。它具备实时语音到语音的对话功能,无需额外的ASR或T...
- 
                    
                         DiariZenDiariZen是一个基于AudioZen和Pyannote 3.1驱动的说话人分割工具包。说话人分割是音频处理中的一个关键步骤,它能够将一段音频中的... DiariZenDiariZen是一个基于AudioZen和Pyannote 3.1驱动的说话人分割工具包。说话人分割是音频处理中的一个关键步骤,它能够将一段音频中的...
- 
                    
                         hertz-devhertz-dev是Standard Intelligence开源的全双工、仅音频的变换器基础模型,拥有85亿参数。该模型代表了可扩展的跨模态学习技术... hertz-devhertz-dev是Standard Intelligence开源的全双工、仅音频的变换器基础模型,拥有85亿参数。该模型代表了可扩展的跨模态学习技术...
- 
                    
                         ComfyUI-MMAudioComfyUI-MMAudio是一个基于ComfyUI的插件,它允许用户利用MMAudio模型进行音频处理。该插件的主要优点在于能够提供高质量的音频生... ComfyUI-MMAudioComfyUI-MMAudio是一个基于ComfyUI的插件,它允许用户利用MMAudio模型进行音频处理。该插件的主要优点在于能够提供高质量的音频生...
- 
                    
                         TangoFluxTangoFlux是一个高效的文本到音频(TTA)生成模型,拥有515M参数,能够在单个A40 GPU上仅用3.7秒生成长达30秒的44.1kHz音频... TangoFluxTangoFlux是一个高效的文本到音频(TTA)生成模型,拥有515M参数,能够在单个A40 GPU上仅用3.7秒生成长达30秒的44.1kHz音频...
- 
                    
                         podscriptPodscript 是一个强大的音频转录工具,它利用语言模型和语音到文本(STT)API,为播客和其他音频内容生成高质量的转录文本。该工具支持多种流行... podscriptPodscript 是一个强大的音频转录工具,它利用语言模型和语音到文本(STT)API,为播客和其他音频内容生成高质量的转录文本。该工具支持多种流行...
- 
                    
                         InspireMusicInspireMusic 是一个专注于音乐、歌曲和音频生成的 AIGC 工具包和模型框架,采用 PyTorch 开发。它通过音频标记化和解码过程,结合... InspireMusicInspireMusic 是一个专注于音乐、歌曲和音频生成的 AIGC 工具包和模型框架,采用 PyTorch 开发。它通过音频标记化和解码过程,结合...
- 
                    
                         LiteAvatarLiteAvatar是一个音频驱动的实时2D头像生成模型,主要用于实时聊天场景。该模型通过高效的语音识别和嘴型参数预测技术,结合轻量级的2D人脸生成模... LiteAvatarLiteAvatar是一个音频驱动的实时2D头像生成模型,主要用于实时聊天场景。该模型通过高效的语音识别和嘴型参数预测技术,结合轻量级的2D人脸生成模...
- 
                    
                         视频翻译配音视频翻译配音是一个免费开源的视频翻译和配音工具,支持多种翻译引擎,可以将视频字幕翻译成多种语言,并生成自然的语音配音,操作简单方便。... 视频翻译配音视频翻译配音是一个免费开源的视频翻译和配音工具,支持多种翻译引擎,可以将视频字幕翻译成多种语言,并生成自然的语音配音,操作简单方便。...
 
                    