收集全球10,000⁺个好用的AI软件
        
        
        
       
        
        
        
        
    - 
                    
                        
                            RiversideRiverside是一款准确的AI转录工具,可以快速将音频和视频转录为文字。它支持100多种语言,提供完全免费的准确AI转录服务。除了转录功能,Riv... - 
                    
                        
                            Brain Pod AIBrain Pod AI是一款革命性的AI内容创作工具,可以帮助用户快速高质量地生成多语言内容。使用AI Writer,Violet,用户可以以惊人的... - 
                    
                        
                            SonixSonix是一款在线音频和视频转录软件,采用行业领先的语音识别算法,能在几分钟内将音频和视频文件转换为文本。Sonix适用于转录播客、采访、演讲等各种... - 
                    
                        
                            MagicAvatarMagicAvatar是一个多模态框架,能够将各种输入模式(文本、视频和音频)转换为运动信号,从而生成/动画化头像。它可以通过简单的文本提示创建头像,... - 
                    
                        
                            VoxifyVoxify是一款超逼真的AI语音生成工具,使用先进的人工智能技术,能够在几分钟内创建出真实、自然的语音合成。支持超过140种语言和口音,并且还可以添... - 
                    
                        
                            ImageBindImageBind是一种新的AI模型,能够同时绑定六种感官模态的数据,无需显式监督。通过识别这些模态之间的关系(图像和视频、音频、文本、深度、热成像和... - 
                    
                        
                            WoisWois 是一款人工智能工具,生成真实的音频视频内容,并将您与全球专业人士和专家连接起来。通过自主引导式访谈,展示您的独特声音,打造个人品牌,轻松增长... - 
                    
                        
                            DevMind AIDevMind AI旨在无缝整合文本、图像、视频、音频和代码等多种模型的推理能力,帮助您像专业人士一样进行开发!DevMind AI通过AI功能增强您... - 
                    
                        
                            Unified-IO 2Unified-IO 2是一个统一的多模态生成模型,能够理解和生成图像、文本、音频和动作。它使用单个编码器-解码器Transformer模型,将不同模... - 
                    
                        
                            EMO阿里巴巴的EMO: 是一款生成具有表情丰富的面部表情视频的工具,可以根据输入的角色图像和声音音频生成各种头部姿势和表情的声音头像视频。支持多语言歌曲... - 
                    
                        
                            TTSynth.comTTSynth.com是一个免费的在线文本转语音(TTS)生成器,它使用先进的AI技术将书面文本转换为自然发音的语音。该服务支持多种语言和口音,适用于... - 
                    
                        
                            ReadsssReadsss是一个提供每日音频新闻简报的应用程序,用户可以订阅并收听来自他们喜爱的Twitter人物的更新。它利用音频形式让用户在忙碌的日程中保持信... - 
                    
                        
                            SenseVoiceSmallSenseVoiceSmall是一款具备多种语音理解能力的语音基础模型,包括自动语音识别(ASR)、口语语言识别(LID)、语音情感识别(SER)和音... - 
                    
                        
                            Udio v1.5Udio v1.5是一个音乐创作平台的高级版本,它在v1的基础上进行了多项改进,包括提高音质、提供音调控制、改善全球语言支持等。它生成48kHz立体声... - 
                    
                        
                            BarkBark是由Suno开发的基于Transformer的文本到音频模型,能够生成逼真的多语言语音以及其他类型的音频,如音乐、背景噪声和简单音效。它还支持... - 
                    
                        
                            Mini-OmniMini-Omni是一个开源的多模态大型语言模型,能够实现实时的语音输入和流式音频输出的对话能力。它具备实时语音到语音的对话功能,无需额外的ASR或T... - 
                    
                        
                            SoBriefSoBrief是一个提供书籍摘要和音频的网站,它通过将书籍内容浓缩成易于理解的摘要,帮助用户在短时间内掌握书籍的核心思想。这个平台支持多种语言,拥有超... - 
                    
                        
                            Draw an AudioDraw an Audio是一个创新的视频到音频合成技术,它通过多指令控制,能够根据视频内容生成高质量的同步音频。这项技术不仅提升了音频生成的可控性和... - 
                    
                        
                            Kaption AIKaption AI是一款Chrome浏览器插件,它利用人工智能技术将WhatsApp上的音频消息转换成文字,并提供消息摘要和回复建议。这款插件重视用... - 
                    
                        
                            AsrToolsAsrTools是一款基于人工智能技术的语音转文字工具,它通过调用大厂的ASR服务接口,实现了无需GPU和复杂配置的高效语音识别功能。该工具支持批量处...