收集全球10,000⁺个好用的AI软件
-
CosyVoiceCosyVoice 是一个多语言的大型语音生成模型,它不仅支持多种语言的语音生成,还提供了从推理到训练再到部署的全栈能力。该模型在语音合成领域具有重要... -
aTrainaTrain是由格拉茨大学商业分析与数据科学中心的研究人员开发,并由格拉茨知识中心的研究人员测试的一款离线语音转录工具。它利用最新的机器学习模型,无需... -
EmiliaEmilia是一个开源的多语种野外语音数据集,专为大规模语音生成研究设计。它包含超过101,000小时的六种语言高质量语音数据和相应的文本转录,覆盖了... -
SenseVoiceSmallSenseVoiceSmall是一款具备多种语音理解能力的语音基础模型,包括自动语音识别(ASR)、口语语言识别(LID)、语音情感识别(SER)和音... -
Cols.aiCols.ai 的 AI Phone Calling Platform 是一款旨在实现无缝人类语音通信的AI产品。它能够与电话系统连接,处理呼入电话,... -
ElevenLabs AI audio APIElevenLabs AI音频API提供了高质量的语音合成服务,支持多种语言,适用于聊天机器人、代理、网站、应用程序等,具有低延迟和高响应速度。该AP... -
SpeechGPT2SpeechGPT2是由复旦大学计算机科学学院开发的端到端语音对话语言模型,能够感知并表达情感,并根据上下文和人类指令以多种风格提供合适的语音响应。该... -
PC AgentPC Agent是一款利用人工智能技术,通过屏幕内容和音频转录来理解用户的电脑环境,从而提供更加精准的辅助服务。它旨在解决当前聊天机器人的局限性,通过... -
Real-time-translation-typingReal-time-translation-typing 是一款集成了实时打字翻译、语音实时打字和翻译、LOL 语音打字功能的软件。它通过AutoHo... -
Voice Assistant Plugin for GPTVoice Assistant Plugin for GPT 是一款专为GPT设计的语音助手插件,旨在通过语音交互提升用户体验。该插件结合了先进的语音... -
SpeechZapSpeechZap是一款专注于语音转文字的在线服务,它能够将用户的语音快速准确地转换成文字,极大地提高了工作效率和信息记录的便捷性。该产品以其高准确性... -
SilviaSilvia是一款能够适应用户说话方式的语音输入系统,支持用户在不同语言之间自由切换,即使在句子中也能无缝切换。它支持英语和西班牙语,并且即将支持法语... -
Gan.AIGan.AI是一个专注于对话式人工智能研究和产品的公司,致力于通过其先进的AI技术,为全球知名品牌提供个性化的视频和音频通信解决方案。该公司的产品和技... -
Felo实时翻译Felo实时翻译是一款应用最新AI技术,提供实时语音翻译服务的应用程序。它通过GPT技术实现高速和高精度的翻译,支持实时转录语音并识别语种,将语音转录... -
汉王语音王汉王语音王App是汉王科技基于自研多模态天地大模型,自主研发的智能语音旗舰应用。它集AI语音记录、智能翻译与同声传译于一体,支持AI精准转写、拍录同步... -
Seed-ASRSeed-ASR是由字节跳动公司开发的基于大型语言模型(Large Language Model, LLM)的语音识别模型。它通过将连续的语音表示和上... -
babelfish.aibabelfish.ai 是一个基于浏览器的实时语音转文字和翻译应用。它利用 Huggingface Transformer.js 和 Supabas... -
Llama3-s v0.2Llama3-s v0.2 是 Homebrew Computer Company 开发的多模态检查点,专注于提升语音理解能力。该模型通过早期融合语义... -
Mini-OmniMini-Omni是一个开源的多模态大型语言模型,能够实现实时的语音输入和流式音频输出的对话能力。它具备实时语音到语音的对话功能,无需额外的ASR或T... -
聆龙聆龙是一款AI笔记助手,它通过语音AI笔记功能,支持用户随时记录信息,并以富文本形式保存。它还具备AI智能标签功能,能够自动生成标题,帮助用户与自己的...