AI TOOL

AI软件大全 AI软件大全
  • AI排行榜
  • AI大模型
    • AI开发框架
    • 国外大模型
    • 国产大模型
    • 开源大模型
    • AI训练模型
  • AI写作软件
    • AI通用写作
    • AI PPT生成
    • 论文AI生成
    • AI小说生成
    • AI脚本剧本
    • AI歌词生成器
    • AI文案生成
    • AI会议助手
    • AI图表生成
    • AI内容检测
  • AI图片生成
    • AI绘画生成
    • AI图片编辑
    • AI 图标生成器
    • 文字生成图片
    • 图片生成图片
    • 图片生成3D
    • AI LOGO生成器
    • AI图片识别
    • 图片生成网页
  • AI视频生成
    • AI视频生成
    • 文字生成视频
    • AI视频换脸
    • 图片生成视频
    • AI虚拟数字人
    • AI视频编辑
    • AI视频直播
    • AI短剧生成
    • AI动漫视频
  • AI音频生成
    • 文字转语音
    • 语音转文字
    • AI音乐创作
    • AI语音识别
    • AI声音降噪
    • AI声音克隆
    • AI音频编辑
  • AI设计软件
    • AI网页设计
    • AI平面设计
    • AI 3D设计
    • AI室内设计
    • AI绘画设计
    • AI游戏设计
    • AI建筑设计
  • AI营销软件
    • AI SEO
    • 社媒营销
    • 网红营销
    • 广告投流
    • 邮件营销
    • 流量变现
    • 裂变增长
    • AI CRM
    • 数据分析
    • 电商平台
    • 营销平台
  • AI智能编程
    • AI开发者工具
    • AI机构协会
    • AI编程开发
    • AI搜索引擎
    • AI开发者社区
    • AI提示指令
    • AI开放平台
    • AI训练模型
    • AI算力平台
  • AI翻译软件
    • AI文本翻译
    • AI图片翻译
    • AI视频翻译
    • AI音频翻译
    • AI文档翻译
  • AI对话聊天
    • AI聊天机器人
    • AI智能客服
  • 其他AI工具
  • AI办公应用
    • AI文档处理
    • AI思维导图
    • 生产力工具
    • AI数据分析
    • 工作流管理
    • AI格式转换
    • 人力资源管理
    • AI表单调查
    • AI团队协作
  • AI行业应用
    • AI教育应用
    • AI电商应用
    • AI生活应用
    • AI医疗应用
    • AI法律助手
    • AI户外旅行
    • AI游戏娱乐
    • AI金融支付
    • AI商业应用
  • AI学习网站
  • 素材资源分享
    • 文档模板素材
    • 图片图标素材
    • 常用工具插件
    • 服务器VPS
    • CMS内容管理
    • 开源免费资源
    • 开发者开放平台
    • 前后端框架
    • API接口服务
  • AI教程评测
    • Deepseek教程
    • ChatGPT教程
    • ‌Midjourney教程
    • AI提示指令
    • AI入门教程
    • AI工具教程
    • AI高级知识
    • AI工具评测
  • AI热点资讯
    • AI热点资讯
    • AI风云人物
    • 国内AI资讯
    • 国外AI资讯
    • AI算力资讯
    • 大咖说AI
    • AI讨论区
  • AI创业专区
    • AI创业项目
    • AI创业案例
    • AI项目融资
    • AI创业攻略
    • AI出海项目
    • 小白AI创业
    • AI创业经验
  • 提交您的AI工具
  • AI工具箱
  • AI工具专题
  • 热门AI工具
  • 免费AI工具
  • 国外AI工具
  • 国产AI工具
  • 最新AI工具
    提交收录
AI工具软件收录提交入口
收集全球10,000⁺个好用的AI软件
  • DeepSeek
  • AI写作
  • AI数字人
  • AI视频
  • AI图片
首页 > 语音识别
  • EngineerDraft
    EngineerDraft
    BeMyEars 是一款实时字幕生成工具,利用本地设备完成语音识别,为听障人士和需要字幕的用户提供极致体验。其主要优点包括多语言支持、多源输入、隐私保...
  • LookOnceToHear
    LookOnceToHear
    LookOnceToHear 是一种创新的智能耳机交互系统,允许用户通过简单的视觉识别来选择想要听到的目标说话者。这项技术在 CHI 2024 上获得...
  • seed-tts-eval
    seed-tts-eval
    seed-tts-eval 是一个用于评估模型零样本语音生成能力的测试集,它提供了一个跨领域目标的客观评估测试集,包含从英语和普通话公共语料库中提取的...
  • StreamSpeech
    StreamSpeech
    StreamSpeech是一款基于多任务学习的实时语音到语音翻译模型。它通过统一框架同时学习翻译和同步策略,有效识别流式语音输入中的翻译时机,实现高质...
  • sherpa-onnx
    sherpa-onnx
    sherpa-onnx 是一个基于下一代 Kaldi 的语音识别和语音合成项目,使用onnxruntime进行推理,支持多种语音相关功能,包括语音转文...
  • GPT4o.so
    GPT4o.so
    GPT-4o是OpenAI的最新创新,代表了人工智能技术的前沿。它通过真正的多模态方法扩展了GPT-4的功能,包括文本、视觉和音频。GPT-4o以其快...
  • Azure 认知服务语音
    Azure 认知服务语音
    Azure 认知服务语音是微软推出的一款语音识别与合成服务,支持超过100种语言和方言的语音转文本和文本转语音功能。它通过创建可处理特定术语、背景噪音...
  • SenseVoice
    SenseVoice
    SenseVoice是一个包含自动语音识别(ASR)、语音语言识别(LID)、语音情感识别(SER)和音频事件检测(AED)等多语音理解能力的语音基础...
  • FunAudioLLM
    FunAudioLLM
    FunAudioLLM是一个旨在增强人类与大型语言模型(Large Language Models, LLMs)之间自然语音交互的框架。它包含两个创新...
  • Onyxium
    Onyxium
    Onyxium是一个综合性的AI工具平台,提供包括图像识别、文本分析、语音识别等在内的多种AI技术。它旨在帮助用户轻松访问最新AI技术,以低成本使用这...
  • SenseVoiceSmall
    SenseVoiceSmall
    SenseVoiceSmall是一款具备多种语音理解能力的语音基础模型,包括自动语音识别(ASR)、口语语言识别(LID)、语音情感识别(SER)和音...
  • AIAvatarKit
    AIAvatarKit
    AIAvatarKit是一个用于快速构建基于AI的会话头像的工具。它支持在VRChat、集群和其他元宇宙平台以及现实世界的设备上运行。该工具易于启动,...
  • PC Agent
    PC Agent
    PC Agent是一款利用人工智能技术,通过屏幕内容和音频转录来理解用户的电脑环境,从而提供更加精准的辅助服务。它旨在解决当前聊天机器人的局限性,通过...
  • Say My Name!
    Say My Name!
    Say My Name! 是一款以趣味和个性化为核心的语音识别应用。它利用先进的语音识别技术,让用户的设备能够识别和响应用户的声音,尤其是用户的名字。...
  • Voice Assistant Plugin for GPT
    Voice Assistant Plugin for GPT
    Voice Assistant Plugin for GPT 是一款专为GPT设计的语音助手插件,旨在通过语音交互提升用户体验。该插件结合了先进的语音...
  • LSLM
    LSLM
    Listening-while-Speaking Language Model (LSLM)是一款旨在提升人机交互自然度的人工智能对话模型。它通过全双...
  • WeST
    WeST
    WeST是一个开源的语音识别转录模型,以300行代码的简洁形式,基于大型语言模型(LLM)实现语音到文本的转换。它由一个大型语言模型、一个语音编码器和...
  • Qwen2 Audio Instruct Demo
    Qwen2 Audio Instruct Demo
    Qwen2 Audio Instruct Demo 是一个基于音频指令的交互式演示网站,它利用最新的人工智能技术,让用户通过语音指令与网页进行互动。这...
  • whisper-diarization
    whisper-diarization
    whisper-diarization是一个结合了Whisper自动语音识别(ASR)能力、声音活动检测(VAD)和说话人嵌入技术的开源项目。它通过提...
  • 汉王语音王
    汉王语音王
    汉王语音王App是汉王科技基于自研多模态天地大模型,自主研发的智能语音旗舰应用。它集AI语音记录、智能翻译与同声传译于一体,支持AI精准转写、拍录同步...
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • »
卓商AI工具集 卓商-AI工具集
AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

隐私策略 免责条款 服务协议关于我们

微信群

AI产品交流群

二维码

扫码联系站长
© 2013-2025 卓商AI 版权所有,保留所有权利 本站SEO技术支持: 知了网络   网站地图   友情链接交换
  • 微信二维码