AI TOOL

AI软件大全 AI软件大全
  • AI排行榜
  • AI大模型
    • AI开发框架
    • 国外大模型
    • 国产大模型
    • 开源大模型
    • AI训练模型
  • AI写作软件
    • AI通用写作
    • AI PPT生成
    • 论文AI生成
    • AI小说生成
    • AI脚本剧本
    • AI歌词生成器
    • AI文案生成
    • AI会议助手
    • AI图表生成
    • AI内容检测
  • AI图片生成
    • AI绘画生成
    • AI图片编辑
    • AI 图标生成器
    • 文字生成图片
    • 图片生成图片
    • 图片生成3D
    • AI LOGO生成器
    • AI图片识别
    • 图片生成网页
  • AI视频生成
    • AI视频生成
    • 文字生成视频
    • AI视频换脸
    • 图片生成视频
    • AI虚拟数字人
    • AI视频编辑
    • AI视频直播
    • AI短剧生成
    • AI动漫视频
  • AI音频生成
    • 文字转语音
    • 语音转文字
    • AI音乐创作
    • AI语音识别
    • AI声音降噪
    • AI声音克隆
    • AI音频编辑
  • AI设计软件
    • AI网页设计
    • AI平面设计
    • AI 3D设计
    • AI室内设计
    • AI绘画设计
    • AI游戏设计
    • AI建筑设计
  • AI营销软件
    • AI SEO
    • 社媒营销
    • 网红营销
    • 广告投流
    • 邮件营销
    • 流量变现
    • 裂变增长
    • AI CRM
    • 数据分析
    • 电商平台
    • 营销平台
  • AI智能编程
    • AI开发者工具
    • AI机构协会
    • AI编程开发
    • AI搜索引擎
    • AI开发者社区
    • AI提示指令
    • AI开放平台
    • AI训练模型
    • AI算力平台
  • AI翻译软件
    • AI文本翻译
    • AI图片翻译
    • AI视频翻译
    • AI音频翻译
    • AI文档翻译
  • AI对话聊天
    • AI聊天机器人
    • AI智能客服
  • 其他AI工具
  • AI办公应用
    • AI文档处理
    • AI思维导图
    • 生产力工具
    • AI数据分析
    • 工作流管理
    • AI格式转换
    • 人力资源管理
    • AI表单调查
    • AI团队协作
  • AI行业应用
    • AI教育应用
    • AI电商应用
    • AI生活应用
    • AI医疗应用
    • AI法律助手
    • AI户外旅行
    • AI游戏娱乐
    • AI金融支付
    • AI商业应用
  • AI学习网站
  • 素材资源分享
    • 文档模板素材
    • 图片图标素材
    • 常用工具插件
    • 服务器VPS
    • CMS内容管理
    • 开源免费资源
    • 开发者开放平台
    • 前后端框架
    • API接口服务
  • AI教程评测
    • Deepseek教程
    • ChatGPT教程
    • ‌Midjourney教程
    • AI提示指令
    • AI入门教程
    • AI工具教程
    • AI高级知识
    • AI工具评测
  • AI热点资讯
    • AI热点资讯
    • AI风云人物
    • 国内AI资讯
    • 国外AI资讯
    • AI算力资讯
    • 大咖说AI
    • AI讨论区
  • AI创业专区
    • AI创业项目
    • AI创业案例
    • AI项目融资
    • AI创业攻略
    • AI出海项目
    • 小白AI创业
    • AI创业经验
  • 提交您的AI工具
  • AI工具箱
  • AI工具专题
  • 热门AI工具
  • 免费AI工具
  • 国外AI工具
  • 国产AI工具
  • 最新AI工具
    提交收录
AI工具软件收录提交入口
收集全球10,000⁺个好用的AI软件
  • DeepSeek
  • AI写作
  • AI数字人
  • AI视频
  • AI图片
首页 > 模型
  • ragobble
    ragobble
    ragobble是一个利用人工智能将音频文件转换为文档的平台。通过将在线视频和音频信息转换为可向量化的RAG文档,用户可以将生成的文档应用于其LLM实...
  • Make-An-Audio 2
    Make-An-Audio 2
    Make-An-Audio 2是一种基于扩散模型的文本到音频生成技术,由浙江大学、字节跳动和香港中文大学的研究人员共同开发。该技术通过使用预训练的大型...
  • ElevenLabs Text to Sound Effects
    ElevenLabs Text to Sound Effects
    Text to Sound Effects是ElevenLabs开发的最新AI音频模型,能够根据文本提示生成各种音效、短音乐曲目、音景和角色声音。它代...
  • Stable Audio Open
    Stable Audio Open
    Stable Audio Open是一个开源的文本到音频模型,专为生成短音频样本、音效和制作元素而优化。它允许用户通过简单的文本提示生成高达47秒的高...
  • VideoLLaMA 2
    VideoLLaMA 2
    VideoLLaMA 2 是一个针对视频理解任务优化的大规模语言模型,它通过先进的空间-时间建模和音频理解能力,提升了对视频内容的解析和理解。该模型在...
  • GenAU
    GenAU
    GenAU是一个由Snap Research开发的音频生成模型,它通过AutoCap自动字幕生成模型和GenAu音频生成架构,显著提升了音频生成的质量...
  • Qwen2-Audio
    Qwen2-Audio
    Qwen2-Audio是由阿里云提出的大型音频语言模型,能够接受各种音频信号输入,并根据语音指令进行音频分析或直接文本回复。该模型支持两种不同的音频交...
  • MaskVAT
    MaskVAT
    MaskVAT是一种视频到音频(V2A)生成模型,它利用视频的视觉特征来生成与场景匹配的逼真声音。该模型特别强调声音的起始点与视觉动作的同步性,以避免...
  • Easy Voice Toolkit
    Easy Voice Toolkit
    Easy Voice Toolkit是一个基于开源语音项目的AI语音工具箱,提供包括语音模型训练在内的多种自动化音频工具。该工具箱能够无缝集成,形成完...
  • CyberHost
    CyberHost
    CyberHost是一个端到端音频驱动的人体动画框架,通过区域码本注意力机制,实现了手部完整性、身份一致性和自然运动的生成。该模型利用双U-Net架构...
  • Stability AI
    Stability AI
    Stability AI是一个专注于生成式人工智能技术的公司,提供多种AI模型,包括文本到图像、视频、音频、3D和语言模型。这些模型能够处理复杂提示,...
  • EzAudio
    EzAudio
    EzAudio是一个先进的文本到音频(T2A)生成模型,它能够从文本提示中创建高质量的音频。它为开源T2A模型设定了新的标准,提供快速、高效和逼真的声...
  • AudioLM
    AudioLM
    AudioLM是由Google Research开发的一个框架,用于高质量音频生成,具有长期一致性。它将输入音频映射到离散标记序列,并将音频生成视为这...
  • Universal-2
    Universal-2
    Universal-2是AssemblyAI推出的最新语音识别模型,它在准确度和精确度上超越了前一代Universal-1,能够更好地捕捉人类语言的复...
  • hertz-dev
    hertz-dev
    hertz-dev是Standard Intelligence开源的全双工、仅音频的变换器基础模型,拥有85亿参数。该模型代表了可扩展的跨模态学习技术...
  • OuteTTS-0.1-350M
    OuteTTS-0.1-350M
    OuteTTS-0.1-350M是一款基于纯语言模型的文本到语音合成技术,它不需要外部适配器或复杂架构,通过精心设计的提示和音频标记实现高质量的语音合...
  • JoyVASA
    JoyVASA
    JoyVASA是一种基于扩散模型的音频驱动人像动画技术,它通过分离动态面部表情和静态3D面部表示来生成面部动态和头部运动。这项技术不仅能够提高视频质量...
  • Fugatto
    Fugatto
    Fugatto(全称Foundational Generative Audio Transformer Opus 1)是由NVIDIA推出的一款生成式...
  • OmniAudio-2.6B
    OmniAudio-2.6B
    OmniAudio-2.6B是一个2.6B参数的多模态模型,能够无缝处理文本和音频输入。该模型结合了Gemma-2B、Whisper turbo和一个...
  • MILS
    MILS
    MILS是一个由Facebook Research发布的开源项目,旨在展示大型语言模型(LLMs)在未经过任何训练的情况下,能够处理视觉和听觉任务的能...
  • «
  • 1
  • 2
  • ...
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • ...
  • 29
  • 30
  • »
卓商AI工具集 卓商-AI工具集
AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

隐私策略 免责条款 服务协议关于我们

微信群

AI产品交流群

二维码

扫码联系站长
© 2013-2025 卓商AI 版权所有,保留所有权利 本站SEO技术支持: 知了网络   网站地图   友情链接交换
  • 微信二维码