人工智能

收集全球10,000⁺个好用的AI软件

首页 > 人工智能

FoleyCrafter

FoleyCrafter是一个基于文本的视频到音频生成框架，能够生成与输入视频语义相关且时间同步的高质量音频。该技术在视频制作领域具有重要意义，特别是...
音频提取文字工具

AIbase音频提取文字工具利用人工智能技术，通过机器学习模型快速生成高质量的音频文本描述，优化文本排版，提升可读性，同时完全免费使用，无需安装、下载...
AudioForge AI

AudioForge AI是一个专注于音乐制作的智能平台，利用先进的人工智能技术，帮助音乐制作人和爱好者提高音乐创作的效率和质量。它通过自动化处理音频...
CyberHost

CyberHost是一个端到端音频驱动的人体动画框架，通过区域码本注意力机制，实现了手部完整性、身份一致性和自然运动的生成。该模型利用双U-Net架构...
Loopy model

Loopy是一个端到端的音频驱动视频扩散模型，专门设计了跨剪辑和内部剪辑的时间模块以及音频到潜在表示模块，使模型能够利用数据中的长期运动信息来学习自然...
Draw an Audio

Draw an Audio是一个创新的视频到音频合成技术，它通过多指令控制，能够根据视频内容生成高质量的同步音频。这项技术不仅提升了音频生成的可控性和...
Youtube-Whisper

Youtube-Whisper是一个基于Gradio的应用程序，它通过提取YouTube视频的音频并使用OpenAI的Whisper模型来转录成文本。...
PodCastLM

PodCastLM是一个创新的智能播客生成平台，它利用先进的人工智能技术，让用户能够快速生成个性化的音频内容。用户只需上传PDF文件，选择问题、语气、...
hertz-dev

hertz-dev是Standard Intelligence开源的全双工、仅音频的变换器基础模型，拥有85亿参数。该模型代表了可扩展的跨模态学习技术...
FLOAT

FLOAT是一种音频驱动的人像视频生成方法，它基于流匹配生成模型，将生成建模从基于像素的潜在空间转移到学习到的运动潜在空间，实现了时间上一致的运动设计...
MMAudio

MMAudio是一种多模态联合训练技术，旨在高质量的视频到音频合成。该技术能够根据视频和文本输入生成同步音频，适用于各种应用场景，如影视制作、游戏开发...
MILS

MILS是一个由Facebook Research发布的开源项目，旨在展示大型语言模型（LLMs）在未经过任何训练的情况下，能够处理视觉和听觉任务的能...
JoyGen

JoyGen 是一种创新的音频驱动 3D 深度感知说话人脸视频生成技术。它通过音频驱动唇部动作生成和视觉外观合成，解决了传统技术中唇部与音频不同步和视...
ElevenLabs Studio

ElevenLabs Studio 是一个专注于音频内容创作的平台，利用先进的人工智能技术，能够将文本内容转化为高质量的音频。其主要优点包括支持多种文...
Ankara AI

Ankara AI是一款利用人工智能为视频生成叙述的应用程序。用户只需上传视频，选择语音，输入叙述提示，Ankara AI将完成剩下的工作！...
Earkind

Earkind是一个通过结合语言模型和神经表达文本转语音技术，生成播客节目描述的平台。它使用新闻和研究论文列表来自动生成完整的播客剧集描述，同时提供有...
GardenofAI

Garden of AI是一个新型的AI助手,具有更好的理解能力,可以处理您交给它的任何任务。与其进行交流就像与普通人交流一样自然,没有机器人式的提示...
Krater

Krater.ai 是一款全能的人工智能超级应用，集成了各种人工智能工具。无论是创作者还是写手，还是任何追求效率和优化工作流程的人，都能从 Krate...
MeslAI

MeslAI是一个能够让用户与各种AI人物进行语音对话的平台。用户可以与思想家、政治家、科学家等进行沉浸式对话，提问、寻求建议和探索有趣的话题。Mes...
Voqal

Voqal革新了开发者与集成开发环境（IDE）的互动方式，将其从图形用户界面（GUI）转变为语音用户界面（VUI），使程序员可以用语音进行软件开发。V...

«
1
2
...
33
34
35
36
37
38
39
...
51
52
»

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们