智能

收集全球10,000⁺个好用的AI软件

首页 > 智能

Loopy model

Loopy是一个端到端的音频驱动视频扩散模型，专门设计了跨剪辑和内部剪辑的时间模块以及音频到潜在表示模块，使模型能够利用数据中的长期运动信息来学习自然...
Draw an Audio

Draw an Audio是一个创新的视频到音频合成技术，它通过多指令控制，能够根据视频内容生成高质量的同步音频。这项技术不仅提升了音频生成的可控性和...
Youtube-Whisper

Youtube-Whisper是一个基于Gradio的应用程序，它通过提取YouTube视频的音频并使用OpenAI的Whisper模型来转录成文本。...
PodCastLM

PodCastLM是一个创新的智能播客生成平台，它利用先进的人工智能技术，让用户能够快速生成个性化的音频内容。用户只需上传PDF文件，选择问题、语气、...
hertz-dev

hertz-dev是Standard Intelligence开源的全双工、仅音频的变换器基础模型，拥有85亿参数。该模型代表了可扩展的跨模态学习技术...
FLOAT

FLOAT是一种音频驱动的人像视频生成方法，它基于流匹配生成模型，将生成建模从基于像素的潜在空间转移到学习到的运动潜在空间，实现了时间上一致的运动设计...
MMAudio

MMAudio是一种多模态联合训练技术，旨在高质量的视频到音频合成。该技术能够根据视频和文本输入生成同步音频，适用于各种应用场景，如影视制作、游戏开发...
Hailuo

Hailuo AI是一个智能AI助手，提供聊天、视频和音频等多种交互方式，能够轻松处理长文本上下文，帮助用户解决问题。它以强大的自然语言处理技术和友好...
Audio Transcription

Audio Transcription是一款利用AI技术将音频内容转换为文本的在线工具。它能够帮助用户快速准确地将播客、音频文件或网址中的音频内容转写...
MILS

MILS是一个由Facebook Research发布的开源项目，旨在展示大型语言模型（LLMs）在未经过任何训练的情况下，能够处理视觉和听觉任务的能...
JoyGen

JoyGen 是一种创新的音频驱动 3D 深度感知说话人脸视频生成技术。它通过音频驱动唇部动作生成和视觉外观合成，解决了传统技术中唇部与音频不同步和视...
ElevenLabs Studio

ElevenLabs Studio 是一个专注于音频内容创作的平台，利用先进的人工智能技术，能够将文本内容转化为高质量的音频。其主要优点包括支持多种文...
Ankara AI

Ankara AI是一款利用人工智能为视频生成叙述的应用程序。用户只需上传视频，选择语音，输入叙述提示，Ankara AI将完成剩下的工作！...
MyNeo AI

MyNeo AI 是一款终极移动助手应用，提供个性化 AI 和智能键盘，实现无障碍沟通。它具有智能聊天、语音识别、语言翻译、智能键盘输入等功能，能够帮...
Earkind

Earkind是一个通过结合语言模型和神经表达文本转语音技术，生成播客节目描述的平台。它使用新闻和研究论文列表来自动生成完整的播客剧集描述，同时提供有...
GardenofAI

Garden of AI是一个新型的AI助手,具有更好的理解能力,可以处理您交给它的任何任务。与其进行交流就像与普通人交流一样自然,没有机器人式的提示...
Gladia

Gladia I Speech-to-Text API 是一款基于先进的Whisper ASR技术的语音转文本API，能够将语音内容转录成文本，并提供...
Krater

Krater.ai 是一款全能的人工智能超级应用，集成了各种人工智能工具。无论是创作者还是写手，还是任何追求效率和优化工作流程的人，都能从 Krate...
DapperGPT

DapperGPT 是一款 AI 写作助手，聊天助手，笔记与插件工具。它基于 OpenAI 的 ChatGPT 技术，提供智能搜索、语音转文字、文字转...
MeslAI

MeslAI是一个能够让用户与各种AI人物进行语音对话的平台。用户可以与思想家、政治家、科学家等进行沉浸式对话，提问、寻求建议和探索有趣的话题。Mes...

«
1
2
...
54
55
56
57
58
59
60
...
80
81
»

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们