收集全球10,000⁺个好用的AI软件
-
ChatTTS是什么?一文让你看懂ChatTTS的技术原理、主要功能、应用场景ChatTTS概述简介 ChatTTS是一款专为对话场景设计的支持中英文的文本转语音(TTS)模型,基于约10万小时的中英文数据进行训练,能够生成高... -
Seed-TTS是什么?一文让你看懂Seed-TTS的技术原理、主要功能、应用场景Seed-TTS概述简介 Seed-TTS是由字节跳动开发的高级文本到语音(Text to Speech,TTS)模型,能够生成与人类语音极为相似的... -
ToonCrafter是什么?一文让你看懂ToonCrafter的技术原理、主要功能、应用场景ToonCrafter概述简介 ToonCrafter是由腾讯AI实验室、香港中文大学和香港城市大学的开发人员开源的卡通动画视频中间帧生成工具,突破... -
Toucan TTS是什么?一文让你看懂Toucan TTS的技术原理、主要功能、应用场景Toucan TTS概述简介 Toucan TTS是由德国斯图加特大学自然语言处理研究所(IMS)开发的文本到语音合成工具箱,支持超过7000种语言... -
CriticGPT是什么?一文让你看懂CriticGPT的技术原理、主要功能、应用场景CriticGPT概述简介 CriticGPT是OpenAI发布的一个新型人工智能模型,基于GPT-4构建,专门用于审查和识别大型语言大模型(如Ch... -
STORM AI是什么?一文让你看懂STORM AI的技术原理、主要功能、应用场景STORM AI 概述简介 STORM AI 是斯坦福大学推出的开源AI写作工具,可在几秒钟内将一个主题转换为长篇文章/研究论文,完全免费,是 Pe... -
GPT-4o Long Output模型是什么?一文让你看懂GPT-4o Long Output模型的技术原理、主要功能、应用场景GPT-4o Long Output模型概述简介 GPT-4o Long Output模型是OpenAI最新推出的超长输出AI大模型,支持高达64k... -
Tora是什么?一文让你看懂Tora的技术原理、主要功能、应用场景Tora概述简介 Tora是阿里推出的AI视频生成框架,基于轨迹导向的扩散变换器(DiT)技术,将文本、视觉和轨迹条件融合,生成高质量且符合物理世界... -
EmoTalk3D是什么?一文让你看懂EmoTalk3D的技术原理、主要功能、应用场景EmoTalk3D概述简介 EmoTalk3D是华为诺亚方舟实验室、南京大学和复旦大学一起推出的3D数字人框架。技术的核心在于能合成具有丰富情感表达... -
Tailor是什么?一文让你看懂Tailor的技术原理、主要功能、应用场景Tailor概述简介 Tailor是免费开源的AI视频编辑工具,集成了人脸识别、语音识别等智能技术,提供视频编辑、生成和优化三大功能。能实现人脸剪辑... -
MDT-A2G是什么?一文让你看懂MDT-A2G的技术原理、主要功能、应用场景直接偏好优化(DPO):一种离线强化学习方法,用于优化策略,使Agent Q能从成功的和不成功的轨迹中学习。DPO算法通过直接优化偏好对来微调模型,不... -
UniTalker是什么?一文让你看懂UniTalker的技术原理、主要功能、应用场景迭代微调:通过直接偏好优化(DPO)算法,Agent Q能够从成功和不成功的轨迹中学习,不断优化其策略。... -
VITA是什么?一文让你看懂VITA的技术原理、主要功能、应用场景VITA概述简介 VITA是腾讯优图实验室推出的全球首个开源多模态大语言大模型(MLLM),能理解和处理视频、图像、文本和音频。基于Mixtral ... -
Glyph-ByT5是什么?一文让你看懂Glyph-ByT5的技术原理、主要功能、应用场景Glyph-ByT5概述简介Glyph-ByT5-v2由微软亚洲研究院、清华大学、北京大学和利物浦大学联合开发的多语言视觉文本渲染项目。Glyph-B... -
SadTalker是什么?一文让你看懂SadTalker的技术原理、主要功能、应用场景SadTalker概述简介 SadTalker是西安交通大学、腾讯AI实验室和蚂蚁集团联合推出的开源AI数字人项目。SadTalker专注于通过单张... -
TurboEdit是什么?一文让你看懂TurboEdit的技术原理、主要功能、应用场景TurboEdit概述简介 TurboEdit是Adobe Research 推出的AI即时图像编辑模型。通过编码器迭代反演和基于文本的精细控制,能... -
Transfusion是什么?一文让你看懂Transfusion的技术原理、主要功能、应用场景Transfusion概述简介 Transfusion是Meta公司最新推出的文本与图像融合的多模态AI大模型,Transfusion通过结合语言大... -
MARS5-TTS是什么?一文让你看懂MARS5-TTS的技术原理、主要功能、应用场景MARS5-TTS概述简介 MARS5-TTS是CAMB.AI推出开源的AI声音克隆工具,有突破性逼真的韵律,支持140多种语言支持。还能处理复杂韵... -
TrackGo是什么?一文让你看懂TrackGo的技术原理、主要功能、应用场景TrackGo概述简介 TrackGo是一种先进的可控AI视频生成技术,通过用自由形状的遮罩和箭头,为用户提供了一种灵活而精确的机制来控制视频中对象... -
GPT Pilot是什么?一文让你看懂GPT Pilot的技术原理、主要功能、应用场景GPT Pilot概述简介 GPT Pilot 是一款AI编程工具,通过模仿人类开发者的工作流程,帮助从零开始构建应用程序。能编写代码、调试程序、与...