收集全球10,000⁺个好用的AI软件
-
Teacher2Task是什么?一文让你看懂Teacher2Task的技术原理、主要功能、应用场景Teacher2Task什么 Teacher2Task是谷歌团队推出的多教师学习框架,引入教师特定的输入标记和重新构思训练过程,消除对手动聚合启发式... -
Takin AudioLLM是什么?一文让你看懂Takin AudioLLM的技术原理、主要功能、应用场景Takin AudioLLM概述简介 Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型,包括Takin ... -
AutoTrain是什么?一文让你看懂AutoTrain的技术原理、主要功能、应用场景AutoTrain概述简介 AutoTrain(AutoTrain Advanced)是Hugging Face推出的开源无代码平台,能简化最先进模... -
ebook2audiobookXTTS是什么?一文让你看懂ebook2audiobookXTTS的技术原理、主要功能、应用场景ebook2audiobookXTTS概述简介 ebook2audiobookXTTS是开源的AI工具,能将电子书转换为有声书。ebook2audi... -
Talker-Reasoner是什么?一文让你看懂Talker-Reasoner的技术原理、主要功能、应用场景Talker-Reasoner概述简介 Talker-Reasoner是谷歌DeepMind推出的双思维AI代理架构,借鉴人类的认知理论,将代理分为... -
TryOffDiff是什么?一文让你看懂TryOffDiff的技术原理、主要功能、应用场景TryOffDiff概述简介 TryOffDiff(VTOFF)是基于扩散模型的新型虚拟试穿技术,用高保真服装重建实现虚拟试穿,专注于从单张穿着者照... -
CAT4D是什么?一文让你看懂CAT4D的技术原理、主要功能、应用场景CAT4D概述简介 CAT4D是Google DeepMind、哥伦比亚大学和加州大学圣地亚哥分校一起推出的,能从单目视频创建4D场景(动态3D)表... -
Co-op Translator是什么?一文让你看懂Co-op Translator的技术原理、主要功能、应用场景Co-op Translator概述简介 Co-op Translator是微软推出的开源多语言翻译工具,基于Azure AI服务实现项目文档和图像... -
MyTimeMachine是什么?一文让你看懂MyTimeMachine的技术原理、主要功能、应用场景MyTimeMachine概述简介 MyTimeMachine(MyTM)是先进的个性化面部年龄转换技术,基于大约50张个人照片,跨越20至40年的... -
MagicDriveDiT是什么?一文让你看懂MagicDriveDiT的技术原理、主要功能、应用场景MagicDriveDiT概述简介 MagicDriveDiT是香港中文大学、香港科技大学、华为云和华为诺亚方舟实验室一起推出基于DiT架构的新型视... -
EfficientTAM是什么?一文让你看懂EfficientTAM的技术原理、主要功能、应用场景EfficientTAM概述简介 EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,能解决SAM 2模型在移动设备上部署时... -
GPT学术优化是什么?一文让你看懂GPT学术优化的技术原理、主要功能、应用场景GPT学术优化概述简介 GPT学术优化(GPT Academic)是功能丰富的开源项目,专为学术研究和写作设计。GPT学术优化集成一键论文翻译、源代... -
TeleAI 视频生成大模型是什么?一文让你看懂TeleAI 视频生成大模型的技术原理、主要功能、应用场景TeleAI 视频生成大模型概述简介 TeleAI 视频生成大模型是中国电信AI研究院推出的视频生成模型,基于两阶段生成框架:先根据文本描述创建分镜... -
TPDM是什么?一文让你看懂TPDM的技术原理、主要功能、应用场景TPDM概述简介 TPDM(Time Prediction Diffusion Model)是西湖大学MAPLE实验室、南方科技大学、北京大学及西湖... -
One Shot, One Talk是什么?一文让你看懂One Shot, One Talk的技术原理、主要功能、应用场景One Shot, One Talk概述简介 One Shot, One Talk是先进的图像生成技术,能从单张图片中生成具有个性化细节的全身动态说... -
OOTDiffusion是什么?一文让你看懂OOTDiffusion的技术原理、主要功能、应用场景OOTDiffusion概述简介 OOTDiffusion是开源的AI虚拟试衣工具,能智能适配不同性别和体型,自动调整衣物尺寸和形状,生成自然贴合的... -
ChatTTSPlus是什么?一文让你看懂ChatTTSPlus的技术原理、主要功能、应用场景ChatTTSPlus概述简介 ChatTTSPlus是ChatTTS的扩展版本,增加了TensorRT加速、语音克隆和移动模型部署等功能,提升语音... -
TEN Agent是什么?一文让你看懂TEN Agent的技术原理、主要功能、应用场景TEN Agent概述简介 TEN Agent是集成OpenAI Realtime API和RTC技术的开源实时多模态AI代理框架。TEN Agen... -
FLOAT是什么?一文让你看懂FLOAT的技术原理、主要功能、应用场景FLOAT概述简介 FLOAT是DeepBrain AI 和韩国先进科技研究院推出的音频驱动说话人头像生成模型,基于流匹配生成模型,学习运动潜在空间... -
STIV是什么?一文让你看懂STIV的技术原理、主要功能、应用场景STIV概述简介 STIV(Scalable Text and Image Conditioned Video Generation)是苹果公司推出...