收集全球10,000⁺个好用的AI软件
-
AingDesk是什么?一文让你看懂AingDesk的技术原理、主要功能、应用场景AingDesk概述简介 AingDesk 是开源的客户端软件,帮助用户快速将上百款 AI 模型部署到个人电脑上。通过一键部署功能,简化复杂的模型安...
-
DeepEP是什么?一文让你看懂DeepEP的技术原理、主要功能、应用场景DeepEP概述简介 DeepEP 是 DeepSeek 开源的首个专为混合专家模型(MoE)训练和推理设计的开源 EP(专家并行)通信库。提供了高...
-
FantasyID是什么?一文让你看懂FantasyID的技术原理、主要功能、应用场景FantasyID概述简介 FantasyID 是阿里集团和北京邮电大学推出新型的身份保持视频生成(IPT2V)框架,基于增强人脸知识生成高质量的身...
-
DeepGEMM是什么?一文让你看懂DeepGEMM的技术原理、主要功能、应用场景DeepGEMM概述简介 DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hoppe...
-
PhotoDoodle是什么?一文让你看懂PhotoDoodle的技术原理、主要功能、应用场景PhotoDoodle概述简介 PhotoDoodle是新加坡国立大学、上海交通大学、北京邮电大学、字节跳动和Tiamat团队联合推出的艺术化图像编...
-
DualPipe是什么?一文让你看懂DualPipe的技术原理、主要功能、应用场景DualPipe概述简介 DualPipe 是DeepSeek开源的创新的双向流水线并行技术,主要用于提升大规模深度学习模型的训练效率。核心思想是将...
-
Profiling Data是什么?一文让你看懂Profiling Data的技术原理、主要功能、应用场景Profiling Data概述简介 Profiling Data是DeepSeek开源的训练和推理框架的性能分析数据,基于PyTorch Prof...
-
CorrDiff是什么?一文让你看懂CorrDiff的技术原理、主要功能、应用场景CorrDiff概述简介 CorrDiff 是 NVIDIA 推出的生成式 AI 模型,用于将低分辨率的全球天气数据下采样为高分辨率数据,提高天气预...
-
LDGen是什么?一文让你看懂LDGen的技术原理、主要功能、应用场景LDGen概述简介 LDGen是创新的文本到图像合成技术,通过结合大型语言大模型(LLMs)与扩散模型,提升文本描述到图像生成的质量和语义一致性。通...
-
AgiBot Digital World是什么?一文让你看懂AgiBot Digital World的技术原理、主要功能、应用场景AgiBot Digital World概述简介 AgiBot Digital World 是智元机器人推出的高保真机器人仿真框架,为机器人操作技能...
-
ViDoRAG是什么?一文让你看懂ViDoRAG的技术原理、主要功能、应用场景ViDoRAG概述简介 ViDoRAG是阿里巴巴通义实验室联合中国科学技术大学和上海交通大学推出的视觉文档检索增强生成框架。基于多智能体协作和动态迭...
-
LCVD是什么?一文让你看懂LCVD的技术原理、主要功能、应用场景LCVD概述简介 LCVD(Lighting Controllable Video Diffusion Model)是四川大学推出的高保真、光照可控...
-
谛韵DiffRhythm是什么?一文让你看懂谛韵DiffRhythm的技术原理、主要功能、应用场景DiffRhythm概述简介 DiffRhythm(中文名称:谛韵) 是西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模...
-
DiffBrush是什么?一文让你看懂DiffBrush的技术原理、主要功能、应用场景DiffBrush概述简介 DiffBrush是北京邮电大学、清华大学、中国电信人工智能研究所和西北工业大学推出的,无需训练的图像生成与编辑框架,支...
-
X-Dancer是什么?一文让你看懂X-Dancer的技术原理、主要功能、应用场景X-Dancer概述简介 X-Dancer 是字节跳动联合加州大学圣地亚哥分校和南加州大学的开发人员一起推出的音乐驱动的人像舞蹈视频生成框架,支持从...
-
AVD2是什么?一文让你看懂AVD2的技术原理、主要功能、应用场景AVD2概述简介 AVD2(Accident Video Diffusion for Accident Video Description)是清华大...
-
Kiss3DGen是什么?一文让你看懂Kiss3DGen的技术原理、主要功能、应用场景Kiss3DGen概述简介 Kiss3DGen是创新的3D资产生成框架,通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于...
-
GCDance是什么?一文让你看懂GCDance的技术原理、主要功能、应用场景GCDance概述简介 GCDance(Genre-Controlled 3D Full Body Dance Generation Driven ...
-
DINO-XSeek是什么?一文让你看懂DINO-XSeek的技术原理、主要功能、应用场景DINO-XSeek概述简介 DINO-XSeek 是 IDEA 研究院推出的多模态目标检测模型,结合视觉感知和自然语言理解能力。DINO-XSee...
-
DoraCycle是什么?一文让你看懂DoraCycle的技术原理、主要功能、应用场景DoraCycle概述简介 DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型,通过两个多模态循环(text-...