收集全球10,000⁺个好用的AI软件
-
SDXL-EcomID是什么?一文让你看懂SDXL-EcomID的技术原理、主要功能、应用场景SDXL-EcomID概述简介 SDXL-EcomID是阿里妈妈推出的开源项目,从单个参考图像生成定制的个性图像。融合PuLID和InstantID...
-
DreamClear是什么?一文让你看懂DreamClear的技术原理、主要功能、应用场景DreamClear概述简介 DreamClear是中国科学院自动化研究所和字节跳动团队联合推出的高性能图像修复技术,专注于隐私安全的数据集管理,能...
-
D-Edit是什么?一文让你看懂D-Edit的技术原理、主要功能、应用场景D-Edit概述简介 D-Edit是基于图像和文本的多功能图像编辑框架,基于预训练的扩散模型和独特的提示(prompts)实现对图像中特定项目的精确...
-
DreamVideo-2是什么?一文让你看懂DreamVideo-2的技术原理、主要功能、应用场景DreamVideo-2概述简介 DreamVideo-2是创新的零样本视频定制框架,复旦大学和阿里集团等机构联合推出。DreamVideo-2能根...
-
OSAID 1.0是什么?一文让你看懂OSAID 1.0的技术原理、主要功能、应用场景OSAID 1.0概述简介 OSAID 1.0(The Open Source AI Definition – 1.0)是Open Source I...
-
DocMind是什么?一文让你看懂DocMind的技术原理、主要功能、应用场景DocMind概述简介 DocMind是司马阅推出的文档智能大模型,基于Transformer结构,融合深度学习、NLP和CV技术,能处理富文本文档...
-
DistilQwen2是什么?一文让你看懂DistilQwen2的技术原理、主要功能、应用场景DistilQwen2概述简介 DistilQwen2是基于Qwen2大模型用知识蒸馏技术优化得到的轻量级语言大模型,能提高运算效率和降低部署成本。...
-
Hunyuan3D-1.0是什么?一文让你看懂Hunyuan3D-1.0的技术原理、主要功能、应用场景Hunyuan3D-1.0概述简介 Hunyuan3D-1.0 是腾讯推出的3D生成模型,具备文本和图像输入条件,支持高质量的3D资产生成。该模型采...
-
Docling是什么?一文让你看懂Docling的技术原理、主要功能、应用场景Docling是什么 Docling是开源的文档解析和转换工具,能高效地将多种格式的文档(包括PDF、DOCX、PPTX、图片和HTML)解析,导出...
-
Fashion-VDM是什么?一文让你看懂Fashion-VDM的技术原理、主要功能、应用场景Fashion-VDM概述简介 Fashion-VDM是谷歌和华盛顿大学一起推出的基于视频扩散模型(VDM)的虚拟试穿技术。能在给定服装图像和人物视...
-
FabricDiffusion是什么?一文让你看懂FabricDiffusion的技术原理、主要功能、应用场景FabricDiffusion概述简介 FabricDiffusion是谷歌和卡内基梅隆大学一起推出的高保真度3D服装生成技术,能将现实世界中2D服...
-
DimensionX是什么?一文让你看懂DimensionX的技术原理、主要功能、应用场景DimensionX概述简介 DimensionX是香港科技大学、清华大学和生数科技一起推出的框架,能从单张图片生成高逼真度的3D和4D场景,基于视...
-
GenXD是什么?一文让你看懂GenXD的技术原理、主要功能、应用场景GenXD概述简介 GenXD是新加坡国立大学和微软公司一起推出的3D-4D联合生成框架,能从任意数量的条件图像中生成高质量的3D和4D场景。框架用...
-
PDFMathTranslate是什么?一文让你看懂PDFMathTranslate的技术原理、主要功能、应用场景PDFMathTranslate概述简介 PDFMathTranslate是开源的PDF文档翻译工具,设计用于翻译科技论文等PDF文件,能保留原文的...
-
MVDrag3D是什么?一文让你看懂MVDrag3D的技术原理、主要功能、应用场景MVDrag3D概述简介 MVDrag3D是创新的3D编辑框架,结合多视图生成和重建先验实现灵活且富有创造性的拖拽编辑。框架用多视图扩散模型作为生成...
-
MikuDance是什么?一文让你看懂MikuDance的技术原理、主要功能、应用场景MikuDance概述简介 MikuDance是基于扩散模型的动画生成技术,整合混合运动动力学来动画化风格化的角色艺术。MikuDance基于混合运...
-
Audio Decomposition是什么?一文让你看懂Audio Decomposition的技术原理、主要功能、应用场景Audio Decomposition概述简介 Audio Decomposition是音频处理技术,基于傅里叶变换和信封匹配将音乐中的各个音符和乐...
-
DanceFusion是什么?一文让你看懂DanceFusion的技术原理、主要功能、应用场景DanceFusion概述简介 DanceFusion是清华大学推出的开源框架,专注于音频驱动的舞蹈动作重建与生成。DanceFusion结合分层时...
-
RAG-Diffusion是什么?一文让你看懂RAG-Diffusion的技术原理、主要功能、应用场景RAG-Diffusion概述简介 RAG-Diffusion是南京大学团队推出的区域感知文本到图像生成方法。基于区域硬绑定和区域软细化两个阶段,实...
-
FitDiT是什么?一文让你看懂FitDiT的技术原理、主要功能、应用场景FitDiT概述简介 FitDiT是高保真虚拟试穿技术,是腾讯和复旦大学联合推出的。基于Diffusion Transformers(DiT)关注高...