D

首页 > D

SDXL-EcomID是什么？一文让你看懂SDXL-EcomID的技术原理、主要功能、应用场景

SDXL-EcomID概述简介 SDXL-EcomID是阿里妈妈推出的开源项目，从单个参考图像生成定制的个性图像。融合PuLID和InstantID...
DreamClear是什么？一文让你看懂DreamClear的技术原理、主要功能、应用场景

DreamClear概述简介 DreamClear是中国科学院自动化研究所和字节跳动团队联合推出的高性能图像修复技术，专注于隐私安全的数据集管理，能...
D-Edit是什么？一文让你看懂D-Edit的技术原理、主要功能、应用场景

D-Edit概述简介 D-Edit是基于图像和文本的多功能图像编辑框架，基于预训练的扩散模型和独特的提示（prompts）实现对图像中特定项目的精确...
DreamVideo-2是什么？一文让你看懂DreamVideo-2的技术原理、主要功能、应用场景

DreamVideo-2概述简介 DreamVideo-2是创新的零样本视频定制框架，复旦大学和阿里集团等机构联合推出。DreamVideo-2能根...
OSAID 1.0是什么？一文让你看懂OSAID 1.0的技术原理、主要功能、应用场景

OSAID 1.0概述简介 OSAID 1.0（The Open Source AI Definition – 1.0）是Open Source I...
DocMind是什么？一文让你看懂DocMind的技术原理、主要功能、应用场景

DocMind概述简介 DocMind是司马阅推出的文档智能大模型，基于Transformer结构，融合深度学习、NLP和CV技术，能处理富文本文档...
DistilQwen2是什么？一文让你看懂DistilQwen2的技术原理、主要功能、应用场景

DistilQwen2概述简介 DistilQwen2是基于Qwen2大模型用知识蒸馏技术优化得到的轻量级语言大模型，能提高运算效率和降低部署成本。...
Hunyuan3D-1.0是什么？一文让你看懂Hunyuan3D-1.0的技术原理、主要功能、应用场景

Hunyuan3D-1.0概述简介 Hunyuan3D-1.0 是腾讯推出的3D生成模型，具备文本和图像输入条件，支持高质量的3D资产生成。该模型采...
Docling是什么？一文让你看懂Docling的技术原理、主要功能、应用场景

Docling是什么 Docling是开源的文档解析和转换工具，能高效地将多种格式的文档（包括PDF、DOCX、PPTX、图片和HTML）解析，导出...
Fashion-VDM是什么？一文让你看懂Fashion-VDM的技术原理、主要功能、应用场景

Fashion-VDM概述简介 Fashion-VDM是谷歌和华盛顿大学一起推出的基于视频扩散模型（VDM）的虚拟试穿技术。能在给定服装图像和人物视...
FabricDiffusion是什么？一文让你看懂FabricDiffusion的技术原理、主要功能、应用场景

FabricDiffusion概述简介 FabricDiffusion是谷歌和卡内基梅隆大学一起推出的高保真度3D服装生成技术，能将现实世界中2D服...
DimensionX是什么？一文让你看懂DimensionX的技术原理、主要功能、应用场景

DimensionX概述简介 DimensionX是香港科技大学、清华大学和生数科技一起推出的框架，能从单张图片生成高逼真度的3D和4D场景，基于视...
GenXD是什么？一文让你看懂GenXD的技术原理、主要功能、应用场景

GenXD概述简介 GenXD是新加坡国立大学和微软公司一起推出的3D-4D联合生成框架，能从任意数量的条件图像中生成高质量的3D和4D场景。框架用...
PDFMathTranslate是什么？一文让你看懂PDFMathTranslate的技术原理、主要功能、应用场景

PDFMathTranslate概述简介 PDFMathTranslate是开源的PDF文档翻译工具，设计用于翻译科技论文等PDF文件，能保留原文的...
MVDrag3D是什么？一文让你看懂MVDrag3D的技术原理、主要功能、应用场景

MVDrag3D概述简介 MVDrag3D是创新的3D编辑框架，结合多视图生成和重建先验实现灵活且富有创造性的拖拽编辑。框架用多视图扩散模型作为生成...
MikuDance是什么？一文让你看懂MikuDance的技术原理、主要功能、应用场景

MikuDance概述简介 MikuDance是基于扩散模型的动画生成技术，整合混合运动动力学来动画化风格化的角色艺术。MikuDance基于混合运...
Audio Decomposition是什么？一文让你看懂Audio Decomposition的技术原理、主要功能、应用场景

Audio Decomposition概述简介 Audio Decomposition是音频处理技术，基于傅里叶变换和信封匹配将音乐中的各个音符和乐...
DanceFusion是什么？一文让你看懂DanceFusion的技术原理、主要功能、应用场景

DanceFusion概述简介 DanceFusion是清华大学推出的开源框架，专注于音频驱动的舞蹈动作重建与生成。DanceFusion结合分层时...
RAG-Diffusion是什么？一文让你看懂RAG-Diffusion的技术原理、主要功能、应用场景

RAG-Diffusion概述简介 RAG-Diffusion是南京大学团队推出的区域感知文本到图像生成方法。基于区域硬绑定和区域软细化两个阶段，实...
FitDiT是什么？一文让你看懂FitDiT的技术原理、主要功能、应用场景

FitDiT概述简介 FitDiT是高保真虚拟试穿技术，是腾讯和复旦大学联合推出的。基于Diffusion Transformers（DiT）关注高...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL