D

首页 > D

Audio Decomposition是什么？一文让你看懂Audio Decomposition的技术原理、主要功能、应用场景

Audio Decomposition概述简介 Audio Decomposition是音频处理技术，基于傅里叶变换和信封匹配将音乐中的各个音符和乐...
DanceFusion是什么？一文让你看懂DanceFusion的技术原理、主要功能、应用场景

DanceFusion概述简介 DanceFusion是清华大学推出的开源框架，专注于音频驱动的舞蹈动作重建与生成。DanceFusion结合分层时...
RAG-Diffusion是什么？一文让你看懂RAG-Diffusion的技术原理、主要功能、应用场景

RAG-Diffusion概述简介 RAG-Diffusion是南京大学团队推出的区域感知文本到图像生成方法。基于区域硬绑定和区域软细化两个阶段，实...
FitDiT是什么？一文让你看懂FitDiT的技术原理、主要功能、应用场景

FitDiT概述简介 FitDiT是高保真虚拟试穿技术，是腾讯和复旦大学联合推出的。基于Diffusion Transformers（DiT）关注高...
Documind是什么？一文让你看懂Documind的技术原理、主要功能、应用场景

Documind概述简介 Documind是开源的AI文档处理工具，能从PDF文档中提取结构化数据。Documind具备将PDF转换为图像、用Ope...
EyeDiff是什么？一文让你看懂EyeDiff的技术原理、主要功能、应用场景

EyeDiff概述简介 EyeDiff是文本到图像的扩散模型，基于自然语言提示生成多模态眼科图像，提高常见和罕见眼病的诊断准确性。模型在多个大规模数...
DeepSeek-R1-Lite是什么？一文让你看懂DeepSeek-R1-Lite的技术原理、主要功能、应用场景

DeepSeek-R1-Lite概述简介 DeepSeek-R1-Lite是深度求索推出的新一代AI推理模型，DeepSeek-R1-Lite用强化...
CAD-MLLM是什么？一文让你看懂CAD-MLLM的技术原理、主要功能、应用场景

CAD-MLLM概述简介 CAD-MLLM是由上海科技大学、Transcengram、DeepSeek AI和香港大学一起推出的，计算机辅助设计（C...
DINO-X是什么？一文让你看懂DINO-X的技术原理、主要功能、应用场景

DINO-X概述简介 DINO-X是IDEA研究院推出的通用视觉大模型，具备开放世界对象检测与理解能力。支持文本、视觉和定制提示，能识别图像中的任何...
DreamPolish是什么？一文让你看懂DreamPolish的技术原理、主要功能、应用场景

DreamPolish概述简介 DreamPolish是智谱 AI、清华大学和北京大学推出的文本到3D生成模型，基于两阶段方法改进复杂对象的精细几何...
DynaMem是什么？一文让你看懂DynaMem的技术原理、主要功能、应用场景

DynaMem概述简介 DynaMem是纽约大学和Hello Robot推出的动态空间语义记忆系统，专为开放世界中的移动操作设计。基于维护一个特征点...
DELIFT是什么？一文让你看懂DELIFT的技术原理、主要功能、应用场景

DELIFT概述简介 DELIFT（Data Efficient Language model Instruction Fine-Tuning）是基...
WebDreamer是什么？一文让你看懂WebDreamer的技术原理、主要功能、应用场景

WebDreamer概述简介 WebDreamer是俄亥俄州立大学和Orby AI研究团队推出的基于模型规划的网络智能体，基于大型语言大模型（LLM...
Flex3D是什么？一文让你看懂Flex3D的技术原理、主要功能、应用场景

Flex3D概述简介 Flex3D是Meta的GenAI团队和牛津大学研究团队推出的创新的两阶段3D生成框架，能基于任意数量的高质量输入视图，解决从...
EvolveDirector是什么？一文让你看懂EvolveDirector的技术原理、主要功能、应用场景

EvolveDirector概述简介 EvolveDirector是阿里巴巴和南洋理工大学联合推出的创新框架，用公开资源和高级模型的API接口训练一...
LEOPARD是什么？一文让你看懂LEOPARD的技术原理、主要功能、应用场景

LEOPARD概述简介 LEOPARD是腾讯AI Lab西雅图实验室推出的视觉语言大模型，专为理解和处理含有大量文本的多图像任务设计。LEOPARD...
Edify 3D是什么？一文让你看懂Edify 3D的技术原理、主要功能、应用场景

Edify 3D概述简介 Edify 3D 是 NVIDIA 推出的先进3D资产生成方案，能从文本提示或参考图像快速合成高质量的3D模型。Edify...
DynaSaur是什么？一文让你看懂DynaSaur的技术原理、主要功能、应用场景

DynaSaur概述简介 DynaSaur是Adobe Research推出的大型语言大模型（LLM）代理框架，突破传统LLM代理系统受限于预定义动...
Find3D是什么？一文让你看懂Find3D的技术原理、主要功能、应用场景

Find3D概述简介 Find3D是加州理工学院推出的3D部件分割模型，能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自...
Devika是什么？一文让你看懂Devika的技术原理、主要功能、应用场景

Devika 概述简介 Devika是开源的AI编程工具，能理解并拆分复杂指令，基于集成AI搜索和网页浏览能力搜集信息，编写代码实现目标。Devik...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL