收集全球10,000⁺个好用的AI软件
-
Audio Decomposition是什么?一文让你看懂Audio Decomposition的技术原理、主要功能、应用场景Audio Decomposition概述简介 Audio Decomposition是音频处理技术,基于傅里叶变换和信封匹配将音乐中的各个音符和乐...
-
DanceFusion是什么?一文让你看懂DanceFusion的技术原理、主要功能、应用场景DanceFusion概述简介 DanceFusion是清华大学推出的开源框架,专注于音频驱动的舞蹈动作重建与生成。DanceFusion结合分层时...
-
RAG-Diffusion是什么?一文让你看懂RAG-Diffusion的技术原理、主要功能、应用场景RAG-Diffusion概述简介 RAG-Diffusion是南京大学团队推出的区域感知文本到图像生成方法。基于区域硬绑定和区域软细化两个阶段,实...
-
FitDiT是什么?一文让你看懂FitDiT的技术原理、主要功能、应用场景FitDiT概述简介 FitDiT是高保真虚拟试穿技术,是腾讯和复旦大学联合推出的。基于Diffusion Transformers(DiT)关注高...
-
Documind是什么?一文让你看懂Documind的技术原理、主要功能、应用场景Documind概述简介 Documind是开源的AI文档处理工具,能从PDF文档中提取结构化数据。Documind具备将PDF转换为图像、用Ope...
-
EyeDiff是什么?一文让你看懂EyeDiff的技术原理、主要功能、应用场景EyeDiff概述简介 EyeDiff是文本到图像的扩散模型,基于自然语言提示生成多模态眼科图像,提高常见和罕见眼病的诊断准确性。模型在多个大规模数...
-
DeepSeek-R1-Lite是什么?一文让你看懂DeepSeek-R1-Lite的技术原理、主要功能、应用场景DeepSeek-R1-Lite概述简介 DeepSeek-R1-Lite是深度求索推出的新一代AI推理模型,DeepSeek-R1-Lite用强化...
-
CAD-MLLM是什么?一文让你看懂CAD-MLLM的技术原理、主要功能、应用场景CAD-MLLM概述简介 CAD-MLLM是由上海科技大学、Transcengram、DeepSeek AI和香港大学一起推出的,计算机辅助设计(C...
-
DINO-X是什么?一文让你看懂DINO-X的技术原理、主要功能、应用场景DINO-X概述简介 DINO-X是IDEA研究院推出的通用视觉大模型,具备开放世界对象检测与理解能力。支持文本、视觉和定制提示,能识别图像中的任何...
-
DreamPolish是什么?一文让你看懂DreamPolish的技术原理、主要功能、应用场景DreamPolish概述简介 DreamPolish是智谱 AI、清华大学和北京大学推出的文本到3D生成模型,基于两阶段方法改进复杂对象的精细几何...
-
DynaMem是什么?一文让你看懂DynaMem的技术原理、主要功能、应用场景DynaMem概述简介 DynaMem是纽约大学和Hello Robot推出的动态空间语义记忆系统,专为开放世界中的移动操作设计。基于维护一个特征点...
-
DELIFT是什么?一文让你看懂DELIFT的技术原理、主要功能、应用场景DELIFT概述简介 DELIFT(Data Efficient Language model Instruction Fine-Tuning)是基...
-
WebDreamer是什么?一文让你看懂WebDreamer的技术原理、主要功能、应用场景WebDreamer概述简介 WebDreamer是俄亥俄州立大学和Orby AI研究团队推出的基于模型规划的网络智能体,基于大型语言大模型(LLM...
-
Flex3D是什么?一文让你看懂Flex3D的技术原理、主要功能、应用场景Flex3D概述简介 Flex3D是Meta的GenAI团队和牛津大学研究团队推出的创新的两阶段3D生成框架,能基于任意数量的高质量输入视图,解决从...
-
EvolveDirector是什么?一文让你看懂EvolveDirector的技术原理、主要功能、应用场景EvolveDirector概述简介 EvolveDirector是阿里巴巴和南洋理工大学联合推出的创新框架,用公开资源和高级模型的API接口训练一...
-
LEOPARD是什么?一文让你看懂LEOPARD的技术原理、主要功能、应用场景LEOPARD概述简介 LEOPARD是腾讯AI Lab西雅图实验室推出的视觉语言大模型,专为理解和处理含有大量文本的多图像任务设计。LEOPARD...
-
Edify 3D是什么?一文让你看懂Edify 3D的技术原理、主要功能、应用场景Edify 3D概述简介 Edify 3D 是 NVIDIA 推出的先进3D资产生成方案,能从文本提示或参考图像快速合成高质量的3D模型。Edify...
-
DynaSaur是什么?一文让你看懂DynaSaur的技术原理、主要功能、应用场景DynaSaur概述简介 DynaSaur是Adobe Research推出的大型语言大模型(LLM)代理框架,突破传统LLM代理系统受限于预定义动...
-
Find3D是什么?一文让你看懂Find3D的技术原理、主要功能、应用场景Find3D概述简介 Find3D是加州理工学院推出的3D部件分割模型,能根据任意文本查询分割任意对象的任何部分。Find3D用一个强大的数据引擎自...
-
Devika是什么?一文让你看懂Devika的技术原理、主要功能、应用场景Devika 概述简介 Devika是开源的AI编程工具,能理解并拆分复杂指令,基于集成AI搜索和网页浏览能力搜集信息,编写代码实现目标。Devik...