收集全球10,000⁺个好用的AI软件
-
AutoDroid-V2是什么?一文让你看懂AutoDroid-V2的技术原理、主要功能、应用场景AutoDroid-V2概述简介 AutoDroid-V2是清华大学人工智能产业研究院推出的基于小型语言大模型(SLM)的移动端GUI自动化脚本代理...
-
SPAR3D是什么?一文让你看懂SPAR3D的技术原理、主要功能、应用场景SPAR3D概述简介 SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量...
-
HoloDrive是什么?一文让你看懂HoloDrive的技术原理、主要功能、应用场景HoloDrive概述简介 HoloDrive 是商汤和上海人工智能实验室等机构提出的用于自动驾驶的整体2D-3D多模态街道场景生成框架。框架联合生...
-
Motion Dreamer是什么?一文让你看懂Motion Dreamer的技术原理、主要功能、应用场景Motion Dreamer概述简介 Motion Dreamer是香港科技大学(广州)研究者提出的视频生成框架,生成运动合理视频。基于两阶段生成方...
-
NVIDIA-Ingest是什么?一文让你看懂NVIDIA-Ingest的技术原理、主要功能、应用场景NVIDIA-Ingest概述简介 NVIDIA-Ingest是英伟达开源的用于解析复杂、混乱的非结构化PDF和其他企业文档的微服务集合。NVIDI...
-
T2A-01-HD是什么?一文让你看懂T2A-01-HD的技术原理、主要功能、应用场景T2A-01-HD概述简介 T2A-01-HD是海螺AI海外版推出新的语音模型。支持声音克隆,仅需10秒音频即可精准克隆声音,保留情感底色。模型具备...
-
X-Dyna是什么?一文让你看懂X-Dyna的技术原理、主要功能、应用场景X-Dyna概述简介 X-Dyna 是基于扩散模型的动画生成框架,基于驱动视频中的面部表情和身体动作,将单张人类图像动画化,生成具有真实感和环境感知...
-
DeepSeek-R1是什么?一文让你看懂DeepSeek-R1的技术原理、主要功能、应用场景DeepSeek-R1概述简介 DeepSeek-R1是杭州深度求索公司 DeepSeek 推出的高性能AI推理模型,对标OpenAI的o1正式版。...
-
DeepSeek R1-Zero是什么?一文让你看懂DeepSeek R1-Zero的技术原理、主要功能、应用场景DeepSeek R1-Zero概述简介 DeepSeek R1-Zero 是 DeepSeek 团队开发的完全依赖纯强化学习(RL)训练的推理模型...
-
3DIS-FLUX是什么?一文让你看懂3DIS-FLUX的技术原理、主要功能、应用场景3DIS-FLUX概述简介 3DIS-FLUX是基于深度学习的多实例生成框架,通过解耦实例合成实现高质量的图像生成。结合3DIS框架的深度驱动场景构...
-
DITTO-2是什么?一文让你看懂DITTO-2的技术原理、主要功能、应用场景DITTO-2概述简介 DITTO-2 是 Adobe 和加州大学开发人员联合推出的新型音乐生成模型,通过优化扩散模型的推理时间,实现快速且可控的音...
-
DiffEditor是什么?一文让你看懂DiffEditor的技术原理、主要功能、应用场景DiffEditor概述简介 DiffEditor是北京大学深圳研究生院与腾讯PCG的研究团队提出的基于扩散模型(Diffusion Model)的...
-
DiffuEraser是什么?一文让你看懂DiffuEraser的技术原理、主要功能、应用场景DiffuEraser概述简介 DiffuEraser是基于稳定扩散模型的视频修复模型,以更丰富的细节和更连贯的结构填充视频中的遮罩区域。模型通过结...
-
MobileVD是什么?一文让你看懂MobileVD的技术原理、主要功能、应用场景MobileVD概述简介 MobileVD(Mobile Video Diffusion)是首个针对移动设备优化的视频扩散模型,Qualcomm A...
-
CityDreamer4D是什么?一文让你看懂CityDreamer4D的技术原理、主要功能、应用场景CityDreamer4D概述简介 CityDreamer4D是南洋理工大学 S-Lab 团队开发的用于生成无边界 4D 城市的组合生成模型。将动态...
-
DiffSplat是什么?一文让你看懂DiffSplat的技术原理、主要功能、应用场景DiffSplat概述简介 DiffSplat是新型的 3D 生成方法,从文本提示和单视图图像快速生成 3D 高斯点阵(Gaussian Splat...
-
OpenDeepResearcher是什么?一文让你看懂OpenDeepResearcher的技术原理、主要功能、应用场景OpenDeepResearcher概述简介 OpenDeepResearcher 是开源的 AI 研究工具,能帮助用户高效地完成复杂的信息查询和分...
-
OCRmyPDF是什么?一文让你看懂OCRmyPDF的技术原理、主要功能、应用场景OCRmyPDF概述简介 OCRmyPDF 是开源的命令行工具,专为将扫描的 PDF 文件转换为可搜索、可复制的文档。通过添加 OCR 文本层,将无...
-
node-DeepResearch是什么?一文让你看懂node-DeepResearch的技术原理、主要功能、应用场景node-DeepResearch概述简介 node-DeepResearch 是开源的 AI 智能体项目,基于持续搜索和阅读网页,用 Gemini...
-
DeepRAG是什么?一文让你看懂DeepRAG的技术原理、主要功能、应用场景DeepRAG概述简介 DeepRAG 是中科院、中科大和腾讯微信AI部联合推出的新型检索增强生成(RAG)框架,提升大型语言大模型(LLMs)在推...