收集全球10,000⁺个好用的AI软件
-
DistriFusion是什么?一文让你看懂DistriFusion的技术原理、主要功能、应用场景DistriFusion概述简介 DistriFusion是高分辨率扩散模型的分布式并行推理框架,通过分布式并行推理显著加速了扩散模型在多个GPU上...
-
VFusion3D是什么?一文让你看懂VFusion3D的技术原理、主要功能、应用场景VFusion3D概述简介 VFusion3D 是由 Meta 和牛津大学的开发人员一起推出的AI生成3D模型项目,能从单张图片或文本描述中生成高质...
-
HivisionIDPhotos是什么?一文让你看懂HivisionIDPhotos的技术原理、主要功能、应用场景HivisionIDPhotos概述简介 HivisionIDPhoto 是一款基于 AI 的轻量级证件照制作工具,能智能识别和抠图,快速生成符合多...
-
LanceDB是什么?一文让你看懂LanceDB的技术原理、主要功能、应用场景LanceDB概述简介 LanceDB 是一款专为人工智能应用设计的无服务器向量数据库,支持向量搜索、全文搜索和SQL查询,优化了多模态数据处理。它...
-
Docmatix是什么?一文让你看懂Docmatix的技术原理、主要功能、应用场景Docmatix概述简介 Docmatix 是一个用于文档视觉问答(Document Visual Question Answering,简称 Do...
-
Stable Diffusion整合包是什么?一文让你看懂Stable Diffusion整合包的技术原理、主要功能、应用场景Stable Diffusion整合包概述简介 Stable Diffusion整合包是B站UP主秋葉aaaki发布的SD绘画本地部署解决方案,包含...
-
DeepSeek-V2.5是什么?一文让你看懂DeepSeek-V2.5的技术原理、主要功能、应用场景DeepSeek-V2.5概述简介 DeepSeek-V2.5 是DeepSeek推出的融合通用与代码能力的全新开源模型。保留了之前 Chat 模型...
-
RegionDrag是什么?一文让你看懂RegionDrag的技术原理、主要功能、应用场景RegionDrag概述简介 RegionDrag是由香港大学和牛津大学联合开发的一种基于区域的图像编辑技术。基于扩散模型,让用户定义手柄区域和目标...
-
Deepfake Defenders是什么?一文让你看懂Deepfake Defenders的技术原理、主要功能、应用场景Deepfake Defenders概述简介 Deepfake Defenders是由中国科学院自动化研究所的团队VisionRush开发的一款开源...
-
DeepSeek-Coder-V2是什么?一文让你看懂DeepSeek-Coder-V2的技术原理、主要功能、应用场景DeepSeek-Coder-V2概述简介 DeepSeek-Coder-V2 是由DeepSeek推出的开源代码语言大模型,在代码特定任务中的表现...
-
mPLUG-DocOwl2是什么?一文让你看懂mPLUG-DocOwl2的技术原理、主要功能、应用场景mPLUG-DocOwl2概述简介 mPLUG-DocOwl 2是由阿里巴巴通义实验室mPLUG团队推出的用于多页文档理解的多模态大型语言大模型。在...
-
QA-MDT是什么?一文让你看懂QA-MDT的技术原理、主要功能、应用场景QA-MDT概述简介 QA-MDT(Quality-aware Masked Diffusion Transformer)是由中国科学技术大学和科大...
-
Claude Dev是什么?一文让你看懂Claude Dev的技术原理、主要功能、应用场景Claude Dev概述简介 Claude Dev是一个集成在Visual Studio Code中的AI编程助手,基于Anthropic公司的Cl...
-
DrawingSpinUp是什么?一文让你看懂DrawingSpinUp的技术原理、主要功能、应用场景DrawingSpinUp概述简介 DrawingSpinUp 是一种先进的3D动画生成技术,由香港城市大学的研究团队推出。模型将平面的角色绘画转化...
-
Draw an Audio是什么?一文让你看懂Draw an Audio的技术原理、主要功能、应用场景Draw an Audio概述简介 Draw an Audio 是中国科学院自动化研究所和美团点评的开发人员推出的视频生成音频系统。根据视频内容自动...
-
书生·物华2.0(3DTopia 2.0)是什么?一文让你看懂书生·物华2.0(3DTopia 2.0)的技术原理、主要功能、应用场景书生·物华2.0概述简介 书生·物华2.0(3DTopia 2.0)是由上海人工智能实验室与南洋理工大学联合开发的三维物体生成大模型。模型采用创新的...
-
LVCD是什么?一文让你看懂LVCD的技术原理、主要功能、应用场景LVCD概述简介 LVCD(Large Video Color Diffusion)是一个专为动画视频线稿上色设计的视频扩散框架,能将黑白线稿自动转...
-
豆包PixelDance是什么?一文让你看懂豆包PixelDance的技术原理、主要功能、应用场景豆包PixelDance概述简介 豆包PixelDance是字节跳动最新推出的AI视频生成模型,采用DiT结构,支持文生视频和图生视频。它能理解复杂...
-
PDF2Audio是什么?一文让你看懂PDF2Audio的技术原理、主要功能、应用场景PDF2Audio概述简介 PDF2Audio 是一个开源工具,能将 PDF 文档转换成音频内容,适合制作播客、讲座或摘要。它基于 OpenAI 的...
-
IDIFY是什么?一文让你看懂IDIFY的技术原理、主要功能、应用场景IDIFY概述简介 IDIFY是一款免费开源的在线证件照生成工具,通过AI技术实现自动抠图,帮助用户快速生成符合标准的证件照。用户只需在浏览器中上传...