收集全球10,000⁺个好用的AI软件
-
IMAGPose是什么?一文让你看懂IMAGPose的技术原理、主要功能、应用场景IMAGPose概述简介 IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架。解决传统方法在姿态引导的人物图像生成中存在的...
-
Heygem是什么?一文让你看懂Heygem的技术原理、主要功能、应用场景Heygem概述简介 Heygem 是硅基智能推出的开源数字人模型,专为 Windows 系统设计。基于先进的AI技术,仅需 1 秒视频或 1 张照...
-
LanDiff是什么?一文让你看懂LanDiff的技术原理、主要功能、应用场景LanDiff概述简介 LanDiff是用于高质量的文本到视频(T2V)生成的创新混合框架,结合了自回归语言大模型(LLM)和扩散模型(Diffus...
-
FoxBrain是什么?一文让你看懂FoxBrain的技术原理、主要功能、应用场景FoxBrain概述简介 FoxBrain 是鸿海研究院推出的繁体中文大型语言大模型(LLM),具有强大的推理能力。基于 Meta Llama 3....
-
COMET是什么?一文让你看懂COMET的技术原理、主要功能、应用场景COMET概述简介 COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题...
-
VideoPainter是什么?一文让你看懂VideoPainter的技术原理、主要功能、应用场景VideoPainter概述简介 VideoPainter 是香港中文大学、腾讯ARC Lab、东京大学、澳门大学等机构推出的视频修复和编辑框架,专...
-
TrajectoryCrafter是什么?一文让你看懂TrajectoryCrafter的技术原理、主要功能、应用场景TrajectoryCrafter概述简介 TrajectoryCrafter 是腾讯PCG ARC Lab和香港中文大学推出的,用在单目视频的相机...
-
LanPaint是什么?一文让你看懂LanPaint的技术原理、主要功能、应用场景LanPaint概述简介 LanPaint 是用在Stable Diffusion 模型的高质量图像修复工具,无需额外训练实现精准的图像修复和替换。...
-
START是什么?一文让你看懂START的技术原理、主要功能、应用场景START概述简介 START(Self-Taught Reasoner with Tools)是阿里集团和中国科学技术大学推出的新型工具增强型推理...
-
SeedFoley是什么?一文让你看懂SeedFoley的技术原理、主要功能、应用场景SeedFoley概述简介 SeedFoley 是字节跳动豆包大模型语音团队开发的端到端视频音效生成模型,为视频创作提供智能音效生成服务。通过融合时...
-
R1-Omni是什么?一文让你看懂R1-Omni的技术原理、主要功能、应用场景R1-Omni概述简介 R1-Omni 是阿里通义推出的基于强化学习(RLVR)的全模态大语言大模型,专注于情感识别任务。通过结合视觉和音频信息,能...
-
DeepSeek百宝箱是什么?一文让你看懂DeepSeek百宝箱的技术原理、主要功能、应用场景DeepSeek百宝箱概述简介 DeepSeek百宝箱是 DeepSeek官方 维护的 GitHub 项目,展示如何将 DeepSeek API 集...
-
Anus是什么?一文让你看懂Anus的技术原理、主要功能、应用场景Anus概述简介 Anus(Autonomous Networked Utility System)是 Manus 生成的开源自主智能体项目,复刻 ...
-
MeshPad是什么?一文让你看懂MeshPad的技术原理、主要功能、应用场景MeshPad概述简介 MeshPad 是基于草图输入的交互式艺术化网格生成与编辑工具,能将简单的二维草图迅速转化为高质量的 3D 网格模型,支持实...
-
PlanGEN是什么?一文让你看懂PlanGEN的技术原理、主要功能、应用场景PlanGEN概述简介 PlanGEN 是谷歌研究团队推出的多智能体框架,通过多智能体协作、约束引导和算法自适应选择,解决复杂问题的规划和推理。包含...
-
MV-MATH是什么?一文让你看懂MV-MATH的技术原理、主要功能、应用场景MV-MATH概述简介 MV-MATH 是中科院自动化所提出的新基准数据集,评估多模态大语言大模型(MLLMs)在多视觉场景中的数学推理能力。数据集...
-
MHA2MLA是什么?一文让你看懂MHA2MLA的技术原理、主要功能、应用场景MHA2MLA概述简介 MHA2MLA是复旦大学、华东师范大学、上海AI Lab等机构联合推出的数据高效的微调方法,基于引入DeepSeek的多头潜...
-
GaussianAnything是什么?一文让你看懂GaussianAnything的技术原理、主要功能、应用场景GaussianAnything概述简介 GaussianAnything 是南洋理工大学 S-Lab 联合上海 AI Lab 等机构推出的 3D ...
-
VACE是什么?一文让你看懂VACE的技术原理、主要功能、应用场景VACE概述简介 VACE(Video Creation and Editing)是阿里巴巴通义实验室推出的一站式视频生成与编辑框架。基于整合多种视...
-
Seedream 2.0是什么?一文让你看懂Seedream 2.0的技术原理、主要功能、应用场景Seedream 2.0概述简介 Seedream 2.0 是字节跳动豆包大模型团队推出的原生中英双语图像生成模型,解决现有模型在文本渲染、文化理解...