收集全球10,000⁺个好用的AI软件
-
HART是什么?一文让你看懂HART的技术原理、主要功能、应用场景HART概述简介 HART(Hybrid Autoregressive Transformer)是麻省理工学院研究团队推出的自回归视觉生成模型。能直...
-
CAVIA是什么?一文让你看懂CAVIA的技术原理、主要功能、应用场景CAVIA概述简介 CAVIA是苹果公司、得克萨斯大学奥斯汀分校、谷歌联合推出的多视角视频生成框架,能将单一输入图像转换成多个时空一致的视频序列。框...
-
LazyGraphRAG是什么?一文让你看懂LazyGraphRAG的技术原理、主要功能、应用场景LazyGraphRAG概述简介 LazyGraphRAG是微软研究院推出的图形增强生成增强检索(RAG)框架,是GraphRAG的迭代版本。Laz...
-
LEOPARD是什么?一文让你看懂LEOPARD的技术原理、主要功能、应用场景LEOPARD概述简介 LEOPARD是腾讯AI Lab西雅图实验室推出的视觉语言大模型,专为理解和处理含有大量文本的多图像任务设计。LEOPARD...
-
MobA是什么?一文让你看懂MobA的技术原理、主要功能、应用场景MobA概述简介 MobA(Mobile Agent)是上海交通大学团队推出的新型移动智能体,基于多模态大型语言大模型(MLLMs)提升移动设备的自...
-
LongRAG是什么?一文让你看懂LongRAG的技术原理、主要功能、应用场景LongRAG概述简介 LongRAG是清华大学、中国科学院和智谱的研究团队推出的,面向长文本问答(LCQA)的双视角鲁棒检索增强生成(RAG)框架...
-
Takin AudioLLM是什么?一文让你看懂Takin AudioLLM的技术原理、主要功能、应用场景Takin AudioLLM概述简介 Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型,包括Takin ...
-
AutoTrain是什么?一文让你看懂AutoTrain的技术原理、主要功能、应用场景AutoTrain概述简介 AutoTrain(AutoTrain Advanced)是Hugging Face推出的开源无代码平台,能简化最先进模...
-
CAMPHOR是什么?一文让你看懂CAMPHOR的技术原理、主要功能、应用场景CAMPHOR概述简介 CAMPHOR是苹果团队推出的端侧小语言大模型(SLM)多智能体框架,能提升移动设备的隐私保护和响应速度。框架基于在设备本地...
-
ACE是什么?一文让你看懂ACE的技术原理、主要功能、应用场景ACE概述简介 ACE(All-round Creator and Editor)是阿里集团Tongyi Lab推出的基于扩散变换器的全能图像生成和...
-
LongAlign是什么?一文让你看懂LongAlign的技术原理、主要功能、应用场景LongAlign概述简介 LongAlign是香港大学研究团队推出的文本到图像(T2I)扩散模型的改进方法,能提升长文本输入的对齐精度。LongA...
-
SAM 2.1是什么?一文让你看懂SAM 2.1的技术原理、主要功能、应用场景SAM 2.1概述简介 SAM 2.1(全称Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先进视...
-
LongLLaVA是什么?一文让你看懂LongLLaVA的技术原理、主要功能、应用场景LongLLaVA概述简介 LongLLaVA是的多模态大型语言大模型(MLLM),是香港中文大学(深圳)的开发人员推出。基于混合架构,结合Mamb...
-
Proactive Agent是什么?一文让你看懂Proactive Agent的技术原理、主要功能、应用场景Proactive Agent概述简介 Proactive Agent是清华大学联合面壁智能等团队推出的新一代主动Agent交互范式 ,具备主动性,...
-
EMOVA是什么?一文让你看懂EMOVA的技术原理、主要功能、应用场景EMOVA概述简介 EMOVA(EMotionally Omni-present Voice Assistant)是多模态全能模型,是香港科技大学、...
-
Agent-E是什么?一文让你看懂Agent-E的技术原理、主要功能、应用场景Agent-E概述简介 Agent-E是基于AutoGen代理框架构建的智能自动化系统,专注于浏览器内的自动化操作。Agent-E基于自然语言交互,...
-
CAT4D是什么?一文让你看懂CAT4D的技术原理、主要功能、应用场景CAT4D概述简介 CAT4D是Google DeepMind、哥伦比亚大学和加州大学圣地亚哥分校一起推出的,能从单目视频创建4D场景(动态3D)表...
-
Make-It-Animatable是什么?一文让你看懂Make-It-Animatable的技术原理、主要功能、应用场景Make-It-Animatable概述简介 Make-It-Animatable是中国科学技术大学和Tencent PCG推出的数据驱动框架,能在...
-
AnchorCrafter是什么?一文让你看懂AnchorCrafter的技术原理、主要功能、应用场景AnchorCrafter概述简介 AnchorCrafter是基于扩散模型的智能视频制作系统,用在自动生成具有高保真度的主播风格产品推广视频。基于...
-
GeneMAN是什么?一文让你看懂GeneMAN的技术原理、主要功能、应用场景GeneMAN概述简介 GeneMAN是上海AI实验室、北京大学、南洋理工大学、上海交通大学联合推出的3D人形创建框架,能从单张图片中创建出高保真度...