收集全球10,000⁺个好用的AI软件
-
MobA是什么?一文让你看懂MobA的技术原理、主要功能、应用场景MobA概述简介 MobA(Mobile Agent)是上海交通大学团队推出的新型移动智能体,基于多模态大型语言大模型(MLLMs)提升移动设备的自...
-
LongRAG是什么?一文让你看懂LongRAG的技术原理、主要功能、应用场景LongRAG概述简介 LongRAG是清华大学、中国科学院和智谱的研究团队推出的,面向长文本问答(LCQA)的双视角鲁棒检索增强生成(RAG)框架...
-
Takin AudioLLM是什么?一文让你看懂Takin AudioLLM的技术原理、主要功能、应用场景Takin AudioLLM概述简介 Takin AudioLLM是喜马拉雅Everest团队推出的一系列高质量零样本语音生成模型,包括Takin ...
-
AutoTrain是什么?一文让你看懂AutoTrain的技术原理、主要功能、应用场景AutoTrain概述简介 AutoTrain(AutoTrain Advanced)是Hugging Face推出的开源无代码平台,能简化最先进模...
-
CAMPHOR是什么?一文让你看懂CAMPHOR的技术原理、主要功能、应用场景CAMPHOR概述简介 CAMPHOR是苹果团队推出的端侧小语言大模型(SLM)多智能体框架,能提升移动设备的隐私保护和响应速度。框架基于在设备本地...
-
ACE是什么?一文让你看懂ACE的技术原理、主要功能、应用场景ACE概述简介 ACE(All-round Creator and Editor)是阿里集团Tongyi Lab推出的基于扩散变换器的全能图像生成和...
-
LongAlign是什么?一文让你看懂LongAlign的技术原理、主要功能、应用场景LongAlign概述简介 LongAlign是香港大学研究团队推出的文本到图像(T2I)扩散模型的改进方法,能提升长文本输入的对齐精度。LongA...
-
SAM 2.1是什么?一文让你看懂SAM 2.1的技术原理、主要功能、应用场景SAM 2.1概述简介 SAM 2.1(全称Segment Anything Model 2.1)是Meta(Facebook的母公司)推出的先进视...
-
LongLLaVA是什么?一文让你看懂LongLLaVA的技术原理、主要功能、应用场景LongLLaVA概述简介 LongLLaVA是的多模态大型语言大模型(MLLM),是香港中文大学(深圳)的开发人员推出。基于混合架构,结合Mamb...
-
Proactive Agent是什么?一文让你看懂Proactive Agent的技术原理、主要功能、应用场景Proactive Agent概述简介 Proactive Agent是清华大学联合面壁智能等团队推出的新一代主动Agent交互范式 ,具备主动性,...
-
EMOVA是什么?一文让你看懂EMOVA的技术原理、主要功能、应用场景EMOVA概述简介 EMOVA(EMotionally Omni-present Voice Assistant)是多模态全能模型,是香港科技大学、...
-
Agent-E是什么?一文让你看懂Agent-E的技术原理、主要功能、应用场景Agent-E概述简介 Agent-E是基于AutoGen代理框架构建的智能自动化系统,专注于浏览器内的自动化操作。Agent-E基于自然语言交互,...
-
CAT4D是什么?一文让你看懂CAT4D的技术原理、主要功能、应用场景CAT4D概述简介 CAT4D是Google DeepMind、哥伦比亚大学和加州大学圣地亚哥分校一起推出的,能从单目视频创建4D场景(动态3D)表...
-
Make-It-Animatable是什么?一文让你看懂Make-It-Animatable的技术原理、主要功能、应用场景Make-It-Animatable概述简介 Make-It-Animatable是中国科学技术大学和Tencent PCG推出的数据驱动框架,能在...
-
AnchorCrafter是什么?一文让你看懂AnchorCrafter的技术原理、主要功能、应用场景AnchorCrafter概述简介 AnchorCrafter是基于扩散模型的智能视频制作系统,用在自动生成具有高保真度的主播风格产品推广视频。基于...
-
GeneMAN是什么?一文让你看懂GeneMAN的技术原理、主要功能、应用场景GeneMAN概述简介 GeneMAN是上海AI实验室、北京大学、南洋理工大学、上海交通大学联合推出的3D人形创建框架,能从单张图片中创建出高保真度...
-
EfficientTAM是什么?一文让你看懂EfficientTAM的技术原理、主要功能、应用场景EfficientTAM概述简介 EfficientTAM是Meta AI推出的轻量级视频对象分割和跟踪模型,能解决SAM 2模型在移动设备上部署时...
-
Amazon Nova是什么?一文让你看懂Amazon Nova的技术原理、主要功能、应用场景Amazon Nova概述简介 Amazon Nova 是亚马逊云服务(AWS)推出的新一代AI基础模型系列,提供行业领先的性能和成本效益。系列包括...
-
StableAnimator是什么?一文让你看懂StableAnimator的技术原理、主要功能、应用场景StableAnimator概述简介 StableAnimator是复旦大学、微软亚洲研究院、虎牙公司和卡内基梅隆大学一起推出的端到端高质量身份保持...
-
TeleAI 视频生成大模型是什么?一文让你看懂TeleAI 视频生成大模型的技术原理、主要功能、应用场景TeleAI 视频生成大模型概述简介 TeleAI 视频生成大模型是中国电信AI研究院推出的视频生成模型,基于两阶段生成框架:先根据文本描述创建分镜...