收集全球10,000⁺个好用的AI软件
-
Asyncflow v1.0是什么?一文让你看懂Asyncflow v1.0的技术原理、主要功能、应用场景Asyncflow v1.0概述简介 Asyncflow v1.0 是播客平台 Podcastle 推出的 AI 文本转语音模型。支持超过 450 ...
-
ART是什么?一文让你看懂ART的技术原理、主要功能、应用场景ART概述简介 ART(Anonymous Region Transformer) 是新型的多层透明图像生成技术,能根据全局文本提示和匿名区域布局直...
-
NextGenAI是什么?一文让你看懂NextGenAI的技术原理、主要功能、应用场景NextGenAI概述简介 NextGenAI是OpenAI推出的全球性联盟,基于AI技术推动教育和研究的进步。NextGenAI联合包括哈佛大学、...
-
OmniAlign-V是什么?一文让你看懂OmniAlign-V的技术原理、主要功能、应用场景OmniAlign-V概述简介 OmniAlign-V 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言...
-
AVD2是什么?一文让你看懂AVD2的技术原理、主要功能、应用场景AVD2概述简介 AVD2(Accident Video Diffusion for Accident Video Description)是清华大...
-
Archon是什么?一文让你看懂Archon的技术原理、主要功能、应用场景Archon概述简介 Archon 是专注于构建和优化 AI 智能体的开源项目。通过自主生成代码和优化智能体性能,展示了现代 AI 开发的核心理念。...
-
PodAgent是什么?一文让你看懂PodAgent的技术原理、主要功能、应用场景PodAgent概述简介 PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主...
-
SpatialVLA是什么?一文让你看懂SpatialVLA的技术原理、主要功能、应用场景SpatialVLA概述简介 SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构一起推出的新型空间具身通用操作模...
-
TheoremExplainAgent是什么?一文让你看懂TheoremExplainAgent的技术原理、主要功能、应用场景TheoremExplainAgent概述简介 TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理...
-
Aya Vision是什么?一文让你看懂Aya Vision的技术原理、主要功能、应用场景Aya Vision概述简介 Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 ...
-
AppAgentX是什么?一文让你看懂AppAgentX的技术原理、主要功能、应用场景AppAgentX概述简介 AppAgentX 是西湖大学推出的新型自我进化式 GUI(图形用户界面)代理框架,基于从执行历史中抽象出高级动作提升代...
-
IMAGPose是什么?一文让你看懂IMAGPose的技术原理、主要功能、应用场景IMAGPose概述简介 IMAGPose 是南京理工大学推出的用于人体姿态引导图像生成的统一条件框架。解决传统方法在姿态引导的人物图像生成中存在的...
-
START是什么?一文让你看懂START的技术原理、主要功能、应用场景START概述简介 START(Self-Taught Reasoner with Tools)是阿里集团和中国科学技术大学推出的新型工具增强型推理...
-
Anus是什么?一文让你看懂Anus的技术原理、主要功能、应用场景Anus概述简介 Anus(Autonomous Networked Utility System)是 Manus 生成的开源自主智能体项目,复刻 ...
-
MV-MATH是什么?一文让你看懂MV-MATH的技术原理、主要功能、应用场景MV-MATH概述简介 MV-MATH 是中科院自动化所提出的新基准数据集,评估多模态大语言大模型(MLLMs)在多视觉场景中的数学推理能力。数据集...
-
MHA2MLA是什么?一文让你看懂MHA2MLA的技术原理、主要功能、应用场景MHA2MLA概述简介 MHA2MLA是复旦大学、华东师范大学、上海AI Lab等机构联合推出的数据高效的微调方法,基于引入DeepSeek的多头潜...
-
GaussianAnything是什么?一文让你看懂GaussianAnything的技术原理、主要功能、应用场景GaussianAnything概述简介 GaussianAnything 是南洋理工大学 S-Lab 联合上海 AI Lab 等机构推出的 3D ...
-
VACE是什么?一文让你看懂VACE的技术原理、主要功能、应用场景VACE概述简介 VACE(Video Creation and Editing)是阿里巴巴通义实验室推出的一站式视频生成与编辑框架。基于整合多种视...
-
BEHAVIOR Robot Suite是什么?一文让你看懂BEHAVIOR Robot Suite的技术原理、主要功能、应用场景BEHAVIOR Robot Suite概述简介 BEHAVIOR Robot Suite(BRS)是斯坦福大学李飞飞团队推出的用在学习全身操作完成...
-
MM-StoryAgent是什么?一文让你看懂MM-StoryAgent的技术原理、主要功能、应用场景MM-StoryAgent概述简介 MM-StoryAgent 是上海交通大学X-LANCE实验室和阿里集团联合推出的开源多模态、多智能体框架,用在...