收集全球10,000⁺个好用的AI软件
-
iAgents是什么?一文让你看懂iAgents的技术原理、主要功能、应用场景iAgents概述简介 iAgents是清华大学推出的多AI智能体协作框架,基于为每个用户配备个人AI智能体促进协作和完成日常任务。智能体能理解用户...
-
Agent K v1.0是什么?一文让你看懂Agent K v1.0的技术原理、主要功能、应用场景Agent K v1.0概述简介 Agent K v1.0 是华为诺亚方舟实验室与伦敦大学学院团队联合推出的端到端自主数据科学智能体,能自动化、优化...
-
LLaVA-o1是什么?一文让你看懂LLaVA-o1的技术原理、主要功能、应用场景LLaVA-o1概述简介 LLaVA-o1是北京大学、清华大学、鹏城实验室、阿里巴巴达摩院以及理海大学(Lehigh University)组成的研...
-
AgileGen是什么?一文让你看懂AgileGen的技术原理、主要功能、应用场景AgileGen概述简介 AgileGen是生成式软件开发框架,基于人与AI协作增强软件的创建过程。AgileGen包含两个核心部分:终端用户决策制...
-
AnimateAnything是什么?一文让你看懂AnimateAnything的技术原理、主要功能、应用场景AnimateAnything概述简介 AnimateAnything是浙江大学和北京航空航天大学研究者推出的统一可控视频生成技术。AnimateA...
-
RAG-Diffusion是什么?一文让你看懂RAG-Diffusion的技术原理、主要功能、应用场景RAG-Diffusion概述简介 RAG-Diffusion是南京大学团队推出的区域感知文本到图像生成方法。基于区域硬绑定和区域软细化两个阶段,实...
-
MARS是什么?一文让你看懂MARS的技术原理、主要功能、应用场景MARS概述简介 MARS(Make vAriance Reduction Shine)是字节跳动推出的创新的优化框架,提升大型模型训练的效率。MA...
-
AtomThink是什么?一文让你看懂AtomThink的技术原理、主要功能、应用场景AtomThink概述简介 AtomThink是中山大学、香港科技大学、上海交通大学、香港大学及华为诺亚方舟实验室的开发人员一起推出的多模态数学推理...
-
AlphaQubit是什么?一文让你看懂AlphaQubit的技术原理、主要功能、应用场景AlphaQubit概述简介 AlphaQubit是谷歌推出基于AI技术的量子错误解码器,用深度学习架构Transformers识别和纠正量子计算中...
-
CAD-MLLM是什么?一文让你看懂CAD-MLLM的技术原理、主要功能、应用场景CAD-MLLM概述简介 CAD-MLLM是由上海科技大学、Transcengram、DeepSeek AI和香港大学一起推出的,计算机辅助设计(C...
-
JoyVASA是什么?一文让你看懂JoyVASA的技术原理、主要功能、应用场景JoyVASA概述简介 JoyVASA是京东健康国际公司开源的音频驱动的数字人头项目,基于扩散模型技术,根据音频信号生成与音频同步的面部动态和头部运...
-
AutoConsis是什么?一文让你看懂AutoConsis的技术原理、主要功能、应用场景AutoConsis概述简介 AutoConsis是UI内容一致性智能检测工具,是美团技术团队与复旦大学联合推出的。工具基于深度学习和大型语言大模型...
-
In-Context LoRA是什么?一文让你看懂In-Context LoRA的技术原理、主要功能、应用场景In-Context LoRA概述简介 In-Context LoRA是阿里巴巴通义实验室推出的基于扩散变换器(DiTs)的图像生成框架,用模型的内...
-
Add-it是什么?一文让你看懂Add-it的技术原理、主要功能、应用场景Add-it概述简介 Add-it是NVIDIA推出的无需训练的图像编辑技术,能根据文本指令在图像中添加对象。这项技术基于扩展扩散模型的注意力机制,...
-
BALROG是什么?一文让你看懂BALROG的技术原理、主要功能、应用场景BALROG概述简介 BALROG是评估大型语言大模型(LLMs)和视觉语言大模型(VLMs)在游戏上的推理能力,特别是模型在动态环境中的规划、空间...
-
AutoVFX是什么?一文让你看懂AutoVFX的技术原理、主要功能、应用场景AutoVFX概述简介 AutoVFX是先进的物理特效框架,是伊利诺伊大学香槟分校研究团队推出的,能根据自然语言指令自动创建真实感和动态的视觉特效(...
-
HART是什么?一文让你看懂HART的技术原理、主要功能、应用场景HART概述简介 HART(Hybrid Autoregressive Transformer)是麻省理工学院研究团队推出的自回归视觉生成模型。能直...
-
CAVIA是什么?一文让你看懂CAVIA的技术原理、主要功能、应用场景CAVIA概述简介 CAVIA是苹果公司、得克萨斯大学奥斯汀分校、谷歌联合推出的多视角视频生成框架,能将单一输入图像转换成多个时空一致的视频序列。框...
-
LazyGraphRAG是什么?一文让你看懂LazyGraphRAG的技术原理、主要功能、应用场景LazyGraphRAG概述简介 LazyGraphRAG是微软研究院推出的图形增强生成增强检索(RAG)框架,是GraphRAG的迭代版本。Laz...
-
LEOPARD是什么?一文让你看懂LEOPARD的技术原理、主要功能、应用场景LEOPARD概述简介 LEOPARD是腾讯AI Lab西雅图实验室推出的视觉语言大模型,专为理解和处理含有大量文本的多图像任务设计。LEOPARD...