收集全球10,000⁺个好用的AI软件
-
FACTS Grounding是什么?一文让你看懂FACTS Grounding的技术原理、主要功能、应用场景FACTS Grounding概述简介 FACTS Grounding是谷歌DeepMind推出的评估大型语言大模型(LLMs)能力的基准测试,衡量...
-
EMMA-X是什么?一文让你看懂EMMA-X的技术原理、主要功能、应用场景EMMA-X概述简介 EMMA-X是新加坡科技设计大学推出的具有70亿参数的具身多模态动作模型,在有根据的链式思维(CoT)推理数据上微调OpenV...
-
X-AnyLabeling是什么?一文让你看懂X-AnyLabeling的技术原理、主要功能、应用场景X-AnyLabeling概述简介 X-AnyLabeling是集成多种深度学习算法的图像标注软件,专注于提升标注效率和精度。X-AnyLabeli...
-
AniDoc是什么?一文让你看懂AniDoc的技术原理、主要功能、应用场景AniDoc概述简介 AniDoc是香港科技大学、蚂蚁集团、南京大学、浙江大学和香港大学一起推出的简化2D动画上色AI大模型,基于视频扩散模型自动将...
-
OpenAI o3是什么?一文让你看懂OpenAI o3的技术原理、主要功能、应用场景OpenAI o3概述简介 OpenAI o3模型是继o1之后的新一代推理模型,包括o3和o3-mini两个版本。o3在某些条件下接近于通用人工智能...
-
AgentScope是什么?一文让你看懂AgentScope的技术原理、主要功能、应用场景AgentScope概述简介 AgentScope是阿里集团开源的多智能体开发平台,帮助开发者轻松构建和部署多智能体应用。AgentScope提供高...
-
ERA-42是什么?一文让你看懂ERA-42的技术原理、主要功能、应用场景ERA-42概述简介 ERA-42是北京星动纪元推出的端到端原生机器人大模型,与自研的五指灵巧手星动XHAND1结合,能完成100多种复杂灵巧操作任...
-
CLEAR是什么?一文让你看懂CLEAR的技术原理、主要功能、应用场景CLEAR概述简介 CLEAR是新加坡国立大学推出新型线性注意力机制,能提升预训练扩散变换器(DiTs)生成高分辨率图像的效率。基于将每个查询的注意...
-
OCTAVE是什么?一文让你看懂OCTAVE的技术原理、主要功能、应用场景OCTAVE 概述简介 OCTAVE(Omni-Capable Text and Voice Engine)是Hume AI推出的新一代语音语言大模...
-
OmniAudio-2.6B是什么?一文让你看懂OmniAudio-2.6B的技术原理、主要功能、应用场景OmniAudio-2.6B概述简介 OmniAudio-2.6B是Nexa AI推出的音频语言大模型,专为边缘部署设计,能实现快速且高效的音频文本...
-
PC Agent是什么?一文让你看懂PC Agent的技术原理、主要功能、应用场景PC Agent概述简介 PC Agent是上海交通大学和Generative AI Research Lab (GAIR)联合推出的先进AI系统。...
-
ASAL是什么?一文让你看懂ASAL的技术原理、主要功能、应用场景ASAL概述简介 ASAL(Automated Search for Artificial Life)是用基础模型自动化搜索人工生命(ALife)的...
-
CogAgent-9B是什么?一文让你看懂CogAgent-9B的技术原理、主要功能、应用场景CogAgent-9B概述简介 CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型,仅依赖屏幕截图作为输入,无需HTML...
-
AGUVIS是什么?一文让你看懂AGUVIS的技术原理、主要功能、应用场景AGUVIS概述简介 AGUVIS是香港大学、Salesforce 联合推出的统一的纯视觉框架,专为自主GUI智能体设计,能在各种平台(如网页、桌面...
-
Enhance-A-Video是什么?一文让你看懂Enhance-A-Video的技术原理、主要功能、应用场景Enhance-A-Video概述简介 Enhance-A-Video 是新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合推出的视频生...
-
SPAR是什么?一文让你看懂SPAR的技术原理、主要功能、应用场景SPAR概述简介 SPAR是智谱团队推出的自我博弈框架,能增强大型语言大模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动,生成...
-
Qwen-Agent是什么?一文让你看懂Qwen-Agent的技术原理、主要功能、应用场景Qwen-Agent概述简介 Qwen-Agent是基于通义千问模型(Qwen)的开源Agent开发框架,支持开发者用Qwen模型的指令遵循、工具使...
-
AgiBot World是什么?一文让你看懂AgiBot World的技术原理、主要功能、应用场景AgiBot World概述简介 AgiBot World是智元机器人开源的百万真机数据集,旨在推动具身智能的发展。数据集包含八十余种日常技能,覆盖...
-
GraphAgent是什么?一文让你看懂GraphAgent的技术原理、主要功能、应用场景GraphAgent概述简介 GraphAgent是香港大学和香港科技大学(广州)联合推出的智能图形语言助手,能处理现实世界中结构化(如图连接)和非...
-
VideoVAE+是什么?一文让你看懂VideoVAE+的技术原理、主要功能、应用场景VideoVAE+概述简介 VideoVAE+(VideoVAE Plus)是香港科技大学团队推出的先进的跨模态视频变分自编码器(Video VAE...