A

首页 > A

FACTS Grounding是什么？一文让你看懂FACTS Grounding的技术原理、主要功能、应用场景

FACTS Grounding概述简介 FACTS Grounding是谷歌DeepMind推出的评估大型语言大模型（LLMs）能力的基准测试，衡量...
EMMA-X是什么？一文让你看懂EMMA-X的技术原理、主要功能、应用场景

EMMA-X概述简介 EMMA-X是新加坡科技设计大学推出的具有70亿参数的具身多模态动作模型，在有根据的链式思维（CoT）推理数据上微调OpenV...
X-AnyLabeling是什么？一文让你看懂X-AnyLabeling的技术原理、主要功能、应用场景

X-AnyLabeling概述简介 X-AnyLabeling是集成多种深度学习算法的图像标注软件，专注于提升标注效率和精度。X-AnyLabeli...
AniDoc是什么？一文让你看懂AniDoc的技术原理、主要功能、应用场景

AniDoc概述简介 AniDoc是香港科技大学、蚂蚁集团、南京大学、浙江大学和香港大学一起推出的简化2D动画上色AI大模型，基于视频扩散模型自动将...
OpenAI o3是什么？一文让你看懂OpenAI o3的技术原理、主要功能、应用场景

OpenAI o3概述简介 OpenAI o3模型是继o1之后的新一代推理模型，包括o3和o3-mini两个版本。o3在某些条件下接近于通用人工智能...
AgentScope是什么？一文让你看懂AgentScope的技术原理、主要功能、应用场景

AgentScope概述简介 AgentScope是阿里集团开源的多智能体开发平台，帮助开发者轻松构建和部署多智能体应用。AgentScope提供高...
ERA-42是什么？一文让你看懂ERA-42的技术原理、主要功能、应用场景

ERA-42概述简介 ERA-42是北京星动纪元推出的端到端原生机器人大模型，与自研的五指灵巧手星动XHAND1结合，能完成100多种复杂灵巧操作任...
CLEAR是什么？一文让你看懂CLEAR的技术原理、主要功能、应用场景

CLEAR概述简介 CLEAR是新加坡国立大学推出新型线性注意力机制，能提升预训练扩散变换器（DiTs）生成高分辨率图像的效率。基于将每个查询的注意...
OCTAVE是什么？一文让你看懂OCTAVE的技术原理、主要功能、应用场景

OCTAVE 概述简介 OCTAVE（Omni-Capable Text and Voice Engine）是Hume AI推出的新一代语音语言大模...
OmniAudio-2.6B是什么？一文让你看懂OmniAudio-2.6B的技术原理、主要功能、应用场景

OmniAudio-2.6B概述简介 OmniAudio-2.6B是Nexa AI推出的音频语言大模型，专为边缘部署设计，能实现快速且高效的音频文本...
PC Agent是什么？一文让你看懂PC Agent的技术原理、主要功能、应用场景

PC Agent概述简介 PC Agent是上海交通大学和Generative AI Research Lab (GAIR)联合推出的先进AI系统。...
ASAL是什么？一文让你看懂ASAL的技术原理、主要功能、应用场景

ASAL概述简介 ASAL（Automated Search for Artificial Life）是用基础模型自动化搜索人工生命（ALife）的...
CogAgent-9B是什么？一文让你看懂CogAgent-9B的技术原理、主要功能、应用场景

CogAgent-9B概述简介 CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型，仅依赖屏幕截图作为输入，无需HTML...
AGUVIS是什么？一文让你看懂AGUVIS的技术原理、主要功能、应用场景

AGUVIS概述简介 AGUVIS是香港大学、Salesforce 联合推出的统一的纯视觉框架，专为自主GUI智能体设计，能在各种平台（如网页、桌面...
Enhance-A-Video是什么？一文让你看懂Enhance-A-Video的技术原理、主要功能、应用场景

Enhance-A-Video概述简介 Enhance-A-Video 是新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合推出的视频生...
SPAR是什么？一文让你看懂SPAR的技术原理、主要功能、应用场景

SPAR概述简介 SPAR是智谱团队推出的自我博弈框架，能增强大型语言大模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动，生成...
Qwen-Agent是什么？一文让你看懂Qwen-Agent的技术原理、主要功能、应用场景

Qwen-Agent概述简介 Qwen-Agent是基于通义千问模型（Qwen）的开源Agent开发框架，支持开发者用Qwen模型的指令遵循、工具使...
AgiBot World是什么？一文让你看懂AgiBot World的技术原理、主要功能、应用场景

AgiBot World概述简介 AgiBot World是智元机器人开源的百万真机数据集，旨在推动具身智能的发展。数据集包含八十余种日常技能，覆盖...
GraphAgent是什么？一文让你看懂GraphAgent的技术原理、主要功能、应用场景

GraphAgent概述简介 GraphAgent是香港大学和香港科技大学（广州）联合推出的智能图形语言助手，能处理现实世界中结构化（如图连接）和非...
VideoVAE+是什么？一文让你看懂VideoVAE+的技术原理、主要功能、应用场景

VideoVAE+概述简介 VideoVAE+（VideoVAE Plus）是香港科技大学团队推出的先进的跨模态视频变分自编码器（Video VAE...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL