收集全球10,000⁺个好用的AI软件
-
OpenAI o3是什么?一文让你看懂OpenAI o3的技术原理、主要功能、应用场景OpenAI o3概述简介 OpenAI o3模型是继o1之后的新一代推理模型,包括o3和o3-mini两个版本。o3在某些条件下接近于通用人工智能...
-
AgentScope是什么?一文让你看懂AgentScope的技术原理、主要功能、应用场景AgentScope概述简介 AgentScope是阿里集团开源的多智能体开发平台,帮助开发者轻松构建和部署多智能体应用。AgentScope提供高...
-
ERA-42是什么?一文让你看懂ERA-42的技术原理、主要功能、应用场景ERA-42概述简介 ERA-42是北京星动纪元推出的端到端原生机器人大模型,与自研的五指灵巧手星动XHAND1结合,能完成100多种复杂灵巧操作任...
-
CLEAR是什么?一文让你看懂CLEAR的技术原理、主要功能、应用场景CLEAR概述简介 CLEAR是新加坡国立大学推出新型线性注意力机制,能提升预训练扩散变换器(DiTs)生成高分辨率图像的效率。基于将每个查询的注意...
-
OCTAVE是什么?一文让你看懂OCTAVE的技术原理、主要功能、应用场景OCTAVE 概述简介 OCTAVE(Omni-Capable Text and Voice Engine)是Hume AI推出的新一代语音语言大模...
-
OmniAudio-2.6B是什么?一文让你看懂OmniAudio-2.6B的技术原理、主要功能、应用场景OmniAudio-2.6B概述简介 OmniAudio-2.6B是Nexa AI推出的音频语言大模型,专为边缘部署设计,能实现快速且高效的音频文本...
-
PC Agent是什么?一文让你看懂PC Agent的技术原理、主要功能、应用场景PC Agent概述简介 PC Agent是上海交通大学和Generative AI Research Lab (GAIR)联合推出的先进AI系统。...
-
ASAL是什么?一文让你看懂ASAL的技术原理、主要功能、应用场景ASAL概述简介 ASAL(Automated Search for Artificial Life)是用基础模型自动化搜索人工生命(ALife)的...
-
CogAgent-9B是什么?一文让你看懂CogAgent-9B的技术原理、主要功能、应用场景CogAgent-9B概述简介 CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型,仅依赖屏幕截图作为输入,无需HTML...
-
AGUVIS是什么?一文让你看懂AGUVIS的技术原理、主要功能、应用场景AGUVIS概述简介 AGUVIS是香港大学、Salesforce 联合推出的统一的纯视觉框架,专为自主GUI智能体设计,能在各种平台(如网页、桌面...
-
Enhance-A-Video是什么?一文让你看懂Enhance-A-Video的技术原理、主要功能、应用场景Enhance-A-Video概述简介 Enhance-A-Video 是新加坡国立大学、上海人工智能实验室和德克萨斯大学奥斯汀分校联合推出的视频生...
-
SPAR是什么?一文让你看懂SPAR的技术原理、主要功能、应用场景SPAR概述简介 SPAR是智谱团队推出的自我博弈框架,能增强大型语言大模型在遵循指令方面的能力。框架基于内部的生成者和完善者两个角色进行互动,生成...
-
Qwen-Agent是什么?一文让你看懂Qwen-Agent的技术原理、主要功能、应用场景Qwen-Agent概述简介 Qwen-Agent是基于通义千问模型(Qwen)的开源Agent开发框架,支持开发者用Qwen模型的指令遵循、工具使...
-
AgiBot World是什么?一文让你看懂AgiBot World的技术原理、主要功能、应用场景AgiBot World概述简介 AgiBot World是智元机器人开源的百万真机数据集,旨在推动具身智能的发展。数据集包含八十余种日常技能,覆盖...
-
GraphAgent是什么?一文让你看懂GraphAgent的技术原理、主要功能、应用场景GraphAgent概述简介 GraphAgent是香港大学和香港科技大学(广州)联合推出的智能图形语言助手,能处理现实世界中结构化(如图连接)和非...
-
VideoVAE+是什么?一文让你看懂VideoVAE+的技术原理、主要功能、应用场景VideoVAE+概述简介 VideoVAE+(VideoVAE Plus)是香港科技大学团队推出的先进的跨模态视频变分自编码器(Video VAE...
-
AI Dev Gallery是什么?一文让你看懂AI Dev Gallery的技术原理、主要功能、应用场景AI Dev Gallery概述简介 AI Dev Gallery是微软推出的开源AI工具包和示例库,集成在Visual Studio中,帮助Win...
-
OpenEMMA是什么?一文让你看懂OpenEMMA的技术原理、主要功能、应用场景OpenEMMA概述简介 OpenEMMA是德州农工大学、密歇根大学和多伦多大学共同开源的端到端自动驾驶多模态模型框架,基于预训练的多模态大型语言大...
-
RAG Logger是什么?一文让你看懂RAG Logger的技术原理、主要功能、应用场景RAG Logger概述简介 RAG Logger是开源的日志记录工具,专为检索增强生成(RAG)应用设计。作为LangSmith的轻量级替代品,专...
-
AutoRAG是什么?一文让你看懂AutoRAG的技术原理、主要功能、应用场景AutoRAG概述简介 AutoRAG是中国科学院计算技术研究所(ICT/CAS)、中国科学院的人工智能安全重点实验室及中国科学院大学的开发人员一起...