A

首页 > A

AutoDroid-V2是什么？一文让你看懂AutoDroid-V2的技术原理、主要功能、应用场景

AutoDroid-V2概述简介 AutoDroid-V2是清华大学人工智能产业研究院推出的基于小型语言大模型（SLM）的移动端GUI自动化脚本代理...
ArtCrafter是什么？一文让你看懂ArtCrafter的技术原理、主要功能、应用场景

ArtCrafter概述简介 ArtCrafter是清华大学、鹏城实验室和联想研究院一起推出的文本到图像风格迁移框架，基于扩散模型，解决传统方法在风...
Aria-UI是什么？一文让你看懂Aria-UI的技术原理、主要功能、应用场景

Aria-UI概述简介 Aria-UI是香港大学和Rhymes AI一起推出的为图形用户界面（GUI）定位任务设计的大型多模态模型。基于纯视觉方法，...
STAR是什么？一文让你看懂STAR的技术原理、主要功能、应用场景

STAR概述简介 STAR是南京大学、字节跳动、西南大学联合推出的，创新的现实世界视频超分辨率（VSR）框架，能从低分辨率（LR）视频生成高分辨率（...
SPAR3D是什么？一文让你看懂SPAR3D的技术原理、主要功能、应用场景

SPAR3D概述简介 SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的，先进的单图生成3D模型方法，能从单张图像中高效重建出高质量...
Agent Laboratory是什么？一文让你看懂Agent Laboratory的技术原理、主要功能、应用场景

Agent Laboratory概述简介 Agent Laboratory是AMD和约翰·霍普金斯大学推出，基于大型语言大模型（LLM）的自主研究框...
PPTAgent是什么？一文让你看懂PPTAgent的技术原理、主要功能、应用场景

PPTAgent概述简介 PPTAgent是中国科学院软件研究所中文信息处理实验室推出的创新框架，基于模仿人类工作流程的两阶段编辑方法，从文档自动生...
NVIDIA-Ingest是什么？一文让你看懂NVIDIA-Ingest的技术原理、主要功能、应用场景

NVIDIA-Ingest概述简介 NVIDIA-Ingest是英伟达开源的用于解析复杂、混乱的非结构化PDF和其他企业文档的微服务集合。NVIDI...
Emotion-LLaMA是什么？一文让你看懂Emotion-LLaMA的技术原理、主要功能、应用场景

Emotion-LLaMA概述简介 Emotion-LLaMA是多模态情绪识别与推理模型，融合了音频、视觉和文本输入，通过特定情绪编码器整合信息。模...
MiniRAG是什么？一文让你看懂MiniRAG的技术原理、主要功能、应用场景

MiniRAG概述简介 MiniRAG是香港大学推出的新型检索增强型生成（RAG）系统，专为在资源受限的场景下高效部署小型语言大模型（SLMs）设计...
Riona-AI-Agent是什么？一文让你看懂Riona-AI-Agent的技术原理、主要功能、应用场景

Riona-AI-Agent概述简介 Riona-AI-Agent是Node.js 和 TypeScript 构建的 AI 驱动的自动化工具，能与 ...
FlowiseAI是什么？一文让你看懂FlowiseAI的技术原理、主要功能、应用场景

FlowiseAI概述简介 Flowise 是开源的低代码或无代码拖放工具，通过拖拽可视化组件，用户可以快速构建自定义的 LLM 应用程序。提供了一...
RAIN是什么？一文让你看懂RAIN的技术原理、主要功能、应用场景

RAIN概述简介 RAIN（Real-time Animation Of Infinite Video Stream）是创新的实时动画解决方案，基于...
AutoMouser是什么？一文让你看懂AutoMouser的技术原理、主要功能、应用场景

AutoMouser概述简介 AutoMouser是Chrome扩展程序，能智能地跟踪用户交互，基于OpenAI的GPT模型自动生成Selenium...
Seaweed APT是什么？一文让你看懂Seaweed APT的技术原理、主要功能、应用场景

Seaweed APT概述简介 Seaweed APT是字节跳动推出的对抗性后训练（Adversarial Post-Training）模型，能实现...
OmAgent是什么？一文让你看懂OmAgent的技术原理、主要功能、应用场景

OmAgent概述简介 OmAgent是Om AI和浙江大学滨江研究院联合开源的多模态语言代理框架，能简化设备端智能代理的开发。OmAgent支持可...
T2A-01-HD是什么？一文让你看懂T2A-01-HD的技术原理、主要功能、应用场景

T2A-01-HD概述简介 T2A-01-HD是海螺AI海外版推出新的语音模型。支持声音克隆，仅需10秒音频即可精准克隆声音，保留情感底色。模型具备...
Uni-AdaFocus是什么？一文让你看懂Uni-AdaFocus的技术原理、主要功能、应用场景

Uni-AdaFocus概述简介 Uni-AdaFocus是清华大学自动化系的研究团队推出的通用的高效视频理解框架，框架通过自适应聚焦机制，动态调整...
AnyStory是什么？一文让你看懂AnyStory的技术原理、主要功能、应用场景

AnyStory概述简介 AnyStory是阿里巴巴通义实验室研发的创新文本到图像生成框架，实现单个和多个主体的高保真个性化图像生成。通过“编码-路...
Video Alchemist是什么？一文让你看懂Video Alchemist的技术原理、主要功能、应用场景

Video Alchemist概述简介 Video Alchemist是Snap公司等推出的新型视频生成模型，具备多主体、开放集合个性化能力，能根据...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL