收集全球10,000⁺个好用的AI软件
-
AutoDroid-V2是什么?一文让你看懂AutoDroid-V2的技术原理、主要功能、应用场景AutoDroid-V2概述简介 AutoDroid-V2是清华大学人工智能产业研究院推出的基于小型语言大模型(SLM)的移动端GUI自动化脚本代理...
-
ArtCrafter是什么?一文让你看懂ArtCrafter的技术原理、主要功能、应用场景ArtCrafter概述简介 ArtCrafter是清华大学、鹏城实验室和联想研究院一起推出的文本到图像风格迁移框架,基于扩散模型,解决传统方法在风...
-
Aria-UI是什么?一文让你看懂Aria-UI的技术原理、主要功能、应用场景Aria-UI概述简介 Aria-UI是香港大学和Rhymes AI一起推出的为图形用户界面(GUI)定位任务设计的大型多模态模型。基于纯视觉方法,...
-
STAR是什么?一文让你看懂STAR的技术原理、主要功能、应用场景STAR概述简介 STAR是南京大学、字节跳动、西南大学联合推出的,创新的现实世界视频超分辨率(VSR)框架,能从低分辨率(LR)视频生成高分辨率(...
-
SPAR3D是什么?一文让你看懂SPAR3D的技术原理、主要功能、应用场景SPAR3D概述简介 SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量...
-
Agent Laboratory是什么?一文让你看懂Agent Laboratory的技术原理、主要功能、应用场景Agent Laboratory概述简介 Agent Laboratory是AMD和约翰·霍普金斯大学推出,基于大型语言大模型(LLM)的自主研究框...
-
PPTAgent是什么?一文让你看懂PPTAgent的技术原理、主要功能、应用场景PPTAgent概述简介 PPTAgent是中国科学院软件研究所中文信息处理实验室推出的创新框架,基于模仿人类工作流程的两阶段编辑方法,从文档自动生...
-
NVIDIA-Ingest是什么?一文让你看懂NVIDIA-Ingest的技术原理、主要功能、应用场景NVIDIA-Ingest概述简介 NVIDIA-Ingest是英伟达开源的用于解析复杂、混乱的非结构化PDF和其他企业文档的微服务集合。NVIDI...
-
Emotion-LLaMA是什么?一文让你看懂Emotion-LLaMA的技术原理、主要功能、应用场景Emotion-LLaMA概述简介 Emotion-LLaMA是多模态情绪识别与推理模型,融合了音频、视觉和文本输入,通过特定情绪编码器整合信息。模...
-
MiniRAG是什么?一文让你看懂MiniRAG的技术原理、主要功能、应用场景MiniRAG概述简介 MiniRAG是香港大学推出的新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言大模型(SLMs)设计...
-
Riona-AI-Agent是什么?一文让你看懂Riona-AI-Agent的技术原理、主要功能、应用场景Riona-AI-Agent概述简介 Riona-AI-Agent是Node.js 和 TypeScript 构建的 AI 驱动的自动化工具,能与 ...
-
FlowiseAI是什么?一文让你看懂FlowiseAI的技术原理、主要功能、应用场景FlowiseAI概述简介 Flowise 是开源的低代码或无代码拖放工具,通过拖拽可视化组件,用户可以快速构建自定义的 LLM 应用程序。提供了一...
-
RAIN是什么?一文让你看懂RAIN的技术原理、主要功能、应用场景RAIN概述简介 RAIN(Real-time Animation Of Infinite Video Stream)是创新的实时动画解决方案,基于...
-
AutoMouser是什么?一文让你看懂AutoMouser的技术原理、主要功能、应用场景AutoMouser概述简介 AutoMouser是Chrome扩展程序,能智能地跟踪用户交互,基于OpenAI的GPT模型自动生成Selenium...
-
Seaweed APT是什么?一文让你看懂Seaweed APT的技术原理、主要功能、应用场景Seaweed APT概述简介 Seaweed APT是字节跳动推出的对抗性后训练(Adversarial Post-Training)模型,能实现...
-
OmAgent是什么?一文让你看懂OmAgent的技术原理、主要功能、应用场景OmAgent概述简介 OmAgent是Om AI和浙江大学滨江研究院联合开源的多模态语言代理框架,能简化设备端智能代理的开发。OmAgent支持可...
-
T2A-01-HD是什么?一文让你看懂T2A-01-HD的技术原理、主要功能、应用场景T2A-01-HD概述简介 T2A-01-HD是海螺AI海外版推出新的语音模型。支持声音克隆,仅需10秒音频即可精准克隆声音,保留情感底色。模型具备...
-
Uni-AdaFocus是什么?一文让你看懂Uni-AdaFocus的技术原理、主要功能、应用场景Uni-AdaFocus概述简介 Uni-AdaFocus是清华大学自动化系的研究团队推出的通用的高效视频理解框架,框架通过自适应聚焦机制,动态调整...
-
AnyStory是什么?一文让你看懂AnyStory的技术原理、主要功能、应用场景AnyStory概述简介 AnyStory是阿里巴巴通义实验室研发的创新文本到图像生成框架,实现单个和多个主体的高保真个性化图像生成。通过“编码-路...
-
Video Alchemist是什么?一文让你看懂Video Alchemist的技术原理、主要功能、应用场景Video Alchemist概述简介 Video Alchemist是Snap公司等推出的新型视频生成模型,具备多主体、开放集合个性化能力,能根据...