收集全球10,000⁺个好用的AI软件
-
STAR是什么?一文让你看懂STAR的技术原理、主要功能、应用场景STAR概述简介 STAR是南京大学、字节跳动、西南大学联合推出的,创新的现实世界视频超分辨率(VSR)框架,能从低分辨率(LR)视频生成高分辨率(...
-
SPAR3D是什么?一文让你看懂SPAR3D的技术原理、主要功能、应用场景SPAR3D概述简介 SPAR3D是Stability AI和伊利诺伊大学香槟分校推出的,先进的单图生成3D模型方法,能从单张图像中高效重建出高质量...
-
Agent Laboratory是什么?一文让你看懂Agent Laboratory的技术原理、主要功能、应用场景Agent Laboratory概述简介 Agent Laboratory是AMD和约翰·霍普金斯大学推出,基于大型语言大模型(LLM)的自主研究框...
-
PPTAgent是什么?一文让你看懂PPTAgent的技术原理、主要功能、应用场景PPTAgent概述简介 PPTAgent是中国科学院软件研究所中文信息处理实验室推出的创新框架,基于模仿人类工作流程的两阶段编辑方法,从文档自动生...
-
Emotion-LLaMA是什么?一文让你看懂Emotion-LLaMA的技术原理、主要功能、应用场景Emotion-LLaMA概述简介 Emotion-LLaMA是多模态情绪识别与推理模型,融合了音频、视觉和文本输入,通过特定情绪编码器整合信息。模...
-
MiniRAG是什么?一文让你看懂MiniRAG的技术原理、主要功能、应用场景MiniRAG概述简介 MiniRAG是香港大学推出的新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言大模型(SLMs)设计...
-
Riona-AI-Agent是什么?一文让你看懂Riona-AI-Agent的技术原理、主要功能、应用场景Riona-AI-Agent概述简介 Riona-AI-Agent是Node.js 和 TypeScript 构建的 AI 驱动的自动化工具,能与 ...
-
FlowiseAI是什么?一文让你看懂FlowiseAI的技术原理、主要功能、应用场景FlowiseAI概述简介 Flowise 是开源的低代码或无代码拖放工具,通过拖拽可视化组件,用户可以快速构建自定义的 LLM 应用程序。提供了一...
-
RAIN是什么?一文让你看懂RAIN的技术原理、主要功能、应用场景RAIN概述简介 RAIN(Real-time Animation Of Infinite Video Stream)是创新的实时动画解决方案,基于...
-
AutoMouser是什么?一文让你看懂AutoMouser的技术原理、主要功能、应用场景AutoMouser概述简介 AutoMouser是Chrome扩展程序,能智能地跟踪用户交互,基于OpenAI的GPT模型自动生成Selenium...
-
Seaweed APT是什么?一文让你看懂Seaweed APT的技术原理、主要功能、应用场景Seaweed APT概述简介 Seaweed APT是字节跳动推出的对抗性后训练(Adversarial Post-Training)模型,能实现...
-
T2A-01-HD是什么?一文让你看懂T2A-01-HD的技术原理、主要功能、应用场景T2A-01-HD概述简介 T2A-01-HD是海螺AI海外版推出新的语音模型。支持声音克隆,仅需10秒音频即可精准克隆声音,保留情感底色。模型具备...
-
Uni-AdaFocus是什么?一文让你看懂Uni-AdaFocus的技术原理、主要功能、应用场景Uni-AdaFocus概述简介 Uni-AdaFocus是清华大学自动化系的研究团队推出的通用的高效视频理解框架,框架通过自适应聚焦机制,动态调整...
-
AnyStory是什么?一文让你看懂AnyStory的技术原理、主要功能、应用场景AnyStory概述简介 AnyStory是阿里巴巴通义实验室研发的创新文本到图像生成框架,实现单个和多个主体的高保真个性化图像生成。通过“编码-路...
-
Video Alchemist是什么?一文让你看懂Video Alchemist的技术原理、主要功能、应用场景Video Alchemist概述简介 Video Alchemist是Snap公司等推出的新型视频生成模型,具备多主体、开放集合个性化能力,能根据...
-
Wear-Any-Way是什么?一文让你看懂Wear-Any-Way的技术原理、主要功能、应用场景Wear-Any-Way概述简介 Wear-Any-Way是阿里巴巴拍立淘团队推出的创新的虚拟试穿框架。通过稀疏对应对齐机制,实现了高保真度且可定制...
-
LineArt是什么?一文让你看懂LineArt的技术原理、主要功能、应用场景LineArt概述简介 LineArt是吉林大学、瑞典皇家理工学院、东京工业大学等机构推出的,无需训练的高质量设计绘图外观迁移框架,能将复杂外观特征...
-
UI-TARS是什么?一文让你看懂UI-TARS的技术原理、主要功能、应用场景UI-TARS概述简介 UI-TARS是字节跳动推出的新一代原生图形用户界面(GUI)代理模型,通过自然语言实现对桌面、移动设备和网页界面的自动化交...
-
FilmAgent是什么?一文让你看懂FilmAgent的技术原理、主要功能、应用场景FilmAgent概述简介 FilmAgent是哈尔滨工业大学(深圳)的研究团队开发的基于多智能体协作框架的虚拟电影制作工具,通过自动化流程实现虚拟...
-
VideoLLaMA3是什么?一文让你看懂VideoLLaMA3的技术原理、主要功能、应用场景VideoLLaMA3概述简介 VideoLLaMA3 是阿里巴巴开源的前沿多模态基础模型,专注于图像和视频理解。基于 Qwen 2.5 架构,结合...