收集全球10,000⁺个好用的AI软件
-
Agent TARS是什么?一文让你看懂Agent TARS的技术原理、主要功能、应用场景Agent TARS概述简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统...
-
Multi-Agent Orchestrator是什么?一文让你看懂Multi-Agent Orchestrator的技术原理、主要功能、应用场景Multi-Agent Orchestrator概述简介 Multi-Agent Orchestrator 是用于管理和协调多个智能代理(Agent...
-
AndroidGen是什么?一文让你看懂AndroidGen的技术原理、主要功能、应用场景AndroidGen概述简介 AndroidGen 是智谱技术团队推出增强基于大语言大模型(LLM)的 Agent 能力的框架,特别是在数据稀缺的情...
-
TaoAvatar是什么?一文让你看懂TaoAvatar的技术原理、主要功能、应用场景TaoAvatar概述简介 TaoAvatar是阿里集团研究团队推出的高保真、轻量级的3D全身对话虚拟人技术。基于3D高斯溅射技术,能生成照片级逼真...
-
ChatAnyone是什么?一文让你看懂ChatAnyone的技术原理、主要功能、应用场景ChatAnyone概述简介 ChatAnyone是阿里巴巴通义实验室推出的实时风格化肖像视频生成框架。通过音频输入,生成具有丰富表情和上半身动作的...
-
Animate Anyone是什么?一文让你看懂Animate Anyone的技术原理、主要功能、应用场景Animate Anyone是由阿里巴巴智能计算研究院推出的一款将静态图像中的角色或人物进行动态化的开源框架,已在GitHub上斩获了近1.3万个星...
-
ReplaceAnything是什么?一文让你看懂ReplaceAnything的技术原理、主要功能、应用场景ReplaceAnything是由阿里巴巴智能计算研究院推出的一款开源AI图像内容替换框架,利用先进的人工智能技术,能够实现对照片或图像中物体的智能...
-
Outfit Anyone是什么?一文让你看懂Outfit Anyone的技术原理、主要功能、应用场景Outfit Anyone是由阿里巴巴智能计算研究院推出的一个高质量服装虚拟试穿的开源项目,借助该技术,用户或模特无需亲自试穿衣服即可预览上身效果。...
-
AnyText是什么?一文让你看懂AnyText的技术原理、主要功能、应用场景AnyText概述简介 AnyText是阿里巴巴智能计算研究院的团队推出的一个基于扩散的多语言视觉文本生成和编辑模型,专注于在图像中渲染准确和连贯的...
-
Real-ESRGAN是什么?一文让你看懂Real-ESRGAN的技术原理、主要功能、应用场景Real-ESRGAN概述简介 Real-ESRGAN(Real-World Blind Super-Resolution with Pure Sy...
-
ActAnywhere是什么?一文让你看懂ActAnywhere的技术原理、主要功能、应用场景ActAnywhere概述简介 ActAnywhere是一个由斯坦福大学和Adobe Research的开发人员共同开发的视频生成模型,旨在解决视频...
-
IP-Adapter是什么?一文让你看懂IP-Adapter的技术原理、主要功能、应用场景IP-Adapter概述简介 IP-Adapter(Image Prompt Adapter)是一种专门为预训练的文本到图像扩散模型(如Stable...
-
Make-A-Character是什么?一文让你看懂Make-A-Character的技术原理、主要功能、应用场景Make-A-Character是什么? Make-A-Character(简称Mach)是一个由阿里集团智能计算研究院开发的一个人工智能3D数字人...
-
AnimateDiff是什么?一文让你看懂AnimateDiff的技术原理、主要功能、应用场景AnimateDiff是什么? AnimateDiff是由上海人工智能实验室、香港中文大学和斯坦福大学的开发人员推出的一款将个性化的文本到图像模型扩...
-
Depth Anything是什么?一文让你看懂Depth Anything的技术原理、主要功能、应用场景Depth Anything是什么? Depth Anything是由来自Tiktok、香港大学和浙江大学的开发人员推出的一个为单目深度估计(Mon...
-
V-JEPA是什么?一文让你看懂V-JEPA的技术原理、主要功能、应用场景V-JEPA是什么? V-JEPA(Video Joint-Embedding Predictive Architecture,视频联合嵌入预测架构...
-
ScreenAgent是什么?一文让你看懂ScreenAgent的技术原理、主要功能、应用场景ScreenAgent概述简介 ScreenAgent是一个由吉林大学人工智能学院的研究团队开发的计算机控制智能体,该智能体是基于视觉语言大模型(V...
-
ScreenAI是什么?一文让你看懂ScreenAI的技术原理、主要功能、应用场景ScreenAI概述简介 ScreenAI是一个由谷歌的开发人员推出的可读屏AI视觉语言大模型,专门设计用于理解和处理用户界面(UI)和信息图表。该...
-
ResAdapter是什么?一文让你看懂ResAdapter的技术原理、主要功能、应用场景ResAdapter概述简介 ResAdapter是由字节跳动的开发人员推出的一种为扩散模型(如Stable Diffusion)设计的分辨率适配器...
-
AtomoVideo是什么?一文让你看懂AtomoVideo的技术原理、主要功能、应用场景AtomoVideo概述简介 AtomoVideo是由阿里巴巴的研究团队提出的一个高保真图像到视频(Image-to-Video, I2V)生成框架...