收集全球10,000⁺个好用的AI软件
-
Follow Your Pose是什么?一文让你看懂Follow Your Pose的技术原理、主要功能、应用场景Follow Your Pose概述简介 Follow Your Pose是由清华大学、香港科技大学、腾讯AI Lab以及中科院的开发人员开源的一个...
-
IP-Adapter是什么?一文让你看懂IP-Adapter的技术原理、主要功能、应用场景IP-Adapter概述简介 IP-Adapter(Image Prompt Adapter)是一种专门为预训练的文本到图像扩散模型(如Stable...
-
OLMo是什么?一文让你看懂OLMo的技术原理、主要功能、应用场景OLMo是什么? OLMo(Open Language Model)是由Allen AI(AI2,艾伦人工智能研究所)开发的一个完全开源开放的大型语...
-
DiffusionGPT是什么?一文让你看懂DiffusionGPT的技术原理、主要功能、应用场景DiffusionGPT是什么? DiffusionGPT是由来自字节跳动与中山大学的开发人员推出的一个开源的大模型(LLM)驱动的文本到图像生成系...
-
MetaGPT是什么?一文让你看懂MetaGPT的技术原理、主要功能、应用场景MetaGPT是什么? MetaGPT是一个创新的元编程框架,结合了大语言大模型和多智能体协作系统,旨在通过模拟人类工作流程来解决复杂问题。该框架的...
-
Make-A-Character是什么?一文让你看懂Make-A-Character的技术原理、主要功能、应用场景Make-A-Character是什么? Make-A-Character(简称Mach)是一个由阿里集团智能计算研究院开发的一个人工智能3D数字人...
-
MotionCtrl是什么?一文让你看懂MotionCtrl的技术原理、主要功能、应用场景MotionCtrl概述简介 MotionCtrl是由来自腾讯、香港大学、上海AI实验室、清华大学、广东工业大学等机构的开发人员推出的一个为视频生成...
-
AnimateDiff是什么?一文让你看懂AnimateDiff的技术原理、主要功能、应用场景AnimateDiff是什么? AnimateDiff是由上海人工智能实验室、香港中文大学和斯坦福大学的开发人员推出的一款将个性化的文本到图像模型扩...
-
Depth Anything是什么?一文让你看懂Depth Anything的技术原理、主要功能、应用场景Depth Anything是什么? Depth Anything是由来自Tiktok、香港大学和浙江大学的开发人员推出的一个为单目深度估计(Mon...
-
V-JEPA是什么?一文让你看懂V-JEPA的技术原理、主要功能、应用场景V-JEPA是什么? V-JEPA(Video Joint-Embedding Predictive Architecture,视频联合嵌入预测架构...
-
Boximator是什么?一文让你看懂Boximator的技术原理、主要功能、应用场景Boximator是什么? Boximator是由字节跳动的研究团队开发的一种视频合成技术,旨在生成丰富且可控的运动,以增强视频合成的质量和可控性。...
-
Boximator是什么?一文让你看懂Boximator的技术原理、主要功能、应用场景Boximator是什么? Boximator是由字节跳动的研究团队开发的一种视频合成技术,旨在生成丰富且可控的运动,以增强视频合成的质量和可控性。...
-
DiT是什么?一文让你看懂DiT的技术原理、主要功能、应用场景DiT概述简介 DiT(Diffusion Transformers)是一种新型的扩散模型,由William Peebles(Sora的研发负责人之...
-
VideoPoet是什么?一文让你看懂VideoPoet的技术原理、主要功能、应用场景VideoPoet概述简介 VideoPoet是由谷歌的研究团队开发的一种基于大模型的AI视频生成方案,支持从文本、图像或视频输入中合成高质量的视频...
-
SDXL-Lightning是什么?一文让你看懂SDXL-Lightning的技术原理、主要功能、应用场景SDXL-Lightning概述简介 SDXL-Lightning是由字节跳动的研究团队推出的一种基于扩散模型的文本到图像生成技术,旨在解决传统扩散...
-
Stable Diffusion 3是什么?一文让你看懂Stable Diffusion 3的技术原理、主要功能、应用场景Stable Diffusion 3概述简介 Stable Diffusion 3 是由 Stability AI 开发的一款先进的文本到图像生成模...
-
ConsiStory是什么?一文让你看懂ConsiStory的技术原理、主要功能、应用场景ConsiStory概述简介 ConsiStory是由NVIDIA和特拉维夫大学的开发人员共同开发的一种无需训练的文本生成图像的方法,可以实现让图像...
-
ScreenAgent是什么?一文让你看懂ScreenAgent的技术原理、主要功能、应用场景ScreenAgent概述简介 ScreenAgent是一个由吉林大学人工智能学院的研究团队开发的计算机控制智能体,该智能体是基于视觉语言大模型(V...
-
YOLOv9是什么?一文让你看懂YOLOv9的技术原理、主要功能、应用场景YOLOv9概述简介 YOLOv9是一个由台北中研院和台北科技大学等机构的研究团队推出的新一代先进的目标检测系统,是YOLO(You Only Lo...
-
VideoPrism是什么?一文让你看懂VideoPrism的技术原理、主要功能、应用场景VideoPrism概述简介 VideoPrism是一个由谷歌研究团队开发的通用视频编码器,旨在通过一个单一的预训练模型来处理多种视频理解任务。该模...