收集全球10,000⁺个好用的AI软件
-
Follow-Your-Click是什么?一文让你看懂Follow-Your-Click的技术原理、主要功能、应用场景Follow-Your-Click概述简介 Follow-Your-Click是一个由来自腾讯公司(混元团队)联合清华大学和香港科技大学的开发人员共...
-
AutoDev是什么?一文让你看懂AutoDev的技术原理、主要功能、应用场景AutoDev概述简介 AutoDev是由微软的开发人员推出的一个AI编程工具,专门设计用于自主规划和执行复杂的软件工程任务,如代码编写、调试、测试...
-
Grok-1是什么?一文让你看懂Grok-1的技术原理、主要功能、应用场景Grok-1概述简介 Grok-1 是由马斯克旗下的人工智能初创公司 xAI 开发的一款大型语言大模型,是一个混合专家(MoE)模型,拥有 3140...
-
Open-Sora是什么?一文让你看懂Open-Sora的技术原理、主要功能、应用场景Open-Sora概述简介 Open-Sora是由Colossal-AI团队开源的视频生成模型,旨在复现OpenAI的Sora视频生成产品。Open...
-
VLOGGER是什么?一文让你看懂VLOGGER的技术原理、主要功能、应用场景VLOGGER概述简介 VLOGGER AI是谷歌的研究团队开发的一个多模态扩散模型,专门用于从单一输入图像和音频样本生成逼真的、连贯的人像动态视频...
-
Stable Video 3D (SV3D)是什么?一文让你看懂Stable Video 3D (SV3D)的技术原理、主要功能、应用场景Stable Video 3D概述简介 Stable Video 3D(简称SV3D)是由Stability AI公司开发的一个多视角合成和3D生成...
-
AnimateDiff-Lightning是什么?一文让你看懂AnimateDiff-Lightning的技术原理、主要功能、应用场景AnimateDiff-Lightning概述简介 AnimateDiff-Lightning是由字节跳动的开发人员最新推出的一个高质量视频生成模型...
-
StreamMultiDiffusion是什么?一文让你看懂StreamMultiDiffusion的技术原理、主要功能、应用场景StreamMultiDiffusion概述简介 StreamMultiDiffusion是一个开源的实时交互式的图像生成框架,结合了扩散模型的高质...
-
Mora是什么?一文让你看懂Mora的技术原理、主要功能、应用场景Mora概述简介 Mora是由来自微软和理海大学的开发人员推出的一个多智能体(AI Agents)框架,专门用于通用视频生成任务,目标是模拟并扩展O...
-
LATTE3D是什么?一文让你看懂LATTE3D的技术原理、主要功能、应用场景LATTE3D概述简介 LATTE3D是由英伟达的多伦多AI实验室的开发人员推出的一个文本生成3D对象的模型,能够从文本提示描述快速生成高质量的3D...
-
BrushNet是什么?一文让你看懂BrushNet的技术原理、主要功能、应用场景BrushNet概述简介 BrushNet是由腾讯PCG部门的ARC实验室与香港大学的开发人员推出的一个基于扩散模型的即插即用的图像照片修复(Inp...
-
SUPIR是什么?一文让你看懂SUPIR的技术原理、主要功能、应用场景SUPIR概述简介 SUPIR(Scaling-UP Image Restoration)是一个突破性的图像修复和画质增强方法,利用了大规模的生成模...
-
StreamingT2V是什么?一文让你看懂StreamingT2V的技术原理、主要功能、应用场景StreamingT2V概述简介 StreamingT2V是由PicsArt AI研究团队推出的一个文本到视频的生成模型,旨在解决现有模型仅能生成1...
-
VoiceCraft是什么?一文让你看懂VoiceCraft的技术原理、主要功能、应用场景VoiceCraft概述简介 VoiceCraft是一个由德克萨斯大学奥斯汀分校研究团队开源的神经编解码器语言大模型,专注于零样本语音编辑和文本到语...
-
Champ是什么?一文让你看懂Champ的技术原理、主要功能、应用场景Champ概述简介 Champ是由阿里巴巴、复旦大学和南京大学的开发人员共同提出的一种基于3D的将人物图片转换为视频动画的模型,该方法结合了3D参数...
-
Jamba是什么?一文让你看懂Jamba的技术原理、主要功能、应用场景Jamba概述简介 Jamba是由AI21 Labs推出的首个基于Mamba架构的生产级别的大语言大模型,目前大部分的大模型(如GPT、Gemini...
-
Voice Engine是什么?一文让你看懂Voice Engine的技术原理、主要功能、应用场景Voice Engine概述简介 Voice Engine是OpenAI最新公布的一项AI语音合成和声音克隆技术,能够利用简短的15秒音频样本和文本...
-
SWE-agent是什么?一文让你看懂SWE-agent的技术原理、主要功能、应用场景SWE-agent概述简介 SWE-agent是一个由普林斯顿大学NLP组开发人员开发的开源AI程序员和软件工程师系统,利用大型语言大模型(如GPT...
-
DreaMoving是什么?一文让你看懂DreaMoving的技术原理、主要功能、应用场景DreaMoving概述简介 DreaMoving是一个基于扩散模型的人类视频生成框架,由阿里集团的研究团队开发。DreaMoving通过视频控制网...
-
AniPortrait是什么?一文让你看懂AniPortrait的技术原理、主要功能、应用场景AniPortrait概述简介 AniPortrait是腾讯开源的照片对口型AI视频生成框架,类似于此前阿里推出的EMO,能够通过音频和一张参考肖像...