收集全球10,000⁺个好用的AI软件
-
InstantStyle是什么?一文让你看懂InstantStyle的技术原理、主要功能、应用场景InstantStyle概述简介 InstantStyle是小红书的InstantX团队(该团队也是InstantID框架背后的开发团队)开源的保留...
-
DesignEdit是什么?一文让你看懂DesignEdit的技术原理、主要功能、应用场景DesignEdit概述简介 DesignEdit是由来自微软亚洲研究院和北京大学的开发人员共同开发的一个AI图像编辑框架,引入了设计领域的图层概念...
-
CodeGemma是什么?一文让你看懂CodeGemma的技术原理、主要功能、应用场景CodeGemma概述简介 CodeGemma是由Google发布的专注于代码生成和理解的大型语言大模型,该系列包含三种不同规模的模型,分别是2B预...
-
Parler-TTS是什么?一文让你看懂Parler-TTS的技术原理、主要功能、应用场景Parler-TTS概述简介 Parler-TTS是由Hugging Face推出的一款开源的文本到语音(TTS)模型,能够通过输入提示描述模仿特定...
-
VASA-1是什么?一文让你看懂VASA-1的技术原理、主要功能、应用场景VASA-1概述简介 VASA-1是由微软亚洲研究院提出的一个将静态照片转换为对口型动态视频的生成框架,能够根据单张静态人脸照片和一段语音音频,实时...
-
Llama 3是什么?一文让你看懂Llama 3的技术原理、主要功能、应用场景Llama 3概述简介 Llama 3是Meta公司最新开源推出的新一代大型语言大模型(LLM),包含8B和70B两种参数规模的模型,标志着开源人工...
-
FunClip是什么?一文让你看懂FunClip的技术原理、主要功能、应用场景FunClip概述简介 FunClip是阿里达摩院通义实验室推出的一款完全开源、本地部署的自动化视频剪辑工具,通过调用阿里巴巴通义实验室的FunAS...
-
Phi-3是什么?一文让你看懂Phi-3的技术原理、主要功能、应用场景Phi-3概述简介 Phi-3是微软研究院推出的新一代系列先进的小语言大模型,包括phi-3-mini、phi-3-small和phi-3-medi...
-
Hyper-SD是什么?一文让你看懂Hyper-SD的技术原理、主要功能、应用场景Hyper-SD概述简介 Hyper-SD是由字节跳动的开发人员推出的一个高效的图像合成框架,旨在解决现有扩散模型在多步推理过程中计算成本高昂的问题...
-
Arctic是什么?一文让你看懂Arctic的技术原理、主要功能、应用场景Arctic概述简介 Arctic是由云计算巨头Snowflake的AI研究团队开发的一款高效、开源的企业级大型语言大模型,该大模型是一个拥有480...
-
OpenELM是什么?一文让你看懂OpenELM的技术原理、主要功能、应用场景OpenELM概述简介 OpenELM是Apple苹果公司最新推出的系列高效开源的语言大模型,包括OpenELM-270M、OpenELM-450M...
-
ID-Animator是什么?一文让你看懂ID-Animator的技术原理、主要功能、应用场景ID-Animator概述简介 ID-Animator是由来自腾讯光子工作室、中科大和中科院合肥物质科学研究院的开发人员推出的一种零样本(zero-...
-
IDM-VTON是什么?一文让你看懂IDM-VTON的技术原理、主要功能、应用场景IDM-VTON概述简介 IDM-VTON(Improved Diffusion Models for Virtual Try-ON)是由韩国科学技...
-
VideoGigaGAN是什么?一文让你看懂VideoGigaGAN的技术原理、主要功能、应用场景VideoGigaGAN概述简介 VideoGigaGAN是由Adobe和马里兰大学的开发人员提出的一种新型的生成式视频超分辨率(VSR)模型,最高...
-
PuLID是什么?一文让你看懂PuLID的技术原理、主要功能、应用场景PuLID概述简介 PuLID是由字节跳动的团队开源的一种个性化文本到图像生成技术,通过对比对齐和快速采样方法,实现了无需调整模型的高效ID定制,轻...
-
IC-Light是什么?一文让你看懂IC-Light的技术原理、主要功能、应用场景IC-Light概述简介 IC-Light是一款由ControlNet作者张吕敏开发的AI图像打光处理工具,可以对图片进行光源操纵和光影重构,实现与...
-
AniTalker是什么?一文让你看懂AniTalker的技术原理、主要功能、应用场景AniTalker概述简介 AniTalker是由来自上海交大X-LANCE实验室和思必驰AISpeech的开发人员推出的AI对口型说话视频生成框架...
-
混元DiT是什么?一文让你看懂混元DiT的技术原理、主要功能、应用场景混元DiT概述简介 混元DiT(Hunyuan-DiT)是由腾讯混元团队开源的一款高性能的文本到图像的扩散Transformer模型,具备细粒度的中...
-
Veo是什么?一文让你看懂Veo的技术原理、主要功能、应用场景Veo概述简介 Veo是由Google DeepMind开发的一款视频生成模型,用户可以通过文本、图像或视频提示来指导其生成所需的视频内容,能够生成...
-
CogVLM2是什么?一文让你看懂CogVLM2的技术原理、主要功能、应用场景CogVLM2概述简介 CogVLM2是由智谱AI推出的新一代多模态大模型,在视觉和语言理解方面实现了显著的性能提升,支持高达8K的文本长度和134...