收集全球10,000⁺个好用的AI软件
-
CSGO AI是什么?一文让你看懂CSGO AI的技术原理、主要功能、应用场景CSGO概述简介 CSGO(Content-Style Composition in Text-to-Image Generation)是南京理工大...
-
GameGen-O是什么?一文让你看懂GameGen-O的技术原理、主要功能、应用场景GameGen-O概述简介 GameGen-O 是腾讯推出的一款基于 Transformer 架构的游戏视频生成模型,专门用于生成开放世界视频游戏。...
-
mPLUG-DocOwl2是什么?一文让你看懂mPLUG-DocOwl2的技术原理、主要功能、应用场景mPLUG-DocOwl2概述简介 mPLUG-DocOwl 2是由阿里巴巴通义实验室mPLUG团队推出的用于多页文档理解的多模态大型语言大模型。在...
-
SleepFM是什么?一文让你看懂SleepFM的技术原理、主要功能、应用场景SleepFM概述简介 SleepFM 是斯坦福大学开源的多模态睡眠分析模型,基于超过14,000名参与者的100,000小时睡眠数据,通过融合大脑...
-
QA-MDT是什么?一文让你看懂QA-MDT的技术原理、主要功能、应用场景QA-MDT概述简介 QA-MDT(Quality-aware Masked Diffusion Transformer)是由中国科学技术大学和科大...
-
书生·筑梦2.0(Vchitect 2.0)是什么?一文让你看懂书生·筑梦2.0(Vchitect 2.0)的技术原理、主要功能、应用场景书生·筑梦2.0概述简介 书生·筑梦2.0(Vchitect 2.0)是由上海人工智能实验室推出的升级版视频生成开源大模型,旨在生成符合中国文化和东...
-
AI Youtube Shorts Generator是什么?一文让你看懂AI Youtube Shorts Generator的技术原理、主要功能、应用场景AI Youtube Shorts Generator概述简介 AI Youtube Shorts Generator 是一款开源的 AI 视频编辑...
-
PhotoPrism是什么?一文让你看懂PhotoPrism的技术原理、主要功能、应用场景PhotoPrism概述简介 PhotoPrism 是一个开源的AI照片管理工具,用 Go 语言编写,旨在为用户提供一个去中心化的照片存储和组织解决...
-
Claude Dev是什么?一文让你看懂Claude Dev的技术原理、主要功能、应用场景Claude Dev概述简介 Claude Dev是一个集成在Visual Studio Code中的AI编程助手,基于Anthropic公司的Cl...
-
FaceSwap是什么?一文让你看懂FaceSwap的技术原理、主要功能、应用场景FaceSwap概述简介 FaceSwap 是一个开源的AI换脸软件,用于创建深度伪造(Deepfakes)视频和图像。基于深度学习技术,在视频或图...
-
Seed-Music是什么?一文让你看懂Seed-Music的技术原理、主要功能、应用场景Seed-Music概述简介 Seed-Music是字节跳动推出的AI音乐生成大模型,将用户录制的 10 秒音频转化为完整的音乐作品。通过自回归语言...
-
ConFiner是什么?一文让你看懂ConFiner的技术原理、主要功能、应用场景ConFiner概述简介 ConFiner 是一个创新的视频生成框架,由多所大学和研究机构一起推出。结合多个现成的扩散模型专家,无需额外训练可生成高...
-
M2UGen是什么?一文让你看懂M2UGen的技术原理、主要功能、应用场景M2UGen概述简介 M2UGen是先进的多模态音乐理解和生成框架,由腾讯PCG ARC实验室与新加坡国立大学联合推出。结合了大型语言大模型(LLM...
-
Nemotron-Mini-4B-Instruct是什么?一文让你看懂Nemotron-Mini-4B-Instruct的技术原理、主要功能、应用场景Nemotron-Mini-4B-Instruct概述简介 Nemotron-Mini-4B-Instruct是英伟达推出的一款开源小型语言大模型,...
-
PoseTalk是什么?一文让你看懂PoseTalk的技术原理、主要功能、应用场景PoseTalk概述简介 PoseTalk 是基于文本和音频的姿势控制和运动细化方法的开源项目,用于一次性生成会说话的头部视频。从图像、驱动音频和驱...
-
Follow-Your-Canvas是什么?一文让你看懂Follow-Your-Canvas的技术原理、主要功能、应用场景Follow-Your-Canvas概述简介 Follow-Your-Canvas 是由腾讯混元团队与清华大学等机构合作推出的一种高分辨率视频扩展技...
-
Filmfotos是什么?一文让你看懂Filmfotos的技术原理、主要功能、应用场景Filmfotos概述简介 Filmfotos是由DynamicWang推出的的基于Flux架构的LoRA模型,专注于模拟和还原胶片的质感效果。以低...
-
Faster Whisper是什么?一文让你看懂Faster Whisper的技术原理、主要功能、应用场景Faster Whisper概述简介 Faster Whisper 是一个基于OpenAI Whisper模型的高效语音识别工具,运用CTransl...
-
SwiftBrush V2是什么?一文让你看懂SwiftBrush V2的技术原理、主要功能、应用场景SwiftBrush V2概述简介 SwiftBrush V2 是文本到图像的单步扩散模型,通过改进训练方法和模型融合技术,实现与多步Stable ...
-
Jina-embeddings-v3是什么?一文让你看懂Jina-embeddings-v3的技术原理、主要功能、应用场景Jina-embeddings-v3概述简介 Jina-embeddings-v3 是 Jina AI 推出的一款先进的文本嵌入模型,专为多语言数据...