功能

首页 > 功能

CSGO AI是什么？一文让你看懂CSGO AI的技术原理、主要功能、应用场景

CSGO概述简介 CSGO（Content-Style Composition in Text-to-Image Generation）是南京理工大...
GameGen-O是什么？一文让你看懂GameGen-O的技术原理、主要功能、应用场景

GameGen-O概述简介 GameGen-O 是腾讯推出的一款基于 Transformer 架构的游戏视频生成模型，专门用于生成开放世界视频游戏。...
mPLUG-DocOwl2是什么？一文让你看懂mPLUG-DocOwl2的技术原理、主要功能、应用场景

mPLUG-DocOwl2概述简介 mPLUG-DocOwl 2是由阿里巴巴通义实验室mPLUG团队推出的用于多页文档理解的多模态大型语言大模型。在...
SleepFM是什么？一文让你看懂SleepFM的技术原理、主要功能、应用场景

SleepFM概述简介 SleepFM 是斯坦福大学开源的多模态睡眠分析模型，基于超过14,000名参与者的100,000小时睡眠数据，通过融合大脑...
QA-MDT是什么？一文让你看懂QA-MDT的技术原理、主要功能、应用场景

QA-MDT概述简介 QA-MDT（Quality-aware Masked Diffusion Transformer）是由中国科学技术大学和科大...
书生·筑梦2.0（Vchitect 2.0）是什么？一文让你看懂书生·筑梦2.0（Vchitect 2.0）的技术原理、主要功能、应用场景

书生·筑梦2.0概述简介书生·筑梦2.0（Vchitect 2.0）是由上海人工智能实验室推出的升级版视频生成开源大模型，旨在生成符合中国文化和东...
AI Youtube Shorts Generator是什么？一文让你看懂AI Youtube Shorts Generator的技术原理、主要功能、应用场景

AI Youtube Shorts Generator概述简介 AI Youtube Shorts Generator 是一款开源的 AI 视频编辑...
PhotoPrism是什么？一文让你看懂PhotoPrism的技术原理、主要功能、应用场景

PhotoPrism概述简介 PhotoPrism 是一个开源的AI照片管理工具，用 Go 语言编写，旨在为用户提供一个去中心化的照片存储和组织解决...
Claude Dev是什么？一文让你看懂Claude Dev的技术原理、主要功能、应用场景

Claude Dev概述简介 Claude Dev是一个集成在Visual Studio Code中的AI编程助手，基于Anthropic公司的Cl...
FaceSwap是什么？一文让你看懂FaceSwap的技术原理、主要功能、应用场景

FaceSwap概述简介 FaceSwap 是一个开源的AI换脸软件，用于创建深度伪造（Deepfakes）视频和图像。基于深度学习技术，在视频或图...
Seed-Music是什么？一文让你看懂Seed-Music的技术原理、主要功能、应用场景

Seed-Music概述简介 Seed-Music是字节跳动推出的AI音乐生成大模型，将用户录制的 10 秒音频转化为完整的音乐作品。通过自回归语言...
ConFiner是什么？一文让你看懂ConFiner的技术原理、主要功能、应用场景

ConFiner概述简介 ConFiner 是一个创新的视频生成框架，由多所大学和研究机构一起推出。结合多个现成的扩散模型专家，无需额外训练可生成高...
M2UGen是什么？一文让你看懂M2UGen的技术原理、主要功能、应用场景

M2UGen概述简介 M2UGen是先进的多模态音乐理解和生成框架，由腾讯PCG ARC实验室与新加坡国立大学联合推出。结合了大型语言大模型（LLM...
Nemotron-Mini-4B-Instruct是什么？一文让你看懂Nemotron-Mini-4B-Instruct的技术原理、主要功能、应用场景

Nemotron-Mini-4B-Instruct概述简介 Nemotron-Mini-4B-Instruct是英伟达推出的一款开源小型语言大模型，...
PoseTalk是什么？一文让你看懂PoseTalk的技术原理、主要功能、应用场景

PoseTalk概述简介 PoseTalk 是基于文本和音频的姿势控制和运动细化方法的开源项目，用于一次性生成会说话的头部视频。从图像、驱动音频和驱...
Follow-Your-Canvas是什么？一文让你看懂Follow-Your-Canvas的技术原理、主要功能、应用场景

Follow-Your-Canvas概述简介 Follow-Your-Canvas 是由腾讯混元团队与清华大学等机构合作推出的一种高分辨率视频扩展技...
Filmfotos是什么？一文让你看懂Filmfotos的技术原理、主要功能、应用场景

Filmfotos概述简介 Filmfotos是由DynamicWang推出的的基于Flux架构的LoRA模型，专注于模拟和还原胶片的质感效果。以低...
Faster Whisper是什么？一文让你看懂Faster Whisper的技术原理、主要功能、应用场景

Faster Whisper概述简介 Faster Whisper 是一个基于OpenAI Whisper模型的高效语音识别工具，运用CTransl...
SwiftBrush V2是什么？一文让你看懂SwiftBrush V2的技术原理、主要功能、应用场景

SwiftBrush V2概述简介 SwiftBrush V2 是文本到图像的单步扩散模型，通过改进训练方法和模型融合技术，实现与多步Stable ...
Jina-embeddings-v3是什么？一文让你看懂Jina-embeddings-v3的技术原理、主要功能、应用场景

Jina-embeddings-v3概述简介 Jina-embeddings-v3 是 Jina AI 推出的一款先进的文本嵌入模型，专为多语言数据...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL