收集全球10,000⁺个好用的AI软件
-
CogVideoX是什么?一文让你看懂CogVideoX的技术原理、主要功能、应用场景CogVideoX概述简介 CogVideoX是智谱AI最新推出的开源AI视频生成模型,与智谱AI的商业产品“清影”同源。CogVideoX支持英文...
-
PhotoMaker V2是什么?一文让你看懂PhotoMaker V2的技术原理、主要功能、应用场景PhotoMaker V2概述简介PhotoMaker V2是腾讯推出的AI图像生成框架,能在极短的时间内生成逼真的人物照片。与初代相比,V2版本在...
-
SEED-Story是什么?一文让你看懂SEED-Story的技术原理、主要功能、应用场景SEED-Story概述简介 SEED-Story是腾讯联合香港科技大学、香港中文大学推出的多模态故事生成模型。基于多模态大语言大模型(MLLM),...
-
FlashFace是什么?一文让你看懂FlashFace的技术原理、主要功能、应用场景FlashFace概述简介 FlashFace是阿里联合香港大学推出的高保真AI写真工具。能基于用户提供的面部图像和文本提示,快速生成个性化的高保真人...
-
EasyAnimate是什么?一文让你看懂EasyAnimate的技术原理、主要功能、应用场景EasyAnimate概述简介EasyAnimate是阿里推出的AI视频生成工具,支持文生视频和图生视频两种方式,用户可以上传图片作为视频的起始和结束...
-
EmoTalk3D是什么?一文让你看懂EmoTalk3D的技术原理、主要功能、应用场景EmoTalk3D概述简介 EmoTalk3D是华为诺亚方舟实验室、南京大学和复旦大学一起推出的3D数字人框架。技术的核心在于能合成具有丰富情感表达...
-
SAM 2是什么?一文让你看懂SAM 2的技术原理、主要功能、应用场景SAM 2概述简介 SAM 2(Segment Anything Model 2)是Meta推出的AI对象分割模型,专注于实时图像和视频对象分割。具...
-
Wordware是什么?一文让你看懂Wordware的技术原理、主要功能、应用场景Wordware概述简介 Wordware 是一个集成开发环境(IDE),可以让任何人通过日常语言构建复杂的 AI Agent 和应用。用户无需编程...
-
Qwen2-Math是什么?一文让你看懂Qwen2-Math的技术原理、主要功能、应用场景Qwen2-Math概述简介 Qwen2-Math是阿里通义千问推出的基于Qwen2语言大模型构建的数学解题专用开源AI大模型,专为解决复杂数学问题...
-
Aide是什么?一文让你看懂Aide的技术原理、主要功能、应用场景Aide概述简介Aide 是免费开源的AI 编程插件,具备代码注释、语言转换、智能粘贴、批量处理、变量命名和自定义命令等功能,帮助开发者快速理解、编写...
-
MaxKB是什么?一文让你看懂MaxKB的技术原理、主要功能、应用场景MaxKB概述简介 MaxKB是飞致云推出的开源AI知识库问答系统,提供开箱即用的功能,支持文档上传、在线文档爬取、文本自动拆分和向量化。用户可以快...
-
ExAvatar是什么?一文让你看懂ExAvatar的技术原理、主要功能、应用场景ExAvatar概述简介 ExAvatar是DGIST和Meta公司Codec Avatars Lab联合推出的3D数字形象生成模型,通过简短视频克...
-
Tailor是什么?一文让你看懂Tailor的技术原理、主要功能、应用场景Tailor概述简介 Tailor是免费开源的AI视频编辑工具,集成了人脸识别、语音识别等智能技术,提供视频编辑、生成和优化三大功能。能实现人脸剪辑...
-
StableDrag是什么?一文让你看懂StableDrag的技术原理、主要功能、应用场景StableDrag概述简介 StableDrag是腾讯联合南京大学推出的AI图像编辑框架。让拖拽图片变得既稳又准,就像给图片装上了精准的GPS。无...
-
La Plateforme是什么?一文让你看懂La Plateforme的技术原理、主要功能、应用场景La Plateforme概述简介 La Plateforme是Mistral AI公司推出AI开发工具,支持用户通过微调来优化AI大模型,更好地适...
-
智谱AI开放平台是什么?一文让你看懂智谱AI开放平台的技术原理、主要功能、应用场景智谱AI开放平台概述简介 智谱AI开放平台 是一个面向开发者的大模型开发平台。整合了先进的模型能力、丰富的开发资源、自定义知识库及应用体验中心,助力...
-
GLM-4-long是什么?一文让你看懂GLM-4-long的技术原理、主要功能、应用场景GLM-4-long概述简介 GLM-4-long 是智谱AI推出的200万字长文本模型,现已在 智谱AI开放平台 BigModel 上开放API调...
-
Deep-Live-Cam是什么?一文让你看懂Deep-Live-Cam的技术原理、主要功能、应用场景Deep-Live-Cam概述简介 Deep-Live-Cam 是开源的AI实时换脸工具,用户仅需一张图片即可在视频中实现实时人脸交换。支持 CPU...
-
Qwen2-Audio是什么?一文让你看懂Qwen2-Audio的技术原理、主要功能、应用场景Qwen2-Audio概述简介 Qwen2-Audio是阿里通义千问团队最新推出的开源AI语音模型,支持直接语音输入和多语言文本输出。具备语音聊天、...
-
Imagen 3是什么?一文让你看懂Imagen 3的技术原理、主要功能、应用场景Imagen 3概述简介 Imagen 3是Google推出的AI图像生成模型,可以生成高质量、逼真的图像。Imagen 3是Google最高质量的...