收集全球10,000⁺个好用的AI软件
-
VASA-1是什么?一文让你看懂VASA-1的技术原理、主要功能、应用场景VASA-1概述简介 VASA-1是由微软亚洲研究院提出的一个将静态照片转换为对口型动态视频的生成框架,能够根据单张静态人脸照片和一段语音音频,实时...
-
Universal-1是什么?一文让你看懂Universal-1的技术原理、主要功能、应用场景Universal-1概述简介 Universal-1是AI语音初创公司AssemblyAI推出的一款多语言语音识别和转录模型,经过超过1250万小...
-
Llama3.1是什么?一文让你看懂Llama3.1的技术原理、主要功能、应用场景Llama3.1概述简介 Llama 3.1是Meta最新发布的开源AI大模型,包括8B、70B和405B三个版本,其中405B版本以其4050亿参...
-
FLUX.1是什么?一文让你看懂FLUX.1的技术原理、主要功能、应用场景FLUX.1概述简介 FLUX.1是由Stable Diffusion创始团队推出的开源AI图像生成模型,拥有12B参数,是迄今为止最大的文生图模型...
-
Llama-3.1-Minitron是什么?一文让你看懂Llama-3.1-Minitron的技术原理、主要功能、应用场景Llama-3.1-Minitron概述简介 Llama-3.1-Minitron是由英伟达和Meta合作开发的AI大模型,通过剪枝和知识蒸馏技术从...
-
DeepSeek-Prover-V1.5是什么?一文让你看懂DeepSeek-Prover-V1.5的技术原理、主要功能、应用场景DeepSeek-Prover-V1.5概述简介 DeepSeek-Prover-V1.5是由DeepSeek团队开发的开源数学大模型,拥有70亿参...
-
Step-1X是什么?一文让你看懂Step-1X的技术原理、主要功能、应用场景Step-1X概述简介 Step-1X 是阶跃星辰推出的AI图像生成大模型,采用自研的 DiT 架构,擅长深度语义理解和细节生成。Step-1X支持...
-
Pixtral 12B是什么?一文让你看懂Pixtral 12B的技术原理、主要功能、应用场景Pixtral 12B概述简介 Pixtral 12B 是法国AI初创公司Mistral推出的第一款多模态AI大模型,能同时处理图像和文本。模型拥有...
-
abab-video-1是什么?一文让你看懂abab-video-1的技术原理、主要功能、应用场景abab-video-1概述简介 abab-video-1是MiniMax公司推出的第一款AI高清视频生成模型,模型支持生成最高1280×720分辨...
-
abab-music-1是什么?一文让你看懂abab-music-1的技术原理、主要功能、应用场景abab-music-1概述简介 abab-music-1 是 MiniMax 推出的一款端到端 AI 音乐生成大模型。支持多功能端到端音乐生成,能...
-
Ovis1.6是什么?一文让你看懂Ovis1.6的技术原理、主要功能、应用场景Ovis1.6概述简介 Ovis1.6是阿里国际AI团队推出的多模态大模型,在多模态权威综合评测基准OpenCompass上取得了优异的成绩,特别是...
-
AMD-135M是什么?一文让你看懂AMD-135M的技术原理、主要功能、应用场景AMD-135M概述简介 AMD-135M是AMD推出的第一款小型语言大模型(SLM),为特定用例提供性能与资源消耗之间的平衡。基于LLaMA2模型...
-
TeleChat2-115B是什么?一文让你看懂TeleChat2-115B的技术原理、主要功能、应用场景TeleChat2-115B概述简介 TeleChat2-115B是由中国电信人工智能研究院(TeleAI)研发的大型语言大模型,属于星辰语义大模型...
-
FLUX1.1是什么?一文让你看懂FLUX1.1的技术原理、主要功能、应用场景FLUX1.1概述简介 FLUX1.1 Pro是Black Forest Labs团队最新推出的升级版AI图像生成模型,代号“蓝莓”,提供比前代快6...
-
MM1.5是什么?一文让你看懂MM1.5的技术原理、主要功能、应用场景MM1.5概述简介 MM1.5是苹果公司推出的多模态大型语言大模型,旨在增强文本丰富图像理解、视觉指代和定位以及多图像推理能力。模型基于数据为中心的...
-
FLUX.1-Turbo-Alpha是什么?一文让你看懂FLUX.1-Turbo-Alpha的技术原理、主要功能、应用场景FLUX.1-Turbo-Alpha概述简介 FLUX.1-Turbo-Alpha是阿里妈妈创意团队基于FLUX.1-dev模型训练的8步蒸馏Lor...
-
mPLUG-DocOwl 1.5是什么?一文让你看懂mPLUG-DocOwl 1.5的技术原理、主要功能、应用场景mPLUG-DocOwl 1.5概述简介 mPLUG-DocOwl 1.5是由阿里集团推出的多模态大型语言大模型,专注于OCR-free(无需光学字...
-
Mochi 1是什么?一文让你看懂Mochi 1的技术原理、主要功能、应用场景Mochi 1概述简介 Mochi 1是Genmo公司推出的开源AI视频生成模型,在动作质量和遵循用户提示方面表现出色。Mochi 1基于Apach...
-
Flux.1 Lite是什么?一文让你看懂Flux.1 Lite的技术原理、主要功能、应用场景Flux.1 Lite概述简介 Flux.1 Lite是Freepik团队推出的轻量级AI大模型,目前处于alpha版本。Flux.1 Lite是基...
-
OSAID 1.0是什么?一文让你看懂OSAID 1.0的技术原理、主要功能、应用场景OSAID 1.0概述简介 OSAID 1.0(The Open Source AI Definition – 1.0)是Open Source I...