收集全球10,000⁺个好用的AI软件
-
Qwen2.5-1M是什么?一文让你看懂Qwen2.5-1M的技术原理、主要功能、应用场景Qwen2.5-1M概述简介 Qwen2.5-1M是阿里通义千问团队推出的开源模型,支持100万Tokens的上下文长度。模型包括Qwen2.5-7...
-
DiffuEraser是什么?一文让你看懂DiffuEraser的技术原理、主要功能、应用场景DiffuEraser概述简介 DiffuEraser是基于稳定扩散模型的视频修复模型,以更丰富的细节和更连贯的结构填充视频中的遮罩区域。模型通过结...
-
Janus-Pro是什么?一文让你看懂Janus-Pro的技术原理、主要功能、应用场景Janus-Pro概述简介 Janus-Pro是 DeepSeek 推出的开源AI大模型,支持图像理解和图像生成,提供 1B 和 7B 两种规模,适...
-
Qwen2.5-VL是什么?一文让你看懂Qwen2.5-VL的技术原理、主要功能、应用场景Qwen2.5-VL概述简介 Qwen2.5-VL是阿里通义千问团队开源的旗舰视觉语言大模型,具有3B、7B和72B三种不同规模。模型在视觉理解方面...
-
QVQ-72B-Preview是什么?一文让你看懂QVQ-72B-Preview的技术原理、主要功能、应用场景QVQ-72B-Preview概述简介 QVQ-72B-Preview 是阿里云通义千问团队开源的多模态推理模型,专注于提升视觉推理能力。模型在多个...
-
Qwen2.5-Max是什么?一文让你看懂Qwen2.5-Max的技术原理、主要功能、应用场景Qwen2.5-Max概述简介 Qwen2.5-Max是阿里云推出的超大规模MoE(Mixture of Experts)模型,使用超过20万亿to...
-
MobileVD是什么?一文让你看懂MobileVD的技术原理、主要功能、应用场景MobileVD概述简介 MobileVD(Mobile Video Diffusion)是首个针对移动设备优化的视频扩散模型,Qualcomm A...
-
YuE是什么?一文让你看懂YuE的技术原理、主要功能、应用场景YuE概述简介 YuE 是香港科技大学和 Multimodal Art Projection 团队联合开发的开源 AI 音乐生成模型。能将歌词转化为...
-
VARGPT是什么?一文让你看懂VARGPT的技术原理、主要功能、应用场景VARGPT概述简介 VARGPT是创新的多模态大语言大模型,专注于视觉理解和生成任务。基于自回归框架,将视觉生成与理解统一在一个模型中,避免任务切...
-
CityDreamer4D是什么?一文让你看懂CityDreamer4D的技术原理、主要功能、应用场景CityDreamer4D概述简介 CityDreamer4D是南洋理工大学 S-Lab 团队开发的用于生成无边界 4D 城市的组合生成模型。将动态...
-
SpeechGPT 2.0-preview是什么?一文让你看懂SpeechGPT 2.0-preview的技术原理、主要功能、应用场景SpeechGPT 2.0-preview概述简介 SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队推出的拟人化实时交...
-
LalaEval是什么?一文让你看懂LalaEval的技术原理、主要功能、应用场景LalaEval概述简介 LalaEval是香港中文大学和货拉拉数据科学团队一起推出的面向特定领域大语言大模型(LLMs)的人类评估框架,框架通过一...
-
Aligner是什么?一文让你看懂Aligner的技术原理、主要功能、应用场景Aligner概述简介 Aligner是北京大学团队提出的大语言大模型对齐技术,通过学习对齐答案与未对齐答案之间的修正残差来提升模型性能。采用自回归...
-
OpenAI o3-mini是什么?一文让你看懂OpenAI o3-mini的技术原理、主要功能、应用场景OpenAI o3-mini概述简介 OpenAI o3-mini是OpenAI正式发布的全新推理模型。是OpenAI推理系列中最新、成本效益最高的...
-
EICopilot是什么?一文让你看懂EICopilot的技术原理、主要功能、应用场景EICopilot概述简介 EICopilot是百度研究院推出的基于AI智能体的企业信息搜索与探索工具。通过大型语言大模型(LLM)驱动的智能体,帮...
-
Mistral Small 3是什么?一文让你看懂Mistral Small 3的技术原理、主要功能、应用场景Mistral Small 3概述简介 Mistral Small 3 是 Mistral AI 发布的开源大型语言大模型,有240亿参数,基于 A...
-
CoA是什么?一文让你看懂CoA的技术原理、主要功能、应用场景CoA概述简介 CoA(Chain-of-Agents)是谷歌推出的多智能体协作框架,用于解决大语言大模型(LLM)在处理长文本任务时面临的上下文限...
-
Oumi是什么?一文让你看懂Oumi的技术原理、主要功能、应用场景Oumi概述简介 Oumi 是完全开源的 AI 平台,简化从数据准备、模型训练到评估和部署的整个生命周期。支持从 1000 万到 4050 亿参数的...
-
IC-Portrait是什么?一文让你看懂IC-Portrait的技术原理、主要功能、应用场景IC-Portrait概述简介 IC-Portrait是新型的个性化肖像生成框架,解决用户资料图像多样性(如外观和光照条件差异)带来的挑战。通过将肖...
-
SyncAnimation是什么?一文让你看懂SyncAnimation的技术原理、主要功能、应用场景SyncAnimation概述简介 SyncAnimation是实时端到端的音频驱动框架,用于生成人体姿态和说话头像动画。通过音频信号实时生成与音频...