收集全球10,000⁺个好用的AI软件
-
百聆是什么?一文让你看懂百聆的技术原理、主要功能、应用场景百聆概述简介 百聆(Bailing)是开源的语音对话助手,基于语音识别(ASR)、语音活动检测(VAD)、大语言大模型(LLM)和语音合成(TTS)...
-
LineArt是什么?一文让你看懂LineArt的技术原理、主要功能、应用场景LineArt概述简介 LineArt是吉林大学、瑞典皇家理工学院、东京工业大学等机构推出的,无需训练的高质量设计绘图外观迁移框架,能将复杂外观特征...
-
SynthLight是什么?一文让你看懂SynthLight的技术原理、主要功能、应用场景SynthLight概述简介 SynthLight 是耶鲁大学和 Adobe Research 联合推出的基于扩散模型的人像重照明技术,通过模拟不同...
-
X-Dyna是什么?一文让你看懂X-Dyna的技术原理、主要功能、应用场景X-Dyna概述简介 X-Dyna 是基于扩散模型的动画生成框架,基于驱动视频中的面部表情和身体动作,将单张人类图像动画化,生成具有真实感和环境感知...
-
DeepSeek-R1是什么?一文让你看懂DeepSeek-R1的技术原理、主要功能、应用场景DeepSeek-R1概述简介 DeepSeek-R1是杭州深度求索公司 DeepSeek 推出的高性能AI推理模型,对标OpenAI的o1正式版。...
-
k1.5是什么?一文让你看懂k1.5的技术原理、主要功能、应用场景k1.5概述简介 k1.5 是月之暗面Kimi推出的最新多模态思考模型,具备强大的推理和多模态处理能力。模型在 short-CoT(短链思维)模式下...
-
OmniThink是什么?一文让你看懂OmniThink的技术原理、主要功能、应用场景OmniThink概述简介 OmniThink是浙江大学和阿里巴巴通义实验室联合开发的创新的机器写作框架,通过模拟人类的迭代扩展和反思过程,突破大型...
-
H-Optimus-0是什么?一文让你看懂H-Optimus-0的技术原理、主要功能、应用场景H-Optimus-0概述简介 H-Optimus-0是法国初创公司Bioptimus发布的世界上最大的开源病理学AI基础模型。模型拥有11亿参数,...
-
Roop-Unleashed是什么?一文让你看懂Roop-Unleashed的技术原理、主要功能、应用场景Roop-Unleashed概述简介 Roop-Unleashed 是基于 Roop 的开源项目,专注于深度伪造(Deepfake)技术的实现与优化...
-
书生·浦像是什么?一文让你看懂书生·浦像的技术原理、主要功能、应用场景书生·浦像概述简介 书生·浦像是上海人工智能实验室联合香港中文大学、浙江大学等机构研发的超高动态成像算法,核心为浦像HDR(UltraFusion ...
-
DeepSeek R1-Zero是什么?一文让你看懂DeepSeek R1-Zero的技术原理、主要功能、应用场景DeepSeek R1-Zero概述简介 DeepSeek R1-Zero 是 DeepSeek 团队开发的完全依赖纯强化学习(RL)训练的推理模型...
-
VideoWorld是什么?一文让你看懂VideoWorld的技术原理、主要功能、应用场景VideoWorld概述简介 VideoWorld是北京交通大学、中国科学技术大学和字节跳动合作开展的一项研究项目,探索深度生成模型是否能仅通过未标...
-
Step-1o Vision是什么?一文让你看懂Step-1o Vision的技术原理、主要功能、应用场景Step-1o Vision概述简介 Step-1o Vision 是阶跃星辰最新研发的原生端到端多模态生成与理解一体化模型中的视觉版本。专注于视觉...
-
3DIS-FLUX是什么?一文让你看懂3DIS-FLUX的技术原理、主要功能、应用场景3DIS-FLUX概述简介 3DIS-FLUX是基于深度学习的多实例生成框架,通过解耦实例合成实现高质量的图像生成。结合3DIS框架的深度驱动场景构...
-
DITTO-2是什么?一文让你看懂DITTO-2的技术原理、主要功能、应用场景DITTO-2概述简介 DITTO-2 是 Adobe 和加州大学开发人员联合推出的新型音乐生成模型,通过优化扩散模型的推理时间,实现快速且可控的音...
-
DiffEditor是什么?一文让你看懂DiffEditor的技术原理、主要功能、应用场景DiffEditor概述简介 DiffEditor是北京大学深圳研究生院与腾讯PCG的研究团队提出的基于扩散模型(Diffusion Model)的...
-
Textoon是什么?一文让你看懂Textoon的技术原理、主要功能、应用场景Textoon概述简介 Textoon是阿里集团通义实验室推出的创新项目,首个能根据文本提示生成Live2D格式2D卡通角色的方法。基于先进的语言和...
-
子曰-o1是什么?一文让你看懂子曰-o1的技术原理、主要功能、应用场景子曰-o1概述简介 子曰-o1是网易有道发布的国内首个输出分步式讲解的推理模型。模型采用14B轻量级架构,专为消费级显卡设计,能在低显存设备上稳定运...
-
豆包大模型1.5是什么?一文让你看懂豆包大模型1.5的技术原理、主要功能、应用场景豆包大模型1.5概述简介 豆包大模型1.5 是字节跳动推出的最新版本大模型。采用大规模稀疏MoE架构,等效于7倍激活参数的Dense模型性能,综合得...
-
OmniManip是什么?一文让你看懂OmniManip的技术原理、主要功能、应用场景OmniManip概述简介 OmniManip 是北京大学与智元机器人联合实验室开发的通用机器人操作框架,通过结合视觉语言大模型(VLM)的高层次推...