收集全球10,000⁺个好用的AI软件
-
JoyGen是什么?一文让你看懂JoyGen的技术原理、主要功能、应用场景JoyGen概述简介 JoyGen是京东科技和香港大学推出的,音频驱动的3D说话人脸视频生成框架,专注于实现精确的唇部与音频同步及高质量的视觉效果。...
-
EMAGE是什么?一文让你看懂EMAGE的技术原理、主要功能、应用场景EMAGE概述简介 EMAGE(Expressive Masked Audio-conditioned GEsture modeling)是清华大学...
-
LIMO是什么?一文让你看懂LIMO的技术原理、主要功能、应用场景LIMO概述简介 LIMO(Less Is More for Reasoning)是上海交通大学研究团队提出的高效推理方法,通过极少量高质量的训练样...
-
SANA 1.5是什么?一文让你看懂SANA 1.5的技术原理、主要功能、应用场景SANA 1.5概述简介 SANA 1.5是英伟达联合MIT、清华、北大等机构推出的新型高效的线性扩散变换器(Linear Diffusion Tr...
-
ASAP是什么?一文让你看懂ASAP的技术原理、主要功能、应用场景ASAP概述简介 ASAP(Aligning Simulation and Real Physics)是卡内基梅隆大学和英伟达联合推出的,用在解决仿...
-
MAETok是什么?一文让你看懂MAETok的技术原理、主要功能、应用场景MAETok概述简介 MAETok(Masked Autoencoders Tokenizer)是卡内基梅隆大学、香港大学、北京大学等机构推出的扩散...
-
Eino是什么?一文让你看懂Eino的技术原理、主要功能、应用场景Eino概述简介 Eino 是字节跳动开源的大模型应用开发框架,能帮助开发者高效构建基于大模型的 AI 应用。Eino以 Go 语言为基础,具备稳定...
-
AstrBot是什么?一文让你看懂AstrBot的技术原理、主要功能、应用场景AstrBot概述简介 AstrBot是多平台聊天机器人及开发框架,支持多种大语言大模型(如 OpenAI GPT、Google Gemini、Ll...
-
Lumina-Image 2.0是什么?一文让你看懂Lumina-Image 2.0的技术原理、主要功能、应用场景Lumina-Image 2.0概述简介 Lumina-Image 2.0 是开源的高效统一图像生成模型,参数量为26亿,基于扩散模型和Transf...
-
BEN2是什么?一文让你看懂BEN2的技术原理、主要功能、应用场景BEN2概述简介 BEN2(Background Erase Network 2)是Prama LLC开发的深度学习模型,专门用于从图像和视频中快速...
-
PartEdit是什么?一文让你看懂PartEdit的技术原理、主要功能、应用场景PartEdit概述简介 PartEdit是KAUST推出基于预训练扩散模型的细粒度图像编辑方法。PartEdit基于优化特定的文本标记(称为“部分...
-
Agentic Object Detection是什么?一文让你看懂Agentic Object Detection的技术原理、主要功能、应用场景Agentic Object Detection概述简介 Agentic Object Detection 是吴恩达团队开发的新型目标检测技术,通过...
-
Agno是什么?一文让你看懂Agno的技术原理、主要功能、应用场景Agno概述简介 Agno是构建智能代理(Agents)的轻量级框架。Agno 支持多模态(文本、图像、音频、视频)和多代理协作,能快速创建代理,速...
-
Ola是什么?一文让你看懂Ola的技术原理、主要功能、应用场景Ola概述简介 Ola是清华大学、腾讯 Hunyuan 研究团队和新加坡国立大学 S-Lab 合作开发的全模态语言大模型。通过渐进式模态对齐策略,逐...
-
AlphaGeometry2是什么?一文让你看懂AlphaGeometry2的技术原理、主要功能、应用场景AlphaGeometry2概述简介 AlphaGeometry2 是谷歌 DeepMind 推出的先进的人工智能系统,专门用于解决国际数学奥林匹克...
-
EliGen是什么?一文让你看懂EliGen的技术原理、主要功能、应用场景EliGen概述简介 EliGen是浙江大学和阿里集团联合开发的新型的实体级可控图像生成框架,通过引入区域注意力机制,无需额外参数即可将实体提示和任...
-
Hibiki是什么?一文让你看懂Hibiki的技术原理、主要功能、应用场景Hibiki概述简介 Hibiki是Kyutai Labs开源的用在同时语音翻译的解码器模型,能实时将一种语言的语音翻译成另一种语言的语音或文本。H...
-
HMA是什么?一文让你看懂HMA的技术原理、主要功能、应用场景HMA概述简介 HMA(Heterogeneous Masked Autoregression)是麻省理工学院、Meta和伊利诺伊大学香槟分校开源的...
-
DeepRant 鲸喷是什么?一文让你看懂DeepRant 鲸喷的技术原理、主要功能、应用场景DeepRant 鲸喷概述简介 DeepRant 鲸喷是专为游戏玩家设计的多语言快捷翻译工具。DeepRant能帮助玩家在国际服务器中快速进行文字交...
-
StochSync是什么?一文让你看懂StochSync的技术原理、主要功能、应用场景StochSync概述简介 StochSync(Stochastic Diffusion Synchronization)是创新的图像生成技术,专门...