收集全球10,000⁺个好用的AI软件
-
Agent Q是什么?一文让你看懂Agent Q的技术原理、主要功能、应用场景Agent Q 概述简介 Agent Q是MultiOn公司联合斯坦福大学推出的自监督代理推理和搜索框架。Agent Q融合了引导式蒙特卡洛树搜索(M...
-
UniPortrait是什么?一文让你看懂UniPortrait的技术原理、主要功能、应用场景UniPortrait概述简介 UniPortrait是阿里巴巴推出的AI图像个性化编辑工具,能将照片转换为动漫风格,支持多人合照和换脸技术。Uni...
-
LabelU是什么?一文让你看懂LabelU的技术原理、主要功能、应用场景LabelU概述简介LabelU 是一款开源的多模态数据标注工具,支持图像、视频和音频的标注,具备拉框、多边形、标点、标线、分类、描述等图像标注能力...
-
Buzz是什么?一文让你看懂Buzz的技术原理、主要功能、应用场景Buzz概述简介 Buzz是一款基于OpenAI Whisper模型构建的离线语音转文字工具,适用于Windows、macOS和Linux系统。Bu...
-
HoloDreamer是什么?一文让你看懂HoloDreamer的技术原理、主要功能、应用场景HoloDreamer概述简介 HoloDreamer是北京大学联合鹏城实验室推出的AI文本驱动3D场景生成框架。通过两个核心模块:风格化全景图生成...
-
HumanVid是什么?一文让你看懂HumanVid的技术原理、主要功能、应用场景HumanVid概述简介 HumanVid是香港中文大学和上海人工智能实验室一起推出的高质量数据集,专为人类图像动画训练设计。结合了现实世界视频和合...
-
ORMBG是什么?一文让你看懂ORMBG的技术原理、主要功能、应用场景ORMBG概述简介ORMBG是开源的AI图像分割工具,由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景,用先...
-
Cradle是什么?一文让你看懂Cradle的技术原理、主要功能、应用场景Cradle概述简介Cradle是面向通用计算机控制(General Computer Control, GCC)的多模态AI Agent框架,由昆仑...
-
Linly-Dubbing是什么?一文让你看懂Linly-Dubbing的技术原理、主要功能、应用场景Linly-Dubbing概述简介 Linly-Dubbing是一个开源AI视频翻译和配音工具,支持配音、翻译、对口型,能自动将视频内容翻译成多种语...
-
VITA是什么?一文让你看懂VITA的技术原理、主要功能、应用场景VITA概述简介 VITA是腾讯优图实验室推出的全球首个开源多模态大语言大模型(MLLM),能理解和处理视频、图像、文本和音频。基于Mixtral ...
-
AI Scientist是什么?一文让你看懂AI Scientist的技术原理、主要功能、应用场景AI Scientist概述简介 AI Scientist是Sakana AI推出的首个全自动科学发现AI系统。能独立完成从创意生成、编码、实验执行...
-
ControlNeXt是什么?一文让你看懂ControlNeXt的技术原理、主要功能、应用场景ControlNeXt概述简介 ControlNeXt是一种新型的AI图像和视频可控生成框架,由香港中文大学和商汤科技联合开发。采用轻量化控制模块和...
-
FancyVideo是什么?一文让你看懂FancyVideo的技术原理、主要功能、应用场景FancyVideo概述简介 FancyVideo是360联合中山大学推出的AI文生视频模型。基于创新的跨帧文本引导模块(Cross-frame T...
-
MovieDreamer是什么?一文让你看懂MovieDreamer的技术原理、主要功能、应用场景MovieDreamer概述简介 MovieDreamer是浙江大学联合阿里巴巴专为长视频研发的AI视频生成框架。结合自回归模型和扩散渲染技术,能生...
-
Glyph-ByT5是什么?一文让你看懂Glyph-ByT5的技术原理、主要功能、应用场景Glyph-ByT5概述简介Glyph-ByT5-v2由微软亚洲研究院、清华大学、北京大学和利物浦大学联合开发的多语言视觉文本渲染项目。Glyph-B...
-
Llama-3.1-Minitron是什么?一文让你看懂Llama-3.1-Minitron的技术原理、主要功能、应用场景Llama-3.1-Minitron概述简介 Llama-3.1-Minitron是由英伟达和Meta合作开发的AI大模型,通过剪枝和知识蒸馏技术从...
-
CrewAI是什么?一文让你看懂CrewAI的技术原理、主要功能、应用场景CrewAI概述简介CrewAI是专注于构建多个 AI Agents 高效协作的开源平台,通过简化 AI Agents 框架的使用,企业能快速构建和部...
-
HybridRAG是什么?一文让你看懂HybridRAG的技术原理、主要功能、应用场景HybridRAG概述简介 HybridRAG 是黑石联合英伟达推出的混合检索增强生成架构,结合了检索增强生成(Retrieval-Augmente...
-
DeepSeek-Prover-V1.5是什么?一文让你看懂DeepSeek-Prover-V1.5的技术原理、主要功能、应用场景DeepSeek-Prover-V1.5概述简介 DeepSeek-Prover-V1.5是由DeepSeek团队开发的开源数学大模型,拥有70亿参...
-
SadTalker是什么?一文让你看懂SadTalker的技术原理、主要功能、应用场景SadTalker概述简介 SadTalker是西安交通大学、腾讯AI实验室和蚂蚁集团联合推出的开源AI数字人项目。SadTalker专注于通过单张...