收集全球10,000⁺个好用的AI软件
-
ConsisID是什么?一文让你看懂ConsisID的技术原理、主要功能、应用场景ConsisID概述简介 ConsisID是北京大学和鹏城实验室等机构推出的文本到视频(Text-to-Video, IPT2V)生成模型,基于频率...
-
GenCast是什么?一文让你看懂GenCast的技术原理、主要功能、应用场景GenCast概述简介 GenCast是DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。GenCast...
-
ClearerVoice-Studio是什么?一文让你看懂ClearerVoice-Studio的技术原理、主要功能、应用场景ClearerVoice-Studio概述简介 ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架,集成语音增强、...
-
O1-CODER是什么?一文让你看懂O1-CODER的技术原理、主要功能、应用场景O1-CODER概述简介 O1-CODER是北京交通大学研究团队推出的开源项目,旨在复制OpenAI的O1模型,专注于编码任务。O1-CODER结合...
-
GenMAC是什么?一文让你看懂GenMAC的技术原理、主要功能、应用场景GenMAC概述简介 GenMAC是香港大学、清华大学和微软研究院推出的多代理协作的迭代框架,用在解决文本到视频生成中的复杂场景生成问题。基于将任务...
-
CausVid是什么?一文让你看懂CausVid的技术原理、主要功能、应用场景CausVid概述简介 CausVid是Adobe和MIT一起推出的自回归实时视频生成技术,能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出...
-
ClotheDreamer是什么?一文让你看懂ClotheDreamer的技术原理、主要功能、应用场景ClotheDreamer概述简介 ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室一起推出的3D服装生成技术,能根据文...
-
ChatTTSPlus是什么?一文让你看懂ChatTTSPlus的技术原理、主要功能、应用场景ChatTTSPlus概述简介 ChatTTSPlus是ChatTTS的扩展版本,增加了TensorRT加速、语音克隆和移动模型部署等功能,提升语音...
-
SynCamMaster是什么?一文让你看懂SynCamMaster的技术原理、主要功能、应用场景SynCamMaster概述简介 SynCamMaster是浙江大学、快手科技、清华大学和香港中文大学的开发人员共同合作推出的全球首个多视角视频生成...
-
ChatMCP是什么?一文让你看懂ChatMCP的技术原理、主要功能、应用场景ChatMCP概述简介 ChatMCP 是基于模型上下文协议(MCP)的 AI 聊天客户端,支持与各种大型语言大模型(LLM)如 OpenAI、Cl...
-
CodeArena是什么?一文让你看懂CodeArena的技术原理、主要功能、应用场景CodeArena概述简介 CodeArena是在线平台,基于让多个大型语言大模型(LLM)同时构建相同的应用程序,实时显示排名结果,比较LLM生成...
-
CosyVoice 2.0是什么?一文让你看懂CosyVoice 2.0的技术原理、主要功能、应用场景CosyVoice 2.0概述简介 CosyVoice 2.0 是阿里巴巴通义实验室推出的CosyVoice语音生成大模型升级版,模型用有限标量量化...
-
ColorFlow是什么?一文让你看懂ColorFlow的技术原理、主要功能、应用场景ColorFlow概述简介 ColorFlow是清华大学和腾讯ARC实验室一起推出的图像序列着色模型,能精细化地保持图像序列中个体身份的同时进行着色...
-
FACTS Grounding是什么?一文让你看懂FACTS Grounding的技术原理、主要功能、应用场景FACTS Grounding概述简介 FACTS Grounding是谷歌DeepMind推出的评估大型语言大模型(LLMs)能力的基准测试,衡量...
-
CLEAR是什么?一文让你看懂CLEAR的技术原理、主要功能、应用场景CLEAR概述简介 CLEAR是新加坡国立大学推出新型线性注意力机制,能提升预训练扩散变换器(DiTs)生成高分辨率图像的效率。基于将每个查询的注意...
-
OCTAVE是什么?一文让你看懂OCTAVE的技术原理、主要功能、应用场景OCTAVE 概述简介 OCTAVE(Omni-Capable Text and Voice Engine)是Hume AI推出的新一代语音语言大模...
-
PC Agent是什么?一文让你看懂PC Agent的技术原理、主要功能、应用场景PC Agent概述简介 PC Agent是上海交通大学和Generative AI Research Lab (GAIR)联合推出的先进AI系统。...
-
CogAgent-9B是什么?一文让你看懂CogAgent-9B的技术原理、主要功能、应用场景CogAgent-9B概述简介 CogAgent-9B是基于 GLM-4V-9B 训练的专用Agent任务模型,仅依赖屏幕截图作为输入,无需HTML...
-
DiTCtrl是什么?一文让你看懂DiTCtrl的技术原理、主要功能、应用场景DiTCtrl概述简介 DiTCtrl是基于多模态扩散变换器(MM-DiT)架构的多提示视频生成方法,是香港中文大学和腾讯等机构联合推出的。DiTC...
-
PeterCat是什么?一文让你看懂PeterCat的技术原理、主要功能、应用场景PeterCat概述简介 PeterCat是开源的智能答疑机器人助手。PeterCat能帮助开发者和社区维护者更高效地解决技术问题,提升社区支持效率...