收集全球10,000⁺个好用的AI软件
-
Delta-CoMe是什么?一文让你看懂Delta-CoMe的技术原理、主要功能、应用场景Delta-CoMe概述简介 Delta-CoMe是清华大学NLP实验室联合OpenBMB开源社区、北京大学和上海财经大学提出的新型增量压缩算法,一...
-
Magic Copy是什么?一文让你看懂Magic Copy的技术原理、主要功能、应用场景Magic Copy概述简介 Magic Copy是开源的AI抠图工具,支持Chrome浏览器扩展,基于Meta的Segment Anything ...
-
CAT4D是什么?一文让你看懂CAT4D的技术原理、主要功能、应用场景CAT4D概述简介 CAT4D是Google DeepMind、哥伦比亚大学和加州大学圣地亚哥分校一起推出的,能从单目视频创建4D场景(动态3D)表...
-
Co-op Translator是什么?一文让你看懂Co-op Translator的技术原理、主要功能、应用场景Co-op Translator概述简介 Co-op Translator是微软推出的开源多语言翻译工具,基于Azure AI服务实现项目文档和图像...
-
AnchorCrafter是什么?一文让你看懂AnchorCrafter的技术原理、主要功能、应用场景AnchorCrafter概述简介 AnchorCrafter是基于扩散模型的智能视频制作系统,用在自动生成具有高保真度的主播风格产品推广视频。基于...
-
PersonaCraft是什么?一文让你看懂PersonaCraft的技术原理、主要功能、应用场景PersonaCraft概述简介 PersonaCraft是韩国首尔国立大学推出的个性化全身图像合成技术,结合扩散模型和3D人类建模,能从单一参考图...
-
ConsisID是什么?一文让你看懂ConsisID的技术原理、主要功能、应用场景ConsisID概述简介 ConsisID是北京大学和鹏城实验室等机构推出的文本到视频(Text-to-Video, IPT2V)生成模型,基于频率...
-
GenCast是什么?一文让你看懂GenCast的技术原理、主要功能、应用场景GenCast概述简介 GenCast是DeepMind推出的革命性AI气象预测模型,基于扩散模型技术,提供长达15天的全球天气预报。GenCast...
-
ClearerVoice-Studio是什么?一文让你看懂ClearerVoice-Studio的技术原理、主要功能、应用场景ClearerVoice-Studio概述简介 ClearerVoice-Studio 是阿里巴巴达摩院通义实验室开源的语音处理框架,集成语音增强、...
-
O1-CODER是什么?一文让你看懂O1-CODER的技术原理、主要功能、应用场景O1-CODER概述简介 O1-CODER是北京交通大学研究团队推出的开源项目,旨在复制OpenAI的O1模型,专注于编码任务。O1-CODER结合...
-
GenMAC是什么?一文让你看懂GenMAC的技术原理、主要功能、应用场景GenMAC概述简介 GenMAC是香港大学、清华大学和微软研究院推出的多代理协作的迭代框架,用在解决文本到视频生成中的复杂场景生成问题。基于将任务...
-
CausVid是什么?一文让你看懂CausVid的技术原理、主要功能、应用场景CausVid概述简介 CausVid是Adobe和MIT一起推出的自回归实时视频生成技术,能实现视频的即时播放。基于蒸馏预训练的双向扩散模型构建出...
-
ClotheDreamer是什么?一文让你看懂ClotheDreamer的技术原理、主要功能、应用场景ClotheDreamer概述简介 ClotheDreamer是上海大学、上海交通大学、复旦大学和腾讯优图实验室一起推出的3D服装生成技术,能根据文...
-
ChatTTSPlus是什么?一文让你看懂ChatTTSPlus的技术原理、主要功能、应用场景ChatTTSPlus概述简介 ChatTTSPlus是ChatTTS的扩展版本,增加了TensorRT加速、语音克隆和移动模型部署等功能,提升语音...
-
SynCamMaster是什么?一文让你看懂SynCamMaster的技术原理、主要功能、应用场景SynCamMaster概述简介 SynCamMaster是浙江大学、快手科技、清华大学和香港中文大学的开发人员共同合作推出的全球首个多视角视频生成...
-
ChatMCP是什么?一文让你看懂ChatMCP的技术原理、主要功能、应用场景ChatMCP概述简介 ChatMCP 是基于模型上下文协议(MCP)的 AI 聊天客户端,支持与各种大型语言大模型(LLM)如 OpenAI、Cl...
-
CodeArena是什么?一文让你看懂CodeArena的技术原理、主要功能、应用场景CodeArena概述简介 CodeArena是在线平台,基于让多个大型语言大模型(LLM)同时构建相同的应用程序,实时显示排名结果,比较LLM生成...
-
CosyVoice 2.0是什么?一文让你看懂CosyVoice 2.0的技术原理、主要功能、应用场景CosyVoice 2.0概述简介 CosyVoice 2.0 是阿里巴巴通义实验室推出的CosyVoice语音生成大模型升级版,模型用有限标量量化...
-
ColorFlow是什么?一文让你看懂ColorFlow的技术原理、主要功能、应用场景ColorFlow概述简介 ColorFlow是清华大学和腾讯ARC实验室一起推出的图像序列着色模型,能精细化地保持图像序列中个体身份的同时进行着色...
-
FACTS Grounding是什么?一文让你看懂FACTS Grounding的技术原理、主要功能、应用场景FACTS Grounding概述简介 FACTS Grounding是谷歌DeepMind推出的评估大型语言大模型(LLMs)能力的基准测试,衡量...