收集全球10,000⁺个好用的AI软件
-
Social Media Agent是什么?一文让你看懂Social Media Agent的技术原理、主要功能、应用场景Social Media Agent概述简介 Social Media Agent是智能的社交媒体内容管理工具,能帮用户收集、整理和安排发布社交媒体...
-
Sa2VA是什么?一文让你看懂Sa2VA的技术原理、主要功能、应用场景Sa2VA概述简介 Sa2VA是字节跳动联合加州大学默塞德分校、武汉大学和北京大学一起推出的多模态大语言大模型,是SAM2和LLaVA结合而成,能实...
-
BAG是什么?一文让你看懂BAG的技术原理、主要功能、应用场景BAG概述简介 BAG(Body-Aligned 3D Wearable Asset Generation)是香港中文大学和腾讯联合提出创新的3D可...
-
AnyCharV是什么?一文让你看懂AnyCharV的技术原理、主要功能、应用场景AnyCharV概述简介 AnyCharV是香港中文大学、清华大学深圳国际研究生院、香港大学联合推出的角色可控视频生成框架,能将任意参考角色图像与目...
-
PIKE-RAG是什么?一文让你看懂PIKE-RAG的技术原理、主要功能、应用场景PIKE-RAG概述简介 PIKE-RAG(sPecIalized KnowledgE and Rationale Augmented Genera...
-
NPOA是什么?一文让你看懂NPOA的技术原理、主要功能、应用场景NPOA概述简介 NPOA 是开源的功能强大的舆情监测工具,可以帮助用户实时监控网络舆情,了解公众对特定话题或品牌的看法。系统基于先进的自然语言处理...
-
Long-VITA是什么?一文让你看懂Long-VITA的技术原理、主要功能、应用场景Long-VITA概述简介 Long-VITA 是腾讯优图实验室、南京大学、厦门大学开源的多模态模型,能处理超过100万tokens的长文本输入,在...
-
DragAnything是什么?一文让你看懂DragAnything的技术原理、主要功能、应用场景DragAnything概述简介 DragAnything 是快手联合浙江大学和新加坡国立大学 Show Lab推出的,基于实体表示的可控视频生成方...
-
ImageRAG是什么?一文让你看懂ImageRAG的技术原理、主要功能、应用场景ImageRAG概述简介 ImageRAG 是基于检索增强生成(Retrieval-Augmented Generation, RAG)的图像生成技...
-
Light-A-Video是什么?一文让你看懂Light-A-Video的技术原理、主要功能、应用场景Light-A-Video概述简介 Light-A-Video 是上海交通大学、中国科学技术大学、香港中文大学、香港科技大学、斯坦福大学及上海AI实...
-
Step-Audio是什么?一文让你看懂Step-Audio的技术原理、主要功能、应用场景Step-Audio概述简介 Step-Audio是阶跃星辰团队推出的首个产品级的开源语音交互模型,能根据不同的场景需求生成情绪、方言、语种、歌声和...
-
SkyReels-A1是什么?一文让你看懂SkyReels-A1的技术原理、主要功能、应用场景SkyReels-A1概述简介 SkyReels-A1是昆仑万维开源的中国首个SOTA(State-of-the-Art)级别的基于视频基座模型的表...
-
MakeAnything是什么?一文让你看懂MakeAnything的技术原理、主要功能、应用场景MakeAnything概述简介 MakeAnything 是新加坡国立大学 Show Lab团队推出的基于扩散变换器(Diffusion Tran...
-
AutoAgents是什么?一文让你看懂AutoAgents的技术原理、主要功能、应用场景AutoAgents概述简介 AutoAgents 是基于大型语言大模型(LLM)的自动智能体生成框架,能根据用户设定的目标自动生成多个专家角色的智...
-
LLaDA是什么?一文让你看懂LLaDA的技术原理、主要功能、应用场景LLaDA概述简介 LLaDA(Large Language Diffusion with mAsking)是中国人民大学高瓴AI学院李崇轩、文继荣...
-
Agentic Reasoning是什么?一文让你看懂Agentic Reasoning的技术原理、主要功能、应用场景Agentic Reasoning概述简介 Agentic Reasoning是牛津大学推出的增强大型语言大模型(LLM)推理能力的框架。基于整合外...
-
Step-Audio-TTS-3B是什么?一文让你看懂Step-Audio-TTS-3B的技术原理、主要功能、应用场景Step-Audio-TTS-3B概述简介 Step-Audio-TTS-3B 是 Stepfun-AI 团队推出的高性能文本到语音(TTS)模型,...
-
MoBA是什么?一文让你看懂MoBA的技术原理、主要功能、应用场景MoBA概述简介 MoBA(Mixture of Block Attention)是 Moonshot AI 提出的新型注意力机制,提高大型语言大模...
-
Aider是什么?一文让你看懂Aider的技术原理、主要功能、应用场景Aider概述简介 Aider 是开源的AI辅助编程工具,基于终端与大型语言大模型(LLM)配合,实现高效代码编辑和开发。Aider支持多种编程语言...
-
AI co-scientist是什么?一文让你看懂AI co-scientist的技术原理、主要功能、应用场景AI co-scientist概述简介 AI co-scientist 是谷歌推出的多智能体AI系统,作为虚拟科研机器人,协助科研人员搞定各种繁琐的...