收集全球10,000⁺个好用的AI软件
-
NextGenAI是什么?一文让你看懂NextGenAI的技术原理、主要功能、应用场景NextGenAI概述简介 NextGenAI是OpenAI推出的全球性联盟,基于AI技术推动教育和研究的进步。NextGenAI联合包括哈佛大学、...
-
NotaGen是什么?一文让你看懂NotaGen的技术原理、主要功能、应用场景NotaGen概述简介 NotaGen 是中央音乐学院、北京航空航天大学、清华大学等机构推出的音乐生成模型,基于模仿大型语言大模型(LLM)的训练范...
-
谛韵DiffRhythm是什么?一文让你看懂谛韵DiffRhythm的技术原理、主要功能、应用场景DiffRhythm概述简介 DiffRhythm(中文名称:谛韵) 是西北工业大学与香港中文大学(深圳)联合开发的端到端音乐生成工具,基于潜扩散模...
-
OmniAlign-V是什么?一文让你看懂OmniAlign-V的技术原理、主要功能、应用场景OmniAlign-V概述简介 OmniAlign-V 是上海交通大学、上海AI Lab、南京大学、复旦大学和浙江大学联合推出的专为提升多模态大语言...
-
TrendPublish是什么?一文让你看懂TrendPublish的技术原理、主要功能、应用场景TrendPublish概述简介 TrendPublish 是基于 AI 的趋势发现和内容发布系统。基于多源数据采集,从 Twitter/X、网站等...
-
Proxy Lite是什么?一文让你看懂Proxy Lite的技术原理、主要功能、应用场景Proxy Lite概述简介 Proxy Lite 是开源的轻量级视觉语言大模型(VLM),参数量为3B,支持自动化网页任务。Proxy Lite ...
-
WeGen是什么?一文让你看懂WeGen的技术原理、主要功能、应用场景WeGen概述简介 WeGen 是中国科学技术大学联合上海交通大学、微信团队、中国科学院等机构推出的统一多模态生成模型,基于自然对话实现多样化的视觉...
-
DiffBrush是什么?一文让你看懂DiffBrush的技术原理、主要功能、应用场景DiffBrush概述简介 DiffBrush是北京邮电大学、清华大学、中国电信人工智能研究所和西北工业大学推出的,无需训练的图像生成与编辑框架,支...
-
Liquid是什么?一文让你看懂Liquid的技术原理、主要功能、应用场景Liquid概述简介 Liquid是华中科技大学、字节跳动和香港大学联合推出的极简统一多模态生成框架。基于VQGAN将图像编码为离散的视觉token...
-
X-Dancer是什么?一文让你看懂X-Dancer的技术原理、主要功能、应用场景X-Dancer概述简介 X-Dancer 是字节跳动联合加州大学圣地亚哥分校和南加州大学的开发人员一起推出的音乐驱动的人像舞蹈视频生成框架,支持从...
-
AVD2是什么?一文让你看懂AVD2的技术原理、主要功能、应用场景AVD2概述简介 AVD2(Accident Video Diffusion for Accident Video Description)是清华大...
-
Kiss3DGen是什么?一文让你看懂Kiss3DGen的技术原理、主要功能、应用场景Kiss3DGen概述简介 Kiss3DGen是创新的3D资产生成框架,通过重新基于预训练的2D图像扩散模型来高效生成、编辑和增强3D对象。核心在于...
-
Archon是什么?一文让你看懂Archon的技术原理、主要功能、应用场景Archon概述简介 Archon 是专注于构建和优化 AI 智能体的开源项目。通过自主生成代码和优化智能体性能,展示了现代 AI 开发的核心理念。...
-
PodAgent是什么?一文让你看懂PodAgent的技术原理、主要功能、应用场景PodAgent概述简介 PodAgent 是香港中文大学、微软和小红书联合推出的播客生成框架。基于模拟真实的脱口秀场景,用多智能体协作系统(包括主...
-
Chat2SVG是什么?一文让你看懂Chat2SVG的技术原理、主要功能、应用场景Chat2SVG概述简介 Chat2SVG 是创新的文本到矢量图形(SVG)生成框架,通过结合大型语言大模型(LLMs)和图像扩散模型,实现高质量 ...
-
QwQ-32B是什么?一文让你看懂QwQ-32B的技术原理、主要功能、应用场景QwQ-32B概述简介 QwQ-32B 是阿里巴巴开源的新型推理模型,参数量为 320 亿。基于大规模强化学习(RL)训练,在数学推理、编程等任务上...
-
Light-R1是什么?一文让你看懂Light-R1的技术原理、主要功能、应用场景Light-R1概述简介 Light-R1是360智脑开源的AI大模型,专注于数学领域的长思维链推理,具体为 Light-R1-32B。模型基于Qw...
-
SpatialVLA是什么?一文让你看懂SpatialVLA的技术原理、主要功能、应用场景SpatialVLA概述简介 SpatialVLA 是上海 AI Lab、中国电信人工智能研究院和上海科技大学等机构一起推出的新型空间具身通用操作模...
-
TheoremExplainAgent是什么?一文让你看懂TheoremExplainAgent的技术原理、主要功能、应用场景TheoremExplainAgent概述简介 TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理...
-
Aya Vision是什么?一文让你看懂Aya Vision的技术原理、主要功能、应用场景Aya Vision概述简介 Aya Vision 是 Cohere 推出的多模态、多语言的视觉模型,提升全球范围内的多语言和多模态通信能力。支持 ...