收集全球10,000⁺个好用的AI软件
-
Qihoo-T2X是什么?一文让你看懂Qihoo-T2X的技术原理、主要功能、应用场景QIHOO-T2X概述简介 Qihoo-T2X 是360 AI 研究院和中山大学推出的基于代理标记化扩散 Transformer(PT-DiT)的高... -
Step-Audio-TTS-3B是什么?一文让你看懂Step-Audio-TTS-3B的技术原理、主要功能、应用场景Step-Audio-TTS-3B概述简介 Step-Audio-TTS-3B 是 Stepfun-AI 团队推出的高性能文本到语音(TTS)模型,... -
ToddlerBot是什么?一文让你看懂ToddlerBot的技术原理、主要功能、应用场景ToddlerBot概述简介 ToddlerBot是斯坦福大学开源的用在运动操作的开源机器学习与人形机器人平台,为高效收集大规模、高质量的训练数据设... -
TongGeometry是什么?一文让你看懂TongGeometry的技术原理、主要功能、应用场景TongGeometry概述简介 TongGeometry 是北京通用AI研究院和北京大学AI研究所联合推出的基于树搜索的几何模型,专门用在提出和解... -
HealthGPT是什么?一文让你看懂HealthGPT的技术原理、主要功能、应用场景HealthGPT概述简介 HealthGPT 是浙江大学、电子科技大学、阿里巴巴等多家机构联合开发的先进的医学视觉语言大模型(Med-LVLM),... -
FlexTok是什么?一文让你看懂FlexTok的技术原理、主要功能、应用场景FlexTok概述简介 FlexTok 是瑞士洛桑联邦理工学院(EPFL)和苹果公司联合开发的图像处理技术。通过将二维图像重新采样为一维离散标记序列... -
Indic Parler-TTS是什么?一文让你看懂Indic Parler-TTS的技术原理、主要功能、应用场景Indic Parler-TTS概述简介 Indic Parler-TTS 是 Hugging Face 和 AI4Bharat 团队合作推出的多语... -
BioMedGPT-R1是什么?一文让你看懂BioMedGPT-R1的技术原理、主要功能、应用场景BioMedGPT-R1概述简介 BioMedGPT-R1 是清华大学AI产业研究院(AIR)与北京水木分子生物科技有限公司联合推出的升级版多模态生... -
TANGLED是什么?一文让你看懂TANGLED的技术原理、主要功能、应用场景TANGLED概述简介 TANGLED是上海科技大学、Deemos Technology和华中科技大学联合推出的3D发型生成方法,支持从任意风格和视... -
Llasa TTS是什么?一文让你看懂Llasa TTS的技术原理、主要功能、应用场景Llasa TTS概述简介 Llasa TTS 是香港科技大学基于 LLaMA 架构推出的开源文本转语音(TTS)模型,支持高质量语音合成和克隆。L... -
MME-CoT是什么?一文让你看懂MME-CoT的技术原理、主要功能、应用场景MME-CoT 概述简介 MME-CoT 是香港中文大学(深圳)、香港中文大学、字节跳动、南京大学、上海人工智能实验室、宾夕法尼亚大学、清华大学等机... -
TinyR1-Preview是什么?一文让你看懂TinyR1-Preview的技术原理、主要功能、应用场景TinyR1-Preview概述简介 TinyR1-Preview是北京大学计算机学院与360公司联合推出的32B参数量的推理模型。模型仅用5%的参... -
OctoTools是什么?一文让你看懂OctoTools的技术原理、主要功能、应用场景OctoTools概述简介 OctoTools 是斯坦福大学推出的开源智能体框架,基于可扩展的工具解决复杂的推理任务。OctoTools用标准化的工... -
IndexTTS是什么?一文让你看懂IndexTTS的技术原理、主要功能、应用场景IndexTTS概述简介 IndexTTS 是 B 站推出的工业级可控文本转语音(TTS)系统。基于 XTTS 和 Tortoise 模型开发,结合... -
腾讯混元Turbo S是什么?一文让你看懂腾讯混元Turbo S的技术原理、主要功能、应用场景腾讯混元Turbo S概述简介 腾讯混元Turbo S是腾讯推出的新一代快思考模型。模型采用创新的Hybrid-Mamba-Transformer融... -
GPT-4.5是什么?一文让你看懂GPT-4.5的技术原理、主要功能、应用场景GPT-4.5概述简介 GPT-4.5 是 OpenAI 推出的最新大型聊天模型,是目前规模最大、性能最强的聊天模型。基于扩展无监督学习,提升模式识... -
ARTalk是什么?一文让你看懂ARTalk的技术原理、主要功能、应用场景ARTalk概述简介 ARTalk是东京大学和日本理化学研究所推出的新型语音驱动3D头部动画生成框架,基于自回归模型实现实时、高同步性的唇部动作和自... -
Spark-TTS是什么?一文让你看懂Spark-TTS的技术原理、主要功能、应用场景Spark-TTS概述简介 Spark-TTS 是SparkAudio 团队开源的基于大型语言大模型(LLM)的高效文本转语音(TTS)工具, 无需... -
ART是什么?一文让你看懂ART的技术原理、主要功能、应用场景ART概述简介 ART(Anonymous Region Transformer) 是新型的多层透明图像生成技术,能根据全局文本提示和匿名区域布局直... -
TrendPublish是什么?一文让你看懂TrendPublish的技术原理、主要功能、应用场景TrendPublish概述简介 TrendPublish 是基于 AI 的趋势发现和内容发布系统。基于多源数据采集,从 Twitter/X、网站等...