收集全球10,000⁺个好用的AI软件
-
ART是什么?一文让你看懂ART的技术原理、主要功能、应用场景ART概述简介 ART(Anonymous Region Transformer) 是新型的多层透明图像生成技术,能根据全局文本提示和匿名区域布局直... -
TrendPublish是什么?一文让你看懂TrendPublish的技术原理、主要功能、应用场景TrendPublish概述简介 TrendPublish 是基于 AI 的趋势发现和内容发布系统。基于多源数据采集,从 Twitter/X、网站等... -
TheoremExplainAgent是什么?一文让你看懂TheoremExplainAgent的技术原理、主要功能、应用场景TheoremExplainAgent概述简介 TheoremExplainAgent(TEA)是滑铁卢大学、Votee AI等机构开源的多模态代理... -
TicVoice 7.0是什么?一文让你看懂TicVoice 7.0的技术原理、主要功能、应用场景TicVoice 7.0概述简介 TicVoice 7.0 是出门问问推出的第七代高品质 TTS(语音合成)引擎,基于新一代语音生成模型 Spark... -
LaWGPT是什么?一文让你看懂LaWGPT的技术原理、主要功能、应用场景LaWGPT概述简介 LaWGPT 是南京大学推出的中文法律大语言大模型,基于 LLaMA 模型进行二次预训练,融入大量中文法律知识。专注于法律领域... -
COMET是什么?一文让你看懂COMET的技术原理、主要功能、应用场景COMET概述简介 COMET是字节跳动推出的针对Mixture-of-Experts(MoE)模型的优化系统,能解决分布式训练中通信开销过大的问题... -
TrajectoryCrafter是什么?一文让你看懂TrajectoryCrafter的技术原理、主要功能、应用场景TrajectoryCrafter概述简介 TrajectoryCrafter 是腾讯PCG ARC Lab和香港中文大学推出的,用在单目视频的相机... -
START是什么?一文让你看懂START的技术原理、主要功能、应用场景START概述简介 START(Self-Taught Reasoner with Tools)是阿里集团和中国科学技术大学推出的新型工具增强型推理... -
MV-MATH是什么?一文让你看懂MV-MATH的技术原理、主要功能、应用场景MV-MATH概述简介 MV-MATH 是中科院自动化所提出的新基准数据集,评估多模态大语言大模型(MLLMs)在多视觉场景中的数学推理能力。数据集... -
PP-TableMagic是什么?一文让你看懂PP-TableMagic的技术原理、主要功能、应用场景PP-TableMagic概述简介 PP-TableMagic 是百度飞桨团队推出的高性能表格识别工具,用在将图片中的表格结构化信息提取出来,转换为... -
TokenSwift是什么?一文让你看懂TokenSwift的技术原理、主要功能、应用场景TokenSwift概述简介 TokenSwift 是北京通用人工智能研究院团队推出的超长文本生成加速框架,能在90分钟内生成10万Token的文本... -
MT-MegatronLM是什么?一文让你看懂MT-MegatronLM的技术原理、主要功能、应用场景MT-MegatronLM概述简介 MT-MegatronLM 是摩尔线程推出的面向全功能 GPU 的开源混合并行训练框架,主要用于高效训练大规模语... -
MT-TransformerEngine是什么?一文让你看懂MT-TransformerEngine的技术原理、主要功能、应用场景MT-TransformerEngine概述简介 MT-TransformerEngine 是摩尔线程开源的高效训练与推理优化框架,专为 Trans... -
Open-LLM-VTuber是什么?一文让你看懂Open-LLM-VTuber的技术原理、主要功能、应用场景Open-LLM-VTuber概述简介 Open-LLM-VTuber 是开源的跨平台语音交互 AI 伴侣项目。支持实时语音对话、视觉感知,配备生动... -
GR00T N1是什么?一文让你看懂GR00T N1的技术原理、主要功能、应用场景GR00T N1概述简介 GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。基于多模态输入(如语言和图像)实现多样化环境... -
Orpheus TTS是什么?一文让你看懂Orpheus TTS的技术原理、主要功能、应用场景Orpheus TTS概述简介 Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音(TTS)系统。Orpheus TTS 支持生... -
YT Navigator是什么?一文让你看懂YT Navigator的技术原理、主要功能、应用场景YT Navigator概述简介 YT Navigator 是 AI 驱动的 YouTube 内容搜索工具,帮助用户高效地搜索和浏览 YouTube... -
Step-Video-TI2V是什么?一文让你看懂Step-Video-TI2V的技术原理、主要功能、应用场景Step-Video-TI2V概述简介 Step-Video-TI2V 是阶跃星辰(StepFun)推出的开源图生视频(Image-to-Video... -
GPT-4o mini TTS是什么?一文让你看懂GPT-4o mini TTS的技术原理、主要功能、应用场景GPT-4o mini TTS概述简介 GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持将文本内容转换为自然流畅语... -
Agent TARS是什么?一文让你看懂Agent TARS的技术原理、主要功能、应用场景Agent TARS概述简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统...