收集全球10,000⁺个好用的AI软件
-
Loong是什么?一文让你看懂Loong的技术原理、主要功能、应用场景Loong概述简介 Loong是由香港大学和字节跳动联合推出的一种新型长视频生成模型,能生成外观一致、动态丰富、场景过渡自然的分钟级长视频。模型基于...
-
ScriptViz是什么?一文让你看懂ScriptViz的技术原理、主要功能、应用场景ScriptViz概述简介 ScriptViz是由斯坦福大学开发人员推出的一款剧本可视化辅助工具,基于大型电影数据库MovieNet,根据剧本文本和...
-
MLE-bench是什么?一文让你看懂MLE-bench的技术原理、主要功能、应用场景MLE-bench概述简介 MLE-bench 是 OpenAI 推出的一个基准测试工具,旨在衡量AI代理(AI Agent)在机器学习工程任务中的...
-
GTSinger是什么?一文让你看懂GTSinger的技术原理、主要功能、应用场景GTSinger概述简介 GTSinger是由浙江大学研究团队推出的大型开源高质量歌声数据集,旨在支持多样化的歌声任务。GTSinger包含80.5...
-
LightRAG是什么?一文让你看懂LightRAG的技术原理、主要功能、应用场景LightRAG概述简介 LightRAG是由香港大学研究团队推出的一种检索增强生成(Retrieval-Augmented Generation,...
-
Gen2Act是什么?一文让你看懂Gen2Act的技术原理、主要功能、应用场景Gen2Act概述简介 Gen2Act是由谷歌、卡内基梅隆大学和斯坦福大学一起推出的一种机器人操作策略,基于预测网络数据中的运动信息来生成人类视频,...
-
T2V-Turbo是什么?一文让你看懂T2V-Turbo的技术原理、主要功能、应用场景T2V-Turbo概述简介 T2V-Turbo是一种先进的文本到视频生成模型,由Google、UC Santa Barbara(加利福尼亚大学圣塔芭...
-
FLUX.1-Turbo-Alpha是什么?一文让你看懂FLUX.1-Turbo-Alpha的技术原理、主要功能、应用场景FLUX.1-Turbo-Alpha概述简介 FLUX.1-Turbo-Alpha是阿里妈妈创意团队基于FLUX.1-dev模型训练的8步蒸馏Lor...
-
OpenR是什么?一文让你看懂OpenR的技术原理、主要功能、应用场景OpenR概述简介 OpenR是一个由伦敦大学学院(UCL)、上海交通大学、利物浦大学、香港科技大学(广州)和西湖大学联合推出的一个开源框架,结合搜...
-
Agent-S是什么?一文让你看懂Agent-S的技术原理、主要功能、应用场景Agent S概述简介 Agent-S 是创新的代理框架,旨在基于图形用户界面(GUI)实现人机交互的自动化。Agent-S 基于模拟人类的操作方式...
-
Adobe Firefly是什么?一文让你看懂Adobe Firefly的技术原理、主要功能、应用场景Adobe Firefly概述简介 Adobe Firefly 是 Adobe 推出的一系列创意生成式 AI 模型,旨在帮助用户扩展其天生的创造力。...
-
Augmented Physics是什么?一文让你看懂Augmented Physics的技术原理、主要功能、应用场景Augmented Physics概述简介 Augmented Physics是一个创新的教育工具,基于集成机器学习技术,将物理教科书中的静态图表转...
-
podlm-public是什么?一文让你看懂podlm-public的技术原理、主要功能、应用场景podlm-public概述简介 podlm-public是一个开源AI播客工具,旨在创建一个中文版的NotebookLM替代品,专门用在将任意UR...
-
Yi-Lightning是什么?一文让你看懂Yi-Lightning的技术原理、主要功能、应用场景Yi-Lightning概述简介 Yi-Lightning 是零一万物公司最新发布的旗舰模型,在国际权威盲测榜单 LMSYS 上取得了显著成绩,超越...
-
FunASR是什么?一文让你看懂FunASR的技术原理、主要功能、应用场景FunASR概述简介 FunASR是由阿里巴巴达摩院开源的语音识别工具包,提供包括语音识别(ASR)、语音活动检测(VAD)、标点恢复、语言大模型、...
-
CleanS2S是什么?一文让你看懂CleanS2S的技术原理、主要功能、应用场景CleanS2S概述简介 CleanS2S是一个流式语音到语音(S2S)交互智能体原型,提供高质量、实时的语音交互体验。CleanS2S项目基于单文...
-
Hallo2是什么?一文让你看懂Hallo2的技术原理、主要功能、应用场景Hallo2概述简介 Hallo2是复旦大学、百度公司和南京大学一起推出的音频驱动视频生成模型。能将单张参考图片和持续几分钟的音频输入结合起来,基于...
-
模型判官是什么?一文让你看懂模型判官的技术原理、主要功能、应用场景模型判官概述简介 模型判官是一个基于 Next.js 构建的在线AI大模型评测平台,用户输入问题并选择多个AI大模型进行测试,帮助用户快速识别出最适...
-
AgentStack是什么?一文让你看懂AgentStack的技术原理、主要功能、应用场景AgentStack概述简介 AgentStack是一个开源工具,旨在帮助开发者快速构建AI代理项目。基于提供一个预配置的模板和集成流行的代理框架及...
-
Marco是什么?一文让你看懂Marco的技术原理、主要功能、应用场景Marco概述简介 Marco是阿里国际最新推出的大规模商用翻译大模型,支持15种全球主流语种,包括中、英、日、韩、西、法等。在BLEU评测指标上超...