收集全球10,000⁺个好用的AI软件
-
Genmoai-smol是什么?一文让你看懂Genmoai-smol的技术原理、主要功能、应用场景Genmoai-smol概述简介 Genmoai-smol是开源视频生成模型,是Genmoai的txt2video模型的工作进展分支,专为单GPU设...
-
VirSci是什么?一文让你看懂VirSci的技术原理、主要功能、应用场景VirSci概述简介 VirSci(Virtual Scientists)是上海人工智能实验室推出的多智能体AI科学研究工具,基于模拟科学家团队的合...
-
Self-Lengthen是什么?一文让你看懂Self-Lengthen的技术原理、主要功能、应用场景Self-Lengthen概述简介 Self-Lengthen是阿里巴巴千问团队推出的创新的迭代训练框架,能提升大型语言大模型(LLMs)生成长文本...
-
Amphion是什么?一文让你看懂Amphion的技术原理、主要功能、应用场景Amphion概述简介 Amphion是开源的音频、音乐和语音生成工具包,是香港中文大学(深圳)副教授武执政团队联合上海人工智能实验室和深圳市大数据...
-
LongReward是什么?一文让你看懂LongReward的技术原理、主要功能、应用场景LongReward概述简介 LongReward是清华大学、中国科学院、智谱AI联合推出的,基于AI反馈改进长文本大型语言大模型(LLMs)性能的...
-
Fish Agent是什么?一文让你看懂Fish Agent的技术原理、主要功能、应用场景Fish Agent概述简介 Fish Agent是FishAudio推出的创新的端到端语音处理模型,集成自动语音识别(ASR)和文本到语音(TTS...
-
MeetingMind是什么?一文让你看懂MeetingMind的技术原理、主要功能、应用场景MeetingMind概述简介 MeetingMind是AI驱动的会议助手,基于录音和文件上传功能自动转录会议音频,从中提取关键信息,如任务、决策和...
-
星辰大模型是什么?一文让你看懂星辰大模型的技术原理、主要功能、应用场景星辰大模型概述简介 星辰大模型是中国电信推出的AI大模型集合平台,覆盖语义、视觉、语音等多模态领域。包含不同参数量级的模型,支持长文本处理,具备多语...
-
Fast GraphRAG是什么?一文让你看懂Fast GraphRAG的技术原理、主要功能、应用场景Fast GraphRAG概述简介 Fast GraphRAG 是微软推出的高效的知识图谱检索框架,旨在提供可解释性和高精度的代理驱动检索工作流。它...
-
Stagehand是什么?一文让你看懂Stagehand的技术原理、主要功能、应用场景Stagehand概述简介 Stagehand是简单和可扩展的AI网页浏览框架,是Playwright的继承者,提供act、extract和obse...
-
VideoTuna是什么?一文让你看懂VideoTuna的技术原理、主要功能、应用场景VideoTuna概述简介 VideoTuna是集成多种AI视频生成模型的代码库,支持文本到视频、图像到视频和文本到图像的转换。VideoTuna提...
-
ComfyUI-MochiEdit是什么?一文让你看懂ComfyUI-MochiEdit的技术原理、主要功能、应用场景ComfyUI-MochiEdit概述简介 ComfyUI-MochiEdit是基于ComfyUI和Genmo Mochi的开源视频编辑工具,基于将...
-
HiCo是什么?一文让你看懂HiCo的技术原理、主要功能、应用场景HiCo概述简介 HiCo是360 AI研究院推出的基于扩散模型的层次化可控布局到图像生成模型,HiCo基于多分支结构设计,实现对对象位置和文本描述...
-
Ferret-UI 2是什么?一文让你看懂Ferret-UI 2的技术原理、主要功能、应用场景Ferret-UI 2概述简介 Ferret-UI 2是苹果公司推出的多模态大型语言大模型,用在理解和交互移动用户界面。Ferret-UI 2能识别...
-
MMBench-Video是什么?一文让你看懂MMBench-Video的技术原理、主要功能、应用场景MMBench-Video概述简介 MMBench-Video是新颖的长视频多题问答基准测试,是浙江大学、上海人工智能实验室、上海交通大学和香港中文...
-
MiniMates是什么?一文让你看懂MiniMates的技术原理、主要功能、应用场景MiniMates概述简介 MiniMates是高性能的轻量级数字人驱动算法,具备语音和表情两种驱动模式,能在普通电脑上实现实时运行。基于先进的技术...
-
MotionCLR是什么?一文让你看懂MotionCLR的技术原理、主要功能、应用场景MotionCLR概述简介 MotionCLR是基于注意力机制的人体动作生成和编辑模型,能根据文本提示生成动作,支持用户进行交互式编辑,如动作强调、...
-
DocMind是什么?一文让你看懂DocMind的技术原理、主要功能、应用场景DocMind概述简介 DocMind是司马阅推出的文档智能大模型,基于Transformer结构,融合深度学习、NLP和CV技术,能处理富文本文档...
-
DistilQwen2是什么?一文让你看懂DistilQwen2的技术原理、主要功能、应用场景DistilQwen2概述简介 DistilQwen2是基于Qwen2大模型用知识蒸馏技术优化得到的轻量级语言大模型,能提高运算效率和降低部署成本。...
-
Hunyuan3D-1.0是什么?一文让你看懂Hunyuan3D-1.0的技术原理、主要功能、应用场景Hunyuan3D-1.0概述简介 Hunyuan3D-1.0 是腾讯推出的3D生成模型,具备文本和图像输入条件,支持高质量的3D资产生成。该模型采...