收集全球10,000⁺个好用的AI软件
-
Hunyuan-Large是什么?一文让你看懂Hunyuan-Large的技术原理、主要功能、应用场景Hunyuan-Large概述简介 Hunyuan-Large是腾讯推出的大型混合专家(MoE)模型,具有3890亿总参数量和520亿激活参数量,是...
-
Cofounder是什么?一文让你看懂Cofounder的技术原理、主要功能、应用场景Cofounder概述简介 Cofounder是开源的全栈AI开发代理,能帮助开发者基于单一提示自动生成完整的应用程序,包括后端、前端、数据库和有状...
-
MagicTailor是什么?一文让你看懂MagicTailor的技术原理、主要功能、应用场景MagicTailor概述简介 MagicTailor 是专门为组件可控个性化设计的新框架,让T2I模型在个性化过程中能精确控制。MagicTail...
-
Claude Computer Use是什么?一文让你看懂Claude Computer Use的技术原理、主要功能、应用场景Claude Computer Use概述简介 Claude Computer Use是Anthropic公司推出的新功能,支持AI大模型Claud...
-
Docling是什么?一文让你看懂Docling的技术原理、主要功能、应用场景Docling是什么 Docling是开源的文档解析和转换工具,能高效地将多种格式的文档(包括PDF、DOCX、PPTX、图片和HTML)解析,导出...
-
Cerebellum是什么?一文让你看懂Cerebellum的技术原理、主要功能、应用场景Cerebellum概述简介 Cerebellum是基于Claude 3.5 Sonnet和Selenium WebDriver构建的浏览器AI智能...
-
WebRL是什么?一文让你看懂WebRL的技术原理、主要功能、应用场景WebRL概述简介 WebRL是清华大学、智谱AI联合推出的自我进化的在线课程强化学习框架,训练使用开放大型语言大模型(LLMs)的高性能网络代理。...
-
GameGen-X是什么?一文让你看懂GameGen-X的技术原理、主要功能、应用场景GameGen-X概述简介 GameGen-X是香港科技大学、中国科学技术大学等机构开发人员推出的扩散变换器模型,用在生成和交互控制开放世界游戏视频...
-
OuteTTS是什么?一文让你看懂OuteTTS的技术原理、主要功能、应用场景OuteTTS概述简介 OuteTTS是开源的文本到语音(TTS)项目,基于纯语言建模的方法生成语音。OuteTTS项目基于LLaMa架构,用Out...
-
GTA是什么?一文让你看懂GTA的技术原理、主要功能、应用场景GTA概述简介 GTA(a benchmark for General Tool Agents)是上海交通大学和上海AI实验室一起推出的基准测试,评...
-
VQAScore是什么?一文让你看懂VQAScore的技术原理、主要功能、应用场景VQAScore概述简介 VQAScore是CMU和Meta联合推出的评估方法,基于视觉问答(VQA)模型衡量由文本提示生成的图像质量。VQASco...
-
AndroidLab是什么?一文让你看懂AndroidLab的技术原理、主要功能、应用场景AndroidLab概述简介 AndroidLab是用在训练和系统评估Android自主代理的框架,集成文本和图像模态操作环境,统一行动空间和可重现...
-
Recraft V3是什么?一文让你看懂Recraft V3的技术原理、主要功能、应用场景Recraft V3概述简介 Recraft V3是Recraft公司推出的AI文本到图像生成模型,在Hugging Face的文本到图像模型排行榜...
-
Magentic-One是什么?一文让你看懂Magentic-One的技术原理、主要功能、应用场景Magentic-One 概述简介 Magentic-One 是微软推出的通用多智能体系统,解决跨领域的复杂网络和文件任务。系统基于多智能体架构,由...
-
X-Portrait 2是什么?一文让你看懂X-Portrait 2的技术原理、主要功能、应用场景X-Portrait 2概述简介 X-Portrait 2是字节跳动智能创作团队推出的单图视频驱动技术,基于一张静态照片和一段驱动视频生成高质量、电...
-
Ichigo是什么?一文让你看懂Ichigo的技术原理、主要功能、应用场景Ichigo概述简介 Ichigo是开源的多模态AI语音助手,采用混合模态模型,能实时处理语音和文本的交织序列。基于将语音直接量化为离散令牌,用统一...
-
CogSound是什么?一文让你看懂CogSound的技术原理、主要功能、应用场景CogSound概述简介 CogSound是智谱AI最新推出的音效模型,能为无声视频增添动人的音效。 基于GLM-4V的视频理解能力,CogSoun...
-
AgentSquare是什么?一文让你看懂AgentSquare的技术原理、主要功能、应用场景AgentSquare概述简介 AgentSquare是清华大学团队推出自动在模块化设计空间中搜索大型语言大模型代理。基于标准化的模块接口抽象,实现...
-
Fashion-VDM是什么?一文让你看懂Fashion-VDM的技术原理、主要功能、应用场景Fashion-VDM概述简介 Fashion-VDM是谷歌和华盛顿大学一起推出的基于视频扩散模型(VDM)的虚拟试穿技术。能在给定服装图像和人物视...
-
olly.bot是什么?一文让你看懂olly.bot的技术原理、主要功能、应用场景olly.bot概述简介 Olly.bot是集成于iMessage和SMS的个人AI助手,基于OpenAI大模型,提供网络搜索、文档分析、图片生成等...