收集全球10,000⁺个好用的AI软件
-
GR00T-Teleop是什么?一文让你看懂GR00T-Teleop的技术原理、主要功能、应用场景GR00T-Teleop概述简介 GR00T-Teleop是NVIDIA Isaac GR00T的一部分,用在捕获远程操作数据的关键技术。基于NVI...
-
MiniRAG是什么?一文让你看懂MiniRAG的技术原理、主要功能、应用场景MiniRAG概述简介 MiniRAG是香港大学推出的新型检索增强型生成(RAG)系统,专为在资源受限的场景下高效部署小型语言大模型(SLMs)设计...
-
Riona-AI-Agent是什么?一文让你看懂Riona-AI-Agent的技术原理、主要功能、应用场景Riona-AI-Agent概述简介 Riona-AI-Agent是Node.js 和 TypeScript 构建的 AI 驱动的自动化工具,能与 ...
-
Prometheus是什么?一文让你看懂Prometheus的技术原理、主要功能、应用场景Prometheus概述简介 Prometheus是创新的3D感知潜在扩散模型,专门用于快速生成文本到3D场景的内容。能在几秒钟内完成对象和场景级别...
-
MinMo是什么?一文让你看懂MinMo的技术原理、主要功能、应用场景MinMo概述简介 MinMo是阿里巴巴通义实验室FunAudioLLM团队推出的多模态大模型,专注于实现无缝语音交互。MinMo拥有约80亿参数,...
-
MiniMax-01是什么?一文让你看懂MiniMax-01的技术原理、主要功能、应用场景MiniMax-01概述简介 MiniMax-01是MiniMax推出的全新系列模型,包含基础语言大模型MiniMax-Text-01和视觉多模态大...
-
讯飞星火 X1是什么?一文让你看懂讯飞星火 X1的技术原理、主要功能、应用场景讯飞星火 X1概述简介 讯飞星火 X1 是科大讯飞于2025年1月15日发布的国内首个基于全国产算力平台训练的具备深度思考和推理能力的大模型。在解题...
-
星火语音同传大模型是什么?一文让你看懂星火语音同传大模型的技术原理、主要功能、应用场景星火语音同传大模型概述简介 星火语音同传大模型是科大讯飞于2025年1月15日发布的国内首个具备端到端语音同传能力的大模型。模型在内容完整度、信息准...
-
Titans是什么?一文让你看懂Titans的技术原理、主要功能、应用场景Titans概述简介 Titans是谷歌推出的新型神经网络架构,能突破Transformer在处理长序列数据时的记忆瓶颈。Titans引入神经长期记...
-
MiniCPM-o 2.6是什么?一文让你看懂MiniCPM-o 2.6的技术原理、主要功能、应用场景MiniCPM-o 2.6概述简介 MiniCPM-o 2.6 是MiniCPM-o 系列最新、性能最佳的多模态大模型,具有 8B 参数量。Mini...
-
FlowiseAI是什么?一文让你看懂FlowiseAI的技术原理、主要功能、应用场景FlowiseAI概述简介 Flowise 是开源的低代码或无代码拖放工具,通过拖拽可视化组件,用户可以快速构建自定义的 LLM 应用程序。提供了一...
-
LlamaV-o1是什么?一文让你看懂LlamaV-o1的技术原理、主要功能、应用场景LlamaV-o1概述简介 LlamaV-o1是阿联酋穆罕默德·本·扎耶德人工智能大学等机构提出的新多模态视觉推理模型,提升大型语言大模型的逐步视觉...
-
Kokoro-TTS是什么?一文让你看懂Kokoro-TTS的技术原理、主要功能、应用场景Kokoro-TTS概述简介 Kokoro-TTS 是 hexgrad 开发的轻量级文本转语音(TTS)模型,具有 8200 万参数。基于 Styl...
-
KHOJ是什么?一文让你看懂KHOJ的技术原理、主要功能、应用场景KHOJ概述简介 KHOJ是开源的个人化AI助手,帮助用户整合和检索知识。支持连接用户的在线和本地文档,如PDF、Markdown、纯文本、GitH...
-
RAIN是什么?一文让你看懂RAIN的技术原理、主要功能、应用场景RAIN概述简介 RAIN(Real-time Animation Of Infinite Video Stream)是创新的实时动画解决方案,基于...
-
Pipecat是什么?一文让你看懂Pipecat的技术原理、主要功能、应用场景Pipecat概述简介 Pipecat是开源的Python框架,专注于构建语音和多模态对话代理。基于内置的语音识别、文本转语音(TTS)和对话处理功...
-
RealtimeSTT是什么?一文让你看懂RealtimeSTT的技术原理、主要功能、应用场景RealtimeSTT概述简介 RealtimeSTT是开源的实时语音转文本库,专为低延迟应用设计。有强大的语音活动检测功能,可自动识别说话的开始与...
-
Step R-mini是什么?一文让你看懂Step R-mini的技术原理、主要功能、应用场景Step R-mini概述简介 Step R-mini(全称Step Reasoner mini)是阶跃星辰推出的推理模型, 是 Step 系列模型...
-
GLM-Realtime是什么?一文让你看懂GLM-Realtime的技术原理、主要功能、应用场景GLM-Realtime概述简介 GLM-Realtime是智谱推出的全新端到端多模态模型,具备低延迟的视频理解与语音交互能力,特别融入清唱功能,让...
-
CogView-3-Flash是什么?一文让你看懂CogView-3-Flash的技术原理、主要功能、应用场景CogView-3-Flash 概述简介 CogView-3-Flash 是智谱推出的首个免费AI图像生成模型,能根据文本描述生成高审美分数的图像,...