收集全球10,000⁺个好用的AI软件
-
GR00T N1是什么?一文让你看懂GR00T N1的技术原理、主要功能、应用场景GR00T N1概述简介 GR00T N1 是英伟达推出的全球首个开源基础模型,专为通用人形机器人设计。基于多模态输入(如语言和图像)实现多样化环境...
-
UniFluid是什么?一文让你看懂UniFluid的技术原理、主要功能、应用场景UniFluid概述简介 UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的,统一的自回归框架,用在联合视觉生成和理解任务。基于连...
-
Multi-Speaker是什么?一文让你看懂Multi-Speaker的技术原理、主要功能、应用场景Multi-Speaker概述简介 Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人...
-
UniAct是什么?一文让你看懂UniAct的技术原理、主要功能、应用场景UniAct概述简介 UniAct 是新型的具身基础模型框架,解决不同机器人之间行为异构性的问题。通过学习通用行为,捕捉不同机器人共享的原子行为特征...
-
ReCamMaster是什么?一文让你看懂ReCamMaster的技术原理、主要功能、应用场景ReCamMaster概述简介 ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架,能根据新的相机轨迹重新生成视频内容。通过预训...
-
Stable Virtual Camera是什么?一文让你看懂Stable Virtual Camera的技术原理、主要功能、应用场景Stable Virtual Camera概述简介 Stable Virtual Camera 是 Stability AI 推出的 AI 模型,能...
-
Instella是什么?一文让你看懂Instella的技术原理、主要功能、应用场景Instella概述简介 Instella是AMD推出的系列30亿参数的开源语言大模型。模型完全从零开始在AMD Instinct™ MI300X ...
-
Maestro是什么?一文让你看懂Maestro的技术原理、主要功能、应用场景Maestro概述简介 Maestro是用在移动和Web应用的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制,解决传统测试中常见的不稳定性和...
-
OLMo 2 32B是什么?一文让你看懂OLMo 2 32B的技术原理、主要功能、应用场景OLMo 2 32B概述简介 OLMo 2 32B 是 Allen Institute for AI(Ai2)推出的最新开源语言大模型,是 OLMo...
-
Umi-OCR是什么?一文让你看懂Umi-OCR的技术原理、主要功能、应用场景Umi-OCR概述简介 Umi-OCR 是免费开源的离线 OCR 文字识别软件。无需联网,解压即用,支持截图、批量图片、PDF 扫描件的文字识别,能...
-
Orpheus TTS是什么?一文让你看懂Orpheus TTS的技术原理、主要功能、应用场景Orpheus TTS概述简介 Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音(TTS)系统。Orpheus TTS 支持生...
-
o1-pro是什么?一文让你看懂o1-pro的技术原理、主要功能、应用场景o1-pro概述简介 o1-pro是 OpenAI 正式推出的 o1 系列的升级版本,o1-pro 是目前 OpenAI 最强大的推理模型,核心优势...
-
Crack Coder是什么?一文让你看懂Crack Coder的技术原理、主要功能、应用场景Crack Coder概述简介 Crack Coder 是开源的隐形 AI 辅助工具,专为技术面试设计。Crack Coder支持在后台运行,完全隐...
-
YT Navigator是什么?一文让你看懂YT Navigator的技术原理、主要功能、应用场景YT Navigator概述简介 YT Navigator 是 AI 驱动的 YouTube 内容搜索工具,帮助用户高效地搜索和浏览 YouTube...
-
Step-Video-TI2V是什么?一文让你看懂Step-Video-TI2V的技术原理、主要功能、应用场景Step-Video-TI2V概述简介 Step-Video-TI2V 是阶跃星辰(StepFun)推出的开源图生视频(Image-to-Video...
-
Dify-Plus是什么?一文让你看懂Dify-Plus的技术原理、主要功能、应用场景Dify-Plus概述简介 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Di...
-
gpt-4o-transcribe是什么?一文让你看懂gpt-4o-transcribe的技术原理、主要功能、应用场景gpt-4o-transcribe概述简介 gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构,...
-
GPT-4o mini TTS是什么?一文让你看懂GPT-4o mini TTS的技术原理、主要功能、应用场景GPT-4o mini TTS概述简介 GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型,支持将文本内容转换为自然流畅语...
-
福棠·百川是什么?一文让你看懂福棠·百川的技术原理、主要功能、应用场景福棠·百川概述简介 福棠·百川是是国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布的全球首个儿科大模型。覆盖了儿童常见...
-
Agent TARS是什么?一文让你看懂Agent TARS的技术原理、主要功能、应用场景Agent TARS概述简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容,与浏览器、命令行和文件系统...