功能

首页 > 功能

GR00T N1是什么？一文让你看懂GR00T N1的技术原理、主要功能、应用场景

GR00T N1概述简介 GR00T N1 是英伟达推出的全球首个开源基础模型，专为通用人形机器人设计。基于多模态输入（如语言和图像）实现多样化环境...
UniFluid是什么？一文让你看懂UniFluid的技术原理、主要功能、应用场景

UniFluid概述简介 UniFluid 是谷歌 DeepMind 和麻省理工学院联合推出的，统一的自回归框架，用在联合视觉生成和理解任务。基于连...
Multi-Speaker是什么？一文让你看懂Multi-Speaker的技术原理、主要功能、应用场景

Multi-Speaker概述简介 Multi-Speaker是AudioShake推出的全球首个高分辨率多说话人分离模型。支持将音频中的多个说话人...
UniAct是什么？一文让你看懂UniAct的技术原理、主要功能、应用场景

UniAct概述简介 UniAct 是新型的具身基础模型框架，解决不同机器人之间行为异构性的问题。通过学习通用行为，捕捉不同机器人共享的原子行为特征...
ReCamMaster是什么？一文让你看懂ReCamMaster的技术原理、主要功能、应用场景

ReCamMaster概述简介 ReCamMaster 是浙江大学、快手科技等联合推出的视频重渲染框架，能根据新的相机轨迹重新生成视频内容。通过预训...
Stable Virtual Camera是什么？一文让你看懂Stable Virtual Camera的技术原理、主要功能、应用场景

Stable Virtual Camera概述简介 Stable Virtual Camera 是 Stability AI 推出的 AI 模型，能...
Instella是什么？一文让你看懂Instella的技术原理、主要功能、应用场景

Instella概述简介 Instella是AMD推出的系列30亿参数的开源语言大模型。模型完全从零开始在AMD Instinct™ MI300X ...
Maestro是什么？一文让你看懂Maestro的技术原理、主要功能、应用场景

Maestro概述简介 Maestro是用在移动和Web应用的端到端自动化测试框架。基于内置的容错能力和延迟容忍机制，解决传统测试中常见的不稳定性和...
OLMo 2 32B是什么？一文让你看懂OLMo 2 32B的技术原理、主要功能、应用场景

OLMo 2 32B概述简介 OLMo 2 32B 是 Allen Institute for AI（Ai2）推出的最新开源语言大模型，是 OLMo...
Umi-OCR是什么？一文让你看懂Umi-OCR的技术原理、主要功能、应用场景

Umi-OCR概述简介 Umi-OCR 是免费开源的离线 OCR 文字识别软件。无需联网，解压即用，支持截图、批量图片、PDF 扫描件的文字识别，能...
Orpheus TTS是什么？一文让你看懂Orpheus TTS的技术原理、主要功能、应用场景

Orpheus TTS概述简介 Orpheus TTS 是基于 Llama-3b 架构的开源文本到语音（TTS）系统。Orpheus TTS 支持生...
o1-pro是什么？一文让你看懂o1-pro的技术原理、主要功能、应用场景

o1-pro概述简介 o1-pro是 OpenAI 正式推出的 o1 系列的升级版本，o1-pro 是目前 OpenAI 最强大的推理模型，核心优势...
Crack Coder是什么？一文让你看懂Crack Coder的技术原理、主要功能、应用场景

Crack Coder概述简介 Crack Coder 是开源的隐形 AI 辅助工具，专为技术面试设计。Crack Coder支持在后台运行，完全隐...
YT Navigator是什么？一文让你看懂YT Navigator的技术原理、主要功能、应用场景

YT Navigator概述简介 YT Navigator 是 AI 驱动的 YouTube 内容搜索工具，帮助用户高效地搜索和浏览 YouTube...
Step-Video-TI2V是什么？一文让你看懂Step-Video-TI2V的技术原理、主要功能、应用场景

Step-Video-TI2V概述简介 Step-Video-TI2V 是阶跃星辰（StepFun）推出的开源图生视频（Image-to-Video...
Dify-Plus是什么？一文让你看懂Dify-Plus的技术原理、主要功能、应用场景

Dify-Plus概述简介 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目，集成基于 gin-vue-admin 的管理中心。Di...
gpt-4o-transcribe是什么？一文让你看懂gpt-4o-transcribe的技术原理、主要功能、应用场景

gpt-4o-transcribe概述简介 gpt-4o-transcribe是 OpenAI 推出的高性能语音转文本模型。基于最新的语音模型架构，...
GPT-4o mini TTS是什么？一文让你看懂GPT-4o mini TTS的技术原理、主要功能、应用场景

GPT-4o mini TTS概述简介 GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型，支持将文本内容转换为自然流畅语...
福棠·百川是什么？一文让你看懂福棠·百川的技术原理、主要功能、应用场景

福棠·百川概述简介福棠·百川是是国家儿童医学中心、首都医科大学附属北京儿童医院联合百川智能、小儿方健康共同发布的全球首个儿科大模型。覆盖了儿童常见...
Agent TARS是什么？一文让你看懂Agent TARS的技术原理、主要功能、应用场景

Agent TARS概述简介 Agent TARS 是字节跳动开源的多模态 AI Agent 项目。基于视觉解释网页内容，与浏览器、命令行和文件系统...

AI爱好者的一站式人工智能AI工具箱，累计收录全球10,000⁺好用的AI工具软件和网站，方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用，力争做全球排名前三的AI网址导航网站，欢迎您成为我们的一员。

隐私策略免责条款服务协议关于我们

AI TOOL