HOVER是什么?一文让你看懂HOVER的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

HOVER是什么

HOVER是英伟达推出的1.5M小模型,全称为“Humanoid Versatile Controller”,即人形机器人的多功能全身神经通用控制器。模型用150万参数实现对机器人复杂动作的控制,能适应多样任务如导航、桌面操作和移动操作等,每种任务需要独特的控制模式。HOVER的核心创新在于用全身运动模仿作为各种任务的通用抽象,提供通用的运动技能,用在学习多种全身控制模式。基于多模式策略蒸馏框架将不同控制模式整合到统一的策略中,实现模式间的无缝切换,且保留每种模式的优势,提高未来人形机器人应用的效率和灵活性。

HOVER的功能特色

多模式控制:HOVER能无缝切换不同的控制模式,如导航、桌面操作和移动操作等,每种模式都有特定的控制需求。

运动学位置跟踪:HOVER支持对机器人关键部位的3D位置进行跟踪,实现精确的运动复制。

关节角度跟踪:HOVER能跟踪每个机器人电机的目标关节角度,实现复杂的肢体动作。

根跟踪:HOVER能跟踪机器人的根速度、高度和方向,对保持平衡和执行动态动作至关重要。

统一命令空间:HOVER设计统一的命令空间,适应各种控制设备,如操纵杆、动作捕捉系统、外骨骼和虚拟现实头设。

策略蒸馏:HOVER从Oracle策略中提取和蒸馏,将多种控制技能整合到单一的“通用策略”中,提高效率和灵活性。

HOVER的技术原理

本体感觉和命令屏蔽:HOVER基于本体感觉(机器人自身的状态感知)和命令屏蔽(选择性激活不同的命令空间)确定任务命令,支持独立控制机器人的上半身和下半身。

多模式策略蒸馏框架:HOVER用策略蒸馏技术,将从大规模人类运动数据中学习到的Oracle策略转化为能处理多种控制模式的单一策略。

DAgger框架:HOVER采用DAgger(Dataset Aggregation)框架对齐学生策略和Oracle策略的动作,基于监督学习优化学生策略。

模拟训练:HOVER的训练在NVIDIA Isaac模拟套件中进行,套件基于GPU加速,能快速模拟长时间的训练,将模型迁移到现实世界中,无需额外的微调。

统一命令空间设计:HOVER的命令空间设计既通用又原子,能覆盖大多数现有的控制配置,且能任意组合支持各种模式。

运动重定向:HOVER能将人类动作数据集重定向为机器人动作数据集,基于匹配关键点和优化参数实现。

HOVER项目介绍

项目官网:hover-versatile-humanoid.github.io

arXiv技术论文:https://arxiv.org/pdf/2410.21229

HOVER能做什么?

导航与移动:HOVER能控制人形机器人在复杂环境中进行导航和移动,如在不平坦的地面上行走或在狭窄的空间中穿梭,适于搜索救援、导览服务等场景。

桌面操作:在需要精细操作的桌面任务中,如组装电子元件或进行实验室工作,HOVER能精确控制机器人的上肢和手部关节,实现复杂的手眼协调操作。

移动操作(Loco-manipulation):结合移动与操作的任务,例如在移动过程中抓取和搬运物体,HOVER能协调机器人的全身动作,实现流畅的搬运和操作任务。

人机交互:HOVER支持各种输入设备(如VR头盔、动作捕捉系统、外骨骼)进行人机交互,让机器人能模仿人类的动作和行为,适于娱乐、教育和培训等领域。

远程操作与仿真:在远程操作场景中,HOVER能实时响应操作者的指令,执行精确的远程任务,如远程手术辅助或危险环境作业。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • storymania ai story generator
    storymania ai story generator 与AI -Power的平台与Storymania进行工艺吸引人的故事,旨在协助各个级别的作家。在干净,无广告的环境中享受无缝的编辑和类型定制。在创纪录...
  • aibooktools
    aibooktools 使用Aibooktools,您可以将书籍快速转化为可行的见解 - 所有这些都没有长时间的阅读或手动数据输入。凭借AI的力量,您可以充分利用自己喜欢的书...
  • Notion Sites
    Notion Sites Notion Sites 是一个简单易用的网站搭建工具,用户可以通过拖放式构建块快速创建个性化网站,无需编写复杂的HTML或代码。它提供了超过10,0...
  • Next.js
    Next.js Next.js 是一个用于构建现代 React 应用程序的框架。它提供了许多功能和优势,包括服务器渲染、静态生成、热模块替换等。Next.js 的定价...
  • Lagrange
    Lagrange Lagrange 是一款由 OrangeCat 开发的 AI 编程工具,能够将开发需求快速转化为可投入生产的代码。它通过先进的 AI 技术理解上下文并...
  • Grimo
    Grimo Grimo 是一个高效的 AI 文本编辑器,结合最新的 AI 模型,如 DeepSeek R1 和 OpenAI GPT-4,致力于提升用户的写作体验...
  • SEO AI Agent
    SEO AI Agent SEO AI Agent 是由 Writesonic 推出的一款先进的人工智能 SEO 工具。它通过实时数据和搜索引擎结果页(SERP)分析,提供智能...
  • Graphy
    Graphy Graphy是一个数据可视化工具,它通过简化数据呈现的方式,使得任何人都可以成为熟练的数据讲述者。它强调数据的行动性、清晰性和美观性,帮助用户快速做出...