HOVER是什么?一文让你看懂HOVER的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

HOVER是什么

HOVER是英伟达推出的1.5M小模型,全称为“Humanoid Versatile Controller”,即人形机器人的多功能全身神经通用控制器。模型用150万参数实现对机器人复杂动作的控制,能适应多样任务如导航、桌面操作和移动操作等,每种任务需要独特的控制模式。HOVER的核心创新在于用全身运动模仿作为各种任务的通用抽象,提供通用的运动技能,用在学习多种全身控制模式。基于多模式策略蒸馏框架将不同控制模式整合到统一的策略中,实现模式间的无缝切换,且保留每种模式的优势,提高未来人形机器人应用的效率和灵活性。

HOVER的功能特色

多模式控制:HOVER能无缝切换不同的控制模式,如导航、桌面操作和移动操作等,每种模式都有特定的控制需求。

运动学位置跟踪:HOVER支持对机器人关键部位的3D位置进行跟踪,实现精确的运动复制。

关节角度跟踪:HOVER能跟踪每个机器人电机的目标关节角度,实现复杂的肢体动作。

根跟踪:HOVER能跟踪机器人的根速度、高度和方向,对保持平衡和执行动态动作至关重要。

统一命令空间:HOVER设计统一的命令空间,适应各种控制设备,如操纵杆、动作捕捉系统、外骨骼和虚拟现实头设。

策略蒸馏:HOVER从Oracle策略中提取和蒸馏,将多种控制技能整合到单一的“通用策略”中,提高效率和灵活性。

HOVER的技术原理

本体感觉和命令屏蔽:HOVER基于本体感觉(机器人自身的状态感知)和命令屏蔽(选择性激活不同的命令空间)确定任务命令,支持独立控制机器人的上半身和下半身。

多模式策略蒸馏框架:HOVER用策略蒸馏技术,将从大规模人类运动数据中学习到的Oracle策略转化为能处理多种控制模式的单一策略。

DAgger框架:HOVER采用DAgger(Dataset Aggregation)框架对齐学生策略和Oracle策略的动作,基于监督学习优化学生策略。

模拟训练:HOVER的训练在NVIDIA Isaac模拟套件中进行,套件基于GPU加速,能快速模拟长时间的训练,将模型迁移到现实世界中,无需额外的微调。

统一命令空间设计:HOVER的命令空间设计既通用又原子,能覆盖大多数现有的控制配置,且能任意组合支持各种模式。

运动重定向:HOVER能将人类动作数据集重定向为机器人动作数据集,基于匹配关键点和优化参数实现。

HOVER项目介绍

项目官网:hover-versatile-humanoid.github.io

arXiv技术论文:https://arxiv.org/pdf/2410.21229

HOVER能做什么?

导航与移动:HOVER能控制人形机器人在复杂环境中进行导航和移动,如在不平坦的地面上行走或在狭窄的空间中穿梭,适于搜索救援、导览服务等场景。

桌面操作:在需要精细操作的桌面任务中,如组装电子元件或进行实验室工作,HOVER能精确控制机器人的上肢和手部关节,实现复杂的手眼协调操作。

移动操作(Loco-manipulation):结合移动与操作的任务,例如在移动过程中抓取和搬运物体,HOVER能协调机器人的全身动作,实现流畅的搬运和操作任务。

人机交互:HOVER支持各种输入设备(如VR头盔、动作捕捉系统、外骨骼)进行人机交互,让机器人能模仿人类的动作和行为,适于娱乐、教育和培训等领域。

远程操作与仿真:在远程操作场景中,HOVER能实时响应操作者的指令,执行精确的远程任务,如远程手术辅助或危险环境作业。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • sunoh.ai
    sunoh.ai Sunoh是一款基于人工智能的医学记录助手,将医生和患者之间的自然对话转化为临床记录。Sunoh为医生和患者提供独特而沉浸式的体验,使临床记录的过程比...
  • i18n web
    i18n web 用i18n Web轻松地将您的网站的JSON和Markdown文件转换。在支持多种语言的同时,保持结构和准确性。对于寻求网站本地化的精确性和效率的开发...
  • SpeechFlow
    SpeechFlow SpeechFlow是一个强大的语音转文字API,提供高准确率的语音转文字功能。它支持14种语言,可将语音、音频转换为文字,适用于各种场景和行业。Sp...
  • AI助手
    AI助手 在8月1日举行的ISC.AI2024第十二届互联网安全大会·人工智能峰会上,360创始人周鸿祎发布了名为“AI助手”的新产品。这款产品集成了国内16家...
  • SpeechGPT2
    SpeechGPT2 SpeechGPT2是由复旦大学计算机科学学院开发的端到端语音对话语言模型,能够感知并表达情感,并根据上下文和人类指令以多种风格提供合适的语音响应。该...
  • NCF3
    NCF3 无代码创始人是全球最大的无代码社区,拥有18,070名创始人和企业家使用无代码工具来更快、更便宜地构建和发展业务。加入我们的社区,与其他创始人建立有意...
  • Ariwave
    Ariwave Ariwave是一款AI图像生成工具,它可以根据用户的想象创造出任何图像。无论是现实世界的照片还是奇幻的幻想作品,Ariwave都能帮助用户实现。它使...
  • Resign.ai
    Resign.ai Resign.ai是一个免费的辞职信生成工具,可在30秒内创建完美辞职信。只需提供工作和情况的相关细节,我们将利用成千上万个人力资源专业人士的集体智慧...