DrivingDojo是什么?一文让你看懂DrivingDojo的技术原理、主要功能、应用场景

来源:卓商AI
发布时间:2025-04-05

DrivingDojo概述简介

DrivingDojo是中国科学院自动化研究所与美团无人车团队合作推出的数据集,用在训练和研究复杂的自动驾驶交互式世界模型。数据集包含18,000个视频片段,覆盖完整的驾驶操作、多智能体交互以及丰富的开放世界驾驶知识,为开发下一代自动驾驶模型提供了坚实的基础。DrivingDojo定义了动作指令跟随(AIF)基准,用在评估世界模型在执行动作控制的未来预测方面的能力。

DrivingDojo的功能特色

交互式世界模型训练:DrivingDojo提供一个平台,用在训练理解和模拟复杂驾驶动态的交互式世界模型。

动作指令跟随(AIF):数据集定义AIF基准,评估世界模型在遵循动作指令生成未来预测的能力。

多样化驾驶操作:基于DrivingDojo-Action子集,模型学习加速、减速、紧急制动和车道变换等多样化的驾驶操作。

多智能体交互:用DrivingDojo-Interplay子集,模型能理解和预测车辆与其他道路使用者之间的复杂交互。

开放世界知识:用DrivingDojo-Open子集,模型学习处理开放世界中的罕见事件和长尾场景。

视频生成与预测:模型基于初始帧和动作指令生成未来的视频,模拟和预测驾驶场景。

DrivingDojo的技术原理

数据收集:用美团无人车团队的自动驾驶车辆平台收集视频数据,。

数据策划:从大量收集的数据中精选出包含丰富驾驶操作、多智能体交互和开放世界知识的视频片段。

动作编码:将驾驶动作(如加速、制动、转向)编码为模型能理解的格式,方便在视频生成中使用。

视频生成模型:基于如Stable Video Diffusion等技术,开发从初始帧和动作指令生成视频的模型。

动作指令跟随(AIF):比较生成视频与输入动作指令的一致性,评估模型的预测准确性。

评估指标:用FID(Frechet Inception Distance)和FVD(Frechet Video Distance)等指标评估生成视频的视觉质量,用AIF错误评估动作指令的跟随能力。

DrivingDojo项目介绍

项目官网:drivingdojo.github.io

GitHub仓库:https://github.com/Robertwyq/Drivingdojo

HuggingFace模型库:https://huggingface.co/datasets/Yuqi1997/DrivingDojo

arXiv技术论文:https://arxiv.org/pdf/2410.10738

DrivingDojo能做什么?

自动驾驶算法开发:开发人员开发和测试自动驾驶车辆的感知、预测和决策算法。

世界模型训练:数据集用在训练模拟真实世界驾驶环境的交互式世界模型,模型能预测未来的状态和可能的事件。

多智能体交互模拟:模拟车辆与其他道路使用者(如行人、自行车、其他车辆)之间的交互,优化自动驾驶车辆的交互策略。

罕见事件和长尾场景处理:训练模型识别和响应罕见事件,如动物突然横穿道路或道路上的障碍物,提高自动驾驶系统的安全性。

虚拟测试和验证:在虚拟环境中测试自动驾驶系统,减少实车测试的成本和风险,加速开发流程。

© 版权声明:本站所有原创文章版权均归卓商AI工具集及原创作者所有,未经允许任何个人、媒体、网站不得转载或以其他方式抄袭本站任何文章。
卓商AI
卓商AI

AI爱好者的一站式人工智能AI工具箱,累计收录全球10,000⁺好用的AI工具软件和网站,方便您更便捷的探索前沿的AI技术。本站持续更新好的AI应用,力争做全球排名前三的AI网址导航网站,欢迎您成为我们的一员。

猜你喜欢
  • CallZen.AI
    CallZen.AI CallZen是一款智能联系中心软件,通过人工智能技术实现对通话的智能分析和监控。它可以帮助用户了解客户需求、分析对话情绪、自动审核合规性、跟踪和评估...
  • Sona
    Sona Sona是一款能够记录、转录、总结和聊天的应用程序,它通过捕捉对话并提供最重要的见解来提升用户的工作效率。Sona可以在多种设备上使用,包括Apple...
  • Noise Eraser
    Noise Eraser Noise Eraser是一款能够辨識并去除音频文件中的背景噪音的工具,提升人声的清晰程度。它使用 AI 技术对音频进行处理,可以帮助用户消除风声、雨...
  • Talks
    Talks Talks是一个提供最美观、简洁易用的视频会议服务的平台。我们致力于为企业和个人提供最宁静、美丽的工作、创作、销售和谈判体验。我们的目标是成为创意行业...
  • godaddy domain generator
    godaddy domain generator 使用Godaddy的AI域名生成器生成独特而引人注目的域名。只需输入单词或短语,并为您的网站获取创意建议。另外,它是完全免费的!从人群中脱颖而出,轻松...
  • Wavtool
    Wavtool WavTool是一款在浏览器中使用AI助手免费制作高质量音乐的产品。它提供了一系列强大的功能,包括音乐创作、音频编辑、混音和编曲等。用户可以通过简单的...
  • Merlin API Platform
    Merlin API Platform Merlin提供统一的API和SDK,用于将LLM/LLVM快速集成到生产应用中。性能高、可靠、易于使用。它可以在5分钟内将Google的Gemini...
  • ChatGPT Minimap
    ChatGPT Minimap ChatGPT Minimap 是一款 Chrome 扩展插件,旨在提升用户在使用 ChatGPT 时的交互体验。它通过在页面侧边提供一个迷你Map,...