跳到主要内容

数据生成概览

概述

数据生成是DISCOVERSE的重要功能之一,包括自动化数据收集和先进的域随机化技术。通过这些工具,用户可以高效地生成大量多样化的机器人学习数据,显著提升模型的泛化能力和Sim2Real迁移效果。

🎯 核心功能

自动化数据收集

  • 多机器人平台支持(AirbotPlay、MMK2等)
  • 并行数据生成提升效率
  • 多模态数据同步采集(RGB、深度、掩码)

域随机化技术

  • 基于生成模型的视觉变换
  • 光流驱动的时序一致性
  • ComfyUI集成的专业渲染

数据格式转换

  • 支持多种学习算法格式
  • HDF5、Zarr等标准格式
  • 自动化转换流程

📚 教程列表

自动化数据收集

学习如何使用DISCOVERSE的自动化数据收集系统,包括:

  • 多机器人平台数据生成
  • 并行处理配置
  • 数据质量控制

域随机化技术

掌握先进的域随机化方法,包括:

  • ComfyUI生成模型集成
  • 光流时序处理
  • 视觉场景变换

🚀 快速开始

# 1. 生成训练数据
python scripts/tasks_data_gen.py \
--robot_name airbot_play \
--task_name kiwi_place \
--track_num 100 \
--nw 8

# 2. 应用域随机化(可选)
cd discoverse/randomain
python generate.py \
--task_name kiwi_place \
--work_dir 000 \
--cam_id 0

# 3. 转换数据格式
python policies/act/data_process/raw_to_hdf5.py \
-md mujoco \
-dir data \
-tn kiwi_place \
-vn cam_0 cam_1

📊 性能优势

指标传统方法DISCOVERSE
数据生成速度1x100x
Sim2Real成功率45%84%
数据多样性
自动化程度部分完全

下一步