MimicLite

面向人形机器人通用运动跟踪的开源训练与部署项目,用 8 GPU 和约 1/500 的 SONIC 算力打通数据、资产、训练、遥操作与 Sim2Real 部署。

MimicLite

核心亮点

MimicLite 是 RoboParty Lab 面向人形机器人通用运动跟踪的开源训练与部署项目。它用 8 GPU 和约 1/500 的 SONIC 算力训练出接近 SONIC 级别的运动跟踪策略,并把数据、资产、训练、遥操作与 Sim2Real 部署打通成一条可复现的工程链路。

它不是一段单独的训练脚本,而是一套围绕 humanoid motion tracking 组织起来的 codebase 和 infra。

训练资源
8 GPU
使用 8 卡 H200 完成核心训练。
算力规模
1/500
目标算力约为 SONIC 的 1/500。
训练时间
2 小时
用于验证 SONIC 级运动跟踪策略的轻量训练路径。
遥操作延迟
0.1 秒
Pico 低延迟遥操作的端到端目标。

项目简介

MimicLite 关注一个很实际的问题:如何用更低成本、更轻量的训练流程,让通用人形机器人运动跟踪策略更容易被复现、扩展和部署。

项目围绕 motion data、robot assets、policy artifact、teleoperation 和 Sim2Real deployment 展开。mjhub 用于统一管理机器人资产,any4hdmi 用于动作数据的 convert、process、visualize 和 load,训练后得到的策略可以继续进入遥操作和真实机器人部署链路。

相关工作

MimicLite 可以放在通用人形机器人运动跟踪、强化学习控制、motion imitation、Sim2Real 部署和低延迟遥操作等方向中理解。

它参考并连接了 SONIC、mjlab / IsaacLab、PPO / SAC、humanoid-gpt、twist2、teleopit 等训练与部署路线。MimicLite 更强调把已有高成本方案中的能力,以更轻量、更可复现的 codebase / infra 方式沉淀下来。

技术方法

快速可扩展训练

MimicLite 仅使用 SONIC 约 1/500 级别的训练算力,用 8 卡 H200 训练约 2 个小时,就能在根部追踪等关键指标上达到接近 SONIC 的效果。系统支持 mjlab 与 IsaacLab 仿真后端,兼容 PPO 和 SAC 强化学习算法,并保留继续随并行环境数、GPU 数量和模型容量扩展的空间。

运动跟踪基础设施

MimicLite 将机器人资产、动作数据格式、policy artifact 和训练后端组织成统一链路。mjhub 降低机器人模型资产维护成本,any4hdmi 将 LAFAN、100STYLE、SONIC、Real 等动作数据统一成存储高效的 HDMI 格式,并支持自动缓存前向运动学结果。

低延迟遥操作

MimicLite 支持约 0.1 秒端到端延迟的 Pico / XR 遥操作。XR 输入会被实时转换为参考动作,策略根据机器人状态和参考运动输出低层控制目标,并可以在 MuJoCo 和真实机器人之间复用同一套接口。

模块化 Sim2Real

Sim2Real 部署侧支持自定义 observation function 作为 policy 输入。Agent 可以追踪外部训练代码,实现对应 obs function,并生成 deploy YAML,从而把外部 codebase 训练出的 policy 接入 MimicLite 的部署链路。

准备动作数据
整理动作来源、机器人资产和训练所需的数据格式。
配置训练任务
确定 observation、reward、资源数量和训练参数。
训练与监控
启动策略训练,观察 loss、step、资源占用和关键行为指标。
导出与部署
导出 policy artifact,并接入 Sim2Real 或机器人部署链路。
Step 0 of 0

评估结果

当前公开文案中,MimicLite 已在根部追踪等关键指标上达到接近 SONIC 的效果,并在真机上支持转身、侧步、折返跑、低姿态下蹲、跪地起身等连续动作切换。正式素材到位后,这一部分会优先补充训练曲线、对比视频和真实机器人部署效果。

讨论

MimicLite 的价值不只在训练结果,也在于统一数据、资产、训练后端、策略 artifact 和部署链路。它可以成为跨 codebase policy 统一评测和真机部署的适配层,减少每个数据集、机器人或训练后端重复编写 glue code 的成本。

结论

MimicLite 希望把人形机器人运动跟踪从高成本、难复现的单点实验,推进到更轻量、更模块化、更适合开源协作的工程链路中。

资源链接

GitHub、训练配置、示例数据、模型权重、技术报告和引用信息将在正式公开后持续补充。