MimicLite

核心亮点

MimicLite 是 RoboParty Lab 面向人形机器人通用运动跟踪的开源训练与部署项目。它用 8 GPU 和约 1/500 的 SONIC 算力训练出接近 SONIC 级别的运动跟踪策略，并把数据、资产、训练、遥操作与 Sim2Real 部署打通成一条可复现的工程链路。

它不是一段单独的训练脚本，而是一套围绕 humanoid motion tracking 组织起来的 codebase 和 infra。

训练资源

8 GPU

使用 8 卡 H200 完成核心训练。

算力规模

1/500

目标算力约为 SONIC 的 1/500。

训练时间

2 小时

用于验证 SONIC 级运动跟踪策略的轻量训练路径。

遥操作延迟

0.1 秒

Pico 低延迟遥操作的端到端目标。

项目简介

MimicLite 关注一个很实际的问题：如何用更低成本、更轻量的训练流程，让通用人形机器人运动跟踪策略更容易被复现、扩展和部署。

项目围绕 motion data、robot assets、policy artifact、teleoperation 和 Sim2Real deployment 展开。mjhub 用于统一管理机器人资产，any4hdmi 用于动作数据的 convert、process、visualize 和 load，训练后得到的策略可以继续进入遥操作和真实机器人部署链路。

技术方法

快速可扩展训练

MimicLite 仅使用 SONIC 约 1/500 级别的训练算力，用 8 卡 H200 训练约 2 个小时，就能在根部追踪等关键指标上达到接近 SONIC 的效果。系统支持 mjlab 与 IsaacLab 仿真后端，兼容 PPO 和 SAC 强化学习算法，并保留继续随并行环境数、GPU 数量和模型容量扩展的空间。

运动跟踪基础设施

MimicLite 将机器人资产、动作数据格式、policy artifact 和训练后端组织成统一链路。mjhub 降低机器人模型资产维护成本，any4hdmi 将 LAFAN、100STYLE、SONIC、Real 等动作数据统一成存储高效的 HDMI 格式，并支持自动缓存前向运动学结果。

低延迟遥操作

MimicLite 支持约 0.1 秒端到端延迟的 Pico / XR 遥操作。XR 输入会被实时转换为参考动作，策略根据机器人状态和参考运动输出低层控制目标，并可以在 MuJoCo 和真实机器人之间复用同一套接口。

模块化 Sim2Real

Sim2Real 部署侧支持自定义 observation function 作为 policy 输入。Agent 可以追踪外部训练代码，实现对应 obs function，并生成 deploy YAML，从而把外部 codebase 训练出的 policy 接入 MimicLite 的部署链路。

准备动作数据

整理动作来源、机器人资产和训练所需的数据格式。

配置训练任务

确定 observation、reward、资源数量和训练参数。

训练与监控

启动策略训练，观察 loss、step、资源占用和关键行为指标。

导出与部署

导出 policy artifact，并接入 Sim2Real 或机器人部署链路。

Step 0 of 0