MimicLite | RoboParty Lab

核心亮点

MimicLite 是 RoboParty Lab 首批公开的开源 codebase：用 8 GPU 和约 1/500 的 SONIC 算力训练出接近 SONIC 级别的人形机器人通用运动跟踪策略，并打通数据、资产、训练、遥操作与 Sim2Real 部署全链路。

首个开源 codebase MimicLite 上线：8 GPU 训练 SONIC 级人形机器人通用运动跟踪策略，打通数据、资产、训练、遥操作与 Sim2Real 部署全链路。

训练资源

8 GPU

用于核心训练的资源规模。

训练时间

2 小时

用于验证轻量训练路径。

算力规模

1/500

约为 SONIC 训练算力的 1/500。

遥操作延迟

0.1 秒

Pico 低延迟遥操作目标。

项目简介

MimicLite 把 motion data、robot assets、reinforcement learning、teleoperation 和 Sim2Real deployment 组织成一套可复现、可复用的开源 codebase。它不只发布训练脚本，也公开围绕人形机器人运动跟踪所需的基础工程链路。

技术方法

快速可扩展训练

MimicLite 仅使用 SONIC 约 1/500 级别的训练算力，用 8 卡 H200 训练约 2 个小时，即可在根部追踪等关键指标上达到接近 SONIC 的效果。系统支持 mjlab 与 IsaacLab 仿真后端，并兼容 PPO 和 SAC 强化学习算法。

运动跟踪基础设施

mjhub 用于统一管理机器人 asset，降低机器人模型资产维护成本；any4hdmi 用于 motion dataset 的 convert、process、visualize 和 load，将 LAFAN、100STYLE、SONIC、Real 等动作数据统一成存储高效的 HDMI 格式，并支持自动缓存前向运动学结果。

低延迟遥操作

MimicLite 支持约 0.1 秒端到端延迟的 Pico 低延迟遥操作。Pico / XR 输入被实时转换为参考动作，策略根据机器人状态和参考运动输出低层控制目标，并可以在 MuJoCo 和真实机器人之间复用同一套接口。

模块化 Sim2Real

Sim2Real 部署侧支持自定义 observation function 作为 policy 输入。Agent 可以追踪外部训练代码，实现对应 obs function，并生成 deploy YAML，从而在 10 分钟级别把外部 codebase 训练出的 policy 接入 MimicLite 的部署链路。

评估结果

公开文案中，MimicLite 已在根部追踪等关键指标上达到接近 SONIC 的效果，并在真机上支持转身、侧步、折返跑、低姿态下蹲、跪地起身等连续动作切换。后续会继续补充训练曲线、动作完成度、资源消耗和不同机器人本体上的表现。

讨论

MimicLite 的价值不只在训练结果，也在于统一数据、资产、训练后端、policy artifact 和部署链路。它可以作为跨 codebase policy 统一评测和真机部署的适配层，减少研发过程中重复编写 glue code 的成本。

结论

MimicLite 将高成本的人形机器人运动跟踪训练，整理成更轻量、更模块化、更适合开源协作的 codebase 和 infra，是 RoboParty Lab 首批公开开放样本之一。

资源链接

GitHub、训练配置、示例数据、模型权重、技术报告和引用信息将在正式公开后持续补充。