MimicLite

RoboParty Lab 首批公开开源 codebase,用 8 GPU 和约 1/500 的 SONIC 算力训练接近 SONIC 级的人形机器人通用运动跟踪策略。

MimicLite

核心亮点

MimicLite 是 RoboParty Lab 首批公开的开源 codebase:用 8 GPU 和约 1/500 的 SONIC 算力训练出接近 SONIC 级别的人形机器人通用运动跟踪策略,并打通数据、资产、训练、遥操作与 Sim2Real 部署全链路。

首个开源 codebase MimicLite 上线:8 GPU 训练 SONIC 级人形机器人通用运动跟踪策略,打通数据、资产、训练、遥操作与 Sim2Real 部署全链路。

训练资源
8 GPU
用于核心训练的资源规模。
训练时间
2 小时
用于验证轻量训练路径。
算力规模
1/500
约为 SONIC 训练算力的 1/500。
遥操作延迟
0.1 秒
Pico 低延迟遥操作目标。

项目简介

MimicLite 把 motion data、robot assets、reinforcement learning、teleoperation 和 Sim2Real deployment 组织成一套可复现、可复用的开源 codebase。它不只发布训练脚本,也公开围绕人形机器人运动跟踪所需的基础工程链路。

相关工作

MimicLite 与 SONIC、mjlab / IsaacLab、PPO / SAC、humanoid-gpt、twist2、teleopit 等训练与部署路线相关。它的价值在于把这些路线中分散的训练、资产、数据格式和部署适配成本,收敛到更统一的 codebase 中。

技术方法

快速可扩展训练

MimicLite 仅使用 SONIC 约 1/500 级别的训练算力,用 8 卡 H200 训练约 2 个小时,即可在根部追踪等关键指标上达到接近 SONIC 的效果。系统支持 mjlab 与 IsaacLab 仿真后端,并兼容 PPO 和 SAC 强化学习算法。

运动跟踪基础设施

mjhub 用于统一管理机器人 asset,降低机器人模型资产维护成本;any4hdmi 用于 motion dataset 的 convert、process、visualize 和 load,将 LAFAN、100STYLE、SONIC、Real 等动作数据统一成存储高效的 HDMI 格式,并支持自动缓存前向运动学结果。

低延迟遥操作

MimicLite 支持约 0.1 秒端到端延迟的 Pico 低延迟遥操作。Pico / XR 输入被实时转换为参考动作,策略根据机器人状态和参考运动输出低层控制目标,并可以在 MuJoCo 和真实机器人之间复用同一套接口。

模块化 Sim2Real

Sim2Real 部署侧支持自定义 observation function 作为 policy 输入。Agent 可以追踪外部训练代码,实现对应 obs function,并生成 deploy YAML,从而在 10 分钟级别把外部 codebase 训练出的 policy 接入 MimicLite 的部署链路。

评估结果

公开文案中,MimicLite 已在根部追踪等关键指标上达到接近 SONIC 的效果,并在真机上支持转身、侧步、折返跑、低姿态下蹲、跪地起身等连续动作切换。后续会继续补充训练曲线、动作完成度、资源消耗和不同机器人本体上的表现。

讨论

MimicLite 的价值不只在训练结果,也在于统一数据、资产、训练后端、policy artifact 和部署链路。它可以作为跨 codebase policy 统一评测和真机部署的适配层,减少研发过程中重复编写 glue code 的成本。

结论

MimicLite 将高成本的人形机器人运动跟踪训练,整理成更轻量、更模块化、更适合开源协作的 codebase 和 infra,是 RoboParty Lab 首批公开开放样本之一。

资源链接

GitHub、训练配置、示例数据、模型权重、技术报告和引用信息将在正式公开后持续补充。