
核心亮点
MimicLite 是 RoboParty Lab 首批公开的开源 codebase:用 8 GPU 和约 1/500 的 SONIC 算力训练出接近 SONIC 级别的人形机器人通用运动跟踪策略,并打通数据、资产、训练、遥操作与 Sim2Real 部署全链路。
首个开源 codebase MimicLite 上线:8 GPU 训练 SONIC 级人形机器人通用运动跟踪策略,打通数据、资产、训练、遥操作与 Sim2Real 部署全链路。
项目简介
MimicLite 把 motion data、robot assets、reinforcement learning、teleoperation 和 Sim2Real deployment 组织成一套可复现、可复用的开源 codebase。它不只发布训练脚本,也公开围绕人形机器人运动跟踪所需的基础工程链路。
相关工作
MimicLite 与 SONIC、mjlab / IsaacLab、PPO / SAC、humanoid-gpt、twist2、teleopit 等训练与部署路线相关。它的价值在于把这些路线中分散的训练、资产、数据格式和部署适配成本,收敛到更统一的 codebase 中。
技术方法
快速可扩展训练
MimicLite 仅使用 SONIC 约 1/500 级别的训练算力,用 8 卡 H200 训练约 2 个小时,即可在根部追踪等关键指标上达到接近 SONIC 的效果。系统支持 mjlab 与 IsaacLab 仿真后端,并兼容 PPO 和 SAC 强化学习算法。
运动跟踪基础设施
mjhub 用于统一管理机器人 asset,降低机器人模型资产维护成本;any4hdmi 用于 motion dataset 的 convert、process、visualize 和 load,将 LAFAN、100STYLE、SONIC、Real 等动作数据统一成存储高效的 HDMI 格式,并支持自动缓存前向运动学结果。
低延迟遥操作
MimicLite 支持约 0.1 秒端到端延迟的 Pico 低延迟遥操作。Pico / XR 输入被实时转换为参考动作,策略根据机器人状态和参考运动输出低层控制目标,并可以在 MuJoCo 和真实机器人之间复用同一套接口。
模块化 Sim2Real
Sim2Real 部署侧支持自定义 observation function 作为 policy 输入。Agent 可以追踪外部训练代码,实现对应 obs function,并生成 deploy YAML,从而在 10 分钟级别把外部 codebase 训练出的 policy 接入 MimicLite 的部署链路。
评估结果
公开文案中,MimicLite 已在根部追踪等关键指标上达到接近 SONIC 的效果,并在真机上支持转身、侧步、折返跑、低姿态下蹲、跪地起身等连续动作切换。后续会继续补充训练曲线、动作完成度、资源消耗和不同机器人本体上的表现。
讨论
MimicLite 的价值不只在训练结果,也在于统一数据、资产、训练后端、policy artifact 和部署链路。它可以作为跨 codebase policy 统一评测和真机部署的适配层,减少研发过程中重复编写 glue code 的成本。
结论
MimicLite 将高成本的人形机器人运动跟踪训练,整理成更轻量、更模块化、更适合开源协作的 codebase 和 infra,是 RoboParty Lab 首批公开开放样本之一。
资源链接
GitHub、训练配置、示例数据、模型权重、技术报告和引用信息将在正式公开后持续补充。