[{"data":1,"prerenderedAt":134},["ShallowReactive",2],{"project-content-zh-bfm-tldr":3},{"id":4,"title":5,"body":6,"description":123,"extension":124,"meta":125,"navigation":129,"path":130,"seo":131,"stem":132,"__hash__":133},"projects\u002Fprojects\u002Fzh\u002Fbfm-tldr.md","BFM-TLDR",{"type":7,"value":8,"toc":105},"minimark",[9,13,17,33,36,39,42,45,48,51,54,58,61,65,68,71,74,78,81,84,87,90,93,96,99,102],[10,11,12],"h2",{"id":12},"核心亮点",[14,15,16],"p",{},"BFM-TLDR 是 RoboParty Lab 面向人形机器人无监督强化学习控制的项目方向。它关注如何让研究者更容易复现 SOTA 无监督控制算法、探索新的行为表示、适配不同机器人平台，并实现从训练到真实机器人遥操作部署的一体化开发。",[18,19,20,24,27,30],"ul",{},[21,22,23],"li",{},"Fast Training Infrastructure：支持 Isaac Lab 与 MJLab，并兼容单卡、多卡并行训练。",[21,25,26],{},"Beyond FB Representation：在经典 BFM-Zero \u002F FB Representation 之外，探索 Temporal Distance Representation（TLDR）等新型行为表示。",[21,28,29],{},"Flexible Data Distribution：支持不同来源数据的混合训练和灵活配比。",[21,31,32],{},"Teleoperation Codebase & Demo：面向真实机器人部署的遥操作代码和验证方案。",[10,34,35],{"id":35},"项目简介",[14,37,38],{},"这个项目当前仍处于对外材料整理阶段，正式名称和链接还会继续确认。根据公开文案，它会是一套面向研发的开源无监督强化学习控制开发框架，覆盖训练基础设施、数据管线、算法研究和推理部署全流程。",[14,40,41],{},"项目的目标不是只展示一个 demo，而是降低无监督强化学习控制的研发门槛，让开发者能更快复现方法、切换机器人平台、测试新的 representation，并把策略带到真实机器人上验证。",[10,43,44],{"id":44},"相关工作",[14,46,47],{},"BFM-TLDR 和 humanoid behavior foundation model、unsupervised reinforcement learning、FB Representation、Temporal Distance Representation、motion data mixture 和 teleoperation deployment 等方向相关。",[14,49,50],{},"它更偏向“研究框架 + 工程验证”的结合：既服务表示学习和算法探索，也关注并行训练、数据调度、真实机器人遥操作和复杂全身动作验证。",[10,52,53],{"id":53},"技术方法",[55,56,57],"h3",{"id":57},"快速训练基础设施",[14,59,60],{},"框架计划支持 Isaac Lab 与 MJLab，兼容单卡和多卡并行训练。统一 codebase 不再受限于特定机器人，可以更快迁移到不同机器人形态。",[55,62,64],{"id":63},"超越-fb-表征","超越 FB 表征",[14,66,67],{},"除集成经典 BFM-Zero（FB Representation）外，项目会支持多种行为表示的无监督学习研究。公开文案中已经提到 Temporal Distance Representation（TLDR）等新型表示，并将其作为探索更通用控制算法的方向。",[55,69,70],{"id":70},"灵活数据分布",[14,72,73],{},"框架会支持来自不同来源的数据混合训练和灵活数据调度。通过合理的数据分布设计，无监督强化学习不仅要学习稳定通用运动，也要支持侧手翻等高动态动作的学习。",[55,75,77],{"id":76},"遥操作代码库与-demo","遥操作代码库与 Demo",[14,79,80],{},"项目计划开放无监督强化学习控制的遥操作代码和验证方案，支持真实机器人部署。文案中提到的动作包括深蹲、半蹲、跪地、打滚、跌倒恢复以及抗外力扰动等复杂全身动作。",[10,82,83],{"id":83},"评估结果",[14,85,86],{},"结果评估会重点关注无监督控制策略在真实机器人上的动作稳定性、复杂全身动作完成度、跨机器人适配能力和数据分布对训练效果的影响。正式素材公开后，这一部分会补充视频、曲线和对比结论。",[10,88,89],{"id":89},"讨论",[14,91,92],{},"BFM-TLDR 更像 RoboParty Lab 中长期演化的基础模型和无监督控制方向。它需要持续接入数据、任务、训练工具和真实机器人验证，也适合在后续 tech report、publication 和开源 codebase 中继续展开。",[10,94,95],{"id":95},"结论",[14,97,98],{},"BFM-TLDR 的目标是把人形机器人无监督控制研究沉淀成可复用、可扩展的开源基础设施，为后续 codebase、infra、tech report 和 publication 提供统一底座。",[10,100,101],{"id":101},"资源链接",[14,103,104],{},"正式名称、项目主页、GitHub、数据集、模型权重、技术报告、论文和引用信息将在公开后补充。",{"title":106,"searchDepth":107,"depth":107,"links":108},"",2,[109,110,111,112,119,120,121,122],{"id":12,"depth":107,"text":12},{"id":35,"depth":107,"text":35},{"id":44,"depth":107,"text":44},{"id":53,"depth":107,"text":53,"children":113},[114,116,117,118],{"id":57,"depth":115,"text":57},3,{"id":63,"depth":115,"text":64},{"id":70,"depth":115,"text":70},{"id":76,"depth":115,"text":77},{"id":83,"depth":107,"text":83},{"id":89,"depth":107,"text":89},{"id":95,"depth":107,"text":95},{"id":101,"depth":107,"text":101},"面向人形机器人无监督强化学习控制的开源开发框架，覆盖训练基础设施、行为表示、数据分布和遥操作部署。","md",{"slug":126,"coverImage":127,"status":128,"published":129},"bfm-tldr","\u002Fimages\u002Fjoin-us\u002Fjoin-us-hero-poster.jpg","coming-soon",true,"\u002Fprojects\u002Fzh\u002Fbfm-tldr",{"title":5,"description":123},"projects\u002Fzh\u002Fbfm-tldr","c6Ntc5Cx_I-u70FHTUNN0HdHkOQ0gwoOOeJaQ8XUc-s",1782988731080]