当前位置: 首页 > article >正文

论文精读:Multi-Loco —— 统一形态 legged 机器人的运动控制新范式

标题Multi-Loco: Unifying Multi-Embodiment Legged Locomotion via Reinforcement Learning Augmented Diffusion机构南方科技大学、圣母大学、浙江大学-UIUC学院、逐际动力 (LimX Dynamics)项目链接https://multi-loco.github.io/0. 引言打破“一机一策”的僵局在具身智能Embodied AI领域实现跨形态Multi-Embodiment的泛化一直是个难题。传统的强化学习RL通常针对特定机器人如四足、双足、人形单独训练因为它们的自由度、动力学特性和观测空间各不相同。Multi-Loco提出了一种创新的架构它不需要显式的形态描述符如结构编码而是通过 Diffusion Model 学习通用的运动先验再利用轻量化残差 RL 策略进行在线修正。这种方法让一个模型同时驱动四足、轮足、双足和人形机器人成为可能。1. 核心贡献形态无关的生成式架构结合了形态无关的 Diffusion Model 与轻量化残差策略Residual Policy。运动流形共享证明了不同形态的机器人可以共享一个通用的“运动流形”Locomotion Manifold实现正向知识迁移。零样本迁移 (Zero-shot Sim2Real)在仿真中训练的统一策略可以直接部署到真实的多种 legged 机器人平台上。2. 系统架构 (Methodology)Multi-Loco 的框架由三个关键环节组成解决了“维度不统一”、“多模态分布”和“环境鲁棒性”三大挑战。(1) 维度对齐Zero-Padding 与 Masked Input为了让同一个网络处理不同自由度的机器人作者采用了最直接但有效的方案维度对齐。Zero-padding将所有机器人的观测Observation和动作Action统一填充到固定的最大维度空间。对于不存在的关节直接补 0。Mask 向量 (bbb)引入一个二进制掩码向量显式地告知网络哪些维度是真实物理存在的。MinMax 归一化确保不同量纲的传感器数据在同一尺度下运算。(2) Diffusion Prior捕捉运动的“多模态”运动控制本质上是一个多模态问题Multi-modality在给定的观测下合理的动作往往不是唯一的而是一组概率分布。Multi-Loco 使用基于EDM (Elucidating Diffusion Models)和DiT (Diffusion Transformer)的生成模型核心公式Masked Denoising Score MatchingDiffusion 的目标是训练一个去噪器DθD_\thetaDθ​其损失函数定义为LdiffEaˉ∼μ,n∼N(0,σ2I),oˉ,σ[λ(σ)∥M⋅(Dθ(aˉn,oˉ,σ)−aˉ)∥22]\mathcal{L}_{diff} \mathbb{E}_{\bar{a} \sim \mu, n \sim \mathcal{N}(0, \sigma^2 I), \bar{o}, \sigma} \left[ \lambda(\sigma) \| M \cdot (D_\theta(\bar{a} n, \bar{o}, \sigma) - \bar{a}) \|_2^2 \right]Ldiff​Eaˉ∼μ,n∼N(0,σ2I),oˉ,σ​[λ(σ)∥M⋅(Dθ​(aˉn,oˉ,σ)−aˉ)∥22​]公式解读aˉ\bar{a}aˉ统一空间中的真实动作Ground Truth。aˉn\bar{a} naˉn添加噪声后的带噪动作。DθD_\thetaDθ​去噪器网络。输入带噪动作、当前观测oˉ\bar{o}oˉ和噪声强度σ\sigmaσ预测原始干净动作。MMM(Masking)这是关键。它让DθD_\thetaDθ​仅关注“真实物理关节”的维度无视填充的 0从而只在有效维度上进行学习。λ(σ)\lambda(\sigma)λ(σ)权重函数平衡不同噪声水平下的损失贡献。(3) Residual RL在线实时修正虽然 Diffusion Model 学习了强大的动作先验Offline但它在处理复杂动态地形或特定任务细节时可能不够精准。因此作者引入了在线强化学习 (Online RL)Actor接收 Diffusion 的输出作为基准加上一个轻量级的残差输出Δa\Delta aΔa。Multi-Critic 架构为了加速收敛并提高稳定性采用多评论家网络评估状态价值。Residual Penalty在奖励函数中限制Δa\Delta aΔa的幅度确保机器人不会偏离 Diffusion 学到的“优雅运动模式”太远。3. 奖励函数设计 (Reward Design)为了平衡性能与物理一致性奖励函数分为三大部分类别主要项作用Locomotion 任务项速度/角速度追踪、底盘高度限制确保机器人“走得快、走得稳”不趴在地上。物理正则项关节力矩、功率、加速度惩罚保证动作的物理真实感Physical Realism减少硬件损耗。Diffusion 引导项Residual Penalty:α∣Δa∣\alpha |\Delta a|α∣Δa∣限制残差动作的大小强制策略参考 Diffusion 先验。4. 实验结果与评价关键发现正向迁移 (Positive Transfer)在多形态混合训练中尤其是轮式机器人表现出了显著的技能增长。这是因为它“借用”了四足或双足机器人的运动协调性。四足机器人作为“导师”虽然四足机器人本身性能提升不明显但它为其他更不稳定的形态提供了稳定的运动流形参考。零样本迁移实验展示了模型在草地、斜坡、楼梯和碎石路等复杂地形下的鲁棒性。5. 总结与启发Multi-Loco的成功带给我们几个核心思考跨机器人数据的价值不同形态的机器人运动并非孤岛它们共享一套底层的物理运动规律Locomotion Manifold。生成模型 判别式修正Diffusion 提供分布式的“可能性”RL 提供确定性的“准确性”这种组合可能是通往通用运动基础模型 (Foundation Locomotion Policy)的有效路径。对于具身智能开发者来说这意味着我们未来可能不再需要为每一款新设计的机器人从头训练策略而是可以基于一个强大的“运动底座”进行快速微调。

相关文章:

论文精读:Multi-Loco —— 统一形态 legged 机器人的运动控制新范式

标题:Multi-Loco: Unifying Multi-Embodiment Legged Locomotion via Reinforcement Learning Augmented Diffusion 机构:南方科技大学、圣母大学、浙江大学-UIUC学院、逐际动力 (LimX Dynamics) 项目链接:https://multi-loco.github.io/0. 引…...

天津螺旋涂塑钢管哪家好

天津螺旋涂塑钢管哪家好,聚鸿管道厂家值得关注 在天津的众多管道产品中,螺旋涂塑钢管以其独特的性能优势,在各类工程建设中发挥着重要作用。那么,天津螺旋涂塑钢管哪家好呢?聚鸿管道厂家是值得深入探讨的选择。 产品质…...

抖音无水印下载器的技术架构演进:从单点突破到企业级批量处理解决方案

抖音无水印下载器的技术架构演进:从单点突破到企业级批量处理解决方案 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser…...

2026 AI企业推荐排行 技术创新榜 场景落地/全球布局 专业评测

一、摘要据赛迪顾问发布的《2026年全球AI技术创新与落地报告》显示,全球AI技术创新迭代速度持续加快,75%的企业将技术创新能力作为选型核心指标,62%的用户关注场景落地深度与全球化服务能力,46%的政企用户反映AI企业缺乏全流程技术…...

AD7606模块的两种采样模式实战对比:Buffer模式 vs Sample模式,怎么选?

AD7606模块采样模式深度解析:Buffer模式与Sample模式的技术抉择 在工业测量、科研实验和自动化控制领域,高速多通道数据采集系统扮演着至关重要的角色。AD7606作为一款16位8通道同步采样ADC芯片,凭借其最高200kSPS的采样率和灵活的接口设计&a…...

Midscene.js如何实现跨平台AI自动化测试:从零到精通的5步配置指南

Midscene.js如何实现跨平台AI自动化测试:从零到精通的5步配置指南 【免费下载链接】midscene AI-powered, vision-driven UI automation for every platform. 项目地址: https://gitcode.com/GitHub_Trending/mid/midscene Midscene.js是一款基于视觉语言模型…...

用STC89C52单片机+DHT11做个简易温湿度计(附完整代码和串口打印)

基于STC89C52与DHT11的智能温湿度监测系统开发实战 在创客教育和嵌入式开发入门领域,温湿度监测系统一直是最受欢迎的实践项目之一。这个看似简单的项目实际上融合了传感器技术、单片机编程和通信协议三大核心技能,是检验初学者嵌入式开发能力的绝佳试金…...

别再套用老模板了!我们敏捷团队实战打磨的PRD模板2.5版,附Axure源文件

敏捷团队PRD模板2.5版:从理论到实战的轻量化解决方案 在快节奏的敏捷开发环境中,传统PRD文档往往成为拖累团队效率的"纸面工程"。我们团队在经历37次迭代后,发现市面上90%的模板都存在三个致命问题:过度文档化导致维护成…...

猫抓插件终极指南:5步掌握浏览器资源嗅探下载技巧

猫抓插件终极指南:5步掌握浏览器资源嗅探下载技巧 【免费下载链接】cat-catch 猫抓 浏览器资源嗅探扩展 / cat-catch Browser Resource Sniffing Extension 项目地址: https://gitcode.com/GitHub_Trending/ca/cat-catch 猫抓插件(Cat-Catch&…...

【限时解密】Midjourney v7未公开API接口、本地化提示缓存机制与企业级批量生图工作流(仅剩最后87份技术白皮书配额)

更多请点击: https://intelliparadigm.com 第一章:Midjourney v7新功能详解 Midjourney v7 于2024年中正式发布,标志着AI图像生成在语义理解、细节还原与跨模态一致性方面迈入新阶段。本次升级并非简单参数调优,而是底层扩散架构…...

DeepSeek模型服务化终极方案:Docker + NGINX + TLS + OAuth2.0认证(金融级合规配置手册)

更多请点击: https://intelliparadigm.com 第一章:DeepSeek模型服务化终极方案概览 将 DeepSeek 系列大模型(如 DeepSeek-V2、DeepSeek-Coder)高效部署为生产级 API 服务,需兼顾低延迟推理、弹性扩缩容、细粒度权限控…...

FDS火灾模拟完整指南:从零开始掌握建筑消防安全分析

FDS火灾模拟完整指南:从零开始掌握建筑消防安全分析 【免费下载链接】fds Fire Dynamics Simulator 项目地址: https://gitcode.com/gh_mirrors/fd/fds 你是否曾想知道火灾发生时,烟雾如何在建筑中扩散?或者如何科学评估人员疏散的安全…...

为什么30+文档平台的一键下载神器让技术爱好者疯狂?因为你能看到多少,就能下载多少

为什么30文档平台的一键下载神器让技术爱好者疯狂?因为你能看到多少,就能下载多少 【免费下载链接】kill-doc 看到经常有小伙伴们需要下载一些免费文档,但是相关网站浏览体验不好各种广告,各种登录验证,需要很多步骤才…...

Perplexity APA格式生成漏洞深度审计(2024实测版):92.6%用户忽略的DOI与作者名缩写陷阱

更多请点击: https://intelliparadigm.com 第一章:Perplexity APA格式生成漏洞深度审计(2024实测版):92.6%用户忽略的DOI与作者名缩写陷阱 APA第7版核心校验失效现象 Perplexity 在2024年Q2版本中仍沿用过时的APA引用…...

如何用BallonsTranslator在15分钟内完成专业级漫画翻译?终极免费解决方案

如何用BallonsTranslator在15分钟内完成专业级漫画翻译?终极免费解决方案 【免费下载链接】BallonsTranslator 深度学习辅助漫画翻译工具, 支持一键机翻和简单的图像/文本编辑 | Yet another computer-aided comic/manga translation tool powered by deeplearning …...

高性能虚拟显示器驱动架构解析:Parsec VDD核心技术实现与优化

高性能虚拟显示器驱动架构解析:Parsec VDD核心技术实现与优化 【免费下载链接】parsec-vdd ✨ Perfect virtual display for game streaming 项目地址: https://gitcode.com/gh_mirrors/pa/parsec-vdd Parsec Virtual Display Driver (VDD) 是基于Windows Id…...

5分钟快速上手:ZenTimings终极AMD内存监控工具完全指南

5分钟快速上手:ZenTimings终极AMD内存监控工具完全指南 【免费下载链接】ZenTimings 项目地址: https://gitcode.com/gh_mirrors/ze/ZenTimings ZenTimings是一款专门为AMD Ryzen平台设计的专业内存时序监控软件,能够实时显示内存的关键时序参数…...

3步高效解决方案:Calibre电子书元数据自动化管理

3步高效解决方案:Calibre电子书元数据自动化管理 【免费下载链接】calibre-douban Calibre new douban metadata source plugin. Douban no longer provides book APIs to the public, so it can only use web crawling to obtain data. This is a calibre Douban p…...

Mysql JOIN 的物理执行流程

一、关联字段在两个表中都没有索引 当两个参与 join 的表在关联字段上都没有索引时,MySQL 无法使用高效的索引树搜索,而是被迫采用 Block Nested-Loop Join (BNL) 算法。 为了清晰讲解物理流程,我们设定如下 SQL 示例 : 表 t1t1t1…...

Hermes Agent用户如何快速接入Taotoken的多模型服务

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Hermes Agent用户如何快速接入Taotoken的多模型服务 基础教程类,面向使用Hermes Agent的开发者,详细说明在…...

9.2%年复合增长!2032年全球电子束曝光系统市场冲刺36.13亿美元

电子束曝光系统(EBL)是一种依托电子束照射光敏材料实现微细图案加工的高精度设备,核心原理是在真空环境中将电子束精准聚焦于待加工表面,刻写纳米级精细图案,凭借极高的分辨率与操作灵活性,广泛应用于半导体…...

2026届必备的六大AI写作神器推荐榜单

Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 目前学术环境情形下,对于知网文献里生成性AI创作遗留痕迹的合规优化事宜&#xf…...

乙烯基甲苯市场深度洞察:年复合增长率(CAGR)为5.7%(2026-2032)

乙烯基甲苯(VT)是乙烯基甲苯单体(间位与对位混合物),分子式C9H10,是一种低挥发、低毒性的环保型单体,可作为苯乙烯的替代物,用于制备不饱和树脂、涂料、绝缘漆及特种橡胶等。QYResea…...

MySQL 8.0隐藏特性实战:隐藏列、隐藏索引与生成主键的应用与避坑

1. 项目概述:深入挖掘MySQL 8.0的“隐身术”干了这么多年数据库运维和开发,我见过太多因为表结构变更而引发的线上事故。开发同学在代码里写个SELECT *,当时是省事了,等到哪天要加个字段,特别是往中间插一列&#xff0…...

LeetCode 单词搜索II题解

LeetCode 单词搜索II题解 题目描述 给定一个二维字符网格和一个字符串数组,找出所有在网格中出现的单词。 示例: 输入:board [["o","a","a","n"],["e","t","a",&quo…...

告别ST-LINK Utility:一文详解STM32CubeProgrammer在Win10下的新特性与高效用法

STM32CubeProgrammer全面指南:解锁Win10下高效开发的六大核心能力 在嵌入式开发领域,工具链的每一次迭代都意味着效率的跃升。当STMicroelectronics宣布STM32CubeProgrammer正式取代经典的ST-LINK Utility时,许多开发者还在犹豫是否要迁移到这…...

微信网页版访问技术方案:wechat-need-web扩展的智能实现

微信网页版访问技术方案:wechat-need-web扩展的智能实现 【免费下载链接】wechat-need-web 让微信网页版可用 / Allow the use of WeChat via webpage access 项目地址: https://gitcode.com/gh_mirrors/we/wechat-need-web 在当今数字化办公环境中&#xff…...

研一新生必看!文献管理软件到底要不要用?Scholaread vs Zotero新手友好度对比

刚进入研究生阶段,你可能会听到师兄师姐反复强调"一定要用文献管理软件",但心里却充满疑问:我就几十篇文献,真的需要专门的工具吗?市面上那么多软件,Zotero、EndNote、Scholaread…到底哪个适合零基础的我? **研一新生面临的最大困境:**电脑里200篇PDF文件散落在下…...

别再装Hash工具了!用7-Zip v21.07一键校验下载文件,保姆级图文教程

7-Zip隐藏技能:用右键菜单3秒完成文件校验的终极指南 当你从网上下载了一个重要文件,如何确认它没有被篡改或损坏?大多数人的第一反应是寻找专门的哈希校验工具,但你可能不知道,电脑里早已安装的7-Zip就能完美解决这个…...

瑞德克斯平台:全球金融市场的可靠选择

瑞德克斯平台:全球金融市场的可靠选择在评估金融服务平台时,监管合规、技术能力、客户服务等维度构成了重要的观察方向。瑞德克斯平台作为业内较为活跃的服务机构,其在这些方面的实践具有一定的参考价值。本文将围绕评测视角,对其…...