李飞飞团队新突破:低成本高泛化机器人训练法,零样本迁移成功率90%!

在机器人训练中,如何高效地利用模拟环境一直是研究者们关注的重点问题。
近日,美国斯坦福大学李飞飞教授团队提出了一种突破性的“数字表亲”(digital cousins)概念。这一创新方法既保留了数字孪生的优势,又大大降低了从真实到模拟环境的生成成本,同时提高了学习的泛化能力。
“数字表亲”不仅能有效地将真实世界的数据扩展到模拟环境中进行学习,还有望为机器人训练带来显著进展,为解决长期存在的模拟到现实迁移问题提供了新的思路。
项目主页:https://digital-cousins.github.io/论文地址:https://arxiv.org/abs/2410.07408
▍什么是“数字表亲”?与“数字孪生”有何不同?
什么是“数字表亲”?它与我们熟知的“数字孪生”有何不同?
“数字孪生”作为真实场景的精确虚拟复制品,虽然能够准确地对场景进行建模,但其生成成本极为昂贵,且无法提供良好的跨域泛化能力。而“数字表亲”则是一种介于数字孪生与完全随机化之间的创新概念。它不直接模拟现实世界的特定对应物,但仍然能够捕捉相似的几何形状和语义功能。
通过这种方式,“数字表亲”大大降低了生成类似虚拟环境的成本。同时,由于提供了一系列相似但不完全相同的训练场景,它还能提高从模拟到真实环境的迁移鲁棒性。
“数字表亲”方法的一大亮点在于,它能够同时实现以下三个目标:
1、将单幅图像转换为完全交互式的虚拟场景2、全自动处理过程,无需人工注释3、训练出的机器人策略可以直接在原始场景中进行零样本部署

这意味着,理论上只需拍摄一张照片,就能完成从现实到虚拟再到现实的全流程训练。 研究团队发现,ACDC方法生成的数字表亲场景成功保留了原始环境的几何结构和语义特征。具体而言,这些策略在零样本迁移到真实世界时,达到了90%的成功率,远远超过了在传统数字孪生环境中训练的策略(仅为25%)。
▍ACDC:自动创建数字表亲的核心算法
为了实现“数字表亲”的自动生成,李飞飞教授团队提出了一种名为ACDC(Automated Creation of Digital Cousins)的算法。这个算法包含三个关键步骤:

1、信息提取:
从输入的单张RGB图像中提取每个物体的关键信息,包括位置、大小、朝向等。
2、数字表亲匹配:
利用第一步提取的信息,结合预先准备的3D模型资产库,为检测到的每个物体匹配最合适的数字表亲模型。
3、场景生成:
对选定的数字表亲模型进行后处理和组合,生成一个物理上合理且完全可交互的虚拟场景。
ACDC通过这三个阶段,能自动生成在语义层面与输入图片相近但又不尽相同的虚拟环境。这为机器人策略学习提供了丰富多样的训练场景。

值得注意的是,与数字孪生不同,数字表亲并不追求在所有微小细节上都完美重建给定场景,而是专注于保留更高层次的细节,如物体间的空间关系和语义信息。这种做法不仅降低了计算成本,还有助于提高学习策略的泛化能力。
在构建了一组数字表亲场景后,研究团队采用了基于脚本演示的模仿学习方法来训练机器人策略。他们实现了包括打开、关闭、拿取和放置等基础技能,这些技能足以用于收集各种日常任务的演示数据,如物体重新排列和操作家具等。
▍实验验证:“数字表亲”的优越性能
为了全面评估"数字表亲"方法的有效性,研究团队设计了一系列实验,旨在回答以下问题:
研究团队通过一系列实验,全面评估了ACDC方法的性能和潜力。他们探讨了ACDC从单张RGB图像生成高质量数字表亲的能力,特别关注其捕捉原始场景语义和空间细节的准确性。
同时,团队比较了数字表亲和数字孪生在策略训练方面的效果,既在原始环境中进行评估,也测试了在分布外设置中的表现,以验证数字表亲训练策略的稳健性和适应能力。
此外,研究还着重考察了这些策略实现零样本从模拟到现实迁移的可能性。 场景重建质量评估
首先,研究者们对ACDC生成的场景进行了定量和定性评估。结果显示,ACDC在多个指标上都取得了令人满意的表现:

ACDC在真实到虚拟场景转换中的表现通过这些指标得到了量化。值得注意的是,系统能为同一场景生成多个不同的数字表亲版本。

基于这些全面的评估结果,研究团队有充分理由得出积极结论:ACDC确实展现了出色的能力,能够从单一RGB图像出发,创建保留原始场景语义和空间特征的数字表亲。这些虚拟复制品不仅在物体识别上表现出色,还能准确还原其在场景中的位置和尺寸。
这些数据表明,ACDC能够准确捕捉输入场景中的语义和空间信息,并生成高质量的数字表亲模型。
sim2sim策略学习
为了验证数字表亲在策略学习中的效果,研究团队在三个典型任务上进行了对比实验:开门、打开抽屉和收起碗。实验结果表明:

1、在数字表亲上训练的策略通常可以匹配,甚至优于数字孪生的表现。 2、随着测试环境与训练环境差异的增大,数字表亲训练的策略展现出更强的鲁棒性。
3、简单的领域随机化(All Assets)策略效果较差,说明"数字表亲"方法的优势。

这些结果证实了数字表亲在保持分布内性能的同时,还能提供更好的分布外泛化能力。
sim2real策略迁移
研究团队进行了深入的实验评估,比较了基于数字孪生和数字表亲的策略在真实世界中的零样本表现。实验任务设定为开启宜家柜门,以成功率作为关键评估指标。

为确保结果的可靠性,模拟环境中进行了超过50次的测试,而在真实环境中则完成了20多次的验证。

real2sim2real全流程验证
在机器人学习领域,无论采用数字孪生还是数字表亲技术,最终的检验标准始终是真实世界的应用表现。基于这一理念,研究团队在实验的收官阶段选择了一个未经预设的真实厨房环境,对ACDC的完整流程和自动化策略学习框架进行了全面的端到端测试。
经过在数字表亲环境中的针对性训练后,机器人成功完成了开启厨房橱柜的任务,有力证明了ACDC方法在真实场景中的适用性和有效性。为了直观展示这一突破,研究团队提供了一个演示视频,展示了数字表亲的全自动生成过程。


实验证明,零样本从模拟到现实(sim2real)的策略迁移实验取得了显著成果。仅仅依靠从四个生成的数字表亲中学习的策略,就能直接应用于相应的真实厨房场景,实现了无缝迁移。

基于数字表亲训练的策略展现出了多方面的优势:首先,在原始分布上,其性能与基于数字孪生训练的策略相当;其次,在面对分布外场景时,表现出了更强的适应能力和鲁棒性;最后,也是最关键的,这些策略成功实现了从模拟到现实的零样本迁移,无需额外调整就能在真实环境中有效运作。
这些成果不仅验证了ACDC方法的实用价值,还为机器人学习在复杂、多变的真实环境中的应用开辟了新的可能性。
▍结论与展望
通过一系列全面的实验,李飞飞教授团队的研究得出了以下重要结论:
1、ACDC能够快速、自动地生成与单张真实世界RGB图像对应的交互式数字表亲场景。
2、在数字表亲上训练的策略展现出更强的鲁棒性,特别是在分布外场景中。
3、数字表亲训练的策略在领域内性能上与数字孪生相当,但在领域外泛化能力上表现更优。
4、数字表亲方法实现了高效的零样本sim2real策略迁移。

然而,研究团队也指出了当前方法存在的一些局限性,如在处理高频深度信息、遮挡物体和特殊语义类别时可能遇到困难。这些问题为未来的研究指明了方向。

总体来说,李飞飞教授团队提出的“数字表亲”技术为机器人学习领域带来了新的思路。这项技术不仅对学术研究具有重要意义,也为机器人技术的实际应用开辟了新的可能性。业界将继续关注这一技术的发展,期待它带来更多创新和突破。
相关文章:
李飞飞团队新突破:低成本高泛化机器人训练法,零样本迁移成功率90%!
在机器人训练中,如何高效地利用模拟环境一直是研究者们关注的重点问题。 近日,美国斯坦福大学李飞飞教授团队提出了一种突破性的“数字表亲”(digital cousins)概念。这一创新方法既保留了数字孪生的优势,又大大降低了…...
PHP内存马:不死马
内存马概念 内存马是无文件攻击的一种常用手段,利用中间件的进程执行某些恶意代码。首先要讲的是PHP不死马,实质上就是直接用代码弄一个死循环,强占一个 PHP 进程,并不间断的写一个PHP shell,或者执行一段代码。 不死…...
【python】OpenCV—Connected Components
文章目录 1、任务描述2、代码实现3、完整代码4、结果展示5、涉及到的库函数6、参考 1、任务描述 基于 python opencv 的连通分量标记和分析函数,分割车牌中的数字、号码、分隔符 cv2.connectedComponentscv2.connectedComponentsWithStatscv2.connectedComponents…...
【优选算法篇】前缀之序,后缀之章:于数列深处邂逅算法的光与影
文章目录 C 前缀和详解:基础题解与思维分析前言第一章:前缀和基础应用1.1 一维前缀和模板题解法(前缀和)图解分析C代码实现易错点提示代码解读题目解析总结 1.2 二维前缀和模板题解法(二维前缀和)图解分析C…...
win10 更新npm 和 node
win10 更新npm 和 node win10 更新 npm winR 输入cmd,打开命令行,并输入如下 # 查看当前npm版本 npm -v # 清缓存 npm cache clean --force # 强制更新npm,试过npm update -g,没起作用,版本没变化 npm install -g …...
搜索引擎算法更新对网站优化的影响与应对策略
内容概要 随着互联网的不断发展,搜索引擎算法也在不断地进行更新和优化。了解这些算法更新的背景与意义,对于网站管理者和优化人员而言,具有重要的指导意义。不仅因为算法更新可能影响到网站的排名,还因为这些变化也可能为网站带…...
使用 Q3D 计算芯片引线的 AC 和 DC R 和 L
摘要: 模具经常用于电子行业。了解其导联的寄生特性对于设计人员来说很重要。Q3D 是计算 RLCG 的完美工具。它可用于高速板或低频电力电子设备。 在下面的视频中,我们展示了如何修改几何结构、设置模型和检查结果。 详细信息: 几何图形可以在 Q3D 中创建,也可以作为不同…...
前端_008_Vite
文章目录 Vite项目结构依赖构建插件 官网:https://vitejs.cn/vite3-cn/guide/ 一句话简介:前端的一个构建工具 Vite项目结构 index.html package.json vite.config.js public目录 src目录 #新建一个vite项目 npm create vitelatest原有项目引入vite需要…...
ssm007亚盛汽车配件销售业绩管理统(论文+源码)_kaic
本科毕业设计论文 题目:亚盛汽车配件销售业绩管理系统设计与实现 系 别: XX系(全称) 专 业: 软件工程 班 级: 软件工程15201 学生姓名: 学生学号: 指导教师&am…...
如何使用python完成时间序列的数据分析?
引言 时间序列分析是统计学和数据分析中的一个重要领域,广泛应用于经济学、金融、气象学、工程等多个领域。 时间序列数据是按时间顺序排列的一系列数据点,通常用于分析数据随时间的变化趋势。 本文将介绍时间序列分析的基本概念、常用方法以及如何使用Python进行时间序列…...
数字ic设计,Windows/Linux系统,其他相关领域,软件安装包(matlab、vivado、modelsim。。。)
目录 一、总述 二、软件列表 1、modelsim_10.6c 2、notepad 3、matlab 4、Visio-Pro-2016 5、Vivado2018 6、VMware15 7、EndNote X9.3.1 8、Quartus 9、pycharm 10、CentOS7-64bit 一、总述 过往发了很多数字ic设计领域相关的内容,反响也很好。 最近…...
SD-WAN分布式组网:构建高效、灵活的企业网络架构
随着企业数字化转型的深入,分布式组网逐渐成为企业网络架构中的核心需求。无论是跨区域的分支机构互联,还是企业与云服务的连接,如何在不同区域实现高效、低延迟的网络传输,已成为业务成功的关键。SD-WAN(软件定义广域…...
Task :prepareKotlinBuildScriptModel UP-TO-DATE,编译卡在这里不动或报错
这里写自定义目录标题 原因方案其他思路 原因 一般来说,当编译到这个task之后,后续是要进行一些资源的下载的,如果你卡在这边不动的话,很有可能就是你的IDE目前没有办法进行下载。 方案 开关一下IDE内部的代理,或者…...
unseping攻防世界
源码分析 <?php highlight_file(__FILE__);//代码高亮 class ease{//声明了两个私有属性:保存要调用的方法的名称和保存该方法的参数。$method,$argsprivate $method;private $args;//构造函数在实例化类的对象时初始化,即为对象成员变量赋初始值。…...
大厂面试真题-简单描述一下SpringBoot的启动过程
SpringBoot的启动流程是一个复杂但有序的过程,它涉及多个步骤和组件的协同工作。以下是SpringBoot启动流程的详细解析: 一、启动main方法 当SpringBoot项目启动时,它会在当前工作目录下寻找有SpringBootApplication注解标识的类,…...
4. 硬件实现
博客补充: CUDA C 编程指南学习_c cuda编程-CSDN博客https://blog.csdn.net/qq_62704693/article/details/141225395?spm1001.2014.3001.5501NVIDIA GPU 架构是围绕可扩展的多线程流式多处理器 (SM) 阵列构建的。当主机 CPU 上的 CUDA 程序…...
《操作系统真象还原》第3章 完善MBR【3.1 — 3.2】
目录 引用与说明 3.1、地址、section、vstart 浅尝辄止 1、什么是地址 2、什么是 section【汇编】 3、什么是 vstart【汇编】 3.2、CPU 的实模式 1、CPU 工作原理【重要】 2、实模式下的寄存器 4、实模式下 CPU 内存寻址方式 5、栈到底是什么玩意儿 6 ~ 8 无条件转移…...
八大排序-冒泡排序
在里面找动图理解 【数据结构】八大排序(超详解附动图源码)_数据结构排序-CSDN博客 一 简介 冒泡排序应该是我们最熟悉的排序了,在C语言阶段我们就学习了冒泡排序。 他的思想也非常简单: 两两元素相比,前一个比后一个大就交换࿰…...
基于Spring Boot+Vue的助农销售平台(协同过滤算法、节流算法、支付宝沙盒支付、图形化分析)
🎈系统亮点:协同过滤算法、节流算法、支付宝沙盒支付、图形化分析; 一.系统开发工具与环境搭建 1.系统设计开发工具 后端使用Java编程语言的Spring boot框架 项目架构:B/S架构 运行环境:win10/win11、jdk17 前端&…...
uniapp写抖音小程序阻止右滑返回上一个页面
最近用uniapp写小程序遇到一个问题因为内部用到右滑的业务,但是只要右滑就会回到上一页面,用了event.preventDeafult()没有用,看了文档找到了解决办法 1.在最外层view加上touchstart事件 <view class"container" touchstart&q…...
零门槛NAS搭建:WinNAS如何让普通电脑秒变私有云?
一、核心优势:专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发,是一款收费低廉但功能全面的Windows NAS工具,主打“无学习成本部署” 。与其他NAS软件相比,其优势在于: 无需硬件改造:将任意W…...
模型参数、模型存储精度、参数与显存
模型参数量衡量单位 M:百万(Million) B:十亿(Billion) 1 B 1000 M 1B 1000M 1B1000M 参数存储精度 模型参数是固定的,但是一个参数所表示多少字节不一定,需要看这个参数以什么…...
Admin.Net中的消息通信SignalR解释
定义集线器接口 IOnlineUserHub public interface IOnlineUserHub {/// 在线用户列表Task OnlineUserList(OnlineUserList context);/// 强制下线Task ForceOffline(object context);/// 发布站内消息Task PublicNotice(SysNotice context);/// 接收消息Task ReceiveMessage(…...
2024年赣州旅游投资集团社会招聘笔试真
2024年赣州旅游投资集团社会招聘笔试真 题 ( 满 分 1 0 0 分 时 间 1 2 0 分 钟 ) 一、单选题(每题只有一个正确答案,答错、不答或多答均不得分) 1.纪要的特点不包括()。 A.概括重点 B.指导传达 C. 客观纪实 D.有言必录 【答案】: D 2.1864年,()预言了电磁波的存在,并指出…...
EtherNet/IP转DeviceNet协议网关详解
一,设备主要功能 疆鸿智能JH-DVN-EIP本产品是自主研发的一款EtherNet/IP从站功能的通讯网关。该产品主要功能是连接DeviceNet总线和EtherNet/IP网络,本网关连接到EtherNet/IP总线中做为从站使用,连接到DeviceNet总线中做为从站使用。 在自动…...
成都鼎讯硬核科技!雷达目标与干扰模拟器,以卓越性能制胜电磁频谱战
在现代战争中,电磁频谱已成为继陆、海、空、天之后的 “第五维战场”,雷达作为电磁频谱领域的关键装备,其干扰与抗干扰能力的较量,直接影响着战争的胜负走向。由成都鼎讯科技匠心打造的雷达目标与干扰模拟器,凭借数字射…...
处理vxe-table 表尾数据是单独一个接口,表格tableData数据更新后,需要点击两下,表尾才是正确的
修改bug思路: 分别把 tabledata 和 表尾相关数据 console.log() 发现 更新数据先后顺序不对 settimeout延迟查询表格接口 ——测试可行 升级↑:async await 等接口返回后再开始下一个接口查询 ________________________________________________________…...
华为OD机试-最短木板长度-二分法(A卷,100分)
此题是一个最大化最小值的典型例题, 因为搜索范围是有界的,上界最大木板长度补充的全部木料长度,下界最小木板长度; 即left0,right10^6; 我们可以设置一个候选值x(mid),将木板的长度全部都补充到x,如果成功…...
MFE(微前端) Module Federation:Webpack.config.js文件中每个属性的含义解释
以Module Federation 插件详为例,Webpack.config.js它可能的配置和含义如下: 前言 Module Federation 的Webpack.config.js核心配置包括: name filename(定义应用标识) remotes(引用远程模块࿰…...
Linux中《基础IO》详细介绍
目录 理解"文件"狭义理解广义理解文件操作的归类认知系统角度文件类别 回顾C文件接口打开文件写文件读文件稍作修改,实现简单cat命令 输出信息到显示器,你有哪些方法stdin & stdout & stderr打开文件的方式 系统⽂件I/O⼀种传递标志位…...
