Fourier-Lerobot——把斯坦福人形动作策略iDP3封装进了Lerobot(含我司七月人形研发落地实践)
前言
近期在抠lerobot源码时,看到其封装了ALOHA ACT、diffusion policy、π0时,我就在想,lerobot其实可以再封装下idp3
- 我甚至考虑是否从我联合带的那十几个具身研究生中选几个同学做下这事,对他们也是很好的历练
- 然当25年3.18日晚上,我把lerobot抠的差不多了「比如此文《LeRobot源码剖析——对机器人各个动作策略的统一封装:包含ALOHA ACT、Diffusion Policy、VLA模型π0》」
却发现傅利叶fork了lerobot,并在fork的fourier-lerobot中,把idp3封装了进去,实在是卷啊..
再加之工厂机械臂开发订单之外,我司「七月在线」近期接到的B端人形开发订单越来越多了(且还有多个人形开发需求正在并行推进中)
- 对于其中一个人形开发订单,我(们)准备把ipd3作为备选,既然fourier把ipd3封装进了lerobot,那这个fourier-lerobot便是我们在落地中会尝试的库之一
- 当然了,idp3外,像vla π0 我们也会考虑并行尝试,而π0此前已经封装进了lerobot,故π0官方库、lerobot库都是可以选择的
我们非常缺人,如果有志于做具身智能或人形研发的,欢迎私我,我还顺带在微博上感慨

而FFTAI/fourier-lerobot对huggingface/lerobot的主要扩展集中在以下几个方面:
- 数据集支持:添加了对Fourier ActionNet数据集的全面支持,包括转换工具和可视化工具
- 训练管道:扩展了IDP3训练管道,针对人形机器人优化
- 工具扩展:提供了特定于Fourier数据集的工具链
这些修改使FFTAI/fourier-lerobot成为一个专为人形机器人开发优化的版本,而保持了与原始huggingface/lerobot项目的核心框架兼容性
第一部分 fourier-lerobot新增的独立scripts
FFTAI/fourier-lerobot添加了一个完全独立的scripts目录(与lerobot/scripts不同),包含:

- convert_to_lerobot_v2.py:这是一个专门为Fourier数据集开发的转换工具,用于将Fourier ActionNet数据集转换为LeRobotDatasetV2格式
该脚本处理了:
HDF5格式的机器人状态和动作数据
摄像机RGB和深度视频数据
点云数据生成和处理
时间戳对齐
特定于人形机器人的关节数据处理 - `fourier_viz.py`:用于可视化Fourier数据集的专用工具
- `requirements.txt`:Fourier数据集处理工具的依赖项
1.1 convert_to_lerobot_v2.py
1.2 fourier_viz.py
第二部分 全新的`idp3`训练管道实现
即在新增的lerobot/common/policies/idp3目录之下,包含以下文件:
- `configuration_idp3.py`
- `modeling_idp3.py`
- `pointnet_extractor.py`
这是一个重要的扩展,因为原始huggingface/lerobot项目中不包含IDP3训练管道
// 待更
第三部分 Fourier数据集的可视化和处理与文档扩展
3.1 pyproject.toml中的修改:以支持Fourier数据集的可视化和处理
添加了`fourier_viz`可选依赖组,包含以下软件包:
fourier_viz = ["opencv-python>=4.10.0.84","rerun-sdk==0.22.0","h5py>=3.12.1","tqdm>=4.67.1","loguru","numpy","rich",
]
这些依赖项专门用于支持Fourier数据集的可视化和处理
3.2 文档扩展
- 添加了完整的`DATASET.md`文件,详细说明了Fourier ActionNet数据集的结构和使用方法
- 修改了`README.md`,添加了关于Fourier-Lerobot的介绍段落和功能说明
第四部分 傅利叶开源人形机器人数据集Fourier ActionNet
// 待更
第五部分 我司七月人形研发落地实践
// 待更
相关文章:
Fourier-Lerobot——把斯坦福人形动作策略iDP3封装进了Lerobot(含我司七月人形研发落地实践)
前言 近期在抠lerobot源码时,看到其封装了ALOHA ACT、diffusion policy、π0时,我就在想,lerobot其实可以再封装下idp3 我甚至考虑是否从我联合带的那十几个具身研究生中选几个同学做下这事,对他们也是很好的历练然当25年3.18日…...
系统架构设计知识体系总结
1.技术选型 1.什么是技术选型? 技术选型是指评估和选择在项目或系统开发中使用的最合适的技术和工具的过程。这涉及考虑基于其能力、特性、与项目需求的兼容性、可扩展性、性能、维护和其他因素的各种可用选项。技术选型的目标是确定与项目目标相符合、能够有效解…...
计划管理工具应该具备的能(甘特图)
在当今快节奏的项目管理环境中,高效地规划和跟踪项目进度是至关重要的。甘特图,作为项目管理领域的经典工具,以其直观的时间轴和任务分配方式,深受项目管理者的青睐。 随着数字化时代的到来,甘特图线上编辑器应运而生&…...
简单实用!百度AI + Raphael AI = 免费生图
简单实用!百度AI Raphael AI 免费生图 --  第一步:下载或截取一些好看的图片当参考图片 第二步:用百度AI描述你想要的图片&…...
2 相交链表
1 常规思路 比较两个链表的长度,然后让较短的链表走二者长度之差,此时两个链表就一样长了,开始用双指针遍历,如果有相等返回,没有返回null; 为了减少冗余代码,我们设置一个minCur和maxCur分别…...
2025-03-22 学习记录--C/C++-C 库函数 - getchar()
C 库函数 - getchar() ⭐️ C 标准库 - <stdio.h> (一)、函数声明 🍭 int getchar(void)从标准输入 stdin 获取一个字符(一个无符号字符)。 参数:🎀 NA 返回值:Ἰ…...
APM 仿真遥控指南
地面站开发了一段时间了,由于没有硬件,所以一直在 APM 模拟器中验证。我们已经实现了 MAVLink 消息接收和解析,显示无人机状态,给无人机发送消息,实现一键起飞,飞往指定地点,降落,返…...
如何防止大语言模型生成有害内容?技术与非技术手段解析
目录 如何防止大语言模型生成有害内容?技术与非技术手段解析 1. 技术手段 方法 1:使用内容过滤(Content Filtering) 方法 2:基于模型的有害内容检测(Toxicity Classification) 方法 3&#…...
BBR 和 CUBIC 对长肥管道的不同反应
有个关于 CUBIC(等一众 AIMD-based cc) 和 BBR 在长肥管道中的行为比较挺有趣,它们的表现竟然截然相反: CUBIC 流共存,RTT 越大,Goodput 越低;BBR 流共存,RTT 越大,Goodput 越高。 前一个被看…...
架构师面试(十九):IM 架构
问题 IM 系统从架构模式上包括 【介绍人模式】和 【代理人模式】。介绍人模式也叫直连模式,消息收发不需要服务端的参与,即客户端之间直连的方式;代理人模式也叫中转模式,消息收发需要服务端进行中转。 下面关于这两类模式描述的…...
Spring框架入门指南:从Hello World到IOC容器
第一章:Spring框架的介绍 1. Spring框架的概述 Spring是一个开放源代码的设计层面框架,它解决的是业务逻辑层和其他各层的松耦合问题,因此它将面向接口的编程思想贯穿整个系统应用。 Spring是于2003 年兴起的一个轻量级的Java开发框架&…...
嵌入式电路设计软件个人安装步骤分享
各位小伙伴大家好,今天给大家分享一个,电路设计软件的安装方法,希望对大家有所帮助。 一、下载【Multisim14.0安装包】: 链接:夸克网盘分享 提取码:kHSP 电脑安装Multisim14.0并且汉化 准备安装包以及汉化包双击“NI_Circuit_Design_Suite_14_0【海量免费资源:kebaiwan…...
git | 回退版本 并保存当前修改到stash,在进行整合。[git checkout | git stash 等方法 ]
目录 一些常见命令: git 回退版本 一、临时回退(不会修改历史,可随时回到当前版本) 方法1:git checkout HEAD~1 二、永久回退(改变分支指向) 方法2:git reset 1. 保留修改&am…...
学习笔记:黑马程序员JavaWeb开发教程(2025.3.22)
11.1 案例-员工管理-新增员工 考试完之后,时隔一个月再次运行项目,出现了报错: class lombok.javac.apt.LombokProcessor (in unnamed module 0x5d7f1e59) cannot access class com.sun.tools.javac.processing.JavacProcessingEnvironme…...
Java IO性能优化:字节流与缓冲流的对比与实战分析
引言 在Java开发中,文件读写和网络数据传输是高频操作。然而,许多开发者在使用FileInputStream、FileOutputStream等基础字节流时,常因忽略IO性能问题导致程序效率低下。本文将深入分析普通字节流与**缓冲字节流(BufferedInputSt…...
【Java SE】单例设计模式
参考笔记:深入理解Java设计模式:单例模式及其饿汉式与懒汉式的对比,-CSDN博客 目录 1.什么是设计模式 2.经典设计模式 3.单例设计模式(static属性/方法经典使用场景 ) 3.1 饿汉式单例模式 3.2 懒汉式单例模式 4.补充 1.什么…...
安全守护:反光衣检测技术的革新之路
视觉分析助力船上工人反光衣检测 在现代工业生产与作业环境中,安全始终是首要考虑的因素。对于水上作业,如船舶维护、海上施工等场景,工人穿戴反光衣是预防事故、提高可见性的重要措施。然而,传统的人工检查方式不仅效率低下&…...
OSCP准备靶场联系-Kioptrix 1
oscp 准备 Kioptrix 1 信息收集 ifconfig 确认自己的电脑ip,nmap收集通往段ip,确认靶机IP nmap 重点关注服务版本 nmap -sn 192.168.1.0/24 # 扫描网段内存活主机,不进行端口扫描[1,10](ref) nmap -sP 192.168.1.1 # 传统Ping扫描…...
【工具变量】中国各地级市是否属于“信息惠民国家试点城市”匹配数据(2010-2024年)
数据来源:国家等12部门联合发布的《关于加快实施信息惠民工程有关工作的通知》 数据说明:内含原始文件和匹配结果,当试点城市在2014年及以后,赋值为1;试点城市在2014年之前或该城市从未实施信息惠民试点工程&#x…...
深度学习 Deep Learning 第7章 深度学习的正则化
深度学习 第7章 深度学习的正则化 章节概述 正则化技术是深度学习中防止过拟合、提升模型泛化能力的核心手段。本章深入探讨了深度学习中的正则化技术,旨在解决模型在新数据上的泛化能力问题。正则化是通过在学习算法中引入额外的约束或惩罚项,来减少模…...
使用DeepSeek翻译英文科技论文,以MarkDown格式输出,使用Writage 3.3.1插件转换为Word文件
一、使用DeepSeek翻译英文科技论文,以MarkDown格式输出 以科技论文“Electrical Power System Sizing within the Numerical Propulsion System Simulation”为例。 关于Writage 3.3.1的进一步了解,可发送邮件至邮箱pyengine163.com. 首先,打…...
一文了解ThreadLocal
什么是ThreadLocal? ThreadLocal是每个线程私有的,线程可以把自己的私有数据放到ThreadLocal里面,不用担心其他线程访问到自己ThreadLocal。 通过set()方法将值存入ThreadLocal或者修改值,get()方法取出值,remove()方…...
常用数据库远程连接工具全解析:从入门到高效管理
引言 在数字化时代,远程连接数据库已成为开发、运维和数据分析的必备技能。无论是云端数据库还是自建服务器,选择合适的工具能大幅提升效率。本文将盘点主流远程连接工具,涵盖功能特性、适用场景及操作指南,助你快速找到趁手的工…...
C语言 转义字符
在C语言中,转义字符是一种特殊的字符序列,用于表示一些无法直接输入或具有特殊含义的字符。它以反斜杠“\”开头,后面跟随一个字符或一组字符,用来表示一个特定的字符或控制功能。 转义字符的用途 表示不可打印字符:…...
【免费】2000-2019年各省地方财政印花税数据
2000-2019年各省地方财政印花税数据 1、时间:2000-2019年 2、来源:国家统计局、统计年鉴 3、指标:行政区划代码、地区、年份、地方财政印花税 4、范围:31省 5、指标说明:印花税是对特定经济活动和法律行为所征收的…...
MyBatis-Plus 的加载及初始化
在 Spring Boot 启动过程中,MyBatis-Plus 的加载和初始化涉及多个阶段的工作。这些工作包括 MyBatis-Plus 自身的配置解析、Mapper 接口的扫描与注册、SQL 语句的动态注入以及底层 MyBatis 的初始化等。以下是对整个过程的详细分析: 1. Spring Boot 启动…...
HTML——什么是块级元素,什么是内联元素,有何区别
在 HTML 中,块级元素(Block-level element)和内联元素(Inline element)是两种不同类型元素,它们在页面布局和样式应用方面有不同的行为和特性。 块级元素(Block-level element) 块级…...
优先级与环境变量的艺术:驾驭 Linux 系统的核心
文章目录 前言一、什么是进程优先级?二、Linux 系统中的优先级2.1 查看进程优先级2.2 PRI 和 NI 的关系2.3 修改进程优先级2.4 进程优先级的实现原理2.5 进程的特性 三、环境变量3.1 PATH——搜索可执行文件的目录列表1. 为什么自己写的程序需要加 ./ 才能执行&…...
【AVRCP】深度剖析 AVRCP 中 Generic Access Profile 的要求与应用
目录 一、GAP基础架构与核心要求 1.1 GAP在蓝牙体系中的定位 1.2 核心模式定义 二、AVRCP对GAP的增强要求 2.1 模式扩展规范 2.2 空闲模式过程支持 三、安全机制实现细节 3.1 认证与加密流程 3.2 安全模式要求 四、设备发现与连接建立 4.1 发现过程状态机 4.2 连接…...
聊聊如何保障自动化测试的稳定性
目录 一、环境隔离与控制 二、 测试用例设计原则 三、处理异步和动态内容 四、依赖管理 五、错误处理与日志 六、持续集成(CI)与自动化流程 七 、监控与维护 八、团队协作与文化 在我们进行自动化测试的时候,可能会遇到一些测试环境不…...
