当前位置: 首页 > article >正文

LeRobot 项目部署运行逻辑(七)—— ACT 在 Mobile ALOHA 训练与部署

全部流程为:硬件配置 -> 环境安装 -> 遥操作数据采集 -> 数据集可视化 -> 策略训练 -> 策略评估

在之前的笔记中已经完成了绝大部分,最后再记录一下最后的训练部署,算是最简单的部分了

目录

1 ACT 训练

2 ALOHA 部署

3 更多细节


1 ACT 训练

lerobot 目前支持算法在 lerobot/common/policies 中可以查看

之前数据采集完成了,修改相应参数,运行如下指令开始训练:

python lerobot/scripts/train.py 
--dataset.repo_id=lerobot/collection_coil  \
--dataset.root=/home/robot/Documents/lerobotnew/collections/collection_coil/  \
--policy.type=act  \
--output_dir=/home/robot/Documents/lerobotnew/outputs/train/act_collection_coil  \
--job_name=act_collection_coil  \
--policy.device=cuda  \
--wandb.enable=true

训练完成后,在 outputs 中生成权重参数:

2 ALOHA 部署

连上机器人和相机,运行如下脚本测试:

python lerobot/scripts/control_robot.py  
--robot.type=aloha   \
--control.type=record   \
--control.fps=30    \
--control.single_task="collection_coil."   \
--control.repo_id=lerobot/eval_collection_coil  \
--control.tags='["collection_coil"]' \
--control.warmup_time_s=3  \
--control.episode_time_s=50  \
--control.reset_time_s=5  \
--control.num_episodes=1  \
--control.policy.path=/home/robot/Documents/lerobotnew/outputs/train/act_collection_coil/checkpoints/last/pretrained_model  \
--control.num_image_writer_processes=1

PS: --control.repo_id 必须是 eval_

可以看到简单任务的效果还行:

部分复杂任务也还行,成功率也还可以:

3 更多细节

1. 数据量我们目前简单动作用的是50组,成功率在90%左右,但是这种成功率在于机器人相机要固定住的前提上,所以如果想泛化能力强,还是需要更多的 diverse 数据;

2. 采集数据和部署可以时间不一致,采集可以短一点20s动作,部署建议时间长一点,可以100s剥削机器人不停地干;

3. lerobot 架构功能很多,但是说明很简单,比如删除数据、采集时候可视化、数据继续采集等功能都有,需要自己修改参数;

4. ACT 对于简单功能够用了,但是复杂功能,首先是相机位置和精度很重要,合理布局可以完成部分复杂功能,但是更建议直接上 GR00T 或者 π0 这种 VLM+ACT/DP 的双系统架构,大脑+小脑确实效果好很多

相关文章:

LeRobot 项目部署运行逻辑(七)—— ACT 在 Mobile ALOHA 训练与部署

全部流程为:硬件配置 -> 环境安装 -> 遥操作数据采集 -> 数据集可视化 -> 策略训练 -> 策略评估 在之前的笔记中已经完成了绝大部分,最后再记录一下最后的训练部署,算是最简单的部分了 目录 1 ACT 训练 2 ALOHA 部署 3 更…...

高频交直流电流测量技术:射频PA与MEMS测试的简单解决方案

随着5G通信和智能传感器技术的快速发展,传统电流测量手段已难以满足现代电子设备的测试需求。最新一代交直流混合测量探头通过突破性的技术创新,正在重新定义射频功率器件和微机电系统的测试标准。 射频功率放大器测试新范式: 在5G基站等高…...

原生微信小程序 textarea组件placeholder无法换行的问题解决办法

【问题描述】 微信小程序原生代码,使用文本域,placeholder使用\n 没有效果,网上找了一堆方案说使用 也没有效果 最后在一个前端大佬博客,找到解决办法,CSS设置word-wrap: break-word; white-space: pre-line; 【解决办…...

网络协议分析 实验二 IP分片与IPv6

文章目录 索引及重要内容实验2 IP 高级实验实验2.1 IPv4协议分片实验实验2.2 IPV6协议实验2.3 ARP初级 索引及重要内容 实验2 IP 高级实验 实验2.1 IPv4协议分片实验 icmp的不可达报文 实验2.2 IPV6协议 实验2.3 ARP初级 arp –a 查看ARP缓存表内容 arp –s IP地址(格式&…...

QT6 源(101)篇一:阅读与注释 QPlainTextEdit,其继承于QAbstractScrollArea,属性学习与测试

(1) (2) (3)属性学习与测试 : (4) (5) 谢谢...

【ROS2】编译Qt实现的库,然后链接该库时,报错:/usr/bin/ld: XXX undefined reference to `vtable for

【ROS】郭老二博文之:ROS目录 1、问题描述 在ROS2工程中,编译使用Qt实现的库,在其它ROS2包链接该库时,报错: /usr/bin/ld: XXX undefined reference to `vtable for2、原因分析 查看链接失败的几个函数接口都是,信号函数(signals 标记的函数)。因为信号函数都只有定…...

工业大数据的定义

目录 工业大数据的定义 工业大数据发展历程 工业大数据的特征 工业大数据的处理流程 工业大数据在处理上面临的挑战 工业大数据的有效处理方案 工业大数据处理相关案例 数益工联 x TDengine 中天钢铁 x TDengine 广州某企业工业互联网项目 x TDengine 格创东智 x TD…...

126.在 Vue 3 中使用 OpenLayers 实现绘制正方形、正三角形、正五边形

🗺️ 项目效果(先看效果) 支持点击按钮绘制图形,效果如下: ✅ 正三角形 ✅ 正方形 ✅ 正五边形 ✅ 支持停止绘制 📌 前言 在 Web GIS 的实际项目中,我们经常需要绘制一些规则的图形,比如:正方形、正三角形、正五边形等,这在标注地块、规划图形、布设区域等场景中都…...

大数据 vs. 小数据:AI项目中数据规模与质量的权衡之道

大数据 vs. 小数据:AI项目中数据规模与质量的权衡之道 引言:数据时代的辩证法则 在AI领域,一个根本性悖论日益凸显:数据规模与质量往往呈现此消彼长的关系。Google Brain团队的研究揭示,当数据规模增长10倍时&#x…...

互联网大厂Java求职面试实战:Spring Boot到微服务全景解析

💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通 2. 我的免费工具站: 欢迎访问 https://tools-6wi.pages.dev/ 😁 3. 毕业设计专栏,毕业…...

最新版VSCode通过SSH远程连接Ubuntu 16.04等旧版Linux的方法

根据官方文档Remote Development FAQ - Can I run VS Code Server on older Linux distributions?,自Visual Studio Code 1.99起,VSCode Remote - SSH Server由于运行库依赖更新,会无法连接到旧版Linux发行版上。但是好在官方在文档中还给了…...

SQL Server中delete table和truncate table删除全表数据哪个快?

目录 1.TRUNCATE 2.DELETE 总结 在 SQL Server 中,DELETE 和 TRUNCATE 都可以用来删除表中的数据,但它们执行的方式和性能影响是不同的。这里简要说明两者的区别以及哪个更快: 1.TRUNCATE 速度: TRUNCATE 是一个DDL&#xff…...

3DVR制作的工具或平台

3DVR(三维虚拟现实)是利用三维图像技术和虚拟现实技术,将真实场景进行三维扫描并转换成计算机可识别的三维模型,使用户能够在虚拟空间中自由漫游,体验身临其境的感觉。3DVR技术结合了全景拍摄和虚拟现实,提…...

qt QMessageBox 的详细解析

以下是关于 QMessageBox 的详细解析,涵盖其核心功能、使用方法、高级特性及常见场景示例。 1. QMessageBox 的核心作用 QMessageBox 是 Qt 中用于快速创建标准化对话框的类,常用于以下场景: 信息提示(如操作成功/失败)。警告或错误通知(如文件未保存)。用户决策(如确认…...

高吞吐与低延迟的博弈:Kafka与RabbitMQ数据管道实战指南

摘要 本文全面对比Apache Kafka与RabbitMQ在数据管道中的设计哲学、核心差异及协同方案。结合性能指标、应用场景和企业级实战案例,揭示Kafka在高吞吐流式处理中的优势与RabbitMQ在复杂路由和低延迟传输方面的独特特点;介绍了使用Java生态成熟第三方库(如Apache Kafka Clie…...

在 Spring Boot 中实现分库分表的全面指南

分库分表(Database Sharding)是一种数据库架构优化技术,通过将数据分散到多个数据库或表中,以应对高并发、大数据量场景,提升系统性能和扩展性。在 Spring Boot 中,分库分表可以通过框架支持(如…...

关于大语言模型的困惑度(PPL)指标优势与劣势

1. 指标本身的局限性 与人类感知脱节: PPL衡量的是模型对词序列的预测概率(基于交叉熵损失),但低困惑度未必对应高质量的生成结果。例如: 模型可能生成语法正确但内容空洞的文本(PPL低但质量差)…...

如何使用WordPress SEO检查器进行实时内容分析

在这篇文章中,我们将带你从头开始了解如何在WordPress中使用SEO检查工具进行实时内容分析。这篇文章面向初学者,帮助你理解SEO的重要性以及如何通过工具提高文章的搜索引擎优化(SEO)效果。 一、什么是SEO内容分析? 内…...

C语言:深入理解指针(5)

目录 一、回调函数 二、qsort 使用举例 三、模拟qsort 一、回调函数 回调函数就是一个通过函数指针调用的函数。 举个例子: int Add(int x, int y) {return xy; }void test(int (*pf)(int, int)) {int r pf(10 ,20);printf("%d\n" ,r); }int main()…...

前端如何获取电脑唯一编码

在前端开发中,出于安全和隐私的考虑,浏览器不允许直接获取硬件的唯一标识(如 MAC 地址、CPU 序列号等)。但可以通过以下方法生成设备指纹(Device Fingerprint),近似实现设备唯一标识&#xff1a…...

IEEE出版|连续多年稳定检索|第三届信号处理与智能计算国际学术会议(SPIC2025)

【重要信息】 会议官网: www.ic-spic.com 会议日期:2025年11月28-30日 会议地点:中国 广州 截稿日期:2025年11月10日 接受或拒绝通知日期:提交后7个工作日 【征稿主题】 人工智能和机器学习 计算机系统和架构 …...

“强强联手,智启未来”凯创未来与绿算技术共筑高端智能家居及智能照明领域新生态

近日,北京凯创未来科技有限公司总经理赵健凯先生莅临广东省绿算技术有限公司北京运营中心,双方正式签订战略合作协议,标志着绿算技术在高端智能家居及智能照明领域的技术实力与产业布局获得智能家居行业认可,同时也为凯创未来在高…...

MQ消息队列的深入研究

目录 1、Apache Kafka 1.1、 kafka架构设 1.2、最大特点 1.3、功能介绍 1.4、Broker数据共享 1.5、数据一致性 2、RabbitMQ 2.1、架构图 2.2、最大特点 2.3、工作原理 2.4、功能介绍 3、RocketMQ 3.1、 架构设计 3.2、工作原理 3.3、最大特点 3.4、功能介绍 3…...

【NLP 74、最强提示词工程 Prompt Engineering 从理论到实战案例】

一定要拼尽全力,才能看起来毫不费劲 —— 25.5.15 一、提示词工程 1.提示词工程介绍 Ⅰ、什么是提示词 所谓的提示词其实就是一个提供给模型的文本片段,用于指导模型生成特定的输出或回答。提示词的目的是为模型提供一个任务的上下文,以便模…...

安卓开饭-ScrollView内嵌套了多个RecyclerView,只想与其中一个RecyclerView有联动

在 Android 开发中,将 RecyclerView 嵌套在 ScrollView 内通常会导致性能问题和滚动冲突,应尽量避免这种设计。以下是原因和替代方案: 为什么不推荐 RecyclerView ScrollView?​​ 性能损耗​ RecyclerView 本身已自带高效回收复…...

Linux 系统中的文件系统层次结构和重要目录的用途。

Linux系统目录结构采用分层布局方式,通过根目录"/"组织管理各类文件。以下为核心目录说明: 一、主要目录结构 1. / : 根目录,所有文件和目录的起点 2. /bin : 存储基础用户命令(ls/cp/mv等) 3. /boot : 存放系统引导程序和…...

从攻击者角度来看Go1.24的路径遍历攻击防御

目录 一、具体攻击示例 程序 攻击步骤: 二、为什么攻击者能成功? 分析 类比理解 总结 三、TOCTOU 竞态条件漏洞 1、背景:符号链接遍历攻击 2. TOCTOU 竞态条件漏洞 3. 另一种变体:目录移动攻击 4. 问题的核心 四、防…...

使用 SiamMask 实现单目标逐帧跟踪与掩码中心提取

使用 SiamMask 实现单目标逐帧跟踪与掩码中心提取 使用 SiamMask 实现逐帧掩码中心提取与目标跟踪1. 功能概述2. 输入要求3. 使用说明4. 可选扩展5. 常见问题排查6. 脚本代码(siam\_one\_frame.py)使用 SiamMask 实现逐帧掩码中心提取与目标跟踪 本文介绍基于 SiamMask 的逐…...

Qt中的RCC

Qt资源系统(Qt resource system)是一种独立于平台的机制,用于在应用程序中传输资源文件。如果你的应用程序始终需要一组特定的文件(例如图标、翻译文件和图片),并且你不想使用特定于系统的方式来打包和定位这些资源,则可以使用Qt资源系统。 最…...

【实战解决方案】Spring Boot+Redisson构建高并发Excel导出服务,彻底解决系统阻塞难题

【实战解决方案】Spring BootRedisson构建高并发Excel导出服务,彻底解决系统阻塞难题 一、问题背景:痛苦的系统卡顿经历 作为电商后台开发者,我们经常遇到这样的场景:运营人员在后台点击"导出订单数据"后,…...