当前位置：首页 > news >正文

iDP3复现代码模型训练全流程（一）——train_policy.sh

news 2026/2/11 2:53:06

iDP3 核心脚本包括三个：deploy_policy.sh、vis_dataset.sh、train_policy.sh，分别代表了部署、预处理和训练，分别作为对应 py 脚本的参数设置前置环节

训练环节仅需运行指令：

# 3d policy
bash scripts/train_policy.sh idp3 gr1_dex-3d 0913_example# 2d policy
bash scripts/train_policy.sh dp_224x224_r3m gr1_dex-image 0913_example

idp3、dp_224x224_r3m：policy 名称

gr1_dex-3d、gr1_dex-image：Fourier GR1、dexterous hands-3d/image

0913_example：附加信息，某个特定时间点的样例

此脚本输入设置包括：算法名称、任务名称和其他配置信息，支持调试模式和训练模式，并集成 wanb 作为日志记录工具

接下来分析一下其运行逻辑

1 变量设置

2 命令行参数

3 衍生变量

4 调试模式

5 切换目录并设置环境变量

6 执行 train.py

1 变量设置

dataset_path=/home/ze/projects/Improved-3D-Diffusion-Policy/training_data_exampleDEBUG=False
wandb_mode=offline

dataset_path：训练数据集路径

DEBUG：切换调试模式（True）或训练模式（False）

wandb_mode：配置 wandb 记录模式，支持 online 或 offline

2 命令行参数

alg_name=${1}
task_name=${2}addition_info=${3}

接收算法名称（alg_name）、任务名称（task_name）和附加信息（addition_info）作为输入参数

3 衍生变量

config_name=${alg_name}seed=0
exp_name=${task_name}-${alg_name}-${addition_info}
run_dir="data/outputs/${exp_name}_seed${seed}"gpu_id=0
echo -e "\033[33mgpu id (to use): ${gpu_id}\033[0m"

config_name：根据算法名称设置配置文件名

exp_name：构建唯一的实验名称

run_dir：指定输出文件的存储目录

gpu_id：使用的 GPU ID

4 调试模式

if [ $DEBUG = True ]; thensave_ckpt=False# wandb_mode=onlineecho -e "\033[33mDebug mode!\033[0m"echo -e "\033[33mDebug mode!\033[0m"echo -e "\033[33mDebug mode!\033[0m"
elsesave_ckpt=Trueecho -e "\033[33mTrain mode\033[0m"
fi

根据 DEBUG 变量的值，动态地设置训练参数和运行模式

此处展开说明一下：

如果 DEBUG=True，则进入调试模式

如果 DEBUG=False，则进入训练模式

在调试模式下，save_ckpt 被设置为 False，即不会保存训练过程中的模型检查点（checkpoints）

调试模式通常用于快速验证脚本或模型是否可以正常运行，避免浪费存储空间和时间在保存中间结果上

此外，注释部分可以切换 wandb（Weights and Biases）的记录模式到在线模式，以实时查看调试日志。当前注释状态下，wandb_mode 保持原始的 offline 配置，以减少调试期间的外部依赖

echo -e "\033[33mDebug mode!\033[0m"

在终端中打印出黄色的 “Debug mode!” ，强调处于调试模式

echo：用于输出文本

-e：启用转义序列

"\033[33m"：设置文本颜色为黄色（ANSI 转义序列）

"\033[0m"：重置文本样式（返回到默认颜色）

然后就，重要的事情说三次......

5 切换目录并设置环境变量

cd Improved-3D-Diffusion-Policyexport HYDRA_FULL_ERROR=1 
export CUDA_VISIBLE_DEVICES=${gpu_id}

切换到项目目录以执行训练脚本

配置环境变量以启用完整错误跟踪（HYDRA_FULL_ERROR），并指定用于训练的 GPU 设备

6 执行 train.py

python train.py --config-name=${config_name}.yaml \task=${task_name} \hydra.run.dir=${run_dir} \training.debug=$DEBUG \training.seed=${seed} \training.device="cuda:0" \exp_name=${exp_name} \logging.mode=${wandb_mode} \checkpoint.save_ckpt=${save_ckpt} \task.dataset.zarr_path=$dataset_path

--config-name：yaml 配置文件名

task：任务名

hydra.run.dir：Hydra 输出目录

training.debug：调试模式标志

training.seed：设置随机种子以确保可重复性

training.device：选择 GPU 设备

exp_name：指定实验名称，用于日志记录

logging.mode：配置 wandb 日志模式

checkpoint.save_ckpt：是否保存模型检查点

task.dataset.zarr_path：数据集路径

iDP3复现代码模型训练全流程（一）——train_policy.sh

iDP3 核心脚本包括三个：deploy_policy.sh、vis_dataset.sh、train_policy.sh，分别代表了部署、预处理和训练，分别作为对应 py 脚本的参数设置前置环节训练环节仅需运行指令： # 3d policy bash scripts/train_policy.sh idp3 gr1…...

编程日记 2024/12/25 23:09:07

重温设计模式--单例模式

文章目录单例模式（Singleton Pattern）概述单例模式的实现方式及代码示例1. 饿汉式单例（在程序启动时就创建实例）2. 懒汉式单例（在第一次使用时才创建实例） 单例模式的注意事项应用场景 C代码懒汉模式-经典…...

编程日记 2024/12/25 23:07:05

【人工智能】Python中的机器学习管道：如何用scikit-learn构建高效的ML管道

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界在机器学习项目中，数据预处理、特征工程、模型训练与评估是不可或缺的环节。随着项目规模的扩大和复杂度的增加，手动管理这些步骤不仅繁琐…...

编程日记 2024/12/25 23:05:03

Redis存在安全漏洞

Redis是美国Redis公司的一套开源的使用ANSI C编写、支持网络、可基于内存亦可持久化的日志型、键值（Key-Value）存储数据库，并提供多种语言的API。 Redis存在安全漏洞。攻击者利用该漏洞使用特制的Lua脚本触发堆栈缓冲区溢出漏洞，从…...

编程日记 2024/12/25 23:03:02

Scala图书管理系统

项目创建并实现基础UI package org.appimport scala.io.StdInobject Main {def main(args: Array[String]): Unit {var running truewhile (running) {println("欢迎来到我的图书管理系统，请选择")println("1.查看所有图书")println("2…...

编程日记 2024/12/25 22:50:46

【数据可视化案列】白葡萄酒质量数据的EDA可视化分析

🧑 博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN…...

编程日记 2024/12/25 22:38:33

Postman接口测试：全局变量/接口关联/加密/解密

🍅 点击文末小卡片，免费获取软件测试全套资料，资料在手，涨薪更快全局变量和环境变量全局变量：在postman全局生效的变量，全局唯一环境变量：在特定环境下生效的变量，本环境内唯一 …...

编程日记 2024/12/25 22:37:33

vue+elementui实现下拉表格多选+搜索+分页+回显+全选2.0

一、vueelementui实现下拉表格多选搜索1.0 二、vueelementui实现下拉表格多选搜索分页回显全选2.0 在1.0的基础上，终于可以实现在下拉框表格分页的前提下不同页码的回显辣，分页是前端来分页的（代码略乱且没有封装还很长，随便看看…...

编程日记 2024/12/25 22:36:31

电商系统-产品经理

电视产品经理的工作体系： 产品经理的分类与职责 C端产品经理：面向个人用户，关注用户体验和产品易用性B端产品经理：面向企业客户，注重功能完整性和商业价值专业方向细分： 用户产品经理：专注用户…...

编程日记 2024/12/25 22:35:30

《庐山派从入门到...》PWM板载蜂鸣器

《庐山派从入门到...》PWM板载蜂鸣器配置PWM模块控制板载无源蜂鸣器播放【一闪一闪亮晶晶】播放do re mi 《庐山派从入门到...》PWM控制无源蜂鸣器 PWM（Pulse Width Modulation，脉宽调制）是一种在嵌入式系统中常用的技术，它可以用…...

编程日记 2024/12/25 22:34:28

【河南新标】豫财预〔2024〕105号－《关于省级政务信息化建设项目支出预算标准的规定》－费用标准解读系列29

2024年12月3日，河南省财政厅发布了《关于省级政务信息化建设项目支出预算标准的规定》豫财预〔2024〕105号。《关于省级政务信息化建设项目支出预算标准的规定 （试行）》（豫财预〔2020〕81号）同时废止。新的豫财预〔20…...

编程日记 2024/12/25 22:30:24

【数据结构】数据结构整体大纲

数据结构用来干什么的？很简单，存数据用的。 （这篇文章仅介绍数据结构的大纲，详细讲解放在后面的每一个章节中，逐个击破） 那为什么不直接使用数组、集合来存储呢 ——> 如果有成千上亿条数据呢&#xff…...

编程日记 2024/12/25 22:28:22

【C++基础】09、结构体

一、结构体(struct) C/C 数组允许定义可存储相同类型数据项的变量，但是结构体是 C 中另一种用户自定义的可用的数据类型，它允许存储不同类型的数据项。结构体用于表示一条记录，假设现在想要跟踪图书馆中书本的动态，可能需要跟踪每…...

编程日记 2024/12/25 22:24:18

大恒相机开发（2）—Python软触发调用采集图像

大恒相机开发（2）—Python软触发调用采集图像完整代码详细解读和功能说明扩展学习这段代码是一个Python程序，用于从大恒相机采集图像，通过软件触发来采集图像。完整代码咱们直接上python的完整代码： # version:…...

编程日记 2024/12/25 22:22:16

QT的前景与互联网岗位发展

qt是用来干什么的 --》桌面应用开发（做电脑的应用程序，面对客户端）。主要用于开发跨平台的应用程序和用户界面（UI）。它是一个全面的C库集合，提供了构建软件应用所需的各种工具和功能。客户端开发的重…...

编程日记 2024/12/25 22:20:13

青藤入选工信部“2024年网络安全技术应用典型案例拟支持项目名单”

近日，工业和信息化部公示了“2024年网络安全技术应用典型案例拟支持项目名单”，青藤云安全联合某股份制银行共同申报的主机威胁狩猎平台项目凭借其技术先进性及行业示范性成功入选。网络安全技术应用试点示范工作是由工业和信息化部、国家互联网信息办公…...

编程日记 2024/12/25 22:19:12

NVIDIA GPU 内部架构介绍

NVIDIA GPU 架构 NVIDIA GPU 的 SM（Streaming Multiprocessor） 和 GPC（Graphics Processing Cluster） 是 GPU 架构中的关键组成部分。它们决定了 GPU 的计算能力和性能，以下是对这两个参数的详细介绍： 1. …...

编程日记 2024/12/25 22:11:03

重温设计模式----装饰模式

文章目录装饰模式定义UML 图其主要优点包括：装饰模式的主要角色有：C 代码示例总结装饰模式定义动态的给一个对象添加一些额外的职责，就增加功能来说，装饰模式必生成子类更加灵活装饰模式（Decorator Pattern&…...

编程日记 2024/12/25 22:08:58

第十六章 C++ 字符串

C 字符串 C 提供了以下两种类型的字符串表示形式： C 风格字符串C 引入的 string 类类型 C 风格字符串 C 风格的字符串起源于 C 语言，并在 C 中继续得到支持。字符串实际上是使用 null 字符终止的一维字符数组。因此，一个以 null 结尾的…...

编程日记 2024/12/25 22:06:56

MySQL中Seconds_Behind_Master是怎么计算的

目录 1.Seconds_Behind_Master计算方式2.Seconds_Behind_Master 计算方式会存在什么问题3.更好的方式3.1 实现方法3.2 优点在MySQL中，Seconds_Behind_Master是一个用于表示从库（Slave）落后于主库（Master）的时间（以秒为单位）的指标。 1.Seconds_Behind_Master计算方式其…...

编程日记 2024/12/25 21:59:49

脑机新手指南（八）：OpenBCI_GUI：从环境搭建到数据可视化（下）

一、数据处理与分析实战 （一）实时滤波与参数调整基础滤波操作 60Hz 工频滤波：勾选界面右侧 “60Hz” 复选框，可有效抑制电网干扰（适用于北美地区，欧洲用户可调整为 50Hz）。平滑处理&…...

编程新知 2025/11/19 22:56:53

基于服务器使用 apt 安装、配置 Nginx

🧾 一、查看可安装的 Nginx 版本首先，你可以运行以下命令查看可用版本： apt-cache madison nginx-core输出示例： nginx-core | 1.18.0-6ubuntu14.6 | http://archive.ubuntu.com/ubuntu focal-updates/main amd64 Packages ng…...

编程新知 2026/1/9 12:53:59

页面渲染流程与性能优化

页面渲染流程与性能优化详解（完整版） 一、现代浏览器渲染流程（详细说明） 1. 构建DOM树浏览器接收到HTML文档后，会逐步解析并构建DOM（Document Object Model）树。具体过程如下： (…...

编程新知 2026/1/31 11:58:35

【Web 进阶篇】优雅的接口设计：统一响应、全局异常处理与参数校验

系列回顾： 在上一篇中，我们成功地为应用集成了数据库，并使用 Spring Data JPA 实现了基本的 CRUD API。我们的应用现在能“记忆”数据了！但是，如果你仔细审视那些 API，会发现它们还很“粗糙”：有…...

编程新知 2026/1/22 20:46:43

[Java恶补day16] 238.除自身以外数组的乘积

给你一个整数数组 nums，返回数组 answer ，其中 answer[i] 等于 nums 中除 nums[i] 之外其余各元素的乘积。题目数据保证数组 nums之中任意元素的全部前缀元素和后缀的乘积都在 32 位整数范围内。请不要使用除法，且在 O(n) 时间复杂度…...

编程新知 2025/10/3 13:53:38

Linux --进程控制

本文从以下五个方面来初步认识进程控制： 目录进程创建进程终止进程等待进程替换模拟实现一个微型shell 进程创建在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程，创建出来的进程就是子进程，原来的进程为父进程。…...

编程新知 2026/1/30 15:27:25

从“安全密码”到测试体系：Gitee Test 赋能关键领域软件质量保障

关键领域软件测试的"安全密码"：Gitee Test如何破解行业痛点在数字化浪潮席卷全球的今天，软件系统已成为国家关键领域的"神经中枢"。从国防军工到能源电力，从金融交易到交通管控，这些关乎国计民生的关键领域…...

编程新知 2026/2/2 20:26:17

永磁同步电机无速度算法--基于卡尔曼滤波器的滑模观测器

一、原理介绍传统滑模观测器采用如下结构： 传统SMO中LPF会带来相位延迟和幅值衰减，并且需要额外的相位补偿。采用扩展卡尔曼滤波器代替常用低通滤波器(LPF)，可以去除高次谐波，并且不用相位补偿就可以获得一个误差较小的转子位…...

编程新知 2026/2/10 6:48:11

Linux部署私有文件管理系统MinIO

最近需要用到一个文件管理服务，但是又不想花钱，所以就想着自己搭建一个，刚好我们用的一个开源框架已经集成了MinIO，所以就选了这个我这边对文件服务性能要求不是太高，单机版就可以安装非常简单，几个命令就…...

编程新知 2026/2/7 17:45:38

如何配置一个sql server使得其它用户可以通过excel odbc获取数据

要让其他用户通过 Excel 使用 ODBC 连接到 SQL Server 获取数据，你需要完成以下配置步骤： ✅ 一、在 SQL Server 端配置（服务器设置） 1. 启用 TCP/IP 协议打开 “SQL Server 配置管理器”。导航到：SQL Server 网络配…...

编程新知 2025/8/25 19:37:12

1 变量设置

2 命令行参数

3 衍生变量

4 调试模式

5 切换目录并设置环境变量

6 执行 train.py

相关文章：