当前位置: 首页 > article >正文

CANN pi0机器人VLA大模型昇腾推理指南

pi0机器人VLA大模型昇腾使用指南【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligencepi0整体介绍论文题目π0: A Vision-Language-Action Flow Model for General Robot Control中文译文π0: 一个用于通用机器人控制的视觉-语言-动作流匹配模型功能介绍pi0是一个视觉-语言-动作VLA模型专为通用机器人控制而设计。它基于预训练的视觉语言模型VLM结合流匹配flow matching机制能够生成高频连续动作实现对复杂、灵巧机器人任务的精准控制。整合OXE开源数据集和自有数据集总计超过10,000小时机器人操作数据。在叠衣服、桌面清理、装盒等复杂任务上表现优异零样本和微调设置下均显著优于现有基线方法OpenVLA、Octo、ACT等。成功完成5-20分钟的长时序多阶段任务展现出强大的鲁棒性和泛化能力。pi0的相关代码仓拉取、数据集和模型下载# 进入需要放置代码仓的本地xxx目录下 cd xxx git clone https://gitcode.com/cann/cann-recipes-embodied-intelligence.git chmod x cann-recipes-embodied-intelligence/manipulation/pi0/infer_with_torch/download_code_and_data.sh ./cann-recipes-embodied-intelligence/manipulation/pi0/infer_with_torch/download_code_and_data.sh完成上述操作之后最终lerobot根目录中相关代码目录树详见附录lerobot根目录相关代码目录树。pi0在昇腾A2上的运行环境配置与昇腾服务器无关的环境配置# 创建运行环境 conda create -y -n lerobot python3.10 conda activate lerobot # 回到lerobot根目录安装lerobot。 cd lerobot pip install -e .与昇腾平台相关的环境配置安装CANN软件包。本样例的编译执行依赖CANN开发套件包cann-toolkit与CANN二进制算子包cann-kernels支持的CANN软件版本为CANN 8.3.RC1。 请从软件包下载地址下载Ascend-cann-toolkit_8.3.RC1_linux-aarch64.run与Ascend-cann-kernels-910b_8.3.RC1_linux-aarch64.run软件包并参考CANN安装文档依次进行安装。# ${cann_install_path}为CANN包的实际安装目录注意每次新建终端时首先source一下set_env.sh。 # 方式1默认路径安装以root用户为例 source /usr/local/Ascend/ascend-toolkit/set_env.sh # 方式2指定路径进行安装 source ${cann_install_path}/ascend-toolkit/set_env.sh # 在上述运行环境中继续安装对应版本torch-npu pip install torch-npu2.1.0.post12pi0在昇腾上的推理步骤运行下面的代码即可自动加载koch机械臂数据集进行pi0模型推理打印推理性能及机器人动作。# 进入lerobot代码仓根目录 cd lerobot conda activate lerobot chmod x run_pi0_inference.sh ./run_pi0_inference.sh koch_test pi0_model 10 100基于上述运行过程得到pi0的单次推理时间及结果如下所示详细的优化过程介绍见 pi0 优化说明文档推理性能单次推理时间下降至80 ms达到了预期的推理时间性能优化目标。推理结果单次推理结果为50组机械臂关节角度序列shape为[50,6]。pi0在昇腾上的精度验证步骤基于koch机械臂末端位姿的ATE(绝对误差)来验证昇腾的推理精度为了能够以固定变量法进行昇腾平台的推理精度测试需将pi0推理中action_expert中的高斯噪声采样部分进行固定噪声文件加载(即使用同样的高斯噪声采样数据)。基于pi0模型推理得到的整段轨迹六关节角度序列(维度:50x6)通过获取koch机械臂的物理DH参数执行koch机械臂正运动学运算得到koch机械臂末端执行器中心的实际位姿位置x-y-z 姿态r-p-y然后通过ATE(absolute error)方法进行二范数计算得到昇腾平台上koch机械臂末端位姿的误差参数误差参考范围如下所示位置ATE误差参考范围[0, 0.03]m姿态ATE误差参考范围[0, 0.2 ]radCitationmisc{black2024pi0, title{$\pi$0: A Vision-Language-Action Flow Model for General Robot Control}, author{Kevin Black and Noah Brown and Danny Driess and Adnan Esmail and Michael Equi and Chelsea Finn and Niccolo Fusai and Lachy Groom and Karol Hausman and Brian Ichter and Szymon Jakubczak and Tim Jones and Liyiming Ke and Sergey Levine and Adrian Li-Bell and Mohith Mothukuri and Suraj Nair and Karl Pertsch and Lucy Xiaoyang Shi and James Tanner and Quan Vuong and Anna Walling and Haohuan Wang and Ury Zhilinsky}, year{2024}, eprint{2410.24164}, archivePrefix{arXiv}, primaryClass{cs.RO}, url{https://arxiv.org/abs/2410.24164} }附录lerobot根目录相关代码目录树检查整体代码目录树经过上述的复制及替换操作pi0适配昇腾的lerobot根目录中的最终相关代码目录树如下所示├── koch_test # koch机械臂抓取任务数据集,符合lerobot数据集格式 ├── lerobot # pi0模型训练及推理框架 | ├── common | | ├── policies | | | ├── pi0 | | | | ├── modeling_pi0.py # pi0的模型训练及推理代码 | | | | ├── paligemma_with_expert.py # pi0的模型训练及推理代码 ├── pi0_model # koch机械臂抓取任务预训练pi0模型 └── pyproject.toml # 运行环境第三方包的安装版本 └── README.md # 昇腾上运行pi0推理的环境配置及操作指导 └── run_pi0_inference.sh # 昇腾上运行pi0推理过程一键启动脚本 └── test_pi0_on_ascend.py # 昇腾上运行pi0推理主代码【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN pi0机器人VLA大模型昇腾推理指南

pi0机器人VLA大模型昇腾使用指南 【免费下载链接】cann-recipes-embodied-intelligence 本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence pi0整体介绍 论…...

CANN/AMCT线性量化训练API文档

LinearQAT 【免费下载链接】amct AMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。 项目地址: https://gitcode.com/cann/amct 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理系列产品√Atlas A2 训练系列产品/Atlas A2…...

STM32F4 FSMC接NOR Flash实战:不仅仅是存储,还能直接运行代码(XIP模式详解)

STM32F4 FSMC接NOR Flash实战:XIP模式深度解析与性能优化 在嵌入式系统设计中,启动速度和存储效率往往是开发者面临的核心挑战。想象一下这样的场景:当系统上电时,传统方案需要将存储在NOR Flash中的代码搬运到RAM中执行&#xff…...

CANN/AMCT自动通道稀疏搜索配置

自动通道稀疏搜索简易配置文件 【免费下载链接】amct AMCT是CANN提供的昇腾AI处理器亲和的模型压缩工具仓。 项目地址: https://gitcode.com/cann/amct 自动通道稀疏搜索的相关配置说明存在于basic_info.proto文件中,该文件所在目录为:_AMCT_安装…...

告别background page!Chrome插件开发从Manifest V2升级到V3,Service Worker保姆级迁移指南

Chrome插件开发:从Manifest V2到V3的Service Worker实战迁移指南 如果你正在为Chrome插件从Manifest V2升级到V3而头疼,特别是面对background page到Service Worker的转变感到困惑,这篇文章就是为你准备的。我们将深入探讨如何将你的插件平滑…...

cannbot-skills多流与控核API路由

多流与控核 API 路由 【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills 本文件用于把“执行路径 / 问题类型”映射到上游…...

CANN/hccl Atlas A2 rank table配置

rank table配置资源信息(Atlas A2 训练系列产品/Atlas A2 推理系列产品) 【免费下载链接】hccl 集合通信库(Huawei Collective Communication Library,简称HCCL)是基于昇腾AI处理器的高性能集合通信库,为计…...

给Stable Diffusion模型加个‘隐形身份证’:手把手教你用Stable Signature实现AI生图溯源

为Stable Diffusion模型植入数字指纹:实战Stable Signature水印技术 在AI生成内容爆炸式增长的今天,如何确保自己精心训练的扩散模型不被滥用?当看到社交媒体上出现用你的模型生成的侵权图片时,如何证明它的来源?传统水…...

CANN运行时异步内存复制示例

4_d2h_async_memory_copy 【免费下载链接】runtime 本项目提供CANN运行时组件和维测功能组件。 项目地址: https://gitcode.com/cann/runtime 描述 本样例展示了Device到Host的内存复制,使用aclrtMemcpyAsync内存复制接口。 产品支持情况 本样例支持以下产…...

CANN PTO手动资源绑定操作

手动/资源绑定 【免费下载链接】pto-isa Parallel Tile Operation (PTO) is a virtual instruction set architecture designed by Ascend CANN, focusing on tile-level operations. This repository offers high-performance, cross-platform tile operations across Ascend …...

CANN/pypto设置验证选项API

pypto.set_verify_options 【免费下载链接】pypto PyPTO(发音: pai p-t-o):Parallel Tensor/Tile Operation编程范式。 项目地址: https://gitcode.com/cann/pypto 产品支持情况 产品是否支持Atlas A3 训练系列产品/Atlas A3 推理系列…...

PCB布局翻车实录:我的电流采样精度为什么总差那么一点?(TI电流感应放大器布局避坑全解)

PCB布局翻车实录:电流采样精度为何总差那么一点? 1. 高精度电流采样的隐形杀手 作为一名硬件工程师,你是否经历过这样的场景:精心挑选了TI的高性能电流感应放大器,按照数据手册一丝不苟地设计了电路,甚至连…...

CANN/ops-math 融合转置D算子

ConfusionTransposeD 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√ 功能说明 算子功能&#xff1a…...

PhonePi MCP:基于MCP协议实现AI助手远程控制手机的完整指南

1. 项目概述:将你的手机变成AI助手的智能工具箱 如果你和我一样,日常工作中重度依赖像Cursor、Claude Desktop这类AI编程助手,那你肯定遇到过这样的场景:正在电脑前专注写代码,手机突然在另一个房间响了,或…...

在昇腾训练平台上适配Hunyuan3D 2.0 模型的推理

在昇腾训练平台上适配Hunyuan3D 2.0 模型的推理 【免费下载链接】cann-recipes-embodied-intelligence 本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence …...

Go语言实现轻量级TCP/UDP代理:核心原理、源码解析与实战部署

1. 项目概述:一个轻量级代理转发工具的核心设计最近在折腾一些本地服务联调和跨网络访问的场景时,经常遇到一个痛点:某个服务只监听在本地回环地址(127.0.0.1),或者因为网络策略限制,无法从外部…...

AI时代网络安全教学:伦理困境、框架设计与实践路径

1. 项目概述:当AI成为课堂的“助教”与“考题”最近几年,AI技术,特别是大语言模型,像潮水一样涌入了各行各业。网络安全这个领域,作为技术的前沿阵地,感受尤为深刻。以前我们教学生,讲的是如何分…...

CANN量化索引器元数据文档

QuantLightningIndexerMetadata 【免费下载链接】cann-recipes-infer 本项目针对LLM与多模态模型推理业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-infer 产品支持情况 产品是否支持 Atlas A3 …...

XUnity翻译器:告别语言障碍,畅玩全球Unity游戏的终极指南

XUnity翻译器:告别语言障碍,畅玩全球Unity游戏的终极指南 【免费下载链接】XUnity.AutoTranslator 项目地址: https://gitcode.com/gh_mirrors/xu/XUnity.AutoTranslator 还在为看不懂的日文RPG、韩文视觉小说或英文独立游戏而烦恼吗&#xff1f…...

CANN/catlass A8W4 MX量化矩阵乘法示例

A8W4MxMatmul Example Readme 【免费下载链接】catlass 本项目是CANN的算子模板库,提供NPU上高性能矩阵乘及其相关融合类算子模板样例。 项目地址: https://gitcode.com/cann/catlass 注意:社区包暂不支持 950 能力,后续支持的版本敬请…...

iPhone价格撑不住了,苹果内存即将见底;追觅CEO要求全员开通社交账号;DeepSeek多模态模型技术报告公布 | 极客头条

「极客头条」—— 技术人员的新闻圈!CSDN 的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。(投稿或寻求报道:zhanghycsdn.net)整理 | 苏宓出品 | CSDN(ID&…...

第二十天打卡逆波兰表达式求值

除法向零截断:这意味着 6 / -132 结果是 0,且 C 中整数除法默认就是向零截断,符合题目要求。操作数顺序:对于减法和除法,先弹出的数是右操作数,后弹出的数是左操作数。例如遇到 -,若栈顶是 b&am…...

大语言模型推理能力与自指认知的架构解析

1. 大语言模型推理能力的底层架构解析大语言模型的逻辑推理能力建立在Transformer架构的多层自注意力机制之上。这种架构设计使得模型能够通过注意力权重动态构建不同概念之间的关联网络。在推理任务中,特定模式的注意力分布会形成类似人类"思维链"的信息…...

CANN框架适配模板

框架适配模板 【免费下载链接】cannbot-skills CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体,本仓库为其提供可复用的 Skills 模块。 项目地址: https://gitcode.com/cann/cannbot-skills 替换 {model_name}(小写下划线)和…...

我做了一个 Agent Skill,一句话生成一镜到底城市宣传片

上周,我制作了一个 skill ,用这个 skill 可以一键直出符合生成 seedance2.0 视频生成模型的城市宣传片分镜提示词,这个 skill 可以让你在 15 秒的视频当中,做出一镜到底效果的城市宣传片。我为什么制作这么一个 skill 呢&#xff…...

AI代码溯源工具clawd-blame:为AI生成代码建立对话上下文映射

1. 项目概述:一个为AI编程时代量身定制的“代码溯源”工具如果你和我一样,深度依赖 Cursor 这类 AI 驱动的 IDE 进行日常开发,那你一定遇到过这个令人头疼的场景:面对一段由 Claude 生成的、逻辑复杂但注释寥寥的代码,…...

轻量级Docker管理面板clawpanel:部署、安全与实战应用指南

1. 项目概述与核心价值最近在折腾一个自托管项目时,发现了一个挺有意思的玩意儿——qingchencloud/clawpanel。这名字乍一看有点抽象,“爪面板”?但如果你和我一样,经常在Docker生态里摸爬滚打,看到这个项目托管在Dock…...

3个步骤让Windows用户也能享受AirPods完整功能:AirPodsDesktop深度指南

3个步骤让Windows用户也能享受AirPods完整功能:AirPodsDesktop深度指南 【免费下载链接】AirPodsDesktop ☄️ AirPods desktop user experience enhancement program, for Windows and Linux (WIP) 项目地址: https://gitcode.com/gh_mirrors/ai/AirPodsDesktop …...

从开发者控制台体验Taotoken计费与用量观测的透明度

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 从开发者控制台体验Taotoken计费与用量观测的透明度 对于依赖大模型API进行开发的团队和个人而言,成本控制与资源管理是…...

CANN ops-math矩阵对角线提取算子

MatrixDiagPartV3 【免费下载链接】ops-math 本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。 项目地址: https://gitcode.com/cann/ops-math 产品支持情况 产品是否支持Ascend 950PR/Ascend 950DT√Atlas A3 训练系列产品/Atlas A3 推理…...