当前位置: 首页 > article >正文

CANN具身智能优化样例

CANN Recipes for Embodied Intelligence【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence Latest News[2026/04] Hunyuan3D 2.0 三维生成与渲染模型在昇腾Atlas A2上推理已支持增加dit-cache方案优化样例已开源。[2026/04] PI0模型支持在昇腾Atlas A2上训练样例已开源。[2026/04] SmolVLA模型支持在昇腾Atlas A2上训练样例已开源。[2026/04] ACT模型支持在昇腾Atlas A2上训练样例已开源。[2026/04] Pi0.5模型在昇腾Ascend 310P上已支持OM静态图推理部署样例已开源。[2026/03] LQC模型在昇腾 A2上已支持训练和推理样例已开源。[2026/03] Pi0.5模型在昇腾Ascend 310P上已支持在线推理部署样例已开源。[2026/02] Isaac-GR00T N1.6模型在昇腾Atlas A3上已支持推理样例已开源。[2026/02] Cosmos-Predict2.5-2B世界模型在昇腾Atlas A3上已支持推理样例已开源。[2026/02] Cosmos-Transfer2.5-2B世界模型在昇腾Atlas A3上已支持推理样例已开源。[2026/02] Alpamayo-R1智驾模型在昇腾Atlas A2上已支持推理样例已开源。[2026/01] Spirit v1.5模型在昇腾Ascend 310P上已支持推理样例已开源。[2025/12] Pi0模型在昇腾Ascend 310P上已支持推理样例已开源。[2025/12] OpenVLA模型在昇腾Ascend 310P上已支持推理样例已开源。[2025/12] DiffusionPolicy模型在昇腾Ascend 310P上已支持推理样例已开源。[2025/12] ACT模型在昇腾Ascend 310P上已支持推理样例已开源。[2025/11] Pi0模型在昇腾Atlas A2系列上已支持推理代码已开源。 概述cann-recipes-embodied-intelligence 仓库针对具身智能领域的典型模型和加速算法提供基于 CANN 平台的优化样例。本仓库旨在帮助开发者快速、高效地在昇腾平台上部署和优化具身智能模型降低开发门槛加速应用落地。核心特性覆盖操作类Manipulation、世界模型World Model、导航Navigation、运动控制Locomotion、3D视觉3D Vision等典型场景提供训练、在线推理、离线推理OM等多种样例包含性能优化指南和精度验证方案✨ 样例列表操作类模型 (Manipulation)场景特点操作类模型专注于机器人手臂的运动控制与任务执行解决抓取、放置、组装等精细操作问题。这类模型通常接收视觉观测和语言指令作为输入输出机器人的动作序列如关节角度、末端位姿等适用于工业装配、家庭服务、实验室自动化等场景。模型平台场景简介性能参考Pi0在线推理Atlas A2在线推理基于LeRobot库通过使能融合算子、图模式、计算逻辑优化等手段实现较低推理时延。80 ms训练Atlas A2训练支持 8 卡分布式训练与评测默认集成已验证的训练优化。81.77 samples/s(优化后)离线推理Ascend 310P离线推理基于LeRobot库使用OM静态图进行离线推理实现较低推理时延。~270 ms(OrangePi AI Station)Pi0.5在线推理Ascend 310P在线推理基于PyTorch直接进行在线推理。~862 ms离线推理Ascend 310P离线推理使用OM静态图进行离线推理实现较低推理时延。~410 ms训练Atlas A2训练在Atlas A2环境进行训练精度正常性能达到较优水平。88.89 samples/s(优化后)ACT训练Atlas A2训练支持 8 卡分布式训练与评测。760.24 samples/s(优化后)离线推理Ascend 310P离线推理使用OM静态图进行离线推理实现较低推理时延。~200 ms(OrangePi AI Station)SmolVLA训练Atlas A2训练支持 LIBERO 数据集的多卡训练与评测。233~244 samples/s(8卡稳定阶段)DiffusionPolicy离线推理Ascend 310P离线推理使用OM静态图进行离线推理实现较低推理时延。-OpenVLA离线推理Ascend 310P离线推理OpenVLA 7B模型OM离线推理实现较低推理时延。-Isaac-GR00T N1.6在线推理Atlas A3在线推理通用人形机器人基础模型适配昇腾A3平台。-Spirit v1.5在线推理Ascend 310P在线推理千寻智能自研的具身智能模型RoboChallenge评测综合排名第一(截至2026.1.12)。-世界模型 (World Model)场景特点世界模型通过学习物理世界的规律能够预测或生成未来场景的视频内容。这类模型支持文本/图像/视频等条件输入生成符合物理一致性如重力、碰撞、流体动力学的视频预测可用于策略评估、合成数据生成、闭环仿真等任务帮助机器人系统在虚拟环境中预演和验证行为决策。模型平台场景简介性能参考Cosmos-Predict2.5-2B在线推理Atlas A3在线推理Cosmos世界基础模型支持文本/图像生成世界(Text2World/Image2World)生成物理一致的视频。~920 s(生成5.8s视频)Cosmos-Transfer2.5-2B在线推理Atlas A3在线推理Cosmos世界基础模型支持多控制信号(深度图/语义分割/边缘检测等)的视频风格转换。-导航模型 (Navigation)场景特点导航模型聚焦于移动机器人或自动驾驶系统的路径规划与决策问题。这类模型融合视觉感知、环境理解和运动预测能力在复杂动态环境中规划安全、高效的行驶路径适用于自动驾驶、无人机导航、移动机器人避障等场景。模型平台场景简介性能参考Alpamayo-R1在线推理Atlas A2在线推理面向L4/L5级智能驾驶的VLA大模型(10B)支持因果思维链推理。~7.32 s(生成10条预测轨迹)运动控制模型 (Locomotion)场景特点运动控制模型解决足式机器人如人形机器人、四足机器人的运动协调与平衡控制问题。这类模型基于强化学习训练学习在不同地形条件下保持稳定行走、奔跑、跳跃等运动模式适用于人形机器人巡检、四足机器人物流配送、救援探索等场景。模型平台场景简介性能参考LQC训练推理Atlas A2训练推理足式机器人的强化学习运动控制器适用于G1、GO2等主流机器人型号。-3D视觉模型 (3D Vision)场景特点3D视觉模型专注于从二维图像或文本描述生成高质量三维资产如网格模型、纹理贴图等。这类模型广泛应用于数字孪生、虚拟现实、游戏开发、建筑设计等领域能够快速生成可编辑、可渲染的3D内容显著降低传统建模的时间成本。模型平台场景简介性能参考Hunyuan3D 2.0在线推理Atlas A2在线推理腾讯混元三维生成与渲染模型支持文本/图像生成高保真3D资产带高分辨率纹理贴图。~26 s(texgen2万平面mesh) 一站式平台快速体验「一站式平台」是为开发者提供的 NPU 环境内部已集成完整的 CANN 环境可以直接使用。cann-recipes-embodied-intelligence 针对该平台在相应样例 README 中提供了简化的「快速启动」路径帮助用户最小步骤完成 NPU 推理体验。当前支持的模型正在持续扩展中敬请关注实践简介VGGT基于PyTorch框架在Atlas A2/A3环境中完成VGGT三维重建推理针对一站式平台场景提供简化的启动流程帮助用户快速上手完成一次端到端 NPU 推理体验。 目录结构说明├─CONTRIBUTION.md ├─DISCLAIMER.md ├─LICENSE ├─README.md ├─Third_Party_Open_Source_Software_Notice ├─docs # 文档目录 │ ├─manipulation # 操作类模型文档目录 │ │ └─pi0 # Pi0相关文档 │ │ └─infer_with_torch │ └─3d_vision # 3D视觉模型文档目录 │ └─Hunyuan3D # Hunyuan3D相关文档 ├─manipulation # 操作类模型目录 │ ├─act # Action Chunking with Transformers模型样例 │ │ ├─infer_with_om # ACT模型om离线推理样例 │ │ └─train # ACT模型训练样例 │ ├─diffusion-policy # DiffusionPolicy模型样例 │ │ └─infer_with_om # DiffusionPolicy模型om离线推理样例 │ ├─openvla # OpenVLA模型样例 │ │ └─infer_with_om │ ├─pi0 # Pi0模型样例 │ │ ├─infer_with_om # Pi0模型离线推理样例 │ │ ├─infer_with_torch # Pi0模型torch推理样例 │ │ └─train # Pi0模型训练样例 │ ├─pi05 # Pi0.5模型样例 │ │ ├─infer_with_om # Pi0.5模型离线推理样例 │ │ ├─infer_with_torch # Pi0.5模型在线推理样例 │ │ └─train # Pi0.5模型训练样例 │ ├─smolvla # SmolVLA模型样例 │ │ └─train # SmolVLA模型训练样例 │ ├─Isaac-GR00T # Isaac-GR00T N1.6模型样例 │ └─spirit-v1.5 # Spirit v1.5模型样例 │ └─infer_with_torch ├─world_model # 世界模型目录 │ ├─cosmos-predict2.5 # Cosmos-Predict2.5-2B世界模型 │ └─cosmos-transfer2.5 # Cosmos-Transfer2.5-2B世界模型 ├─navigation # 导航模型目录 │ └─alpamayo-r1 # Alpamayo-R1智驾模型样例 ├─locomotion # 运动控制模型目录 │ └─LQC # Learning-based Quadruped Robot Controller运动控制模型 └─3d_vision # 3D视觉模型目录 └─Hunyuan3D # Hunyuan3D 2.0三维生成模型样例 相关信息贡献指南许可证cann-recipes-embodied-intelligence仓涉及的模型如模型目录下存在License的以该License为准。如模型目录下不存在License的遵循Apache 2.0许可证。免责声明【免费下载链接】cann-recipes-embodied-intelligence本项目针对具身智能业务中的典型模型、加速算法提供基于CANN平台的优化样例项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

相关文章:

CANN具身智能优化样例

CANN Recipes for Embodied Intelligence 【免费下载链接】cann-recipes-embodied-intelligence 本项目针对具身智能业务中的典型模型、加速算法,提供基于CANN平台的优化样例 项目地址: https://gitcode.com/cann/cann-recipes-embodied-intelligence &#…...

如何10分钟快速搭建Sunshine游戏串流服务器:完整实战指南

如何10分钟快速搭建Sunshine游戏串流服务器:完整实战指南 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine Sunshine是一款开源的自托管游戏串流服务器,专为M…...

抖音批量下载工具:5分钟搞定无水印内容保存

抖音批量下载工具:5分钟搞定无水印内容保存 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallback support. 抖音批…...

解锁全平台直播录制:DouyinLiveRecorder让你永不错过精彩瞬间

解锁全平台直播录制:DouyinLiveRecorder让你永不错过精彩瞬间 【免费下载链接】DouyinLiveRecorder 可循环值守和多人录制的直播录制软件,支持抖音、TikTok、Youtube、快手、虎牙、斗鱼、B站、小红书、pandatv、sooplive、flextv、popkontv、twitcasting…...

企业级即时通讯「删除消息」:六个场景叠加之后,复杂性超出你的想象

本文不是一上来就讲方案,而是带你还原真实的业务场景,看清楚复杂性是如何一层一层叠加上来的。每加一个场景,原来的解法就出现新的漏洞,直到六个场景同时存在,你才会明白为什么"删除一条消息"在企业级系统里…...

bili2text:如何用3个步骤将B站视频转换为可搜索的文本知识库?

bili2text:如何用3个步骤将B站视频转换为可搜索的文本知识库? 【免费下载链接】bili2text Bilibili视频转文字,一步到位,输入链接即可使用 项目地址: https://gitcode.com/gh_mirrors/bi/bili2text 在信息过载的数字时代&a…...

TranslucentTB - Windows任务栏透明化技术配置手册

TranslucentTB - Windows任务栏透明化技术配置手册 【免费下载链接】TranslucentTB A lightweight utility that makes the Windows taskbar translucent/transparent. 项目地址: https://gitcode.com/gh_mirrors/tr/TranslucentTB TranslucentTB是一款专为Windows 10/1…...

Taotoken模型广场如何帮助开发者快速对比与选择合适模型

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 Taotoken模型广场如何帮助开发者快速对比与选择合适模型 当开发者需要为大语言模型应用选择基础模型时,常常面临一个现…...

解决Wireshark安装 无法显示USB接口

密评实施过程中,会使用到Wireshark抓取智能密码钥匙的通信流量,但是某些情况下安装Wireshark之后,无法找到USB的捕获接口,重启Wireshark和电脑后还是无法正常显示。如下图。解决办法如下:将“USBPcapCMD.exe”复制到“…...

3D高斯泼溅优化:多项式核函数与高效剔除算法

1. 3D高斯泼溅技术背景与挑战在实时神经渲染领域,3D高斯泼溅(3D Gaussian Splatting, 3DGS)已成为近年来最具突破性的技术之一。这项技术通过将场景表示为大量各向异性高斯基元的集合,实现了高质量的实时渲染效果。每个高斯基元包含位置(μ)、协方差矩阵…...

基于GSAP与线性插值实现丝滑自定义光标动画

1. 项目概述:一个丝滑的现代自定义光标如果你厌倦了浏览器那个千篇一律的箭头指针,想为你的个人作品集、创意网站或者某个酷炫的着陆页注入一点灵动的生命力,那么这个名为“Cuberto Cursor”的项目绝对值得你花时间研究。它不是一个简单的图片…...

如何5分钟搞定抖音无水印视频下载:douyin-downloader完整指南

如何5分钟搞定抖音无水印视频下载:douyin-downloader完整指南 【免费下载链接】douyin-downloader A practical Douyin downloader for both single-item and profile batch downloads, with progress display, retries, SQLite deduplication, and browser fallbac…...

Zotero中文文献识别难题终结者:Jasminum插件深度解析

Zotero中文文献识别难题终结者:Jasminum插件深度解析 【免费下载链接】jasminum A Zotero add-on to retrive CNKI meta data. 一个简单的Zotero 插件,用于识别中文元数据 项目地址: https://gitcode.com/gh_mirrors/ja/jasminum 告别乱码与信息缺…...

Blender MMD Tools终极指南:高效导入导出MMD模型与动作数据的完整解决方案

Blender MMD Tools终极指南:高效导入导出MMD模型与动作数据的完整解决方案 【免费下载链接】blender_mmd_tools MMD Tools is a blender addon for importing/exporting Models and Motions of MikuMikuDance. 项目地址: https://gitcode.com/gh_mirrors/bl/blend…...

当你的智能体需要处理高并发请求时如何保障 API 稳定性

🚀 告别海外账号与网络限制!稳定直连全球优质大模型,限时半价接入中。 👉 点击领取海量免费额度 当你的智能体需要处理高并发请求时如何保障 API 稳定性 在智能体应用的实际部署中,用户量的增长或特定时段的高并发请求…...

期末复习方法:从知识树到 AI 闪卡,一套更适合大学生的资料整理法

期末复习最常见的误区,是把“资料看完”当成“知识掌握”。很多学生会把课件、教材、PDF、课堂笔记全部打开,从第一页看到最后一页。看时觉得都懂,合上资料却想不起来;刷题时看到熟悉概念,还是不知道该从哪里入手。这不…...

Arm Neoverse V3AE性能监控架构与PMU寄存器详解

1. Arm Neoverse V3AE性能监控架构深度解析在处理器微架构设计中,性能监控单元(PMU)如同汽车的仪表盘,为开发人员提供观察硬件行为的直接窗口。Arm Neoverse V3AE作为面向基础设施的高性能核心,其PMU实现包含一组精密的…...

增量备份为什么还是这么慢?KingbaseES块级永久增量备份给出答案!

🔥承渊政道:个人主页 ❄️个人专栏: 《C语言基础语法知识》 《数据结构与算法》 《C知识内容》 《Linux系统知识》 《算法刷题指南》 《测评文章活动推广》 《大模型语言路线学习》 ✨逆境不吐心中苦,顺境不忘来时路!✨ 🎬 博主简介: 增量备…...

单例模式:C++实现与多线程安全

1. 核心定义与作用(精准版)定义单例模式是一种创建型设计模式,确保一个类有且仅有一个实例,并向整个系统提供唯一的全局访问点。核心作用控制实例数量:严格保证类在程序生命周期内只有一个对象全局访问:无需…...

C++虚函数机制深度解析:从原理到实战

1. 核心概念与多态实现多态的定义:多态是指“以一个接口,多种实现”的能力。在 C 中,通过在基类中使用 virtual 关键字声明函数,可以实现动态绑定(Dynamic Binding),即在运行时根据对象的实际类…...

Sunshine游戏串流完全指南:打造你的私人游戏云服务

Sunshine游戏串流完全指南:打造你的私人游戏云服务 【免费下载链接】Sunshine Self-hosted game stream host for Moonlight. 项目地址: https://gitcode.com/GitHub_Trending/su/Sunshine 你是否梦想着在任何设备上都能流畅地玩PC游戏?Sunshine正…...

工业物联网实战:从预测性维护到系统优化,制造业数字化转型核心解析

1. 制造业的“静默革命”:当产线开始“思考”如果你在制造业干了十年以上,最近几年可能会有一个越来越强烈的感觉:车间里的机器好像“活”过来了。这不再是科幻电影的桥段,而是一场正在发生的、静默但深刻的革命。过去&#xff0c…...

N_m3u8DL-RE如何深度解析加密流媒体:架构设计与实战优化指南

N_m3u8DL-RE如何深度解析加密流媒体:架构设计与实战优化指南 【免费下载链接】N_m3u8DL-RE Cross-Platform, modern and powerful stream downloader for MPD/M3U8/ISM. English/简体中文/繁體中文. 项目地址: https://gitcode.com/GitHub_Trending/nm3/N_m3u8DL…...

2026中国DevOps平台选型全景洞察:技术适配与效能跃升的深层思考

在中国企业数字化转型浪潮中,DevOps平台作为技术基础设施的核心组件,其选型决策正经历从单纯功能对比向多维度综合评估的转变。2026年,这一选择不再是简单的工具采购,而是关乎企业技术战略、业务发展和合规安全的关键决策。通过对…...

CANN/oam-tools安全声明

安全声明 【免费下载链接】oam-tools 本项目为开发者提供故障定位工具,包含故障信息收集,软硬件信息展示,AI core error报错分析等能力,提升故障问题定位效率,文档可在昇腾社区搜索“故障处理简介”(选择社…...

Gitee与OpenSCA的深度整合:构建企业级开源治理新范式

在数字化转型浪潮中,开源技术已成为企业创新的重要驱动力。然而,伴随开源组件广泛应用而来的安全风险与合规挑战也日益严峻。Gitee作为国内领先的代码托管平台,选择与OpenSCA深度集成,打造了一套完整的开源治理解决方案&#xff0…...

NeuroRebuild 动态孪生,虚实同步秒级应急推演

NeuroRebuild 动态孪生,虚实同步秒级应急推演前言危化园区危险源密集、事故蔓延快、应急处置窗口期极短,传统静态BIM、倾斜摄影孪生模型固化滞后,无法跟随现场实景实时变化,灾害推演失真滞后、应急决策被动迟缓,难以适…...

3步掌握开源硬件性能优化工具:解锁你的设备隐藏潜力 [特殊字符]

3步掌握开源硬件性能优化工具:解锁你的设备隐藏潜力 😊 【免费下载链接】Universal-x86-Tuning-Utility Unlock the full potential of your Intel/AMD based device. 项目地址: https://gitcode.com/gh_mirrors/un/Universal-x86-Tuning-Utility …...

Figma中文插件终极指南:3分钟快速安装让设计界面秒变中文

Figma中文插件终极指南:3分钟快速安装让设计界面秒变中文 【免费下载链接】figmaCN 中文 Figma 插件,设计师人工翻译校验 项目地址: https://gitcode.com/gh_mirrors/fi/figmaCN 还在为Figma复杂的英文界面而烦恼?Figma中文插件通过精…...

阴阳师百鬼夜行自动化脚本:从入门到精通的完整指南

阴阳师百鬼夜行自动化脚本:从入门到精通的完整指南 【免费下载链接】OnmyojiAutoScript Onmyoji Auto Script | 阴阳师脚本 项目地址: https://gitcode.com/gh_mirrors/on/OnmyojiAutoScript 阴阳师百鬼夜行作为获取式神碎片的重要途径,长期手动操…...