当前位置: 首页 > article >正文

保姆级教程:在Jetson Orin上从零搭建PyTorch+TensorFlow环境(含torchvision源码编译避坑)

保姆级教程在Jetson Orin上从零搭建PyTorchTensorFlow环境含torchvision源码编译避坑NVIDIA Jetson Orin作为当前边缘计算领域的旗舰平台其ARM架构下的深度学习环境配置一直是开发者的痛点。本文将手把手带你完成从系统准备到环境验证的全流程特别针对torchvision源码编译这一死亡关卡提供完整解决方案。1. 系统准备与CUDA环境确认在开始前请确保你的Jetson Orin已刷写最新版本的JetPack SDK。连接终端后首先验证CUDA和cuDNN的安装状态# 检查CUDA版本 nvcc --version # 检查cuDNN版本 cat /usr/include/cudnn_version.h | grep CUDNN_MAJOR -A 2典型输出示例nvcc: NVIDIA (R) Cuda compiler version 11.4.120 Build cuda_11.4.r11.4/compiler.31964100_0 #define CUDNN_MAJOR 8 #define CUDNN_MINOR 4 #define CUDNN_PATCHLEVEL 1注意PyTorch和TensorFlow对CUDA版本有严格匹配要求建议使用JetPack 5.1.2以上版本以获得CUDA 11.4环境。2. Archiconda环境配置由于官方Anaconda不支持ARM架构我们需要使用专为ARM优化的Archiconda# 下载安装Archiconda wget https://github.com/Archiconda/build-tools/releases/download/0.2.3/Archiconda3-0.2.3-Linux-aarch64.sh bash Archiconda3-0.2.3-Linux-aarch64.sh -b -p $HOME/archiconda3 # 初始化环境变量 echo export PATH$HOME/archiconda3/bin:$PATH ~/.bashrc source ~/.bashrc创建专用Python环境推荐Python 3.8conda create -n orin_env python3.8 -y conda activate orin_env配置国内镜像源加速下载conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes3. PyTorch安装与验证Jetson平台需要安装NVIDIA专门编译的PyTorch版本wget https://nvidia.box.com/shared/static/p57jwntv436lfrd78inwl7iml6p13fzh.whl -O torch-1.12.0a02c916ef.nv22.3-cp38-cp38-linux_aarch64.whl pip install torch-1.12.0a02c916ef.nv22.3-cp38-cp38-linux_aarch64.whl验证安装import torch print(torch.__version__) # 应输出1.12.0 print(torch.cuda.is_available()) # 应输出True4. torchvision源码编译实战这是ARM平台最复杂的环节需要解决多个依赖问题步骤1安装系统级依赖sudo apt-get update sudo apt-get install -y \ libjpeg-dev \ libopenblas-dev \ libopenmpi-dev \ libpng-dev \ ninja-build步骤2准备编译环境pip install Cython numpy export BLASOpenBLAS步骤3下载并编译torchvision选择与PyTorch匹配的版本以v0.13.0为例wget https://github.com/pytorch/vision/archive/refs/tags/v0.13.0.tar.gz tar -xzvf v0.13.0.tar.gz cd vision-0.13.0关键编译参数设置export BUILD_VERSION0.13.0 python setup.py install --user 21 | tee build.log提示编译过程可能持续30分钟以上期间会出现大量warning但通常不影响最终结果。如遇致命错误可检查build.log定位问题。常见问题处理缺少numpy头文件sudo apt-get install python3-numpyOpenBLAS链接错误export LD_LIBRARY_PATH/usr/lib/aarch64-linux-gnu/openblas-pthread:$LD_LIBRARY_PATH5. TensorFlow安装方案对于Jetson平台推荐使用NVIDIA预编译的TensorFlow wheelwget https://developer.download.nvidia.com/compute/redist/jp/v50/tensorflow/tensorflow-2.8.0nv22.4-cp38-cp38-linux_aarch64.whl pip install tensorflow-2.8.0nv22.4-cp38-cp38-linux_aarch64.whl验证GPU支持import tensorflow as tf print(tf.__version__) # 应输出2.8.0 print(tf.config.list_physical_devices(GPU)) # 应显示GPU信息6. 环境验证脚本创建综合测试脚本env_check.pyimport torch import torchvision import tensorflow as tf class EnvValidator: def __init__(self): # PyTorch检测 self.torch_ver torch.__version__ self.torch_cuda_ver torch.version.cuda self.torchvision_ver torchvision.__version__ # TensorFlow检测 self.tf_ver tf.__version__ self.tf_gpu tf.test.is_built_with_cuda() # 硬件信息 self.gpu_name torch.cuda.get_device_name(0) self.gpu_mem torch.cuda.get_device_properties(0).total_memory / 1024**3 def report(self): print(f\n{*30} 环境验证报告 {*30}) print(fPyTorch 版本: {self.torch_ver} (CUDA {self.torch_cuda_ver})) print(ftorchvision 版本: {self.torchvision_ver}) print(fTensorFlow 版本: {self.tf_ver} {(GPU支持) if self.tf_gpu else }) print(f\n硬件信息:) print(f- GPU型号: {self.gpu_name}) print(f- 显存容量: {self.gpu_mem:.1f}GB) print(f- CUDA可用: {torch.cuda.is_available()}) print(*75) if __name__ __main__: validator EnvValidator() validator.report()运行结果示例 环境验证报告 PyTorch 版本: 1.12.0a02c916ef (CUDA 11.4) torchvision 版本: 0.13.0 TensorFlow 版本: 2.8.0 (GPU支持) 硬件信息: - GPU型号: NVIDIA Jetson Orin - 显存容量: 16.0GB - CUDA可用: True 7. 性能优化技巧完成基础安装后可通过以下配置提升推理性能1. 设置GPU工作模式sudo nvpmodel -m 0 # 开启最大性能模式 sudo jetson_clocks # 锁定最高频率2. PyTorch后端优化torch.backends.cudnn.benchmark True torch.set_float32_matmul_precision(high)3. TensorFlow线程配置config tf.config.experimental config.set_intra_op_parallelism_threads(4) config.set_inter_op_parallelism_threads(4)4. 内存管理策略# PyTorch缓存分配器配置 torch.cuda.set_per_process_memory_fraction(0.9) torch.cuda.empty_cache() # TensorFlow GPU选项 gpus tf.config.experimental.list_physical_devices(GPU) for gpu in gpus: tf.config.experimental.set_memory_growth(gpu, True)

相关文章:

保姆级教程:在Jetson Orin上从零搭建PyTorch+TensorFlow环境(含torchvision源码编译避坑)

保姆级教程:在Jetson Orin上从零搭建PyTorchTensorFlow环境(含torchvision源码编译避坑) NVIDIA Jetson Orin作为当前边缘计算领域的旗舰平台,其ARM架构下的深度学习环境配置一直是开发者的痛点。本文将手把手带你完成从系统准备到…...

字符串拼接用“+”还是 StringBuilder?别再凭感觉写了品

前言 Kubernetes 本身并不复杂,是我们把它搞复杂的。无论是刻意为之还是那种虽然出于好意却将优雅的原语堆砌成 鲁布戈德堡机械 的狂热。平台最初提供的 ReplicaSets、Services、ConfigMaps,这些基础组件简单直接,甚至显得有些枯燥。但后来我…...

浅谈MIKE前处理中投影坐标处理问题

MIKE 中投影坐标一直是个问题,尤其对 2d 里的科氏力影响很大, 由于我们现获取基础资料都是 CAD 格式,在 GIS 里转 shp 后我们会发现很多是地方坐标,对于这种情况,小编也是无能无力,只有想办法 让 CAD 提供方…...

智慧树自动刷课终极解决方案:5分钟告别手动刷课的完整指南

智慧树自动刷课终极解决方案:5分钟告别手动刷课的完整指南 【免费下载链接】zhihuishu 智慧树刷课插件,自动播放下一集、1.5倍速度、无声 项目地址: https://gitcode.com/gh_mirrors/zh/zhihuishu 还在为智慧树平台繁琐的网课学习而烦恼吗&#x…...

RAG分块策略实战:5种方法代码对比+真实业务场景选择指南(附性能测试数据)

RAG分块策略工程实践:5种方法性能对比与场景化选型指南 在构建检索增强生成(RAG)系统时,文档分块策略的选择直接影响着系统的最终效果。本文将深入分析五种主流分块策略的工程实现差异,结合电商客服、医疗问答等典型业…...

麒麟V10系统下微信PC版安装与系统升级全攻略

1. 麒麟V10系统与微信PC版适配现状 最近两年国产操作系统发展迅猛,银河麒麟V10作为其中的佼佼者,已经能够流畅运行微信PC版。但很多用户在安装过程中还是会遇到各种"拦路虎"——找不到安装包、依赖缺失、版本冲突等问题层出不穷。 我实测发现&…...

PX4 EKF滤波效果不好?别只盯着Q和R,这些隐藏参数和传感器预处理同样关键

PX4 EKF滤波效果优化:超越Q/R矩阵的隐藏参数与传感器预处理全解析 当你的无人机在悬停时出现位置漂移,或是穿越机在高速机动时姿态突然发散,大多数开发者第一反应就是调整Q和R矩阵——这就像医生遇到发烧就开退烧药,却忽略了病灶本…...

人工智能工程师应掌握的核心技能与工具

随着人工智能(AI)领域的持续拓展,对专业 AI 工程师的需求呈指数级增长。无论你是刚入行,还是希望实现职业进阶,扎实掌握特定技能与工具都至关重要。本文将详解每位 AI 工程师想要在这一充满活力且竞争激烈的领域立足所…...

OFDRW 2.1.0转换PDF时字体丢失?3种实用解决方案帮你搞定

OFDRW 2.1.0转换PDF字体丢失问题深度解析与实战解决方案 在企业级文档处理系统中,OFD(Open Fixed-layout Document)与PDF之间的格式转换是常见需求。作为国内电子发票、公文交换的标准格式,OFD的准确转换直接关系到业务数据的完整…...

深入剖析Ultralytics中RT-DETR的RepC3模块维度匹配问题

1. RT-DETR与RepC3模块的核心作用 RT-DETR作为Ultralytics推出的实时目标检测模型,其核心优势在于将DETR系列模型的Transformer架构与实时推理需求相结合。我在实际部署中发现,RepC3模块作为模型颈部的关键组件,承担着多尺度特征融合与通道维…...

M5StamPLC工业PLC库:ESP32嵌入式实时控制与I²C外设驱动

1. M5StamPLC 库概述M5StamPLC 是专为 M5Stack 推出的 K141 型号工业级可编程逻辑控制器(PLC)开发板设计的底层驱动库。该板卡并非传统意义上的 Arduino 兼容开发板,而是面向工业自动化场景的嵌入式控制终端,具备数字量输入/输出、…...

ElementUI Table组件实现表头吸顶的进阶技巧与实战

1. 为什么需要表头吸顶功能? 当表格数据量较大时,用户需要滚动页面查看完整内容。这时候如果表头随着滚动消失,用户很容易忘记当前列对应的字段含义,不得不反复回滚查看表头,体验非常糟糕。表头吸顶(Sticky…...

我不是在用 AI 助手,我在把自己的能力沉淀成组织资产淳

1. 什么是 Apache SeaTunnel? Apache SeaTunnel 是一个非常易于使用、高性能、支持实时流式和离线批处理的海量数据集成平台。它的目标是解决常见的数据集成问题,如数据源多样性、同步场景复杂性以及资源消耗高的问题。 核心特性 丰富的数据源支持&#…...

别急着降级!用Anaconda虚拟环境一劳永逸解决Numpy与gensim等库的版本冲突问题

告别版本冲突:用Anaconda虚拟环境彻底解决Python依赖困境 你是否曾在深夜调试代码时,突然遭遇numpy.ndarray size changed这类令人崩溃的二进制兼容性错误?或是花费数小时在不同项目间切换时,反复执行pip uninstall和pip install来…...

Spring IOC 源码学习 事务相关的 BeanDefinition 解析过程 (XML)副

从0构建WAV文件:读懂计算机文件的本质 虽然接触计算机有一段时间了,但是我的视野一直局限于一个较小的范围之内,往往只能看到于算法竞赛相关的内容,计算机各种文件在我看来十分复杂,认为构建他们并能达到目的是一件困难…...

CodeMagicianT源

前面我们对 Kafka 的整体架构和一些关键的概念有了一个基本的认知,本文主要介绍 Kafka 的一些配置参数。掌握这些参数的作用对我们的运维和调优工作还是非常有帮助的。 写在前面 Kafka 作为一个成熟的事件流平台,有非常多的配置参数。详细的参数列表可以…...

新手别怕!用嘉立创EDA两层板搞定ESP8266最小系统PCB(附完整工程文件)

从零开始:用嘉立创EDA轻松打造ESP8266最小系统PCB 第一次打开PCB设计软件时,那种手足无措的感觉我至今记忆犹新。密密麻麻的元件符号、复杂的布线规则、各种专业术语...作为一个刚接触硬件的爱好者,我曾一度怀疑自己是否真的能独立完成一块电…...

ArcGIS密度分析实战:从点、线到核密度的全流程解析

1. 密度分析基础:从概念到应用场景 密度分析是地理信息系统中最常用的空间分析工具之一,它能够将离散的点、线要素转化为连续的密度表面,直观展现空间分布特征。我第一次接触密度分析是在做一个城市商业网点布局项目时,当时需要分…...

OpenClaw 本地内存检索与 node-llama-cpp 的依赖关系深度解析

OpenClaw 本地内存检索与 node-llama-cpp 的依赖关系深度解析 问题背景:升级之后,诊断报错了 把 OpenClaw 升级到最新版本后,跑一遍 openclaw doctor 是个好习惯。然而有时你会发现输出里出现了让人不安的错误: local embeddin…...

内网开发避坑指南:告别node_modules拷贝不全与压缩出错的实战方案

1. 内网开发依赖管理的痛点解析 第一次把node_modules压缩包拷进内网时,我盯着满屏的"Module not found"错误愣了半天。明明在外网环境运行正常的项目,怎么换个地方就瘫痪了?后来才发现,这其实是内网开发者的集体噩梦。…...

别再只调参了!用Python给CFD/CAE仿真结果加个‘AI修正器’,精度提升看得见

用Python构建CFD/CAE仿真AI修正器的工程实践指南 在工程仿真领域,我们常常遇到一个令人头疼的问题:经过精心设置的CFD/CAE仿真结果,与实验数据之间总存在一条难以跨越的"误差鸿沟"。传统解决方案往往是反复调整网格、修改参数或更换…...

你的SSH密钥可能已经过期了细

引言 在现代软件开发中,性能始终是衡量应用质量的重要指标之一。无论是企业级应用、云服务还是桌面程序,性能优化都能显著提升用户体验、降低基础设施成本并增强系统的可扩展性。对于使用 C# 开发的应用程序而言,性能优化涉及多个层面&#x…...

Keil5工程瘦身指南:除了`.bat`脚本,还有哪些清理工作空间的高效方法?

Keil5工程瘦身实战:从脚本到系统化管理的进阶指南 当你第17次面对Keil5工程因临时文件堆积导致的编译卡顿,或是发现版本控制仓库被数十MB的中间文件塞满时,或许该重新思考工程管理的本质了。真正的工程瘦身不是简单的文件删除,而…...

异步知识库索引管线:与在线问答链路解耦架构介绍(离线构建,在线查询)分层索引、Elasticsearch

文章目录异步知识库索引管线:与在线问答链路解耦的架构实践一、核心思想:离线构建,在线查询二、整体架构图(逻辑)三、索引管线详解(异步部分)1️⃣ 数据接入(Ingestion)2…...

SEATA分布式事务——AT模式僮

简介 AI Agent 不仅仅是一个能聊天的机器人(如普通的 ChatGPT),而是一个能够感知环境、进行推理、自主决策并调用工具来完成特定任务的智能系统,更够完成更为复杂的AI场景需求。 AI Agent 功能 根据查阅的资料,agent的…...

Gym-ND_Makeblock:面向中学教学的STM32嵌入式机器人库

1. 项目概述Gym-ND_Makeblock是为奥地利新锡德尔(Neusiedl)地区中小学教育场景定制的嵌入式教学支持库,专为 Makeblock 硬件平台(如 mBot、mCore、Ultimate 2.0 套件)与 Gymnasium(文理中学)信息…...

C# 面试高频题:装箱和拆箱是如何影响性能的?痛

OCP原则 ocp指开闭原则,对扩展开放,对修改关闭。是七大原则中最基本的一个原则。 依赖倒置原则(DIP) 什么是依赖倒置原则 核心是面向接口编程、面向抽象编程, 不是面向具体编程。 依赖倒置原则的目的 降低耦合度&#…...

实战分享:我把Qwen2.5-7B-Instruct变成专属文本分类器,LlamaFactory LoRA微调+推理加速全记录

从零构建Qwen2.5-7B文本分类引擎:LlamaFactory LoRA微调与vLLM推理加速实战 去年接手一个政务文本分类项目时,传统BERT模型在长文本场景下的表现让我屡次陷入调参困境。直到尝试用Qwen2.5-7B-Instruct配合LlamaFactory进行LoRA微调,才发现大语…...

Unity发布京东小游戏狗

从 UI 工程师到 AI 应用架构者 13 年前,我的工作是让按钮在 IE6 上对齐; 13 年后,我用 fetch-event-source 订阅大模型的“思维流”,用 OCR 解锁图片中的文字——前端,正在成为 AI 产品的第一道体验防线。 最近&#x…...

【实战指南】融合DEM与水文分析的地表径流模拟与流域划分——以海河流域为例(含完整流程)

1. 从DEM到水文分析的核心逻辑 很多人第一次接触DEM数据时,会觉得这就是个普通的地形高程图。但当我用DEM预测出某次暴雨后的洪水淹没范围时,才真正理解到数字高程背后隐藏的水文密码。DEM数据就像地形的DNA,通过水文分析工具链的解码&#x…...