当前位置：首页 > article >正文

保姆级教程：在Jetson Orin上从零搭建PyTorch+TensorFlow环境（含torchvision源码编译避坑）

article 2026/4/13 2:06:25

保姆级教程在Jetson Orin上从零搭建PyTorchTensorFlow环境含torchvision源码编译避坑NVIDIA Jetson Orin作为当前边缘计算领域的旗舰平台其ARM架构下的深度学习环境配置一直是开发者的痛点。本文将手把手带你完成从系统准备到环境验证的全流程特别针对torchvision源码编译这一死亡关卡提供完整解决方案。1. 系统准备与CUDA环境确认在开始前请确保你的Jetson Orin已刷写最新版本的JetPack SDK。连接终端后首先验证CUDA和cuDNN的安装状态# 检查CUDA版本 nvcc --version # 检查cuDNN版本 cat /usr/include/cudnn_version.h | grep CUDNN_MAJOR -A 2典型输出示例nvcc: NVIDIA (R) Cuda compiler version 11.4.120 Build cuda_11.4.r11.4/compiler.31964100_0 #define CUDNN_MAJOR 8 #define CUDNN_MINOR 4 #define CUDNN_PATCHLEVEL 1注意PyTorch和TensorFlow对CUDA版本有严格匹配要求建议使用JetPack 5.1.2以上版本以获得CUDA 11.4环境。2. Archiconda环境配置由于官方Anaconda不支持ARM架构我们需要使用专为ARM优化的Archiconda# 下载安装Archiconda wget https://github.com/Archiconda/build-tools/releases/download/0.2.3/Archiconda3-0.2.3-Linux-aarch64.sh bash Archiconda3-0.2.3-Linux-aarch64.sh -b -p $HOME/archiconda3 # 初始化环境变量 echo export PATH$HOME/archiconda3/bin:$PATH ~/.bashrc source ~/.bashrc创建专用Python环境推荐Python 3.8conda create -n orin_env python3.8 -y conda activate orin_env配置国内镜像源加速下载conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --set show_channel_urls yes3. PyTorch安装与验证Jetson平台需要安装NVIDIA专门编译的PyTorch版本wget https://nvidia.box.com/shared/static/p57jwntv436lfrd78inwl7iml6p13fzh.whl -O torch-1.12.0a02c916ef.nv22.3-cp38-cp38-linux_aarch64.whl pip install torch-1.12.0a02c916ef.nv22.3-cp38-cp38-linux_aarch64.whl验证安装import torch print(torch.__version__) # 应输出1.12.0 print(torch.cuda.is_available()) # 应输出True4. torchvision源码编译实战这是ARM平台最复杂的环节需要解决多个依赖问题步骤1安装系统级依赖sudo apt-get update sudo apt-get install -y \ libjpeg-dev \ libopenblas-dev \ libopenmpi-dev \ libpng-dev \ ninja-build步骤2准备编译环境pip install Cython numpy export BLASOpenBLAS步骤3下载并编译torchvision选择与PyTorch匹配的版本以v0.13.0为例wget https://github.com/pytorch/vision/archive/refs/tags/v0.13.0.tar.gz tar -xzvf v0.13.0.tar.gz cd vision-0.13.0关键编译参数设置export BUILD_VERSION0.13.0 python setup.py install --user 21 | tee build.log提示编译过程可能持续30分钟以上期间会出现大量warning但通常不影响最终结果。如遇致命错误可检查build.log定位问题。常见问题处理缺少numpy头文件sudo apt-get install python3-numpyOpenBLAS链接错误export LD_LIBRARY_PATH/usr/lib/aarch64-linux-gnu/openblas-pthread:$LD_LIBRARY_PATH5. TensorFlow安装方案对于Jetson平台推荐使用NVIDIA预编译的TensorFlow wheelwget https://developer.download.nvidia.com/compute/redist/jp/v50/tensorflow/tensorflow-2.8.0nv22.4-cp38-cp38-linux_aarch64.whl pip install tensorflow-2.8.0nv22.4-cp38-cp38-linux_aarch64.whl验证GPU支持import tensorflow as tf print(tf.__version__) # 应输出2.8.0 print(tf.config.list_physical_devices(GPU)) # 应显示GPU信息6. 环境验证脚本创建综合测试脚本env_check.pyimport torch import torchvision import tensorflow as tf class EnvValidator: def __init__(self): # PyTorch检测 self.torch_ver torch.__version__ self.torch_cuda_ver torch.version.cuda self.torchvision_ver torchvision.__version__ # TensorFlow检测 self.tf_ver tf.__version__ self.tf_gpu tf.test.is_built_with_cuda() # 硬件信息 self.gpu_name torch.cuda.get_device_name(0) self.gpu_mem torch.cuda.get_device_properties(0).total_memory / 1024**3 def report(self): print(f\n{*30} 环境验证报告 {*30}) print(fPyTorch 版本: {self.torch_ver} (CUDA {self.torch_cuda_ver})) print(ftorchvision 版本: {self.torchvision_ver}) print(fTensorFlow 版本: {self.tf_ver} {(GPU支持) if self.tf_gpu else }) print(f\n硬件信息:) print(f- GPU型号: {self.gpu_name}) print(f- 显存容量: {self.gpu_mem:.1f}GB) print(f- CUDA可用: {torch.cuda.is_available()}) print(*75) if __name__ __main__: validator EnvValidator() validator.report()运行结果示例环境验证报告 PyTorch 版本: 1.12.0a02c916ef (CUDA 11.4) torchvision 版本: 0.13.0 TensorFlow 版本: 2.8.0 (GPU支持) 硬件信息: - GPU型号: NVIDIA Jetson Orin - 显存容量: 16.0GB - CUDA可用: True 7. 性能优化技巧完成基础安装后可通过以下配置提升推理性能1. 设置GPU工作模式sudo nvpmodel -m 0 # 开启最大性能模式 sudo jetson_clocks # 锁定最高频率2. PyTorch后端优化torch.backends.cudnn.benchmark True torch.set_float32_matmul_precision(high)3. TensorFlow线程配置config tf.config.experimental config.set_intra_op_parallelism_threads(4) config.set_inter_op_parallelism_threads(4)4. 内存管理策略# PyTorch缓存分配器配置 torch.cuda.set_per_process_memory_fraction(0.9) torch.cuda.empty_cache() # TensorFlow GPU选项 gpus tf.config.experimental.list_physical_devices(GPU) for gpu in gpus: tf.config.experimental.set_memory_growth(gpu, True)

保姆级教程：在Jetson Orin上从零搭建PyTorch+TensorFlow环境（含torchvision源码编译避坑）

相关文章：

保姆级教程：在Jetson Orin上从零搭建PyTorch+TensorFlow环境（含torchvision源码编译避坑）

字符串拼接用“+”还是 StringBuilder？别再凭感觉写了品

浅谈MIKE前处理中投影坐标处理问题

智慧树自动刷课终极解决方案：5分钟告别手动刷课的完整指南

RAG分块策略实战：5种方法代码对比+真实业务场景选择指南（附性能测试数据）

麒麟V10系统下微信PC版安装与系统升级全攻略

PX4 EKF滤波效果不好？别只盯着Q和R，这些隐藏参数和传感器预处理同样关键

人工智能工程师应掌握的核心技能与工具

OFDRW 2.1.0转换PDF时字体丢失？3种实用解决方案帮你搞定

深入剖析Ultralytics中RT-DETR的RepC3模块维度匹配问题

M5StamPLC工业PLC库：ESP32嵌入式实时控制与I²C外设驱动

ElementUI Table组件实现表头吸顶的进阶技巧与实战

我不是在用 AI 助手，我在把自己的能力沉淀成组织资产淳

别急着降级！用Anaconda虚拟环境一劳永逸解决Numpy与gensim等库的版本冲突问题

Spring IOC 源码学习事务相关的 BeanDefinition 解析过程 (XML)副

CodeMagicianT源

新手别怕！用嘉立创EDA两层板搞定ESP8266最小系统PCB（附完整工程文件）

ArcGIS密度分析实战：从点、线到核密度的全流程解析

OpenClaw 本地内存检索与 node-llama-cpp 的依赖关系深度解析

内网开发避坑指南：告别node_modules拷贝不全与压缩出错的实战方案

别再只调参了！用Python给CFD/CAE仿真结果加个‘AI修正器’，精度提升看得见

你的SSH密钥可能已经过期了细

Keil5工程瘦身指南：除了`.bat`脚本，还有哪些清理工作空间的高效方法？

异步知识库索引管线：与在线问答链路解耦架构介绍（离线构建，在线查询）分层索引、Elasticsearch

SEATA分布式事务——AT模式僮

Gym-ND_Makeblock：面向中学教学的STM32嵌入式机器人库

C# 面试高频题：装箱和拆箱是如何影响性能的？痛

实战分享：我把Qwen2.5-7B-Instruct变成专属文本分类器，LlamaFactory LoRA微调+推理加速全记录

Unity发布京东小游戏狗

【实战指南】融合DEM与水文分析的地表径流模拟与流域划分——以海河流域为例（含完整流程）