当前位置: 首页 > article >正文

jetson_yolo_deployment 03_jetson_hardware

03 — Jetson 硬件与生态作者智汇嵌入式实验室 · 7yewh本文件是 Jetson YOLO 部署系列的第 3 篇。目标理解 Jetson 平台的硬件能力和软件生态知道它能干什么、不能干什么。0. 先建立整体认知你已经很熟悉 MCUSTM32现在要理解的是MCUSTM32 Cortex-M4 GPUJetson CPU 只有 1 个核 CPU 有 4-12 个核 没有 GPU 有专用 GPU128-2048 CUDA 核心 128 MHz 1-2 GHz GPU 加速 512 KB Flash 128 KB RAM 4-64 GB 统一内存 跑裸机 / RTOS 跑完整 LinuxUbuntu 推理 ~10ms简单 CNN 推理 ~10ms复杂 YOLO 用途传感器数据处理 用途视觉/语音/多模态 AIJetson 不是大号 MCU它是一台完整的 Linux 电脑 GPU 加速卡的组合。1. Jetson 系列产品对比1.1 当前主流型号型号GPU 核心AI 算力内存功耗价格适合场景Jetson Nano128 CUDA0.47 TFLOPS4 GB5-10W~¥700入门学习、简单检测Jetson Orin Nano1024 CUDA40 TOPS(INT8)4/8 GB7-15W~¥1500性价比最高Jetson Orin NX1024 CUDA70-100 TOPS8/16 GB10-25W~¥3000生产级部署Jetson AGX Orin2048 CUDA275 TOPS32/64 GB15-60W~¥1w高端多路推理1.2 怎么选预算有限 / 纯学习 → Jetson Nano二手更便宜 想要性能也想控制成本 → Orin Nano 8GB推荐 公司项目 / 多路摄像头 → Orin NX 高端需求 / 多模型并行 → AGX Orin学习阶段用 Nano 完全够了能跑 YOLOv8n15-25 FPS。1.3 与竞品对比平台优势劣势适合Jetson生态完善、TensorRT、DeepStream贵、功耗偏高视觉推理树莓派 5便宜、社区大没有 GPU、AI 能力弱通用 IoTRK3588便宜、NPU 6 TOPS生态不如 Jetson消费类产品Coral TPU低功耗、推理快只支持 TFLite、灵活性差固定模型部署PC RTX算力最强功耗大、不便携训练、研发2. 硬件架构2.1 SoC 内部结构┌──────────────────────────────────────────────┐ │ Jetson SoC │ │ │ │ ┌──────────┐ ┌───────────────────────┐ │ │ │ ARM CPU │ │ NVIDIA GPU │ │ │ │ 4-12核 │ │ 128-2048 CUDA 核心 │ │ │ │ Cortex-A │ │ Tensor CoreOrin │ │ │ │ 通用计算 │ │ 并行矩阵乘法 │ │ │ └────┬─────┘ └──────────┬────────────┘ │ │ │ │ │ │ └──────────┬──────────┘ │ │ │ │ │ ┌────────▼────────┐ │ │ │ 统一内存 │ │ │ │ 4-64 GB │ │ │ │ CPU/GPU 共享 │ ← 这是 Jetson 的关键特点│ │ └─────────────────┘ │ │ │ │ ┌───────┐ ┌───────┐ ┌───────┐ ┌───────┐ │ │ │ CSI │ │ USB │ │ PCIe │ │ UART │ │ │ │摄像头 │ │ 3.0 │ │ NVMe │ │ SPI │ │ │ └───────┘ └───────┘ └───────┘ └───────┘ │ └──────────────────────────────────────────────┘2.2 关键特点统一内存PC 上独立显卡 CPU 用 DDR 内存 GPU 用 GDDR 显存 数据要在 CPU 内存 ↔ GPU 显存之间来回复制 → 开销大 Jetson统一内存 CPU 和 GPU 共享同一块物理内存 不需要 CPU→GPU 的数据拷贝 → 延迟更低 但总内存有限Nano 只有 4GBCPUGPU 一起用实际影响好处图像从摄像头到 GPU 推理不需要额外拷贝坏处4GB Nano 运行 Ubuntu 桌面就用掉 1.5GB剩给 AI 的不多2.3 CUDA 核心 vs Tensor CoreCUDA 核心所有 Jetson 都有 通用并行计算单元 每个核心在每个时钟周期做 1 次 FMA乘加 128 个 CUDA 核心 × 921 MHz 128 个并行乘加 → 适合 FP32 推理 Tensor CoreOrin 系列才有 专门做矩阵乘法的硬件 一次操作完成 4×4 矩阵乘法 → FP16/INT8 推理速度比 CUDA 核心快很多 → 这就是为什么 Orin 的 TOPS 比 Nano 高几十倍3. 软件生态JetPack SDK3.1 JetPack 组成JetPack SDK 完整的 AI 开发工具栈 ┌─────────────────────────────────┐ │ 你的应用程序 │ ├─────────────────────────────────┤ │ DeepStream │ Triton │ VPI │ ← 应用框架 ├─────────────────────────────────┤ │ TensorRT │ cuDNN │ OpenCV │ ← AI 推理库 ├─────────────────────────────────┤ │ CUDA Toolkit │ ← GPU 编程接口 ├─────────────────────────────────┤ │ Linux Kernel BSP │ ← 操作系统 ├─────────────────────────────────┤ │ Jetson 硬件 │ ← SoC └─────────────────────────────────┘3.2 每个组件的作用组件作用你需要了解的深度CUDAGPU 编程接口写 GPU 代码用的知道概念即可部署 YOLO 不需要写 CUDAcuDNN深度学习基础算子库Conv、Pool 等的 GPU 实现不需要直接用TensorRT 内部调用它TensorRT模型推理优化引擎ONNX → 优化后的 Engine必须掌握部署的核心工具OpenCV图像/视频处理库必须掌握读取摄像头、预处理DeepStream视频分析框架多路流、编解码、推理管线建议了解生产环境常用VPI视觉编程接口GPU 加速的图像处理可选高级优化时用3.3 JetPack 版本JetPack 4.6 → CUDA 10.2, TensorRT 8.0 → Jetson Nano / TX2 / Xavier JetPack 5.x → CUDA 11.4, TensorRT 8.5 → Jetson Orin 系列 JetPack 6.x → CUDA 12.x, TensorRT 8.6 → Jetson Orin最新 注意JetPack 版本和 Jetson 型号是绑定的 Nano 最高只能用 JetPack 4.6 Orin 必须用 JetPack 5.x 或 6.x4. 性能模式Jetson 支持多种功耗/性能模式直接影响推理速度。4.1 查看和切换模式# 查看当前模式sudonvpmodel-q# Jetson Nano 的模式# MODE 0: MAXN全速10W# 4 CPU 核心 1.43 GHz# GPU 921 MHz# MODE 1: 5W# 2 CPU 核心 918 MHz# GPU 640 MHz# 切换到全速模式sudonvpmodel-m0# 启用最大时钟频率不自动降频sudojetson_clocks4.2 性能模式对推理的影响以 YOLOv8n 为例Jetson NanoMODE 15W ~8 FPS MODE 010W ~15 FPS ← 翻倍 加上 jetson_clocks~18 FPS ← 再提 20% 所以部署前一定要先切到 MAXN 模式5. 与 MCU 开发的对比理解你已经会 MCU 开发下面用对比帮你快速建立 Jetson 认知维度MCUSTM32Jetson操作系统裸机 / FreeRTOSUbuntu Linux启动方式Flash 中的固件SD 卡 / eMMC 中的 Linux开发方式Keil 烧录器SSH VS Code Remote编译交叉编译PC 上编译烧到 MCU直接在 Jetson 上编译调试SWD/JTAG 串口printf gdb nvidia-smiAI 框架ST Edge AI生成 C 代码TensorRT生成优化 Engine推理代码C 语言手动调用 APIPython/C调用 TensorRT API输入数据ADC 采样摄像头帧OpenCV优化手段CCMRAM、Flash 预取FP16/INT8 量化、CUDA 流部署产物.hex / .bin 固件.engine 文件 Python 脚本关键思维转变MCU 思维 Jetson 思维 每个字节都很珍贵 内存相对充裕关注吞吐量 推理要嵌在主循环里 推理是独立进程 优化到 cycle 级别 优化到 ms 级别用并行弥补 没有操作系统也能跑 依赖 Linux 生态 一切自己控制 很多东西框架帮你做了6. Jetson 能做什么 / 不适合做什么适合实时目标检测YOLO10-30 FPS人脸识别、姿态估计智能摄像头、边缘视频分析机器人视觉ROS Jetson自动驾驶原型多传感器融合小规模语音识别边缘推理服务器少量并发不适合模型训练算力不够训练用 PC/云端大规模并发多用户同时请求高分辨率实时处理4K60fps 对 Nano 太难极低功耗场景 1W 的需求用 MCU极低延迟场景 1ms 的需求用 FPGA7. 本章实操任务□ 1. 查看你的 Jetson 型号和 JetPack 版本cat /etc/nv_tegra_release □ 2. 查看 GPU 信息nvidia-smi 或 sudo tegrastats □ 3. 查看当前性能模式sudo nvpmodel -q □ 4. 切换到 MAXN 模式sudo nvpmodel -m 0 sudo jetson_clocks □ 5. 查看 CUDA 版本nvcc --version □ 6. 查看可用内存free -h □ 7.如果没有 Jetson阅读 NVIDIA 官方规格对比表确定你打算购买的型号智汇嵌入式实验室 · 7yewh

相关文章:

jetson_yolo_deployment 03_jetson_hardware

03 — Jetson 硬件与生态作者:智汇嵌入式实验室 7yewh 本文件是 Jetson YOLO 部署系列的第 3 篇。 目标:理解 Jetson 平台的硬件能力和软件生态,知道它能干什么、不能干什么。0. 先建立整体认知 你已经很熟悉 MCU(STM32&#xff…...

jetson_yolo_deployment 02_linux_dev_skills

02 — Linux 开发必备技能作者:智汇嵌入式实验室 7yewh 本文件是 Jetson YOLO 部署系列的第 2 篇。 目标:掌握部署过程中真正用得到的 Linux 技能,不贪多,只求实战够用。1. Shell 脚本基础 部署时经常需要写脚本来自动化流程&…...

jetson_yolo_deployment 01_linux_dev_env

01 — Linux 开发环境搭建作者:智汇嵌入式实验室 7yewh 本文件是 Jetson YOLO 部署系列的第 1 篇。 目标:从"能用 Linux"到"能在 Linux 上高效开发"。你现在的水平 vs 部署需要的水平 你现在会的: 部署 YO…...

波比跳,一个动作练遍全身 75% 肌群!

波比跳,一个动作练遍全身 75% 肌群! 一个动作,相当于一个健身房! 🏋️ 深蹲(练腿臀)💪 俯卧撑(练胸肩臂)🦘 跳跃(练爆发力 心肺&…...

血泪教训!MySQL索引我踩过的5个坑(附生产级解决方案)

血泪教训!MySQL索引我踩过的5个坑(附生产级解决方案)写在前面:本文包含完整的踩坑经历、原因分析、解决方案和代码示例,建议先收藏再阅读前言 大家好,我是小柚。。 说出来你们可能不信,我第一次…...

三菱PLC追剪项目:与昆仑通态触摸屏的完美协作

三菱plc追剪昆仑通态触摸屏三菱plc,编码器读取位置和速度,双步进或者双伺服,X轴同步送料,Y轴旋转切断,送料长度,旋转角度均可设置。 程序稳定可靠,借鉴价值高。在自动化控制领域,追剪…...

水浒智慧与职场跃迁:AI时代的管理学启示

目录 一、梁山政治的管理学本质:组织从 “草莽” 到 “体系” 的进化 1. 宋江:“以义为纲” 的领导力构建 —— 职场跃迁的核心是 “人心凝聚” 2. 吴用:“谋定而后动” 的策略智慧 —— 职场破局的关键是 “借势而为” 3. 林冲&#xff…...

基于三菱PLC和MCGS组态的药片装瓶控制系统:开启制药自动化新篇

No.787 基于三菱PLC和MCGS组态的药片装瓶控制系统在制药行业,药片装瓶环节的高效与精准至关重要。今天咱们来聊聊基于三菱PLC和MCGS组态的药片装瓶控制系统,看看它是如何提升生产效率与质量的。 三菱PLC:系统的智能“大脑” 三菱PLC&#xff…...

用WDCNN实现轴承智能故障诊断:挖掘其优越抗噪能力

DL00351-首层卷积为宽卷积的WDCNN的实现优越抗噪能力轴承的智能故障诊断 首层卷积为宽卷积的深度神经网络Deep Convolutional Neural Networks with Wide First-layer Kernels (WDCNN)的实现,该模型具有优越的抗噪能力,可用于轴承的智能故障诊断。在工业…...

大数据领域运用Eureka提升系统弹性

大数据领域运用Eureka提升系统弹性关键词:Eureka、服务发现、系统弹性、微服务架构、负载均衡、容错机制、大数据系统摘要:本文深入探讨了如何在大数据系统中运用Netflix Eureka服务发现组件来提升系统弹性。我们将从微服务架构的基础概念出发&#xff0…...

Macbook Neo挤爆牙膏也没做到的,它做到了!

谁懂啊家人们!刚入手MacBook Neo就被苹果封闭生态整emo了😤想和安卓手机传文件、用Mac玩3A大作、远程操控办公电脑…结果要么各种不兼容,要么操作复杂到想摔电脑💻直到我挖到了UU远程!简直是Mac用户的救命稻草&#x1…...

python hadoop spark hive 商品比价系统 爬虫+可视化

1、项目介绍技术栈: Python语言、MySQL数据库 、Django框架、requests爬虫技术、HTML2、项目界面(1)商品比价界面(2)商品推荐(3)系统主页(4)注册登录界面(5&a…...

基于python spark hadoop hive 旅游推荐系统 协同过滤推荐算法

1、项目介绍技术栈: Python语言、Django框架、Echarts可视化、基于用户的协同过滤推荐算法、购票功能、HTML 旅游推荐系统可视化2、项目界面(1)系统首页----景点分类、热门景点(2)旅游景点详情页----点赞、评论、收藏、…...

python hadoop spark hive LDA主题分析 NLP情感分析旅游景点评论数据分析系统

1、项目介绍 项目技术说明: python语言、Flask框架、MySQL数据库、Echarts可视化、 评论多维度分析、NLP 情感分析、LDA主题分析、Bayes评论分类2、项目界面 (1)评论年月时间分析(2)评论评分等级分析(3&…...

基于python hadoop spark hive 租房数据分析可视化系统 房源信息分析 爬虫

1、项目 介绍 Python 租房数据分析可视化系统 爬虫 Flask框架、Layui前端框架、Echarts可视化、requests爬虫、MySQL数据库本程序使用python编写,后端采用Flask框架,采用Layui前端框架,数据库采用mysql设计,echarts进行数据可视化…...

轻量专业的 M3U8 在线播放器,m3u8live.cn详解与使用指南

在 HTTP Live Streaming(HLS)流媒体技术的应用中,M3U8 作为核心的播放列表格式,被广泛应用于直播、点播等音视频场景。而在 M3U8 相关的开发与调试过程中,一款高效、专业的在线播放工具,能大幅降低工作成本…...

HLS 开发必备神器,详解m3u8live.cn的核心功能与使用价值

在 HTTP Live Streaming(HLS)流媒体技术体系中,M3U8 作为核心的播放列表格式,被广泛应用于直播、点播、短视频等音视频场景。但在实际开发过程中,M3U8 流的验证、播放调试却常常成为开发卡点 —— 本地测试环境搭建繁琐…...

GPT-5.4如何解决Excel数据清洗噩梦?一个客户反馈表的深度实测

目前国内职场人若想体验GPT-5.4在Excel数据清洗上的强大能力,最便捷的方式是使用国内聚合镜像站RskAi(ai.rsk.cn)。该平台已同步接入OpenAI于2026年3月发布的GPT-5.4最新版本,完整保留了ChatGPT for Excel插件的深度集成能力&…...

2026年打工人效率革命:GPT-5.4如何帮你搞定Excel、邮件和日常琐事

目前国内职场人若想体验GPT-5.4这一最新生产力工具,最便捷的方式是使用国内聚合镜像站RskAi(ai.rsk.cn)。该平台已同步接入OpenAI于2026年3月发布的GPT-5.4最新版本,完整保留了模型的Excel深度集成、原生计算机操控、百万级上下文…...

《ShardingSphere解读》04 配置驱动:ShardingSphere 中的配置体系是如何设计的?

ShardingSphere 提供了高度抽象的配置体系,开发者只需通过声明式配置即可定义分片规则、读写分离策略、数据脱敏规则等,而无需关心底层的复杂实现。那么,这套配置体系究竟是如何设计的?它包含了哪些核心概念?不同的配置…...

《ShardingSphere解读》03 JDBC 规范与 ShardingSphere 是什么关系?

在上一篇中,我们全面了解了 ShardingSphere 作为 Apache 顶级开源软件的发展历程、设计理念和核心功能。其中特别强调了一点:ShardingSphere 是一种典型的客户端分片解决方案,而客户端分片的核心实现方式之一就是重写 JDBC 规范。ShardingSph…...

【GitHub开源项目】一文学会Git提交本地代码到GitCode远程代码仓库)

摘要 本文详细讲解如何将本地代码提交到GitCode远程仓库的全流程。内容涵盖Git基础概念、安装配置、本地仓库初始化、提交规范、远程连接、分支管理与合并策略,以及常见问题解决方案。 目录 Git基础介绍与安装配置本地仓库初始化与文件添加提交更改与提交信息规范…...

智慧矿井监测数据集 矿车载人状态检测 矿车数据集 矿山井下作业安全监测、违规载人行为自动识别、智能视频监控预警第10563期

计算机视觉数据集数据集概览 本数据集聚焦矿山井下场景,针对矿车载人状态检测设计,适用于目标检测类深度学习模型训练与验证。项目内容类别数量2类类别中文名称正常情况、载人图像数量900张数据集格式YOLO格式核心应用价值矿山井下作业安全监测、违规载人…...

00后天才少女创业,Axiom获2亿美元A轮融资冲击AI上限

2亿美元A轮融资,Axiom估值飙升至16亿美元 近日,洪乐潼创立的AI初创公司Axiom完成了2亿美元的A轮融资,由Menlo Ventures领投,Greycroft、Madrona Venture、B Capital、Toyota Ventures等老股东继续追加投资。至此,公司估…...

马斯克 xAI 人事动荡,项目困境何解?

近日,马斯克的 AI 创业公司 xAI 人事变动剧烈,3 年前 11 名联合创始人仅 2 人在职。同时,其 AI 智能体项目“巨硬”困境重重,产品未达承诺。人事变动:华人联合创始人全离职3 年前 xAI 的 11 名联合创始人,如…...

Violoop:AI Agent 领域的破局者?

3 月 12 日,Violoop 宣布完成数千万元种子轮和天使轮融资。这家专注 AI PC 自动化硬件的中国创业公司,以独特路径探索 AI Agent 落地,有望打破行业格局。融资助力发展Violoop 完成两轮融资,资金将用于产品量产、市场推广和数据集构…...

AI 浪潮下软件行业的变革与重塑

AI 赋能:软件开发进入新时代两名 19 岁高中生凭借 AI 卡路里追踪应用 Cal AI 年收入超 3000 万美元,AI 编程公司 Cursor 年化收入超 20 亿美元,这些案例彰显了 AI 在软件领域的巨大潜力。Cursor 公司内部超三分之一的代码由 AI 完全自主完成&…...

三月估值翻四倍,Kimi改写AI叙事?

投资界消息,月之暗面Kimi正以180亿美元投前估值进行10亿美元融资。不到三个月,其估值翻四倍,成中国最快“十角兽”,业务端也迎来爆发。融资速度惊人去年底Kimi完成5亿美元C轮融资,投后估值43亿美元。春节期间超7亿美元…...

个人微信接入龙虾全攻略:官方合规直连,模型运行清晰,新手零门槛上手

个人微信接入龙虾全攻略:官方合规直连,模型运行清晰,新手零门槛上手 近期微信官方开放合规通道,个人微信终于能直接接入OpenClaw(俗称“龙虾”),不用再碰违规插件、不用担心里程碑封号风险&…...

抽象、建模与系统化:人类文明进步的通用算法

在人类漫长的历史中,从钻木取火到登月探索,从结绳记事到大语言模型,每一次重大突破似乎都源于某种深层的认知机制。这种机制并非神秘天赋,而是一种可被识别、学习和复用的方法论。本文将深入探讨这一方法论的核心三要素&#xff1…...