OpenCV + CUDA + cuDNN模块编译
简介
在追求高端性能与资源优化并重的应用场景中,如边缘计算设备或资源受限的开发板上运行YOLO等复杂深度学习模型,采用C++结合OpenCV与GPU加速技术相较于传统的Python环境展现出显著优势。这种策略不仅极大地提升了执行效率,还显著降低了运行时资源消耗,是实现实时物体检测与识别的理想选择。
C++运行YOLO,安装环境稍微复杂些,不像Python一键安装pip包。本案例使用了GPU加速算法运行,所以编译OpenCV的时候需要开启CUDA和DNN模块。
一.CUDA安装
访问下载地址,选择对应的版本,这里我安装的是11.7.0版本
https://developer.nvidia.com/cuda-toolkit-archive


安装命令:
wget https://developer.download.nvidia.com/compute/cuda/11.7.0/local_installers/cuda_11.7.0_515.43.04_linux.run
sudo sh cuda_11.7.0_515.43.04_linux.run
执行.run 程序后,等待一会输入accept

已经安装过显卡驱动的话,Driver这里可不用选择


安装完成后,根据以上的提示加入环境变量
执行:vim ~/.bashrc,加入以下内容
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
export PATH=$PATH:/usr/local/cuda/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
执行:source ~/.bashrc 更新 .bashrc
输入命令进行验证:nvcc -V,出现下面的内容,说明安装成功

二.cuDNN安装
1.下载地址:https://developer.nvidia.com/rdp/cudnn-archive
2.下载对应cuda版本的cudnn,解压后将cuDNN头文件和库文件复制到CUDA安装目录:
sudo cp include/cudnn* /usr/local/cuda/include
sudo cp lib/libcudnn* /usr/local/cuda/lib64
3.更改文件权限:
sudo chmod a+r /usr/local/cuda/include/cudnn*
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
三.OpenCV编译
1.下载源码:https://opencv.org/releases/
2.解压源码后,在根目录下载执行:
git clone https://github.com/opencv/opencv_contrib.git
3.CUDA_ARCH_BIN查看方式:
一.git clone https://github.com/NVIDIA-AI-IOT/deepstream_tlt_apps.git
二.cd deepstream_tlt_apps/TRT-OSS/x86
三.nvcc deviceQuery.cpp -o deviceQuery
四. 执行 ./deviceQuery,得到了Capability Major

4.编译环境准备:
一.sudo apt-get update
二.sudo apt-get upgrade
三.sudo apt-get install build-essential cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev
四.sudo apt-get install python-dev python-numpy libtbb2 libtbb-dev libjpeg-dev libpng-dev libtiff-dev libdc1394-22-dev
五.sudo apt-get install libgtk-3-dev libtbb-dev libatlas-base-dev gfortran
5.开始编译
一.cd opencv-4.10.0 && mkdir build && cd build二.
cmake -D CMAKE_BUILD_TYPE=RELEASE \
-D CMAKE_INSTALL_PREFIX=/usr/local \
-D OPENCV_EXTRA_MODULES_PATH=../opencv_contrib/modules \
-D WITH_CUDA=ON \
-D WITH_CUDNN=ON \
-D WITH_GTK=ON \
-D CUDNN_INCLUDE_DIR=/usr/include \
-D CUDA_ARCH_BIN=7.5 \
-D OPENCV_DNN_CUDA=ON \
-D ENABLE_FAST_MATH=1 \
-D CUDA_FAST_MATH=1 \
-D WITH_DNN=ON \
-D OPENCV_GENERATE_PKGCONFIG=ON ..三.make -j$(nproc)四.sudo make instal

出现红色框的内容,说明模块加载正常,接着执行三和四的步骤即可,编译过程需要二十几分钟;下面是使用C++调用onnx模型的输出结果。

四.OpenCV编译参数说明
指令 说明
-D CMAKE_BUILD_TYPE=RELEASE 编译opencv的版本。这里是release版本
-D CMAKE_INSTALL_PREFIX=/usr/local 为opencv安装的目录
-D OPENCV_EXTRA_MODULES_PATH=…/opencv_contrib/modules 该选选项为opencv_contrib模块下module文件夹
-D WITH_CUDA=ON 编译CUDA
-D WITH_CUDNN=ON 编译CUDNN
-D WITH_GTK=ON 编译图形界面,cv2.show会用到
-D CUDA_ARCH_BIN=7.5 显卡的算力
-D OPENCV_DNN_CUDA=ON
-D ENABLE_FAST_MATH=1 支持math快速计算
-D CUDA_FAST_MATH=1 cuda的math快速计算
-D WITH_DNN=ON 编译DNN
-D OPENCV_GENERATE_PKGCONFIG=ON … …表示上一层目录

相关文章:
OpenCV + CUDA + cuDNN模块编译
简介 在追求高端性能与资源优化并重的应用场景中,如边缘计算设备或资源受限的开发板上运行YOLO等复杂深度学习模型,采用C结合OpenCV与GPU加速技术相较于传统的Python环境展现出显著优势。这种策略不仅极大地提升了执行效率,还显著降低了运行时…...
Redis 缓存预热、雪崩、穿透、击穿
缓存预热 缓存预热是什么 缓存预热就是系统上线后,提前将相关的缓存数据直接加载到缓存系统。避免在用户请求的时候,先查询数据库,然后再将数据缓存的问题!用户直接查询事先被预热的缓存数据!解决方案 使用 PostConstr…...
仿RabbiteMq简易消息队列基础篇(gtest的使用)
TOC gtest介绍 gtest是google的一个开源框架,它主要用于写单元测试,检查自己的程序是否符合预期行为。可在多个平台上使用(包含Linux,MAC OC,Windows等)。它提供了丰富的断言,致命和非致命失败…...
图像处理中的图像梯度和幅值是什么???(通俗讲解)
在边缘检测和特征提取等任务中,图像的梯度和幅值是图像处理中非常重要的概念。 目录 一、图像的梯度1.1 专业解释1.2 通俗理解1.3 计算方式 二、梯度的幅值2.1 专业解释2.2 通俗理解2.3 计算方式 一、图像的梯度 1.1 专业解释 图像的梯度可以看作是图像中亮度或颜…...
01.计算机网络导论
引言 协议分层 协议分层使我们可以将大任务化简成几个更小、更简单的任务。模块化指的是独立的协议层。一个协议层(模块)可以定义为一个具有输入和输出而不需要考虑输入是如何变成输出的黑匣子。当向两台机器提供相同输入得到相同输出时,它…...
API网关:SpringCloud GateWay
一. 网关的作用及背景 1.API网关的作用 请求路由 在我们的系统中由于同一个接口新老两套系统都在使用,我们需要根据请求上下文将请求路由到对应的接口。 统一鉴权 对于鉴权操作不涉及到业务逻辑,那么可以在网关层进行处理,不用下层到业务…...
【Leetcode 383】赎金信 —— 哈希表 有注解
给你两个字符串:ransomNote 和 magazine ,判断 ransomNote 能不能由 magazine 里面的字符构成。 如果可以,返回 true ;否则返回 false 。 magazine 中的每个字符只能在 ransomNote 中使用一次。 示例 1: 输入&#…...
Linux 常见的冷知识集锦
一、前言 本文旨在记录那些常见的Linux概念和名词,但这些又没经常直接使用到,更多在底层运行,见过却又不是特别清楚的碎片知识,以温故知新。 二、知识点和概念说明 2.1、POSIX标准/协议 POSIX(Portable Operating S…...
【喜报】科大睿智祝贺青岛海信网络科技通过CMMI5级评估
青岛海信网络科技股份有限公司成立于1998年,是海信集团B2B产业的核心力量。其主要从事城市交通、公共交通、智慧公路、交通枢纽、智慧停车、智能网联、大数据管理、城市治理、应急管理、轨道交通智能化和医院、校园、园区等智能化建设领域的产品和解决方案开发、…...
2024全国大学生电子设计大赛全国初赛 E题 三子棋游戏装置 一等奖满分最简方案
感想:电赛初赛控制类题还是蛮简单的,别被五花八门的硬件搞懵了(决赛当我没说)。抓住核心,理念都是通用的。我是计科专业的,因此选择的控制类E题,相对来说背的知识要少很多,更考验智商…...
尚品汇-ES(三十一)
目录: (1)封装搜索相关实体对象 (2)搜索接口封装 (3)在service-list-client模块添加远程接口 (1)封装搜索相关实体对象 搜索参数实体:SearchParam 搜索参…...
NC 跳台阶
系列文章目录 文章目录 系列文章目录前言 前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看懂了就去分享给你的码吧。 描述 一只青蛙一次…...
linux 文件编程
1. 标准IO 也称为标准输入输出(Standard Input/Output),是计算机编程中一种常见的IO操作方式,特别是在C语言及其衍生语言中广泛使用。它主要通过标准C库中的函数来实现,提供了丰富的接口用于数据的输入和输出。 文本文…...
【后端速成 Vue】实现动态表白墙
前言: 通过前面几篇的文章的讲解,已经学习到了很多的 Vue 指令了,那么现在就将学习到的指令利用起来,做一个小的 demo。 最终效果图: 通过效果图可以发现,一共有这几个功能: ● 渲染列表&…...
【日常开发】 java返回ECharts数据结构封装
java返回ECharts数据结构封装 一、前端页面示例图如下: 二、准备测试数据: 三、后端 格式封装代码: 四、最终结果: 🎈边走、边悟🎈迟早会好 一、前端页面示例图如下: 二、准备测试数据&am…...
Table表格控件实现单选功能
Table表格控件实现单选功能 <el-tableref"tableRef"height"385"style"--el-table-border-color: none"row-key"contractId"highlight-current-rowsingle-selectselect"handleSelect":data"contractInfo">&l…...
AI技术加速落地 港科广联手思谋打开智能缺陷检测新纪元
AI 技术应用落地的元年,工业是主战场,尤其是工业缺陷检测。 在“生产制造-缺陷检测-工艺优化-生产制造”的智能制造闭环链条中,基于AI的智能缺陷检测扮演着“把关者”的角色。但这个把关者长期以来却缺少一个称手的工具——样本量大、精度高…...
Python爬虫开发:BeautifulSoup、Scrapy入门
在现代网络开发中,网络爬虫是一个非常重要的工具。它可以自动化地从网页中提取数据,并且可以用于各种用途,如数据收集、信息聚合和内容监控等。在Python中,有多个库可以用于爬虫开发,其中BeautifulSoup和Scrapy是两个非…...
数据科学、数据分析、人工智能必备知识汇总-----常用数据分析方法-----持续更新
数据科学、数据分析、人工智能必备知识汇总-----主目录-----持续更新(进不去说明我没写完):https://blog.csdn.net/grd_java/article/details/140174015 文章目录 一、对比分析法1. 按时间和地区2. 同比和环比 二、分组分析法三、结构分析法四、交叉分析法五、矩阵分…...
学习vue Router 一 起步,编程式导航,历史记录,路由传参
目录 起步,安装 1. 安装 2. 使用 命名路由 编程式导航 1. 字符串模式 2. 对象模式 3. 命名路由模式 历史记录 replace的使用 横跨历史 路由传参 1. query路由传参 2. 动态路由传参 3. 二者的区别 起步,安装 router 路由 因为vue是单页应用…...
OpenClaw性能调优:Qwen3-14B镜像任务吞吐量提升300%实战
OpenClaw性能调优:Qwen3-14B镜像任务吞吐量提升300%实战 1. 问题背景与挑战 去年在尝试用OpenClaw对接本地部署的Qwen3-14B模型时,我发现一个尴尬的现象:当处理批量文件整理任务时,系统平均响应时间会从单任务的3秒暴增到20秒以…...
VMware虚拟机中部署Qwen3智能字幕对齐系统:Windows开发者的Linux环境方案
VMware虚拟机中部署Qwen3智能字幕对齐系统:Windows开发者的Linux环境方案 如果你和我一样,主要用Windows电脑工作,但时不时又需要折腾一下Linux环境来跑AI模型,那今天这个方案可能正合你意。直接在Windows上部署某些依赖复杂的AI…...
Redis中有事务吗?有何不同?
在技术领域,我们常常被那些闪耀的、可见的成果所吸引。今天,这个焦点无疑是大语言模型技术。它们的流畅对话、惊人的创造力,让我们得以一窥未来的轮廓。然而,作为在企业一线构建、部署和维护复杂系统的实践者,我们深知…...
网站主域名和子域名的seo优化有何不同
网站主域名和子域名的SEO优化有何不同 在现代网络环境中,网站的SEO优化已经成为了提升网站流量、吸引潜在客户的关键环节。无论是网站主域名还是子域名,其在SEO优化中都有着不同的重要性和作用。本文将详细探讨网站主域名和子域名在SEO优化中的不同&…...
机器学习04——numpy
1、numpy介绍Numpy(Numerical Python)是一个开源的Python科学计算库,用于快速处理任意维度的数组。Numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用Numpy比直接使用Python要简洁的多。Numpy使用ndarray对象来处理多维…...
Go HTTP 客户端连接池管理
Go HTTP 客户端连接池管理:提升性能的关键实践 在现代Web开发中,高效的HTTP客户端是微服务通信和API调用的核心组件。Go语言凭借其简洁的并发模型和原生HTTP库,成为构建高性能服务的首选。默认的HTTP客户端若不加以优化,频繁创建…...
2026届毕业生推荐的六大降重复率网站实测分析
Ai论文网站排名(开题报告、文献综述、降aigc率、降重综合对比) TOP1. 千笔AI TOP2. aipasspaper TOP3. 清北论文 TOP4. 豆包 TOP5. kimi TOP6. deepseek 要降低文本被认定为是由人工智能生成内容即AIGC的可能性,就得从语言所具备的特征…...
前端组件库吐槽:别再用那些华而不实的组件了!
前端组件库吐槽:别再用那些华而不实的组件了! 毒舌时刻 前端组件库就像超市里的预制菜——看起来方便,实际吃起来味同嚼蜡。Ant Design、Material UI、Element Plus... 一堆组件库让你挑花了眼,结果你的页面还是丑得像车祸现场。…...
HC32F460引脚复用避坑指南:如何正确释放SWDIO/SWCLK做普通IO
HC32F460引脚复用实战:释放SWDIO/SWCLK的完整解决方案 当你在华大HC32F460项目中发现GPIO资源紧张时,PB3/PB4这些复用引脚就像藏在抽屉里的备用钥匙。但当你真正需要使用它们时,却发现这些引脚被调试接口牢牢占据。这不是简单的配置问题&…...
从“被看错”到“卖爆”,宇树机器人全国首店开业:机器狗平价上路,人形机器人掀价!
在经历了八年的深耕与资本的反复试炼后,杭州宇树科技(Ushush Technology)今天迎来了一个标志性的时刻——其全国首家线下门店正式在京东Mall西门入口处开业。这不仅是宇树向消费者展示“具身智能”实力的窗口,更是其“讲人形的故事…...


