使用C++实现YOLO图像分类:从环境搭建到性能评估的完整指南
⭐️我叫忆_恒心,一名喜欢书写博客的研究生👨🎓。
如果觉得本文能帮到您,麻烦点个赞
👍呗!
近期会不断在专栏里进行更新讲解博客~~~ 有什么问题的小伙伴 欢迎留言提问欧,喜欢的小伙伴给个三连支持一下呗。👍⭐️❤️
Qt5.9专栏
定期更新Qt的一些项目Demo
项目与比赛专栏
定期更新比赛的一些心得,面试项目常被问到的知识点。
一、引言
YOLO(You Only Look Once)是一种先进的实时对象检测系统,其核心思想是在一个单一的神经网络中直接预测对象边界框和类概率。与传统的对象检测方法相比,YOLO在速度和准确性上都有显著优势。在这篇文章中,我们将介绍如何使用C++实现YOLO进行图像分类,并提供示例代码和相关资源。
随着YOLO技术的迅速发展,使用Python进行yolo部署变得相对简单。然而,在实际的业务场景中,我们往往需要利用C++进行高效调用。因此,本文将重点介绍如何使用C++实现YOLO进行图像分类,并提供相关的示例代码和资源,帮助您在自己的项目中灵活应用YOLO。
1.1 YOLO的基本概念
接下来,我们将详细介绍如何搭建环境、下载并配置YOLO模型文件,以及如何编写和运行示例代码。
YOLO的基本思想是将整个图像分为SxS的网格,每个网格负责预测多个边界框和这些边界框的置信度,以及每个边界框中包含的类别概率。通过训练一个深度卷积神经网络,YOLO可以在一个前向传递中预测多个对象。
除了进行目标检测,也可以将这个应用在图像分类中。
二、 环境搭建
在开始之前,您需要确保已经安装了以下工具和库:
- C++编译器(如GCC)
- OpenCV库(用于图像处理)
- YOLOv模型文件(.cfg和.weights文件)
您可以通过以下命令在Ubuntu上安装OpenCV:
sudo apt-get update
sudo apt-get install libopencv-dev
2.1 下载YOLO模型
首先,您需要下载YOLO的配置文件和权重文件。您可以从以下链接获取这些文件:
- YOLO配置文件(.cfg)
- YOLO权重文件(.weights)
将这些文件放在您的项目目录中。如果计算机性能较差,可以直接使用训练好的模型,直接调用:C++版本的YOLO文件。
三、关键要点
- YOLO是一种先进的实时对象检测系统,能够在单次前向传递中预测多个对象。
- 使用OpenCV的DNN模块可以方便地加载和运行YOLO模型。
- 提供的示例代码展示了如何使用C++实现YOLO图像分类,并进行了详细的注释。
- 相关的仓库可以帮助获取模型文件、更多的示例代码和文档。
3.1 示例代码
接下来,让我们来看一个使用YOLO和C++进行图像分类的简单示例代码。您可以参考这篇文章获取详细的代码实现。
以下是一个基本的代码示例:
#include <opencv2/opencv.hpp>
#include <fstream>
#include <iostream>
#include <vector>// 载入模型和配置文件
std::string modelConfiguration = "yolov.cfg";
std::string modelWeights = "yolov.weights";
cv::dnn::Net net = cv::dnn::readNetFromDarknet(modelConfiguration, modelWeights);void classifyImage(const std::string& imagePath) {// 读取图像cv::Mat frame = cv::imread(imagePath);if (frame.empty()) {std::cerr << "Could not read the image: " << imagePath << std::endl;return;}// 图像预处理cv::Mat blob;cv::dnn::blobFromImage(frame, blob, 1/255.0, cv::Size(416, 416), cv::Scalar(0, 0, 0), true, false);// 设置输入net.setInput(blob);// 前向传播获取结果std::vector<cv::Mat> outs;net.forward(outs, net.getUnconnectedOutLayersNames());// 解析结果for (const auto& out : outs) {for (int i = 0; i < out.rows; i++) {// 解析每个检测结果const auto* data = out.ptr<float>(i);// 此处省略详细的解析代码}}// 显示结果cv::imshow("Image", frame);cv::waitKey(0);
}int main() {std::string imagePath = "path_to_your_image.jpg";classifyImage(imagePath);return 0;
}
3.2 性能评估
在COCO数据集上的训练效果如下:
Model | GPU | Mode | Inference Time |
---|---|---|---|
Yolov3-416 | GTX 1060 | Caffe | 54.593ms |
Yolov3-416 | GTX 1060 | float32 | 23.817ms |
Yolov3-416 | GTX 1060 | int8 | 11.921ms |
Yolov3-608 | GTX 1060 | Caffe | 88.489ms |
Yolov3-608 | GTX 1060 | float32 | 43.965ms |
Yolov3-608 | GTX 1060 | int8 | 21.638ms |
Yolov3-608 | GTX 1080 Ti | float32 | 19.353ms |
Yolov3-608 | GTX 1080 Ti | int8 | 9.727ms |
Yolov3-416 | GTX 1080 Ti | float32 | 9.677ms |
Yolov3-416 | GTX 1080 Ti | int8 | 6.129ms |
3.3 评估结果
Model | GPU | Mode | Dataset | MAP(0.50) | MAP(0.75) |
---|---|---|---|---|---|
Yolov3-416 | GTX 1060 | Caffe(fp32) | COCO val2014 | 50.33 | 33.00 |
Yolov3-416 | GTX 1060 | float32 | COCO val2014 | 50.27 | 32.98 |
Yolov3-416 | GTX 1060 | int8 | COCO val2014 | 44.15 | 30.24 |
Yolov3-608 | GTX 1060 | Caffe(fp32) | COCO val2014 | 52.89 | 35.31 |
Yolov3-608 | GTX 1060 | float32 | COCO val2014 | 52.84 | 35.26 |
Yolov3-608 | GTX 1060 | int8 | COCO val2014 | 48.55 | 35.53 |
四、 相关仓库
以下是一些与YOLO相关的仓库,这些仓库提供了模型文件、示例代码以及文档:
- Darknet:YOLO的原始实现,可以在此找到模型配置文件和权重文件。
- AlexeyAB/darknet:Darknet的一个常用分支,提供了更多的功能和优化。
- opencv/opencv:OpenCV库,提供了对YOLO的DNN模块支持。
完整的测试练习demo
五、结论
通过本文,您了解了如何利用YOLO模型和C++进行图像分类。我们从环境搭建开始,逐步讲解了模型文件的下载和示例代码的实现。希望这些内容能对您的项目有所帮助。如果您有任何问题或建议,请随时在评论区留言。
最后,最后
如果觉得有用,麻烦三连👍⭐️❤️支持一下呀,希望这篇文章可以帮到你,你的点赞是我持续更新的动力
相关文章:

使用C++实现YOLO图像分类:从环境搭建到性能评估的完整指南
⭐️我叫忆_恒心,一名喜欢书写博客的研究生👨🎓。 如果觉得本文能帮到您,麻烦点个赞👍呗! 近期会不断在专栏里进行更新讲解博客~~~ 有什么问题的小伙伴 欢迎留言提问欧,喜欢的小伙伴给个三连支…...

Linux中安装Docker,并使用Docker安装MySQL和Redis
1、安装docker 1卸载系统之前的docker yum remove docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logrotate \docker-logrotate \docker-engine2、安装Docker-CE #安装必须的依赖 sudo yum install -y yum-utils \device-map…...
期货短线交易的核心技术是什么
一、市场分析是短线交易的基础: 技术分析在短线交易中尤为重要,包括K线图、均线系统、成交量与持仓量等指标。K线图可以帮助交易者识别关键价格形态和趋势线,从而判断市场走势。均线系统则可以利用短期均线交叉作为买卖信号,如金…...

VSCode+Vite+Vue3断点调试
目录 lunch.json创建 vite.config.ts 打断点运行 lunch.json创建 首先,点击VSCode左上角,甲壳虫运行的按钮,然后点击运行与调试,选择chrome浏览器,修改成一下配置。 { // 使用 IntelliSense 了解相关属性。 // 悬停…...

RPC框架原理(一)
RPC框架原理 网络和IO的关系,IO(input和output)面向的是谁?OSI 7层参考模型,TCP/IP协议为什么会出现一个会话层三次握手socket心跳keep alive四次挥手 网络IO(IO模型) IO框架底层 学习顺序&…...

LCTF 2018 bestphp‘s revenge
考点:Soap原生类Session反序列化CRLF注入 <?php highlight_file(__FILE__); $b implode; call_user_func($_GET[f], $_POST); session_start(); if (isset($_GET[name])) { $_SESSION[name] $_GET[name]; } var_dump($_SESSION); $a array(reset($_…...
MySQL主从搭建--保姆级教学
MYSQL主从搭建步骤 主节点 # 进入目录 cd /opt# 下载安装包 wget https://dev.mysql.com/get/Downloads/MySQL-8.0/mysql-8.0.20-linux-glibc2.12-x86_64.tar.xz# 解压 tar -xvf mysql-8.0.20-linux-glibc2.12-x86_64.tar.xz# 拷贝到/usr/local mv /opt/mysql-8.0.20-linux-g…...

Modbus通信协议--RTU
一、RTU介绍 MODBUS协议支持多种功能码,不同的功能码对应不同的操作: 0x01读线圈状态0x02读离散输入状态0x03读保持寄存器0x04读输入寄存器0x05写单个线圈0x06写单个保持寄存器0x0F写多个线圈0x10写多个保持寄存器 二、实验 1.0x03功能码读单个保持寄…...
我是大学生,应该选系统运维方向,还是web开发方向?
选择系统运维方向还是Web开发方向取决于你的兴趣、职业目标和个人技能。以下是对这两个方向的详细对比和建议,帮助你做出更明智的选择 双方比较 🤦♀️系统运维方向 优点: 稳定性:系统运维工作通常比较稳定,许多…...

Qt窗口与对话框
目录 Qt窗口 1.菜单栏 2.工具栏 3.状态栏 4.滑动窗口 QT对话框 1.基础对话框QDiaog 创建新的ui文件 模态对话框与非模态对话框 2.消息对话框 QMessageBox 3.QColorDialog 4.QFileDialog文件对话框 5.QFontDialog 6.QInputDialog Qt窗口 前言:之前以上…...

【笔记】Windows 中 一键部署本地私人专属知识库:MaxKB + Docker + MaxKB docker + Ollama
Docker的部署: Docker下载直接进入链接: https://www.docker.com/ Docker使用需要启动Docker,启动Docker以后,会在桌面右下角看到Docker的一个图标: 只有启动了Docker以后,Docker的各种命令才可以使用。 好像还需要…...

【Vue】scoped解决样式冲突
默认情况下写在组件中的样式会 全局生效 → 因此很容易造成多个组件之间的样式冲突问题。 全局样式: 默认组件中的样式会作用到全局,任何一个组件中都会受到此样式的影响 局部样式: 可以给组件加上scoped 属性,可以让样式只作用于当前组件 一、代码示例 BaseOne…...
word模板内容替换
1.pom引入依赖: <dependency><groupId>com.alibaba</groupId><artifactId>easyexcel</artifactId><version>3.0.5</version> </dependency> <dependency><groupId>com.deepoove</groupId><a…...
docker安装和使用
1. docker-ce Docker Community Edition (CE): 功能: 这是 Docker 的主要组件,用于创建、管理和运行容器。它包括 Docker 守护进程 (dockerd),该守护进程负责处理容器的生命周期,包括创建、启动、停止和删除容器。用途: 允许用户在其系统上…...

【AIGC X UML 落地】通过多智能体实现自然语言绘制UML图
前天写了篇博文讲到用PlantUML来绘制C类图和流程图。后台有读者留言,问这步能否自动化生成,不想学习 PlantUML 语法。 我想了下,发现这事可行,确实可以做到通过自然语言的描述就能实现 UML图的绘制,昨天晚上加了个班到…...
C++访问越界
常见场景 访问数组元素越界vector容器访问等 vector<int>;vec<2>;字符串访问越界string str;str[2];array数组访问越界字符串处理,没有添加’\0’字符,导致访问字符串的时候越界了;使用类型强转,让一个大…...

MATLAB format
在MATLAB中,format 是一个函数,用于控制命令窗口中数值的显示格式。这个函数可以设置数值的精度、显示的位数等。以下是一些常用的 format 命令: format long:以默认的长格式显示数值,通常显示15位有效数字。format s…...

Face Forgery Detection by 3D Decomposition
文章目录 Face Forgery Detection by 3D Decomposition研究背景研究目标创新点方法提出问题研究过程技术贡献实验结果未来工作Face Forgery Detection by 3D Decomposition 会议:CVPR2021 作者: 研究背景 面部伪造引发关注传统面部伪造检测主要关注原始RGB图像研究目标 将…...

socket网络编程——多进程、多线程处理并发
如下图所示, 当一个客户端与服务器建立连接以后,服务器端 accept()返回,进而准备循环接收客户端发过来的数据。 如果客户端暂时没发数据,服务端会在 recv()阻塞。此时,其他客户端向服务器发起连接后,由于服务器阻塞了,无法执行 accept()接受连接,也就是其他客户端发送…...

C++---模板进阶(非类型模板参数,模板的特化,模板分离编译)
我们都学习和使用过模板,而这篇文章我们来将一些更深入的知识。在此之前,我们在使用C编程时可以看到模板是随处可见的,它能支持泛型编程。模板包括函数模板和类模板,我们有的人可能会说是模板函数和模板类,但严格讲这样…...

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)
题目:3442. 奇偶频次间的最大差值 I 思路 :哈希,时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况,哈希表这里用数组即可实现。 C版本: class Solution { public:int maxDifference(string s) {int a[26]…...

C++实现分布式网络通信框架RPC(3)--rpc调用端
目录 一、前言 二、UserServiceRpc_Stub 三、 CallMethod方法的重写 头文件 实现 四、rpc调用端的调用 实现 五、 google::protobuf::RpcController *controller 头文件 实现 六、总结 一、前言 在前边的文章中,我们已经大致实现了rpc服务端的各项功能代…...

深入剖析AI大模型:大模型时代的 Prompt 工程全解析
今天聊的内容,我认为是AI开发里面非常重要的内容。它在AI开发里无处不在,当你对 AI 助手说 "用李白的风格写一首关于人工智能的诗",或者让翻译模型 "将这段合同翻译成商务日语" 时,输入的这句话就是 Prompt。…...

Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility
Cilium动手实验室: 精通之旅---20.Isovalent Enterprise for Cilium: Zero Trust Visibility 1. 实验室环境1.1 实验室环境1.2 小测试 2. The Endor System2.1 部署应用2.2 检查现有策略 3. Cilium 策略实体3.1 创建 allow-all 网络策略3.2 在 Hubble CLI 中验证网络策略源3.3 …...

跨链模式:多链互操作架构与性能扩展方案
跨链模式:多链互操作架构与性能扩展方案 ——构建下一代区块链互联网的技术基石 一、跨链架构的核心范式演进 1. 分层协议栈:模块化解耦设计 现代跨链系统采用分层协议栈实现灵活扩展(H2Cross架构): 适配层…...

CocosCreator 之 JavaScript/TypeScript和Java的相互交互
引擎版本: 3.8.1 语言: JavaScript/TypeScript、C、Java 环境:Window 参考:Java原生反射机制 您好,我是鹤九日! 回顾 在上篇文章中:CocosCreator Android项目接入UnityAds 广告SDK。 我们简单讲…...
Java入门学习详细版(一)
大家好,Java 学习是一个系统学习的过程,核心原则就是“理论 实践 坚持”,并且需循序渐进,不可过于着急,本篇文章推出的这份详细入门学习资料将带大家从零基础开始,逐步掌握 Java 的核心概念和编程技能。 …...
大语言模型(LLM)中的KV缓存压缩与动态稀疏注意力机制设计
随着大语言模型(LLM)参数规模的增长,推理阶段的内存占用和计算复杂度成为核心挑战。传统注意力机制的计算复杂度随序列长度呈二次方增长,而KV缓存的内存消耗可能高达数十GB(例如Llama2-7B处理100K token时需50GB内存&a…...

MySQL 知识小结(一)
一、my.cnf配置详解 我们知道安装MySQL有两种方式来安装咱们的MySQL数据库,分别是二进制安装编译数据库或者使用三方yum来进行安装,第三方yum的安装相对于二进制压缩包的安装更快捷,但是文件存放起来数据比较冗余,用二进制能够更好管理咱们M…...
腾讯云V3签名
想要接入腾讯云的Api,必然先按其文档计算出所要求的签名。 之前也调用过腾讯云的接口,但总是卡在签名这一步,最后放弃选择SDK,这次终于自己代码实现。 可能腾讯云翻新了接口文档,现在阅读起来,清晰了很多&…...