当前位置：首页 > news >正文

25/1/11 算法笔记 Yolov8物体识别

news 2026/2/10 1:08:53

这几天做了给Yolov8检测物体的小任务，今天来做下总结。

首先介绍下整个Yolov8检测的步骤吧，安装库那些就不讲了。

这是我的文件包的对象树。

有images包，里面装了训练和验证的图像。

labels包，装了标注好的labels的txt文件，一开始标注好是json文件，要经过脚本转化，变成yolov能识别的txt文件。

这里我之前遇到一个麻烦，就是我已经开始是用多边形标注的，结果yolov8训练出来一坨，我查了查yolov8好像在目标识别这块不能用多边形。分割的话可以用多边形做。然后就改成矩形做了。

dataset.yaml文件

path: C:/Users/ren/Desktop/gm/guardrail_monitoring/datasets/guardrail
train: C:/Users/ren/Desktop/gm/guardrail_monitoring/datasets/guardrail/images/train
val: C:/Users/ren/Desktop/gm/guardrail_monitoring/datasets/guardrail/images/val# 类别信息
nc: 1
names: ['fence']

script文件里装的是运行脚本

train.py

from ultralytics import YOLOdef train_model():"""训练 YOLOv8 目标检测模型。"""# 加载预训练的目标检测模型model = YOLO("yolov8n.pt")  # 使用 YOLOv8 的目标检测模型# 训练模型results = model.train(data="C:/Users/ren/Desktop/gm/guardrail_monitoring/datasets/dataset.yaml",  # 数据集配置文件路径epochs=100,  # 训练轮数imgsz=640,   # 图像大小batch=16,    # 批量大小name="guardrail_detection",  # 训练任务名称patience=10,  # 早停机制，如果 10 轮验证集性能没有提升，则停止训练device="0",  # 使用 GPU 训练（如果有 GPU）workers=4,   # 数据加载的线程数optimizer="auto",  # 自动选择优化器lr0=0.01,    # 初始学习率lrf=0.01,    # 最终学习率weight_decay=0.0005,  # 权重衰减save=True,   # 保存训练结果save_period=10,  # 每 10 轮保存一次模型)print("训练完成！模型权重保存在 runs/detect/guardrail_detection/weights/ 目录下。")if __name__ == "__main__":train_model()

device = “0”就代表我用的GPU训练，记得要装pytorch的GPU版本。

训练完了之后权值会在run/../weight文件里面,选里面最好的best,吧它的地址换进，infer_image文件里面

from ultralytics import YOLO
from PIL import Image, ImageDraw, ImageFont
import osdef draw_boxes(image, boxes, labels, confidences):"""在图像上绘制边界框和标签。:param image: PIL 图像对象:param boxes: 边界框坐标列表:param labels: 类别标签列表:param confidences: 置信度列表:return: 绘制后的图像"""draw = ImageDraw.Draw(image)font = ImageFont.load_default()for box, label, confidence in zip(boxes, labels, confidences):x1, y1, x2, y2 = boxdraw.rectangle([x1, y1, x2, y2], outline="red", width=2)draw.text((x1, y1), f"{label} {confidence:.2f}", fill="red", font=font)return imagedef infer_image(image_path, output_dir):"""对单张图像进行推理。:param image_path: 图像路径:param output_dir: 输出目录"""# 加载训练好的模型model = YOLO("C:/Users/ren/Desktop/gm/runs/detect/guardrail_detection2/weights/best.pt")# 推理（降低置信度阈值）results = model(image_path, conf=0.1)  # 设置置信度阈值为 0.1# 处理结果for result in results:boxes = result.boxes.xyxy.tolist()  # 获取边界框坐标labels = result.boxes.cls.tolist()  # 获取类别 IDconfidences = result.boxes.conf.tolist()  # 获取置信度names = result.names  # 获取类别名称# 将类别 ID 转换为类别名称labels = [names[int(cls)] for cls in labels]# 打开图像image = Image.open(image_path)# 绘制标注if boxes:  # 如果有检测到目标image = draw_boxes(image, boxes, labels, confidences)else:print(f"{image_path} 未检测到目标！")# 创建输出目录（如果不存在）os.makedirs(output_dir, exist_ok=True)# 保存图像image_name = os.path.basename(image_path)  # 获取图像文件名output_path = os.path.join(output_dir, image_name)image.save(output_path)print(f"推理完成！结果保存在 {output_path}")def infer_validation_set(validation_dir, output_dir):"""对验证集进行批量推理。:param validation_dir: 验证集目录:param output_dir: 输出目录"""# 遍历验证集目录中的所有图像for image_name in os.listdir(validation_dir):if image_name.lower().endswith((".jpg", ".jpeg", ".png")):  # 仅处理图像文件image_path = os.path.join(validation_dir, image_name)infer_image(image_path, output_dir)if __name__ == "__main__":validation_dir = "C:/Users/ren/Desktop/gm/guardrail_monitoring/datasets/guardrail/images/val"  # 验证集目录output_dir = "C:/Users/ren/Desktop/outputs/images"  # 输出目录infer_validation_set(validation_dir, output_dir)

最后就训练好了Yolov8模型

明天来解析一下yolov8的源代码逻辑。

25/1/11 算法笔记 Yolov8物体识别

这几天做了给Yolov8检测物体的小任务，今天来做下总结。首先介绍下整个Yolov8检测的步骤吧，安装库那些就不讲了。这是我的文件包的对象树。有images包，里面装了训练和验证的图像。 labels包，装了标注好的labels的txt文件&…...

编程日记 2025/1/12 15:01:47

水水水水水水

为了拿推广卷，但不想把我原本完整的文章拆成零散的多篇，只能出此下策随便发一篇，认真写的都笔记专栏里网络技术：数字时代的基础设施在当今社会，网络技术无疑是推动现代生活和经济发展的核心动力之一。从简单的信息传…...

编程日记 2025/1/12 15:00:46

XS5037C一款应用于专业安防摄像机的图像信号处理芯片，支持MIPI和 DVP 接口，内置高性能ISP处理器，支持3D降噪和数字宽动态

XS5037C是一款应用于专业安防摄像机的图像信号处理芯片，支持MIPI和 DVP 接口，最大支持 5M sensor接入。内置高性能ISP处理器，支持3D降噪和数字宽动态。标清模拟输出支持960H，高清模拟输出支持HDCCTV 720P/1080P/4M/5M。高度集成…...

编程日记 2025/1/12 14:58:43

机器学习无处不在，AI顺势而为，创新未来

机器学习无处不在： 1、推荐广告和搜索：推广搜不分家，属于数据科学中，对人的行为进行理解 2、计算机视觉CV：对人看到的东西进行理解 3、自然语言处理：对人交流的东西进行理解 4、数据挖掘和数据分析&…...

编程日记 2025/1/12 14:55:39

pandas处理json的相关操作

Pandas 是一个强大的数据处理库，它提供了丰富的功能来处理 JSON 数据。以下是 Pandas 中处理 JSON 的所有常见操作： 1. 读取 JSON 文件使用 pandas.read_json() 函数可以从 JSON 文件或 JSON 字符串中读取数据。从 JSON 文件读取 import pandas as …...

编程日记 2025/1/12 14:53:37

linux内存泄露定位过程（kmemleak和slab debug）

1，当遇到内存增加过多时，或者由于内存导致系统oom时我们怎么定位呢，定位时需要确认是内核态还是用户态内存泄露。排查步骤 top查看VIRT和RES内存 rootubuntu2004:~# top top - 21:05:39 up 7 min, 1 user, load average: 5.01, 4.09, 2.…...

编程日记 2025/1/12 14:51:35

2025年安卓面试复习总结

文章目录深入理解并熟练运用常用设计模式及反射原理，能够自定义注解及泛型，多次通过设计模式对 app 代码进行高效重构，显著提升代码的可维护性与扩展性。设计模式自定义注解泛型Kotlin泛型精通多线程原理，对 ThreadPoolExecutor…...

编程日记 2025/1/12 14:49:32

JS scrollIntoView 技巧揭秘：解锁网页流畅交互

文章目录一.基本概念二.语法和参数基本语法：element.scrollIntoView();参数详解： 三.应用场景和示例场景一：点击目录点位到相应的位置React 示例代码：Vue3 示例代码： 场景二：轮播图定位到指定图片示例代码…...

编程日记 2025/1/12 14:43:25

【Ubuntu 24.04】常见问题解决

1.24开启3D加速黑屏参考文章：Ubuntu24开机黑屏，VMware卡死，虚拟机繁忙解决方案没有3D加速就没有动画，所以我们需要开启3D加速，但是直接开启3D加速会黑屏由于Ubuntu24内部的图形加速驱动异常，因此需要更新…...

编程日记 2025/1/12 14:41:23

前端依赖安装指南

前端依赖安装指南一、NVM管理工具安装 1.在 Windows 上安装下载 NVM for Windows 的安装程序：(最新版本可以在 nvm-windows Releases 页面找到)运行下载的安装程序并按步骤操作。 2.配置 NVM exe安装自动配置环境变量 3. 验证 NVM 安装验证 NVM 是否成功…...

编程日记 2025/1/12 14:39:21

灌区闸门自动化控制系统-精准渠道量测水-灌区现代化建设

项目背景本项目聚焦于黑龙江某一灌区的现代化改造工程，该灌区覆盖广阔，灌溉面积高达7.5万亩，地域上跨越6个乡镇及涵盖17个村庄。项目核心在于通过全面的信息化建设，强力推动节水灌溉措施的实施，旨在显著提升农业用水的…...

编程日记 2025/1/12 14:37:16

ELK实战（最详细）

一、什么是ELK ELK是三个产品的简称：ElasticSearch(简称ES) 、Logstash 、Kibana 。其中： ElasticSearch：是一个开源分布式搜索引擎Logstash ：是一个数据收集引擎，支持日志搜集、分析、过滤，支持大量数据…...

编程日记 2025/1/12 14:36:14

《大型语言模型与强化学习的融合：探索问题的新解决方案与开源验证需求》

强化学习在2020年代初期通过开源项目如CleanRL的多学习者PPO算法取得了显著进展，但在语言模型领域未能充分利用其潜力 1. 开源项目CleanRL的贡献 CleanRL 是一个致力于提供简单、高效且易于理解的强化学习（RL）算法实现的开源项目。该项目通…...

编程日记 2025/1/12 14:35:11

springboot 默认的 mysql 驱动版本

本案例以 springboot 3.1.12 版本为例 <parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>3.1.12</version><relativePath/> </parent> 点击 spring-…...

编程日记 2025/1/12 14:34:10

10分钟快速了解OceanGPT(沧渊)

10分钟快速了解OceanGPT(沧渊) 海洋科学任务的大语言模型——OceanGPT OceanGPT是如何训练的？为了训练 OceanGPT (沧渊) ，收集了一个跨越多个领域的海洋科学语料库。由于每个子领域和主题都有其独特的数据特征和模式，因此提出了一个特定于领域的指令生成框架，称为 DoDirec…...

编程日记 2025/1/12 14:31:06

蓝桥杯嵌入式速通（1）

1.工程准备创建一文件夹存放自己的代码，并在mdk中include上文件夹地址把所有自身代码的头文件都放在headfile头文件中，之后只需要在新的文件中引用headfile即可 headfile中先提前可加入 #include "stdio.h" #include "string.h"…...

编程日记 2025/1/12 14:29:03

Redis优化建议详解

Redis优化建议详解 1. 内存优化 1.1 内存配置设置最大内存 maxmemory 4gb 内存淘汰策略 maxmemory-policy allkeys-lru 样本数量 maxmemory-samples 51.2 内存优化策略数据结构优化使用压缩列表（ziplist）合理设置hash-max-ziplist-entries使用整数…...

编程日记 2025/1/12 14:27:00

ceph 存储 full 阈值调整

前言在 Ceph 集群中，默认情况下，当某些 OSD（对象存储守护进程）的使用率达到 85% 时，系统会发出 nearfull 警告，并可能限制进一步的写入操作，以防止数据丢失或集群不稳定。要允许在 OSD 使用率超过 85% 的情况下继续写入，您可以调整以下两个参数： mon_osd_nearful…...

编程日记 2025/1/12 14:16:50

后端技术选型 sa-token校验学习下结合项目学习后端鉴权

目录后端注册拦截器实现对 WebMvcConfigurer 接口的类实现静态变量方法重写注册 Spring Framework拦截器 Sa-Token中SaServletFilter拦截器思考为什么使用两个拦截器 1. Spring Framework 拦截器 2. SaServletFilter 为什么要注册两个拦截器？ 总结 …...

编程日记 2025/1/12 14:15:49

Vue.js组件开发-实现组件切换效果的两种方法条件渲染、动态组件

在Vue.js中，实现组件切换效果通常依赖于条件渲染或动态组件。方法一：条件渲染条件渲染使用v-if、v-else-if和v-else指令来根据条件展示或隐藏组件。这种方法适用于需要在不同条件下展示不同组件的场景。 <template><div><button cli…...

编程日记 2025/1/12 14:14:47

1. Android wifi 关键日志总结 (1) Wi-Fi 断开 (CTRL-EVENT-DISCONNECTED reason3) 日志相关部分： 06-05 10:48:40.987 943 943 I wpa_supplicant: wlan0: CTRL-EVENT-DISCONNECTED bssid44:9b:c1:57:a8:90 reason3 locally_generated1解析： CTR…...

编程新知 2025/9/14 19:44:52

synchronized 学习

学习源： https://www.bilibili.com/video/BV1aJ411V763?spm_id_from333.788.videopod.episodes&vd_source32e1c41a9370911ab06d12fbc36c4ebc 1.应用场景不超卖，也要考虑性能问题（场景） 2.常见面试问题： sync出…...

编程新知 2025/12/14 17:38:17

微信小程序之bind和catch

这两个呢，都是绑定事件用的，具体使用有些小区别。官方文档： 事件冒泡处理不同 bind：绑定的事件会向上冒泡，即触发当前组件的事件后，还会继续触发父组件的相同事件。例如，有一个子视图绑定了b…...

编程新知 2026/2/5 5:05:56

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录第一章概述第二章弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制第三章主要定义 …...

编程新知 2026/1/22 6:07:24

大数据零基础学习day1之环境准备和大数据初步理解

学习大数据会使用到多台Linux服务器。一、环境准备 1、VMware 基于VMware构建Linux虚拟机是大数据从业者或者IT从业者的必备技能之一也是成本低廉的方案所以VMware虚拟机方案是必须要学习的。 （1）设置网关打开VMware虚拟机，点击编辑…...

编程新知 2026/1/25 14:43:07

系统设计 --- MongoDB亿级数据查询优化策略

系统设计 --- MongoDB亿级数据查询分表策略背景Solution --- 分表背景使用audit log实现Audi Trail功能 Audit Trail范围: 六个月数据量: 每秒5-7条audi log，共计7千万 – 1亿条数据需要实现全文检索按照时间倒序因为license问题，不能使用ELK只能使用…...

编程新知 2026/1/4 3:47:09