当前位置：首页 > news >正文

附录2-tensorflow目标检测

news 2026/2/8 23:20:40

源码来自作者Bubbliiiing，我对参考链接的代码略有修改，网盘地址

链接：百度网盘请输入提取码提取码：dvb1

1 参考链接

2 环境

3 数据集准备

3.1 VOCdevkit/VOC2007

3.2 model_data/voc_classes.txt

3.3 voc_annotation.py

4 训练 train.py

5 训练结果

6 预测

7 其他

7.1 多线程训练

7.2 二次训练

7.3 学习速率

1 参考链接

源码地址 GitHub - bubbliiiing/yolo3-tf2: 这是一个yolo3-tf2的源码，可以用于训练自己的模型。

博客地址睿智的目标检测51——Tensorflow2搭建yolo3目标检测平台_Bubbliiiing的博客-CSDN博客_yolo3

视频地址睿智的目标检测51——Tensorflow2搭建yolo3目标检测平台_Bubbliiiing的博客-CSDN博客_yolo3

2 环境

系统 Linux
显卡 NVIDIA GeForce RTX 3060
CUDA 11.1
CUDNN 无 (cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2与cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2都查不到)

python版本3.6，环境如下

我直接用这个whl装的，tensorflow_gpu-2.6.0-cp36-cp36m-manylinux2010_x86_64.whl

装完之后将keras降到了2.6.0

训练时默认使用GPU资源进行训练

项目放在home下，项目命名为tensorflow_object_detection

3 数据集准备

数据集为877张图像，4分类，其中speedlimit 705个框，crosswalk 174个框，traffclight 154个框，stop 88个框

3.1 VOCdevkit/VOC2007

在项目路径下的VOCdevkit/VOC2007中，将Annotations放入标注的XML文件，JPEGImages放入标注的图片文件(必须是jpg格式的图像，其他格式的不行)

进入ImageSets/Main，删除其中的所有内容

删除项目路径下的 2007_train.txt与2007_val.txt

3.2 model_data/voc_classes.txt

打开项目路径下model_data中的voc_classes.txt

将里面的内容改为自己要训练的类别，顺序无所谓

3.3 voc_annotation.py

不需要改动代码直接运行 voc_annotation.py

运行后会生成这些文件

4 训练 train.py

根据需要修改这里的epoch

然后直接运行就好了，一些warning可以无视掉

在训练开始的时候会给一些提示，可根据这里的提示修改上面的epoch，比如我现在就将epoch设置为569

训练会持续很长事件

5 训练结果

训练结束后会在logs中出现一些文件，我们预测的时候使用 best_epoch_weights.h5 就可以了

我们可以在训练过程中，或者在训练好的loss文件中，查看loss情况

在epoch_loss.txt中可以查看具体的数值

看下面这两个哪个都行

6 预测

修改yolo.py这里的模型信息

我简单改了一下源代码中yolo.py的detect_image方法，目的是拿到预测的信息，而不是直接得到图像

文件名改为了Suyu_yolo.py，下面的predict.py中会进行调用

然后改了一下源码中的predict.py(文件名我改为了Suyu_predict.py)

import time
import cv2
import numpy as np
import tensorflow as tf
from PIL import Image
from Suyu_yolo import YOLO
from utils.utils import get_classesgpus = tf.config.experimental.list_physical_devices(device_type='GPU')
for gpu in gpus:tf.config.experimental.set_memory_growth(gpu, True)yolo = YOLO()class_names,num_classes = get_classes('model_data/voc_classes.txt')
img = './img/road344.jpg'
image = Image.open(img)
out_boxes, out_scores, out_classes = yolo.detect_image(image)result_img = cv2.imread(img)
for i, c in list(enumerate(out_classes)):predicted_class = class_names[int(c)]box = out_boxes[i]score = out_scores[i]top, left, bottom, right = boxtop = max(0, np.floor(top).astype('int32'))left = max(0, np.floor(left).astype('int32'))bottom = min(image.size[1], np.floor(bottom).astype('int32'))right = min(image.size[0], np.floor(right).astype('int32'))label = '{} {:.2f}'.format(predicted_class, score)print(label)cv2.rectangle(result_img,(left,top),(right,bottom),(0,255,0),2)cv2.putText(result_img,label,(left,top+5),cv2.FONT_HERSHEY_SIMPLEX,1,(255,0,0),2)cv2.imshow('result_img',result_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

之后我们将一张图像放在文件夹img中

之后运行predict.py就可以得到结果了

7 其他

7.1 多线程训练

将train.py中的num_workers置为0可以进行多线程训练

7.2 二次训练

每一次都从0开始训练耗费时间太多，所以我们需要对训练好的模型进行二次训练

首先读取一次训练，训练好的模型

将其更改为一次训练的epoch数

将其更改为最终的轮数，我上面初始写的500，这里写的1000，就表明再训练500轮

二次训练的初始loss值是根据你之前训练好的模型来的，所以初始的loss值不会像没训练过一样高(20多)

7.3 学习速率

训练结束后，如果我们发现loss值没有走低的趋势的时候（或训练过程中，我们可以停止训练，然后使用最近一次的h5文件进行二次训练二次训练），我们可以尝试降低学习率

附录2-tensorflow目标检测

源码来自作者Bubbliiiing，我对参考链接的代码略有修改，网盘地址链接：百度网盘请输入提取码提取码：dvb1 目录 1 参考链接 2 环境 3 数据集准备 3.1 VOCdevkit/VOC2007 3.2 model_data/voc_classes.txt 3.3 voc_an…...

编程日记 2023/5/31 22:09:20

常见的EMC问题

电磁兼容设计的目的就在于满足产品功能要求、减少调试时间，使产品满足电磁兼容标准的要求，并且使产品不会对系统中的其它设备产生电磁干扰。电磁兼容设计中常见的问题有哪些？ 1、电磁兼容设计可以从电路设计（包括器件选择&…...

编程日记 2023/5/7 18:22:40

Redis内存存储效率问题

目录内存碎片是如何形成的？ 如何判断是否有内存碎片？ 如何清理内存碎片？ INFO命令面向 Prometheus 的 Redis-exporter 监控实习期间，了解到，企业级开发中多个项目使用Redis，运行Redis实例的有可能是…...

编程日记 2023/5/31 22:11:28

3.28 haas506 2.0开发教程-example-蓝牙多设备扫描(仅支持M320,HD1)

haas506 2.0开发教程-example-蓝牙多设备扫描案例说明蓝牙信息克隆1.手机蓝牙改名信息克隆代码测试案例说明开发板扫描蓝牙设备，获取并打印蓝牙设备mac地址。mac地址每个设备不同，且不能更改。本案例仅适用于M320开发板和HD1-RTU。案例使用手机与iBeac…...

编程日记 2023/6/1 6:55:54

C语言经典编程题100例（41~60）

目录41、习题4-4 特殊a串数列求和42、习题4-6 水仙花数43、习题4-7 最大公约数和最小公倍数44、习题7-5 找鞍点45、练习5-1 求m到n之和46、练习5-2 找两个数中最大者47、练习5-3 数字金字塔48、习题5-1 符号函数49、习题5-2 使用函数求奇数和50、习题5-3 使用函数计算两点间的距…...

编程日记 2023/5/31 22:12:03

git日常使用命令

实习这段时间使用了很多git指令来提交代码，简单记录一下日常使用的指令： 提交代码通常顺序： 1.git status 查看本地修改项 2.git add . 提交全部文件 （这个 .是全部文件）到暂存区 3.git commit -m ‘本次提交的说明’…...

编程日记 2023/5/22 3:40:19

ES6对象展开运算符浅拷贝or深拷贝

ES6中提出的对象展开运算符“…”就是用来展开元素的。有了它就不用代码循环遍历了，偷懒专用。 1. 合并数组展开原有数组中的所有元素，可以合并成一个新的数组。 var a[1,2,3]; var b[4,5,6]; var c[...a,...b]; console.log(c) // 输出：…...

编程日记 2023/5/9 12:08:44

leaflet 上传包含shp的zip文件，在map上解析显示图形（059）

第059个点击查看专栏目录本示例的目的是介绍演示如何在vue+leaflet中本地上传包含shp的zip文件，利用shapefile读取shp数据，并在地图上显示图形。直接复制下面的 vue+openlayers源代码，操作2分钟即可运行实现效果文章目录示例效果加载shapefile.js方式安装引用jszip（…...

编程日记 2023/5/7 12:25:45

CAN总线详细介绍

1.1 CAN是什么？ CAN 最终成为国际标准 （ ISO11898(高速应用)和 ISO11519（低速应用）），是国际上应用最广泛的现场总线之一。 1.2 CAN总线特点多主方式: 可以多主方式工作，网络上任意一个节点…...

编程日记 2023/5/28 10:21:44

python如何完成对 Excel文件的解密后读取？

通常为了防止重要的Excel文件数据内容的泄露，需要对文件整体进行加密与解密的操作。对于文件的加解密过程，python也有很多非标准库来帮助我们完成操作，这里主要说明如何完成对Excel文件的解密与读取操作。这里我们使用到的是msoffcrypto-…...

编程日记 2023/5/6 17:43:19

微服务实战--高级篇：RabbitMQ高级

服务异步通信-高级篇消息队列在使用过程中，面临着很多实际问题需要思考： 1.消息可靠性消息从发送，到消费者接收，会经理多个过程： 其中的每一步都可能导致消息丢失，常见的丢失原因包括： 发送…...

编程日记 2023/5/22 3:43:03

autoCAD2022 - 设置新的原点

文章目录autoCAD2022 - 设置新的原点概述笔记UCS原点设置功能的菜单位置ENDautoCAD2022 - 设置新的原点概述上次整板子的dxf时, 原来的原点不合适, 想调整一下. 当时整完了, 没记录. 这次用的时候, 又找半天… 设置新原点的功能, 不在顶部菜单中, 而是在视图右上角的UCS图标…...

编程日记 2023/5/17 0:49:52

spring boot 配置 mybatis-plus多数据源

简介Mybatis-puls 多数据源的使用，采用的是官方提供的dynamic-datasource-spring-boot-starter包的 DS 注解，具体可以参考官网：https://gitee.com/baomidou/dynamic-datasource-spring-boot-starterpom.xml文件引入如下依赖主要引入dynamic-d…...

编程日记 2023/5/28 0:23:49

独立产品灵感周刊 DecoHack #047 - 安卓手机上最有用的APP

本周刊记录有趣好玩的独立产品设计开发相关内容，每周发布，往期内容同样精彩，感兴趣的伙伴可以点击订阅我的周刊。为保证每期都能收到，建议邮件订阅。欢迎通过 Twitter 私信推荐或投稿。💻 产品推荐 1. Bouncer Tempor…...

编程日记 2023/5/22 10:47:08

【面试题】JavaScript中递归的理解

大厂面试题分享面试题库后端面试题库 （面试必备） 推荐：★★★★★地址：前端面试题库递归 RecursionTo iterate is human, to recurse, divine. 理解迭代，神理解递归。本文会以 JavaScript为主、有部分 Rust 举例说明。…...

编程日记 2023/5/22 18:08:28

PyTorch学习笔记

PyTorch学习笔记（一）：PyTorch环境安装往期学习资料推荐： 1.Pytorch实战笔记_GoAI的博客-CSDN博客 2.Pytorch入门教程_GoAI的博客-CSDN博客安装参考： 1.视频教程：3分钟深度学习【环境搭建】CUDA Anacon…...

编程日记 2023/5/4 10:53:33

SpringBoot2知识点记录1.SpringBoot2基础入门1.1 环境要求1.1.1 maven设置1.2 第一个程序 HelloWorld1.2.1 创建maven工程1.2.2 引入依赖1.2.3 创建主程序1.2.4 编写业务1.2.5 测试1.2.6 简化配置1.2.7 简化部署1.3 自动装配1.3.1 SpringBoot特点1.3.1.1 依赖管理1.3.1.2 自动装…...

编程日记 2023/5/9 12:22:53

Mysql

1 Sql编写 count(*) //是对行数目进行计数 count(column_name) //是对列中不为空的行进行计数 SELECT COUNT( DISTINCT id ) FROM tablename; //计算表中id不同的记录有多少条 SELECT DISTINCT id, type FROM tablename; //返回表中id与type同时不同的结果 X.1 连表子查询 sel…...

编程日记 2023/5/2 2:30:27

Q4营收利润增长背后估值持续偏低，全球支付巨头PayPal前景如何？

作为国际版的“支付宝”，全球第三方支付巨头PayPal的业务横跨欧美市场，覆盖了全球200多个国家和地区。同时，PayPal也是首家进军中国支付市场的外资机构，实力强劲。然而，近两年，PayPal的市值一路从3000亿跌至…...

编程日记 2023/5/26 19:39:02

【自然语言处理】【大模型】BLOOM：一个176B参数且可开放获取的多语言模型

BLOOM：一个176B参数且可开放获取的多语言模型《BLOOM: A 176B-Parameter Open-Access Multilingual Language Model》论文地址：https://arxiv.org/pdf/2211.05100.pdf 相关博客【自然语言处理】【大模型】用于大型Transformer的8-bit矩阵乘法介绍【自然…...

编程日记 2023/5/9 1:34:42

Ubuntu系统下交叉编译openssl

一、参考资料 OpenSSL&&libcurl库的交叉编译 - hesetone - 博客园二、准备工作 1. 编译环境宿主机：Ubuntu 20.04.6 LTSHost：ARM32位交叉编译器：arm-linux-gnueabihf-gcc-11.1.0 2. 设置交叉编译工具链在交叉编译之前&#x…...

编程新知 2025/11/10 15:33:04

Docker 运行 Kafka 带 SASL 认证教程

Docker 运行 Kafka 带 SASL 认证教程 Docker 运行 Kafka 带 SASL 认证教程一、说明二、环境准备三、编写 Docker Compose 和 jaas文件docker-compose.yml代码说明：server_jaas.conf 四、启动服务五、验证服务六、连接kafka服务七、总结 Docker 运行 Kafka 带 SASL 认…...

编程新知 2026/1/23 4:15:03

深入浅出：JavaScript 中的 `window.crypto.getRandomValues()` 方法

深入浅出：JavaScript 中的 window.crypto.getRandomValues() 方法在现代 Web 开发中，随机数的生成看似简单，却隐藏着许多玄机。无论是生成密码、加密密钥，还是创建安全令牌，随机数的质量直接关系到系统的安全性。Jav…...

编程新知 2025/10/8 4:56:09

Linux相关概念和易错知识点（42）（TCP的连接管理、可靠性、面临复杂网络的处理）

目录 1.TCP的连接管理机制（1）三次握手①握手过程②对握手过程的理解 （2）四次挥手（3）握手和挥手的触发（4）状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...

编程新知 2026/1/30 0:09:51

渗透实战PortSwigger靶场-XSS Lab 14：大多数标签和属性被阻止

编程新知 2026/1/24 13:05:24

Frozen-Flask ：将 Flask 应用“冻结”为静态文件

Frozen-Flask 是一个用于将 Flask 应用“冻结”为静态文件的 Python 扩展。它的核心用途是：将一个 Flask Web 应用生成成纯静态 HTML 文件，从而可以部署到静态网站托管服务上，如 GitHub Pages、Netlify 或任何支持静态文件的网站服务器。 &am…...

编程新知 2025/12/5 20:57:13

Python ROS2【机器人中间件框架】简介

销量过万TEEIS德国护膝夏天用薄款优惠券冠生园百花蜂蜜428g 挤压瓶纯蜂蜜巨奇严选鞋子除臭剂360ml 多芬身体磨砂膏280g健70%-75%酒精消毒棉片湿巾1418cm 80片/袋3袋大包清洁食品用消毒优惠券AIMORNY52朵红玫瑰永生香皂花同城配送非鲜花七夕情人节生日礼物送女友热卖妙洁棉…...

编程新知 2026/1/29 9:12:46

【VLNs篇】07：NavRL—在动态环境中学习安全飞行

项目内容论文标题NavRL: 在动态环境中学习安全飞行 (NavRL: Learning Safe Flight in Dynamic Environments)核心问题解决无人机在包含静态和动态障碍物的复杂环境中进行安全、高效自主导航的挑战，克服传统方法和现有强化学习方法的局限性。核心算法基于近端策略优化…...

编程新知 2026/2/7 4:16:41

Caliper 负载(Workload)详细解析

Caliper 负载(Workload)详细解析负载(Workload)是 Caliper 性能测试的核心部分，它定义了测试期间要执行的具体合约调用行为和交易模式。下面我将全面深入地讲解负载的各个方面。一、负载模块基本结构一个典型的负载模块(如 workload.js)包含以下基本结构： use strict;/…...

编程新知 2025/10/31 21:11:39

MySQL 索引底层结构揭秘：B-Tree 与 B+Tree 的区别与应用

文章目录一、背景知识：什么是 B-Tree 和 BTree？ B-Tree（平衡多路查找树） BTree（B-Tree 的变种） 二、结构对比：一张图看懂三、为什么 MySQL InnoDB 选择 BTree？ 1. 范围查询更快 2…...

编程新知 2026/2/3 19:38:38

1 参考链接

2 环境

3 数据集准备

3.1 VOCdevkit/VOC2007

3.2 model_data/voc_classes.txt

3.3 voc_annotation.py

4 训练 train.py

5 训练结果

6 预测

7 其他

7.1 多线程训练

7.2 二次训练

7.3 学习速率

相关文章：