当前位置：首页 > news >正文

【目标检测】理论篇（3）YOLOv5实现

news 2025/7/8 7:27:53

Yolov5网络构架实现

import torch
import torch.nn as nnclass SiLU(nn.Module):@staticmethoddef forward(x):return x * torch.sigmoid(x)def autopad(k, p=None):if p is None:p = k // 2 if isinstance(k, int) else [x // 2 for x in k] return pclass Focus(nn.Module):def __init__(self, c1, c2, k=1, s=1, p=None, g=1, act=True):  # ch_in, ch_out, kernel, stride, padding, groupssuper(Focus, self).__init__()self.conv = Conv(c1 * 4, c2, k, s, p, g, act)def forward(self, x):# 320, 320, 12 => 320, 320, 64return self.conv(# 640, 640, 3 => 320, 320, 12torch.cat([x[..., ::2, ::2], x[..., 1::2, ::2], x[..., ::2, 1::2], x[..., 1::2, 1::2]], 1))class Conv(nn.Module):def __init__(self, c1, c2, k=1, s=1, p=None, g=1, act=True):super(Conv, self).__init__()self.conv   = nn.Conv2d(c1, c2, k, s, autopad(k, p), groups=g, bias=False)self.bn     = nn.BatchNorm2d(c2, eps=0.001, momentum=0.03)self.act    = SiLU() if act is True else (act if isinstance(act, nn.Module) else nn.Identity())def forward(self, x):return self.act(self.bn(self.conv(x)))def fuseforward(self, x):return self.act(self.conv(x))class Bottleneck(nn.Module):# Standard bottleneckdef __init__(self, c1, c2, shortcut=True, g=1, e=0.5):  # ch_in, ch_out, shortcut, groups, expansionsuper(Bottleneck, self).__init__()c_ = int(c2 * e)  # hidden channelsself.cv1 = Conv(c1, c_, 1, 1)self.cv2 = Conv(c_, c2, 3, 1, g=g)self.add = shortcut and c1 == c2def forward(self, x):return x + self.cv2(self.cv1(x)) if self.add else self.cv2(self.cv1(x))class C3(nn.Module):# CSP Bottleneck with 3 convolutionsdef __init__(self, c1, c2, n=1, shortcut=True, g=1, e=0.5):  # ch_in, ch_out, number, shortcut, groups, expansionsuper(C3, self).__init__()c_ = int(c2 * e)  # hidden channelsself.cv1 = Conv(c1, c_, 1, 1)self.cv2 = Conv(c1, c_, 1, 1)self.cv3 = Conv(2 * c_, c2, 1)  # act=FReLU(c2)self.m = nn.Sequential(*[Bottleneck(c_, c_, shortcut, g, e=1.0) for _ in range(n)])# self.m = nn.Sequential(*[CrossConv(c_, c_, 3, 1, g, 1.0, shortcut) for _ in range(n)])def forward(self, x):return self.cv3(torch.cat((self.m(self.cv1(x)), self.cv2(x)), dim=1))class SPP(nn.Module):# Spatial pyramid pooling layer used in YOLOv3-SPPdef __init__(self, c1, c2, k=(5, 9, 13)):super(SPP, self).__init__()c_ = c1 // 2  # hidden channelsself.cv1 = Conv(c1, c_, 1, 1)self.cv2 = Conv(c_ * (len(k) + 1), c2, 1, 1)self.m = nn.ModuleList([nn.MaxPool2d(kernel_size=x, stride=1, padding=x // 2) for x in k])def forward(self, x):x = self.cv1(x)return self.cv2(torch.cat([x] + [m(x) for m in self.m], 1))class CSPDarknet(nn.Module):def __init__(self, base_channels, base_depth, phi, pretrained):super().__init__()#-----------------------------------------------##   输入图片是640, 640, 3#   初始的基本通道base_channels是64#-----------------------------------------------##-----------------------------------------------##   利用focus网络结构进行特征提取#   640, 640, 3 -> 320, 320, 12 -> 320, 320, 64#-----------------------------------------------#self.stem       = Focus(3, base_channels, k=3)#-----------------------------------------------##   完成卷积之后，320, 320, 64 -> 160, 160, 128#   完成CSPlayer之后，160, 160, 128 -> 160, 160, 128#-----------------------------------------------#self.dark2 = nn.Sequential(# 320, 320, 64 -> 160, 160, 128Conv(base_channels, base_channels * 2, 3, 2),# 160, 160, 128 -> 160, 160, 128C3(base_channels * 2, base_channels * 2, base_depth),)#-----------------------------------------------##   完成卷积之后，160, 160, 128 -> 80, 80, 256#   完成CSPlayer之后，80, 80, 256 -> 80, 80, 256#                   在这里引出有效特征层80, 80, 256#                   进行加强特征提取网络FPN的构建#-----------------------------------------------#self.dark3 = nn.Sequential(Conv(base_channels * 2, base_channels * 4, 3, 2),C3(base_channels * 4, base_channels * 4, base_depth * 3),)#-----------------------------------------------##   完成卷积之后，80, 80, 256 -> 40, 40, 512#   完成CSPlayer之后，40, 40, 512 -> 40, 40, 512#                   在这里引出有效特征层40, 40, 512#                   进行加强特征提取网络FPN的构建#-----------------------------------------------#self.dark4 = nn.Sequential(Conv(base_channels * 4, base_channels * 8, 3, 2),C3(base_channels * 8, base_channels * 8, base_depth * 3),)#-----------------------------------------------##   完成卷积之后，40, 40, 512 -> 20, 20, 1024#   完成SPP之后，20, 20, 1024 -> 20, 20, 1024#   完成CSPlayer之后，20, 20, 1024 -> 20, 20, 1024#-----------------------------------------------#self.dark5 = nn.Sequential(Conv(base_channels * 8, base_channels * 16, 3, 2),SPP(base_channels * 16, base_channels * 16),C3(base_channels * 16, base_channels * 16, base_depth, shortcut=False),)if pretrained:url = {'s' : 'https://github.com/bubbliiiing/yolov5-pytorch/releases/download/v1.0/cspdarknet_s_backbone.pth','m' : 'https://github.com/bubbliiiing/yolov5-pytorch/releases/download/v1.0/cspdarknet_m_backbone.pth','l' : 'https://github.com/bubbliiiing/yolov5-pytorch/releases/download/v1.0/cspdarknet_l_backbone.pth','x' : 'https://github.com/bubbliiiing/yolov5-pytorch/releases/download/v1.0/cspdarknet_x_backbone.pth',}[phi]checkpoint = torch.hub.load_state_dict_from_url(url=url, map_location="cpu", model_dir="./model_data")self.load_state_dict(checkpoint, strict=False)print("Load weights from ", url.split('/')[-1])def forward(self, x):x = self.stem(x)x = self.dark2(x)#-----------------------------------------------##   dark3的输出为80, 80, 256，是一个有效特征层#-----------------------------------------------#x = self.dark3(x)feat1 = x#-----------------------------------------------##   dark4的输出为40, 40, 512，是一个有效特征层#-----------------------------------------------#x = self.dark4(x)feat2 = x#-----------------------------------------------##   dark5的输出为20, 20, 1024，是一个有效特征层#-----------------------------------------------#x = self.dark5(x)feat3 = xreturn feat1, feat2, feat3

【目标检测】理论篇（3）YOLOv5实现

Yolov5网络构架实现 import torch import torch.nn as nnclass SiLU(nn.Module):staticmethoddef forward(x):return x * torch.sigmoid(x)def autopad(k, pNone):if p is None:p k // 2 if isinstance(k, int) else [x // 2 for x in k] return pclass Focus(nn.Module):def …...

编程日记 2023/9/6 21:45:23

IDEA爪哇操作数据库

少小离家老大回,乡音无改鬓毛衰 ⒈.IDEA2018设置使用主题颜色 IDEA2018主题颜色分为三种：idea原始颜色，高亮色，黑色设置方法：Settings–Appearance&Behavior–Appearance ⒉.mysql中，没有my.ini，只有…...

编程日记 2023/9/6 21:44:22

一文速学-让神经网络不再神秘，一天速学神经网络基础(七)-基于误差的反向传播

前言思索了很久到底要不要出深度学习内容，毕竟在数学建模专栏里边的机器学习内容还有一大半算法没有更新，很多坑都没有填满，而且现在深度学习的文章和学习课程都十分的多，我考虑了很久决定还是得出神经网络系列文章，…...

编程日记 2023/9/6 21:43:21

C++ 异常处理——学习记录007

1. 概念程序中的错误分为编译时错误和运行时错误。编译时出现的错误包括关键字拼写出错、语句分号缺少、括号不匹配等，编译时的错误容易解决。运行时出现的错误包括无法打开文件、数组越界和无法实现指定的操作。运行时出现的错误称为异常，对异常的处理…...

编程日记 2023/9/6 21:42:20

【BIM+GIS】“BIM+”是什么? “BIM+”技术详解

对于我们日常生活影响最大的是信息化和网络化给我们的日常生活带来革命性的变化。“互联网+“在建筑行业里可以称为“BIM+”。“BIM+”"即是通过BIM与各类技术(互联网、大数据等）结合去完成不同的任务。将产品的全生命周期和全制造流程的数字化以及基于信息通信技术的模块…...

编程日记 2023/9/6 21:41:18

Flink算子如何限流

目录使用方法调用类图内部源码 GuavaFlinkConnectorRateLimiter RateLimiter 使用方法重写AbstractRichFunction中的open()方法，在处理数据前调用limiter.acquire(1); 调用limiter.open(getRuntimeContext())的源码，实际内部是RateLimiter,根据并行度算出subTask…...

编程日记 2023/9/6 21:40:17

垃圾分代收集的过程是怎样的?

垃圾分代收集是Java虚拟机(JVM)中一种常用的垃圾回收策略。该策略将堆内存分为不同的代(Generation)，通常分为年轻代(Young Generation)和老年代(Old Generation)。不同代的对象具有不同的生命周期和回收频率。下面是Java中垃圾分代收集的一般过程： 1…...

编程日记 2023/9/6 21:39:16

NPM 常用命令（四）

目录 1、npm diff 1.1 描述 1.2 过滤文件 1.3 配置 diff diff-name-only diff-unified diff-ignore-all-space diff-no-prefix diff-src-prefix diff-dst-prefix diff-text global tag workspace workspaces include-workspace-root 2、npm dist-tag 2.1 常…...

编程日记 2023/9/6 21:38:15

Anaconda虚拟环境下导入opencv

文章目录解决方法测试解决方法 1、根据自己虚拟环境对于的python版本与电脑对应的位长选择具体的版本，例如python3.9选择cp39，64位电脑选择64 下载地址：资源地址若是不确定自己虚拟环境对应的python版本，可以输入下列命令&…...

编程日记 2023/9/6 21:37:14

Linux设备驱动程序

一、设备驱动程序简介图1.1 内核功能的划分可装载模块 Linux有一个很好的特性:内核提供的特性可在运行时进行扩展。这意味着当系统启动并运行时，我们可以向内核添加功能( 当然也可以移除功能)。可在运行时添加到内核中的代码被称为“模块”。Linux内核支持好几…...

编程日记 2023/9/6 21:36:12

mybatis ＜if＞标签判断“0“不生效

原if标签写法 <if test"type 0"> </if> 这种情况不生效,原因是mybatis是用OGNL表达式来解析的，在OGNL的表达式中，0’会被解析成字符(而我传入的type却是string)，java是强类型的，cha…...

编程日记 2023/9/6 21:35:11

企业数据的存储形式与方案选择

企业数据的存储形式 DAS（直接附加存储）：企业初期银行规模不大，企业的数据存储需求也比较简单，因此对企业数据存储的要求就是安全保存并可以随时调用。而DAS的之间连接可以解决单台服务器的存储空间扩展，高…...

编程日记 2023/9/6 21:34:10

图像处理简介

目录基本术语 1 .图像(image) 1.1 像素(Pixel) 1.2 颜色深度（Color Depth） 1.3 分辨率（Resolution） 1.4 像素宽高比（Pixel Aspect Ratio） 1.5 帧率(FPS) 1.6 码率（BR） 1. …...

编程日记 2023/9/6 21:33:10

adb server version (19045) doesn‘t match this client (41)； killing.的解决办法

我是因为安装了360手机助手，导致adb版本冲突。卸载之后问题解决根据这个思路，如果产生"adb server version (19045) doesn’t match this client (41); killing."的错误，检查一下是否有多个版本的adb服务。...

编程日记 2023/9/6 21:31:08

实验室的服务器和本地pycharm怎么做图传

提前说一个自认为比较重要的一点： 容器中安装opencv，可以先试试用 apt install libopencv-dev python3-opencv 我感觉在图传的时候用的不是 opencv-python 而是ubuntu的opencv库所以用 apt install 安装试一下参考远程调试 qt.qpa.xcb: coul…...

编程日记 2023/9/6 21:30:06

Vue + Element UI 前端篇（五）：国际化实现

Vue Element UI 实现权限管理系统前端篇（五）：国际化实现国际化支持 1.安装依赖执行以下命令，安装 i18n 依赖。 yarn add vue-i18n $ yarn add vue-i18n yarn add v1.9.4 warning package-lock.json found. Your project …...

编程日记 2023/9/6 21:29:05

[ROS]虚拟机ubuntu18.04系统里面运行usb_cam

首先安装usb_cam sudo apt-get install ros-melodic-usb-cam 运行： roscore roslaunch usb_cam usb_cam-test.launch 如果一运行报错，首先确认是否存在/dev/video0 可以使用ls /dev/video*查看，如果没有就是没有连接摄像头，…...

编程日记 2023/9/6 21:28:05

常用通讯协议比较

dubbo与http1.0的区别二进制协议：Dubbo使用自定义的二进制协议，而HTTP 1.0使用文本，发送一条相同的消息，http1.0会有更大的网络开销。连接复用：Dubbo采用单一的多路复用NIO长链接，每个请求都有一个对应的…...

编程日记 2023/9/6 21:27:02

鼠标键盘管理 ShareMouse for Mac最新

软件“ShareMouse”允许您通过单个鼠标和键盘控制多台计算机： 将鼠标移动到您想要控制的计算机的监视器上，指针会神奇地跳转到该计算机。任何鼠标和键盘输入都会传输到相应的计算机。与网络KVM类似，ShareMouse通过本地LAN传输鼠标移动和点…...

编程日记 2023/9/6 21:26:00

【ALM工具软件】上海道宁与Perforce为您带来用于整个生命周期的应用程序生命周期管理软件

Helix ALM是用于整个生命周期的应用程序生命周期管理的ALM软件具有专用于需求管理（Helix RM）、测试用例管理（Helix TCM） 问题管理（Helix IM）的功能模块 Helix ALM提供了无与伦比的可追溯性您将…...

编程日记 2023/9/6 21:24:58

基于大模型的 UI 自动化系统

基于大模型的 UI 自动化系统下面是一个完整的 Python 系统，利用大模型实现智能 UI 自动化，结合计算机视觉和自然语言处理技术，实现"看屏操作"的能力。系统架构设计 #mermaid-svg-2gn2GRvh5WCP2ktF {font-family:"trebuchet ms",verdana,arial,sans-…...

编程新知 2025/6/21 5:42:11

Linux链表操作全解析

Linux C语言链表深度解析与实战技巧一、链表基础概念与内核链表优势1.1 为什么使用链表？1.2 Linux 内核链表与用户态链表的区别二、内核链表结构与宏解析常用宏/函数三、内核链表的优点四、用户态链表示例五、双向循环链表在内核中的实现优势5.1 插入效率5.2 安全…...

编程新知 2025/6/21 5:31:03

解决Ubuntu22.04 VMware失败的问题 ubuntu入门之二十八

现象1 打开VMware失败 Ubuntu升级之后打开VMware上报需要安装vmmon和vmnet，点击确认后如下提示最终上报fail 解决方法内核升级导致，需要在新内核下重新下载编译安装查看版本 $ vmware -v VMware Workstation 17.5.1 build-23298084$ lsb_release…...

编程新知 2025/7/7 16:21:08

高危文件识别的常用算法：原理、应用与企业场景

高危文件识别的常用算法：原理、应用与企业场景高危文件识别旨在检测可能导致安全威胁的文件，如包含恶意代码、敏感数据或欺诈内容的文档，在企业协同办公环境中（如Teams、Google Workspace）尤为重要。结合大模型技术&…...

编程新知 2025/7/7 21:08:21

三体问题详解

从物理学角度，三体问题之所以不稳定，是因为三个天体在万有引力作用下相互作用，形成一个非线性耦合系统。我们可以从牛顿经典力学出发，列出具体的运动方程，并说明为何这个系统本质上是混沌的，无法得到一般解…...

编程新知 2025/6/21 9:02:37

C++八股 —— 单例模式

文章目录 1. 基本概念2. 设计要点3. 实现方式4. 详解懒汉模式 1. 基本概念线程安全（Thread Safety） 线程安全是指在多线程环境下，某个函数、类或代码片段能够被多个线程同时调用时，仍能保证数据的一致性和逻辑的正确性&#xf…...

编程新知 2025/7/6 22:10:07

2025季度云服务器排行榜

在全球云服务器市场，各厂商的排名和地位并非一成不变，而是由其独特的优势、战略布局和市场适应性共同决定的。以下是根据2025年市场趋势，对主要云服务器厂商在排行榜中占据重要位置的原因和优势进行深度分析： 一、全球“三巨头”…...

编程新知 2025/7/5 17:16:12

A2A JS SDK 完整教程：快速入门指南

目录什么是 A2A JS SDK?A2A JS 安装与设置A2A JS 核心概念创建你的第一个 A2A JS 代理A2A JS 服务端开发A2A JS 客户端使用A2A JS 高级特性A2A JS 最佳实践A2A JS 故障排除什么是 A2A JS SDK? A2A JS SDK 是一个专为 JavaScript/TypeScript 开发者设计的强大库&#xff…...

编程新知 2025/6/18 3:11:41

招商蛇口 | 执笔CID，启幕低密生活新境

作为中国城市生长的力量，招商蛇口以“美好生活承载者”为使命，深耕全球111座城市，以央企担当匠造时代理想人居。从深圳湾的开拓基因到西安高新CID的战略落子，招商蛇口始终与城市发展同频共振，以建筑诠释对土地与生活的…...

编程新知 2025/7/7 4:58:29

现有的 Redis 分布式锁库（如 Redisson）提供了哪些便利？

现有的 Redis 分布式锁库（如 Redisson）相比于开发者自己基于 Redis 命令（如 SETNX, EXPIRE, DEL）手动实现分布式锁，提供了巨大的便利性和健壮性。主要体现在以下几个方面： 原子性保证 (Atomicity)&#xff…...

编程新知 2025/6/20 16:41:45

相关文章：