当前位置：首页 > news >正文

yolo源码注释4——yolo-py

news 2025/11/18 6:42:17

代码基于yolov5 v6.0

yolo源码注释1——文件结构
yolo源码注释2——数据集配置文件
yolo源码注释3——模型配置文件
yolo源码注释4——yolo-py

yolo.py 用于搭建 yolov5 的网络模型，主要包含 3 部分：

Detect：Detect 层
Model：搭建网络
parse_model：根据配置实例化模块

Model（仅注释了 init 函数）：

class Model(nn.Module):# YOLOv5 modeldef __init__(self, cfg='yolov5s.yaml', ch=3, nc=None, anchors=None):  # model, input channels, number of classessuper().__init__()if isinstance(cfg, dict):self.yaml = cfg  # model dictelse:  # is *.yamlimport yamlself.yaml_file = Path(cfg).namewith open(cfg, encoding='ascii', errors='ignore') as f:self.yaml = yaml.safe_load(f)# Define modelch = self.yaml['ch'] = self.yaml.get('ch', ch)  # input channelsif nc and nc != self.yaml['nc']:LOGGER.info(f"Overriding model.yaml nc={self.yaml['nc']} with nc={nc}")self.yaml['nc'] = nc  # override yaml valueif anchors:LOGGER.info(f'Overriding model.yaml anchors with anchors={anchors}')self.yaml['anchors'] = round(anchors)  # override yaml value# 根据配置搭建网络self.model, self.save = parse_model(deepcopy(self.yaml), ch=[ch])self.names = [str(i) for i in range(self.yaml['nc'])]  # default namesself.inplace = self.yaml.get('inplace', True)# 计算生成 anchors 时的步长m = self.model[-1]  # Detect()if isinstance(m, Detect):s = 256  # 2x min stridem.inplace = self.inplacem.stride = torch.tensor([s / x.shape[-2] for x in self.forward(torch.zeros(1, ch, s, s))])  # forwardcheck_anchor_order(m)  # must be in pixel-space (not grid-space)m.anchors /= m.stride.view(-1, 1, 1)self.stride = m.strideself._initialize_biases()  # only run once# Init weights, biasesinitialize_weights(self)self.info()LOGGER.info('')

parse_model：

def parse_model(d, ch):  # model_dict, input_channels(3)LOGGER.info(f"\n{'':>3}{'from':>18}{'n':>3}{'params':>10}  {'module':<40}{'arguments':<30}")anchors, nc, gd, gw = d['anchors'], d['nc'], d['depth_multiple'], d['width_multiple']na = (len(anchors[0]) // 2) if isinstance(anchors, list) else anchors  # number of anchorsno = na * (nc + 5)  # number of outputs = anchors * (classes + 5)# layers： 保存每一层的结构# save： 记录 from 不是 -1 的层，即需要多个输入的层如 Concat 和 Detect 层# c2: 当前层输出的特征图数量layers, save, c2 = [], [], ch[-1]  # layers, savelist, ch outfor i, (f, n, m, args) in enumerate(d['backbone'] + d['head']):  # from:-1, number:1, module:'Conv', args:[64, 6, 2, 2]m = eval(m) if isinstance(m, str) else m  # eval strings, m:<class 'models.common.Conv'># 数字、列表直接放入args[i]，字符串通过 eval 函数变成模块for j, a in enumerate(args):try:args[j] = eval(a) if isinstance(a, str) else a  # eval strings, [64, 6, 2, 2]except NameError:pass# 对数量大于1的模块和 depth_multiple 相乘然后四舍五入n = n_ = max(round(n * gd), 1) if n > 1 else n  # depth gain# 实例化 ymal 文件中的每个模块if m in (Conv, GhostConv, Bottleneck, GhostBottleneck, SPP, SPPF, DWConv, MixConv2d, Focus, CrossConv,BottleneckCSP, C3, C3TR, C3SPP, C3Ghost,SE, FSM):c1, c2 = ch[f], args[0]  # 输入特征图数量（f指向的层的输出特征图数量），输出特征图数量# 如果输出层的特征图数量不等于 no (Detect输出层)# 则将输出图的特征图数量乘 width_multiple ，并调整为 8 的倍数if c2 != no:  # if not outputc2 = make_divisible(c2 * gw, 8)args = [c1, c2, *args[1:]]  # 默认参数格式：[输入， 输出， 其他参数……]# 参数有特殊格式要求的模块if m in [BottleneckCSP, C3, C3TR, C3Ghost, CSPStage]:args.insert(2, n)  # number of repeatsn = 1elif m is nn.BatchNorm2d:args = [ch[f]]elif m is Concat:c2 = sum(ch[x] for x in f)elif m is Detect:args.append([ch[x] for x in f])if isinstance(args[1], int):  # number of anchorsargs[1] = [list(range(args[1] * 2))] * len(f)elif m is Contract:c2 = ch[f] * args[0] ** 2elif m is Expand:c2 = ch[f] // args[0] ** 2else:c2 = ch[f]m_ = nn.Sequential(*(m(*args) for _ in range(n))) if n > 1 else m(*args)  # modulet = str(m)[8:-2].replace('__main__.', '')  # module typenp = sum(x.numel() for x in m_.parameters())  # number paramsm_.i, m_.f, m_.type, m_.np = i, f, t, np  # attach index, 'from' index, type, number paramsLOGGER.info(f'{i:>3}{str(f):>18}{n_:>3}{np:10.0f}  {t:<40}{str(args):<30}')  # printsave.extend(x % i for x in ([f] if isinstance(f, int) else f) if x != -1)  # append to savelistlayers.append(m_)if i == 0:ch = []ch.append(c2)return nn.Sequential(*layers), sorted(save)

yolo源码注释4——yolo-py

代码基于yolov5 v6.0 目录： yolo源码注释1——文件结构yolo源码注释2——数据集配置文件yolo源码注释3——模型配置文件yolo源码注释4——yolo-py yolo.py 用于搭建 yolov5 的网络模型，主要包含 3 部分： Detect：Detect 层Model…...

编程日记 2023/8/14 21:34:16

计算机网络中速率和带宽的区别

速率，指的是连接在计算机网络上的主机在数字信道上传送数据的速率，它也称为数据率或比特率，单位是bps。速率往往指的是额定速率或者标称速率，意思也就是在非常理想的情况下才能达到的数据传送的速率，然而在现实生活中是…...

编程日记 2023/8/14 21:33:15

MySQL数据库练习

目录表结构建表插入数据 1、用SQL语句创建学生表student，定义主键，姓名不能重名，性别只能输入男或女，所在系的默认值是 “计算机”。 2、修改student 表中年龄（age）字段属性，数据类型由…...

编程日记 2023/8/14 21:32:14

Redis BitMap/HyperLogLog/GEO/布隆过滤器案例

面试问题： 抖音电商直播，主播介绍的商品有评论，1个商品对应了1系列的评论，排序展现取前10条记录用户在手机App上的签到打卡信息：1天对应1系列用户的签到记录，新浪微博、钉钉打卡签到，来没来如何…...

编程日记 2023/8/14 21:31:12

POI处理excel，根据XLOOKUP发现部分公式格式不支持问题

poi4不支持XLOOKUP函数，但poi最新的5.2.3却已经对此函数做了支持 poi下载地址：Index of /dist/poi/release/bin 公式源码位置：org/apache/poi/ss/formula/atp/XLookupFunction.java 但是在使用此函数过程中，发现有些XLOOKUP函数会…...

编程日记 2023/8/14 21:30:11

第一次PR经历

第一次PR测试地址：https://github.com/firstcontributions/first-contributions说明文档： https://github.com/firstcontributions/first-contributions/blob/main/translations/README.zh-cn.md...

编程日记 2023/8/14 21:29:09

背上小书包准备面试之TypeScript篇

目录 typescript是啥？与javascript的区别？ typescript数据类型？ typescript中枚举类型？应用场景？ typescript中接口的理解？应用场景？ typescript中泛型的理解？应用场景&#xf…...

编程日记 2023/8/14 21:28:08

【Spring】浅谈spring为什么推荐使用构造器注入

目录一、前言二、常见的三种注入方式 2.1 field注入 2.2 构造器注入 2.3 setter注入三、构造器注入的好处四、答疑五、总结一、前言 Spring框架对Java开发的重要性不言而喻，其核心特性就是IOC（Inversion of Control， 控制反转&…...

编程日记 2023/8/14 21:27:07

在阿里云Linux服务器上部署MySQL数据库流程

阿里云百科分享在阿里云Linux服务器上部署MySQL数据库流程，MySQL是一个关系型数据库管理系统，常用于LAMP和LNMP等网站场景中。本教程介绍如何在Linux系统ECS实例上安装、配置以及远程访问MySQL数据库。目录背景信息 Alibaba Cloud Linux 2/3、CentO…...

编程日记 2023/8/14 21:26:04

实战——OPenPose讲解及代码实现

一些前提先思考下面几个问题； 1、什么是姿态估计？ 参考：Point Detect任务，识别人体指定部分的关键点； 2、姿态估计中的难点是什么？ 从干扰的角度，人体被遮挡对检测的影响很大；…...

编程日记 2023/8/14 21:25:03

专注于创意设计，为您的小程序和网站建设带来更多的可能性

随着移动互联网的快速发展，越来越多的企业开始关注小程序和网站建设，以此来拓展业务和提升品牌形象。在这个领域中，创意设计扮演着关键的角色。它不仅可以帮助企业打造独特的形象和品牌，还能够提高用户体验和购买决策的效率。因…...

编程日记 2023/8/14 21:24:01

ATF(TF-A)安全通告 TFV-6 (CVE-2017-5753, CVE-2017-5715, CVE-2017-5754)

ATF(TF-A)安全通告汇总目录一、ATF(TF-A)安全通告 TFV-6 (CVE-2017-5753, CVE-2017-5715, CVE-2017-5754) 二、Variant 1 (CVE-2017-5753) 三、Variant 2 (CVE-2017-5715) 四、Variant 3 (CVE-2017-5754) 一、ATF(TF-A)安全通告 TFV-6 (CVE-2017-5753, CVE-2017-5715, C…...

编程日记 2023/8/14 21:22:59

vue3 基础语法 02

你好，今天过的怎么样呀，嘿嘿，加油夏 💕 文章目录一、模板语法一、模板语法 React的开发模式： React 使用的 jsx，对应的代码编写的类似于js的一种语法；通过 Babel 将 jsx ， 编译成…...

编程日记 2023/8/14 21:21:58

版本控制工具——git

版本控制是指对软件开发过程中各种程序代码、配置文件及说明文档等文件变更的管理，是软件配置管理的核心思想之一。版本控制最主要的功能就是追踪文件的变更。它将什么时候、什么人更改了文件的什么内容等信息忠实地了记录下来。每一次文件的改变，文件的…...

编程日记 2023/8/14 21:20:57

超详细，自动化测试实战-获取配置文件信息（实例源码）

目录：导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结（尾部小惊喜） 前言配置文件的类型 …...

编程日记 2023/8/14 21:19:56

spring 2.7.14 cors 设置 allowedOrigins(“*“)通配符失效怎么解决

失效代码： package com.yukuanyan.searcher_web.config;import org.springframework.context.annotation.Configuration; import org.springframework.web.servlet.config.annotation.CorsRegistry; import org.springframework.web.servlet.config.annotation.WebM…...

编程日记 2023/8/14 21:18:55

一、Go的前景与优势、基础语法

Go简介 Go的公司、场景应用公司占比： 字节跳动领先，公司内部有上万个微服务使用go来编写，不久前也开源了GO RPC框架KiteX。同时，腾讯、百度、美团、滴滴、深信服、平安、OPPO、知乎、去哪儿、360、金山、微博、哩哔哩、七牛、…...

编程日记 2023/8/14 21:17:54

shell脚本循环语句

shell脚本循环语句一.echo命令二.查看当前系统的时间--date命令三.循环语句for四.while循环语句结构五.while循环语句结构（迭代）六.continue和break 一.echo命令 echo -n 表示不换行输出 echo -e输出转义符，将转义后的内容输出到屏幕上常…...

编程日记 2023/8/14 21:16:53

二叉树题目：二叉树的直径

文章目录题目标题和出处难度题目描述要求示例数据范围解法思路和算法代码复杂度分析题目标题和出处标题：二叉树的直径出处：543. 二叉树的直径难度 3 级题目描述要求给定二叉树的根结点 root \texttt{root} root，返回其直径…...

编程日记 2023/8/14 21:15:52

嵌入式：C高级 Day4

一、整理思维导图二、写一个函数，获取用户的uid和gid并使用变量接收三、整理冒泡排序、简单选择排序和快速排序的代码冒泡排序 #include <myhead.h>void output(int arr[], int len); void bubble_sort(int arr[], int len);int main(int argc, const ch…...

编程日记 2023/8/14 21:14:49

stm32G473的flash模式是单bank还是双bank？

今天突然有人stm32G473的flash模式是单bank还是双bank？由于时间太久，我真忘记了。搜搜发现，还真有人和我一样。见下面的链接：https://shequ.stmicroelectronics.cn/forum.php?modviewthread&tid644563 根据STM32G4系列参考手…...

编程新知 2025/11/16 21:57:58

Leetcode 3576. Transform Array to All Equal Elements

Leetcode 3576. Transform Array to All Equal Elements 1. 解题思路2. 代码实现题目链接：3576. Transform Array to All Equal Elements 1. 解题思路这一题思路上就是分别考察一下是否能将其转化为全1或者全-1数组即可。至于每一种情况是否可以达到&#xf…...

编程新知 2025/9/17 7:25:07

《Qt C++ 与 OpenCV：解锁视频播放程序设计的奥秘》

引言：探索视频播放程序设计之旅在当今数字化时代，多媒体应用已渗透到我们生活的方方面面，从日常的视频娱乐到专业的视频监控、视频会议系统，视频播放程序作为多媒体应用的核心组成部分，扮演着至关重要的角色。无论是在个人电脑、移动设备还是智能电视等平台上，用户都期望…...

编程新知 2025/11/16 21:48:13

Redis相关知识总结（缓存雪崩，缓存穿透，缓存击穿，Redis实现分布式锁，如何保持数据库和缓存一致）

文章目录 1.什么是Redis？2.为什么要使用redis作为mysql的缓存？3.什么是缓存雪崩、缓存穿透、缓存击穿？3.1缓存雪崩3.1.1 大量缓存同时过期3.1.2 Redis宕机 3.2 缓存击穿3.3 缓存穿透3.4 总结 4. 数据库和缓存如何保持一致性5. Redis实现分布式…...

编程新知 2025/11/16 22:19:32

Mybatis逆向工程，动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件

今天呢，博主的学习进度也是步入了Java Mybatis 框架，目前正在逐步杨帆旗航。那么接下来就给大家出一期有关 Mybatis 逆向工程的教学，希望能对大家有所帮助，也特别欢迎大家指点不足之处，小生很乐意接受正确的建议&…...

编程新知 2025/11/16 23:26:11

Objective-C常用命名规范总结

【OC】常用命名规范总结文章目录【OC】常用命名规范总结1.类名（Class Name)2.协议名（Protocol Name)3.方法名（Method Name)4.属性名（Property Name）5.局部变量/实例变量（Local / Instance Variables&…...

编程新知 2025/10/5 6:41:51

【Zephyr 系列 10】实战项目：打造一个蓝牙传感器终端 + 网关系统（完整架构与全栈实现）

🧠关键词：Zephyr、BLE、终端、网关、广播、连接、传感器、数据采集、低功耗、系统集成 📌目标读者：希望基于 Zephyr 构建 BLE 系统架构、实现终端与网关协作、具备产品交付能力的开发者 📊篇幅字数：约 5200 字 ✨ 项目总览在物联网实际项目中，**“终端 + 网关”**是…...

编程新知 2025/11/16 22:40:15

云原生玩法三问：构建自定义开发环境

云原生玩法三问：构建自定义开发环境引言临时运维一个古董项目，无文档，无环境，无交接人，俗称三无。运行设备的环境老，本地环境版本高，ssh不过去。正好最近对腾讯出品的云原生 cnb 感兴趣&…...

编程新知 2025/11/17 9:30:05

LeetCode - 199. 二叉树的右视图

题目 199. 二叉树的右视图 - 力扣（LeetCode） 思路右视图是指从树的右侧看，对于每一层，只能看到该层最右边的节点。实现思路是： 使用深度优先搜索(DFS)按照"根-右-左"的顺序遍历树记录每个节点的深度对于…...

编程新知 2025/9/13 20:07:18

[免费]微信小程序问卷调查系统(SpringBoot后端+Vue管理端)【论文+源码+SQL脚本】

大家好，我是java1234_小锋老师，看到一个不错的微信小程序问卷调查系统(SpringBoot后端Vue管理端)【论文源码SQL脚本】，分享下哈。项目视频演示【免费】微信小程序问卷调查系统(SpringBoot后端Vue管理端) Java毕业设计_哔哩哔哩_bilibili 项…...

编程新知 2025/11/16 22:42:41

相关文章：