目标检测算法:对比YOLOv3、YOLOv5、YOLOv8
目标检测
YOLOv3
数据处理
- 可输入任意大小的图片(特征图大小最好是32倍数)
- Anchor:K-Means聚类+IOU+NMS
模型结构
- Backbone
- Darknet53
- 无最大池化,步长2卷积层进行下采样
- 每个Conv后 + BN + LeakyReLU
- 引入残差结构
- 中间层和某一层上采样拼接
- 模块
- CBL = Conv + BN + LeakyReLU
- ResUnit = CBL + 残差
- ResX = CBL + N个ResUnit
- Darknet53
- Head
- Conf置信度:Logistic分类器(逻辑回归预测每个框的置信度分数)
- Cls分类:BCELoss
- Bbox目标框:MSELoss
YOLOv5
数据处理
- 马赛克增强
- Anchor-Based,K-means计算锚框(自适应锚框)
模型结构
- Backbone
- 输入进行特征提取
- CSPDarkNet53或ResNet网络
- 模块
- CBS = Conv2d + BN + SILU
- C3 = Conv + ResNet + Add + Concat
- SPPF = Conv + Maxpool + Concat
- Neck
- FPN特征金字塔:上采样+下采样+横向连接,多尺度特征融合
- 自顶向下:上采样融合不同层次特征融合
- 自底向上:卷积层融合不同层次特征图
- Head
- Conf置信度:BCELoss
- Cls分类:BCELoss
- Bbox目标框:CIOU
迭代
- 300
YOLOv8
数据处理
- Mosaic增强
- CutMix、Mixup增强
- Anchor-Free无锚框
模型结构
- Backbone
- CSPDarkNet
- C3–>C2f
- Neck
- PANet,一个双向通路网络,引入了自下向上的路径
- Head
- Cls分类:BCELoss
- Bbox目标框:CIOU + DFL(Distribution Focal Loss)
迭代
- 500
- 最后10轮,Mosaic增强替换为推理式的Letter box
相关文章:
目标检测算法:对比YOLOv3、YOLOv5、YOLOv8
目标检测 YOLOv3 数据处理 可输入任意大小的图片(特征图大小最好是32倍数)Anchor:K-Means聚类IOUNMS 模型结构 Backbone Darknet53 无最大池化,步长2卷积层进行下采样每个Conv后 BN LeakyReLU引入残差结构中间层和某一层上…...
C# 属性(Property)
C# 属性(Property) C# 中的属性(Property)是一种用于访问和设置类或结构体成员的值的特殊成员。属性提供了一种封装字段的方式,使得字段的访问更加安全和灵活。本文将详细介绍 C# 属性的概念、用途、语法以及如何使用…...
3. 数据结构——栈的操作实现
1. 顺序栈 主要操作:初始化、栈判空、入栈、出栈、去栈顶元素 1.1 直接数组存储栈 //顺序栈的实现 #include<stdio.h> #define MaxSize 50 typedef int ElemType; typedef struct{ElemType data[MaxSize];int top; //指向栈顶指针,最开始-1 …...
EmguCV学习笔记 VB.Net 4.5 像素距离和连通区域
版权声明:本文为博主原创文章,转载请在显著位置标明本文出处以及作者网名,未经作者允许不得用于商业目的。 教程VB.net版本请访问:EmguCV学习笔记 VB.Net 目录-CSDN博客 教程C#版本请访问:EmguCV学习笔记 C# 目录-CSD…...
使用spring boot开发与直接开发一个web项目的区别
1. 项目结构的区别 springboot开发没有web.xml,配置更加简洁。 2. 启动 传统的web项目将项目打成war包,然后将war包复制到tomcat的webapp目录下,最后通过启动tomcat部署运行项目。 而springboot将项目打成jar包,jar包中包含内置的…...
Leetcode JAVA刷刷站(48)旋转图像
一、题目概述 二、思路方向 要在原地顺时针旋转一个 n x n 的二维矩阵 90 度,你可以通过一系列交换操作来实现。这里的关键在于理解旋转后的矩阵与原矩阵之间的元素对应关系。 假设原矩阵为 matrix,其中 matrix[i][j] 表示第 i 行第 j 列的元素。旋转 90…...
编译型语言和解释型语言
年代区分 从硬件技术和软件需求,计算机发展初期,没有可能发展真正的解释型语言,运行速度和内存都受限,只有给机器喂二进制代码才能勉强跑起来。但事实上,解释型语言却在计算机发展很早的时期曾经出现过,当…...
TensorRT 和 PyTorch区别
一、TensorRT 和 PyTorch TensorRT 和 PyTorch 是两个不同的深度学习工具,虽然它们可以用于处理相同类型的任务,但它们的用途、特点和设计目标有所不同。 TensorRT 简介 TensorRT 是 NVIDIA 开发的一款高性能深度学习推理引擎,主要用于优化…...
iOS 17.6.1版本重发,修复高级数据保护错误
今日,苹果没有带来iOS 17.6.2的更新,而是重新发布了iOS 17.6.1版本,本次升级版本号为21G101,高于第一版的21G93。距离初版发布相隔一周半时间。 在 iOS / iPadOS 17.6.1 的更新日志,苹果公司写道:“此更新包…...
【排序算法】八大排序(上)(c语言实现)(附源码)
🌟🌟作者主页:ephemerals__ 🌟🌟所属专栏:算法 目录 前言 写一串测试数据 交换两元素的函数 一、冒泡排序 二、选择排序 三、插入排序 四、希尔排序 程序全部代码 总结 前言 排序算法是计算机科…...
Python版《超级玛丽+源码》-Python制作超级玛丽游戏
小时候最喜欢玩的小游戏就是超级玛丽了,有刺激有又技巧,通关真的很难,救下小公主还被抓走了,唉,心累,最后还是硬着头皮继续闯,终于要通关了,之后再玩还是没有那么容易,哈…...
互联网私有IP地址列表
最近因为业务需要,要判断用户的IP是否私有IP, 以前知道的私有IP,基本上只有如下几个(注意:这不是正确答案): 10.0.0.0/8(10.0.0.0-10.255.255.255)172.16.0.0/12(172.16.0.0-172.31…...
光伏项目管理软件为什么那么多光伏人在用?
在光伏行业迅速发展的今天,光伏项目管理软件已成为众多光伏从业者不可或缺的得力助手。那么,为何这款软件能够受到如此广泛的青睐和应用呢? 一、提高项目管理效率 光伏项目管理软件通过数字化、智能化的手段,对光伏项目的各个环节…...
《AOP实战》— 自定义注解
承接上文(传送门 —>《面试必考》 — AOP-CSDN博客),在被面试官拷打的时候,会被问到一个致命问题:“你了解aop吗?有具体的使用经验吗?” 你:......... 言尽于此,此篇…...
微前端架构下的单页应用实现策略
随着Web应用的复杂性日益增加,传统的多页应用(MPA)模式已经难以满足现代Web开发的需求。单页应用(SPA)以其流畅的用户体验和高效的页面加载速度,逐渐成为Web开发的主流模式。然而,在微前端架构下…...
JWT(JSON Web Token)工作原理及特点
JWT定义 概念:JWT是一种开放标准(RFC 7519),用于在网络上安全传输信息,常用于身份验证。比喻:类似于电子通行证,包含用户身份信息,用于身份验证和享受服务。 JWT组成部分 头部&am…...
【体检】程序人生之健康检查,全身体检与预防疫苗,五大传染病普筛,基因检测等
程序员养生指南之 【体检】程序人生之健康检查,全身体检项目分类,五大传染病普筛,基因检测等 文章目录 一、全身体检与预防疫苗(年检)1、实验室检测:生化全套检查2、医技检查:辅助诊疗科室3、科…...
汇编语言中的指令锁定:解锁高效并发编程
标题:汇编语言中的指令锁定:解锁高效并发编程 在汇编语言的微观世界中,指令锁定(Instruction Locking)是一种确保数据一致性和操作原子性的关键机制。通过使用特定的lock前缀,开发者可以告诉CPU在执行多处…...
《人工智能时代:金融投资决策的潜在系统性风险及防范策略》
在当今数字化飞速发展的时代,人工智能(AI)在金融领域的应用日益广泛,特别是在投资决策方面展现出了巨大的潜力。然而,随着其影响力的不断扩大,我们也必须警惕潜在的系统性风险。 人工智能在金融投资决策中…...
MT7621+MT7915(MT7905)+MT7975 (W7621A6G-SDK)编译固件与升级固件方法
一、搭建开发环境,编译固件。 1、安装在Ubuntu 14.04.5 x86_64系统后,然后安装下面命令行。 $ sudo apt-get install git g make libncurses5-dev subversion libssl-dev gawk libxml-parser-perl unzip wget python xz-utils vim zlibc zlib1g zlib1g…...
Vin象棋:基于Yolov5的中国象棋智能视觉辅助系统,重新定义数字化对弈体验
Vin象棋:基于Yolov5的中国象棋智能视觉辅助系统,重新定义数字化对弈体验 【免费下载链接】VinXiangQi Xiangqi syncing tool based on Yolov5 / 基于Yolov5的中国象棋连线工具 项目地址: https://gitcode.com/gh_mirrors/vi/VinXiangQi 在数字化对…...
Alpamayo-R1-10B多场景测试:拥堵跟车、无保护左转、施工区绕行等长尾场景适配效果
Alpamayo-R1-10B多场景测试:拥堵跟车、无保护左转、施工区绕行等长尾场景适配效果 1. 引言:自动驾驶的“最后一公里”难题 想象一下,你坐在一辆自动驾驶汽车里,行驶在一条陌生的城市道路上。前方是一个没有红绿灯的十字路口&…...
OpenClaw定时任务技巧:让Kimi-VL-A3B-Thinking自动处理每日图文简报
OpenClaw定时任务技巧:让Kimi-VL-A3B-Thinking自动处理每日图文简报 1. 为什么需要自动化图文简报 每天早上打开电脑,我的第一件事就是浏览行业资讯、技术博客和社交媒体,把有价值的内容整理成简报。这个过程通常要花费30-45分钟࿰…...
COMSOL 6.1版本皮秒多脉冲激光烧蚀模型:双温变形几何烧蚀模拟系统——电子晶格温度清晰解...
COMSOL 6.1版本 皮秒多脉冲激光烧蚀模型 模型内容:涉及双温模型,变形几何,烧蚀,皮秒脉冲热源,电子、晶格温度 优势:模型注释清晰明了,各个情况都有涉及可参考性极强,可以修改&#x…...
RoboStudio6.08学习记录(1)
一.软件安装一、下载RobotStudio软件官方1. 请登陆网址:https://new.abb.com/products/robotics/robotstudio。2. 单击进入页面“下载RobotStudio软件”3. 单击填写信息后,可以获得下载链接二、安装RobotStudio软件1. 下载完成后,对压缩包进行…...
Phi-4-mini-reasoning部署避坑指南:CUDA OOM、端口映射、STARTING卡顿全解析
Phi-4-mini-reasoning部署避坑指南:CUDA OOM、端口映射、STARTING卡顿全解析 1. 模型简介 Phi-4-mini-reasoning是微软推出的3.8B参数轻量级开源模型,专为数学推理、逻辑推导和多步解题等强逻辑任务设计。这个模型主打"小参数、强推理、长上下文、…...
cv_resnet18_ocr-detection保姆级教程:从安装到批量处理图片文字
cv_resnet18_ocr-detection保姆级教程:从安装到批量处理图片文字 1. 快速上手:5分钟搞定OCR文字检测 你是不是经常需要从图片里提取文字?比如整理扫描的文档、识别截图里的信息,或者处理一堆商品图片上的标签。手动打字太慢&…...
会议纪要秒变问答库!WeKnora即时知识系统实战教程
会议纪要秒变问答库!WeKnora即时知识系统实战教程 1. 为什么你需要一个"不跑题"的会议助手? 想象这些常见的工作场景: 项目复盘会上,有人问"三个月前那次迭代的排期是怎样的?",所有…...
OpenClaw跨平台控制:Kimi-VL-A3B-Thinking远程执行多模态任务方案
OpenClaw跨平台控制:Kimi-VL-A3B-Thinking远程执行多模态任务方案 1. 为什么需要跨平台远程控制? 上周五晚上11点,我正躺在沙发上刷手机,突然想起有个紧急的竞品分析报告需要处理。电脑在书房,实在懒得起身。这时我意…...
OpenClaw安全实践:Kimi-VL-A3B-Thinking本地化部署的数据边界保障
OpenClaw安全实践:Kimi-VL-A3B-Thinking本地化部署的数据边界保障 1. 为什么选择本地化部署? 去年夏天,我接手了一个医疗影像分析项目,需要处理大量患者CT扫描图像和诊断报告。最初尝试使用公有云API服务时,每次上传…...
