当前位置: 首页 > news >正文

目标检测算法:对比YOLOv3、YOLOv5、YOLOv8

目标检测

YOLOv3

数据处理

  • 可输入任意大小的图片(特征图大小最好是32倍数)
  • Anchor:K-Means聚类+IOU+NMS

模型结构

  • Backbone
    • Darknet53
      • 无最大池化,步长2卷积层进行下采样
      • 每个Conv后 + BN + LeakyReLU
      • 引入残差结构
      • 中间层和某一层上采样拼接
    • 模块
      • CBL = Conv + BN + LeakyReLU
      • ResUnit = CBL + 残差
      • ResX = CBL + N个ResUnit
  • Head
    • Conf置信度:Logistic分类器(逻辑回归预测每个框的置信度分数)
    • Cls分类:BCELoss
    • Bbox目标框:MSELoss

YOLOv5

数据处理

  • 马赛克增强
  • Anchor-Based,K-means计算锚框(自适应锚框)

模型结构

  • Backbone
    • 输入进行特征提取
    • CSPDarkNet53或ResNet网络
    • 模块
      • CBS = Conv2d + BN + SILU
      • C3 = Conv + ResNet + Add + Concat
      • SPPF = Conv + Maxpool + Concat
  • Neck
    • FPN特征金字塔:上采样+下采样+横向连接,多尺度特征融合
    • 自顶向下:上采样融合不同层次特征融合
    • 自底向上:卷积层融合不同层次特征图
  • Head
    • Conf置信度:BCELoss
    • Cls分类:BCELoss
    • Bbox目标框:CIOU

迭代

  • 300

YOLOv8

数据处理

  • Mosaic增强
  • CutMix、Mixup增强
  • Anchor-Free无锚框

模型结构

  • Backbone
    • CSPDarkNet
    • C3–>C2f
  • Neck
    • PANet,一个双向通路网络,引入了自下向上的路径
  • Head
    • Cls分类:BCELoss
    • Bbox目标框:CIOU + DFL(Distribution Focal Loss)

迭代

  • 500
  • 最后10轮,Mosaic增强替换为推理式的Letter box

相关文章:

目标检测算法:对比YOLOv3、YOLOv5、YOLOv8

目标检测 YOLOv3 数据处理 可输入任意大小的图片(特征图大小最好是32倍数)Anchor:K-Means聚类IOUNMS 模型结构 Backbone Darknet53 无最大池化,步长2卷积层进行下采样每个Conv后 BN LeakyReLU引入残差结构中间层和某一层上…...

C# 属性(Property)

C# 属性(Property) C# 中的属性(Property)是一种用于访问和设置类或结构体成员的值的特殊成员。属性提供了一种封装字段的方式,使得字段的访问更加安全和灵活。本文将详细介绍 C# 属性的概念、用途、语法以及如何使用…...

3. 数据结构——栈的操作实现

1. 顺序栈 主要操作&#xff1a;初始化、栈判空、入栈、出栈、去栈顶元素 1.1 直接数组存储栈 //顺序栈的实现 #include<stdio.h> #define MaxSize 50 typedef int ElemType; typedef struct{ElemType data[MaxSize];int top; //指向栈顶指针&#xff0c;最开始-1 …...

EmguCV学习笔记 VB.Net 4.5 像素距离和连通区域

版权声明&#xff1a;本文为博主原创文章&#xff0c;转载请在显著位置标明本文出处以及作者网名&#xff0c;未经作者允许不得用于商业目的。 教程VB.net版本请访问&#xff1a;EmguCV学习笔记 VB.Net 目录-CSDN博客 教程C#版本请访问&#xff1a;EmguCV学习笔记 C# 目录-CSD…...

使用spring boot开发与直接开发一个web项目的区别

1. 项目结构的区别 springboot开发没有web.xml&#xff0c;配置更加简洁。 2. 启动 传统的web项目将项目打成war包&#xff0c;然后将war包复制到tomcat的webapp目录下&#xff0c;最后通过启动tomcat部署运行项目。 而springboot将项目打成jar包&#xff0c;jar包中包含内置的…...

Leetcode JAVA刷刷站(48)旋转图像

一、题目概述 二、思路方向 要在原地顺时针旋转一个 n x n 的二维矩阵 90 度&#xff0c;你可以通过一系列交换操作来实现。这里的关键在于理解旋转后的矩阵与原矩阵之间的元素对应关系。 假设原矩阵为 matrix&#xff0c;其中 matrix[i][j] 表示第 i 行第 j 列的元素。旋转 90…...

编译型语言和解释型语言

年代区分 从硬件技术和软件需求&#xff0c;计算机发展初期&#xff0c;没有可能发展真正的解释型语言&#xff0c;运行速度和内存都受限&#xff0c;只有给机器喂二进制代码才能勉强跑起来。但事实上&#xff0c;解释型语言却在计算机发展很早的时期曾经出现过&#xff0c;当…...

TensorRT 和 PyTorch区别

一、TensorRT 和 PyTorch TensorRT 和 PyTorch 是两个不同的深度学习工具&#xff0c;虽然它们可以用于处理相同类型的任务&#xff0c;但它们的用途、特点和设计目标有所不同。 TensorRT 简介 TensorRT 是 NVIDIA 开发的一款高性能深度学习推理引擎&#xff0c;主要用于优化…...

iOS 17.6.1版本重发,修复高级数据保护错误

今日&#xff0c;苹果没有带来iOS 17.6.2的更新&#xff0c;而是重新发布了iOS 17.6.1版本&#xff0c;本次升级版本号为21G101&#xff0c;高于第一版的21G93。距离初版发布相隔一周半时间。 在 iOS / iPadOS 17.6.1 的更新日志&#xff0c;苹果公司写道&#xff1a;“此更新包…...

【排序算法】八大排序(上)(c语言实现)(附源码)

&#x1f31f;&#x1f31f;作者主页&#xff1a;ephemerals__ &#x1f31f;&#x1f31f;所属专栏&#xff1a;算法 目录 前言 写一串测试数据 交换两元素的函数 一、冒泡排序 二、选择排序 三、插入排序 四、希尔排序 程序全部代码 总结 前言 排序算法是计算机科…...

Python版《超级玛丽+源码》-Python制作超级玛丽游戏

小时候最喜欢玩的小游戏就是超级玛丽了&#xff0c;有刺激有又技巧&#xff0c;通关真的很难&#xff0c;救下小公主还被抓走了&#xff0c;唉&#xff0c;心累&#xff0c;最后还是硬着头皮继续闯&#xff0c;终于要通关了&#xff0c;之后再玩还是没有那么容易&#xff0c;哈…...

互联网私有IP地址列表

最近因为业务需要&#xff0c;要判断用户的IP是否私有IP&#xff0c; 以前知道的私有IP&#xff0c;基本上只有如下几个(注意&#xff1a;这不是正确答案)&#xff1a; 10.0.0.0/8&#xff08;10.0.0.0-10.255.255.255&#xff09;172.16.0.0/12&#xff08;172.16.0.0-172.31…...

光伏项目管理软件为什么那么多光伏人在用?

在光伏行业迅速发展的今天&#xff0c;光伏项目管理软件已成为众多光伏从业者不可或缺的得力助手。那么&#xff0c;为何这款软件能够受到如此广泛的青睐和应用呢&#xff1f; 一、提高项目管理效率 光伏项目管理软件通过数字化、智能化的手段&#xff0c;对光伏项目的各个环节…...

《AOP实战》— 自定义注解

承接上文&#xff08;传送门 —>《面试必考》 — AOP-CSDN博客&#xff09;&#xff0c;在被面试官拷打的时候&#xff0c;会被问到一个致命问题&#xff1a;“你了解aop吗&#xff1f;有具体的使用经验吗&#xff1f;” 你&#xff1a;......... 言尽于此&#xff0c;此篇…...

微前端架构下的单页应用实现策略

随着Web应用的复杂性日益增加&#xff0c;传统的多页应用&#xff08;MPA&#xff09;模式已经难以满足现代Web开发的需求。单页应用&#xff08;SPA&#xff09;以其流畅的用户体验和高效的页面加载速度&#xff0c;逐渐成为Web开发的主流模式。然而&#xff0c;在微前端架构下…...

JWT(JSON Web Token)工作原理及特点

JWT定义 概念&#xff1a;JWT是一种开放标准&#xff08;RFC 7519&#xff09;&#xff0c;用于在网络上安全传输信息&#xff0c;常用于身份验证。比喻&#xff1a;类似于电子通行证&#xff0c;包含用户身份信息&#xff0c;用于身份验证和享受服务。 JWT组成部分 头部&am…...

【体检】程序人生之健康检查,全身体检与预防疫苗,五大传染病普筛,基因检测等

程序员养生指南之 【体检】程序人生之健康检查&#xff0c;全身体检项目分类&#xff0c;五大传染病普筛&#xff0c;基因检测等 文章目录 一、全身体检与预防疫苗&#xff08;年检&#xff09;1、实验室检测&#xff1a;生化全套检查2、医技检查&#xff1a;辅助诊疗科室3、科…...

汇编语言中的指令锁定:解锁高效并发编程

标题&#xff1a;汇编语言中的指令锁定&#xff1a;解锁高效并发编程 在汇编语言的微观世界中&#xff0c;指令锁定&#xff08;Instruction Locking&#xff09;是一种确保数据一致性和操作原子性的关键机制。通过使用特定的lock前缀&#xff0c;开发者可以告诉CPU在执行多处…...

《人工智能时代:金融投资决策的潜在系统性风险及防范策略》

在当今数字化飞速发展的时代&#xff0c;人工智能&#xff08;AI&#xff09;在金融领域的应用日益广泛&#xff0c;特别是在投资决策方面展现出了巨大的潜力。然而&#xff0c;随着其影响力的不断扩大&#xff0c;我们也必须警惕潜在的系统性风险。 人工智能在金融投资决策中…...

MT7621+MT7915(MT7905)+MT7975 (W7621A6G-SDK)编译固件与升级固件方法

一、搭建开发环境&#xff0c;编译固件。 1、安装在Ubuntu 14.04.5 x86_64系统后&#xff0c;然后安装下面命令行。 $ sudo apt-get install git g make libncurses5-dev subversion libssl-dev gawk libxml-parser-perl unzip wget python xz-utils vim zlibc zlib1g zlib1g…...

Vin象棋:基于Yolov5的中国象棋智能视觉辅助系统,重新定义数字化对弈体验

Vin象棋&#xff1a;基于Yolov5的中国象棋智能视觉辅助系统&#xff0c;重新定义数字化对弈体验 【免费下载链接】VinXiangQi Xiangqi syncing tool based on Yolov5 / 基于Yolov5的中国象棋连线工具 项目地址: https://gitcode.com/gh_mirrors/vi/VinXiangQi 在数字化对…...

Alpamayo-R1-10B多场景测试:拥堵跟车、无保护左转、施工区绕行等长尾场景适配效果

Alpamayo-R1-10B多场景测试&#xff1a;拥堵跟车、无保护左转、施工区绕行等长尾场景适配效果 1. 引言&#xff1a;自动驾驶的“最后一公里”难题 想象一下&#xff0c;你坐在一辆自动驾驶汽车里&#xff0c;行驶在一条陌生的城市道路上。前方是一个没有红绿灯的十字路口&…...

OpenClaw定时任务技巧:让Kimi-VL-A3B-Thinking自动处理每日图文简报

OpenClaw定时任务技巧&#xff1a;让Kimi-VL-A3B-Thinking自动处理每日图文简报 1. 为什么需要自动化图文简报 每天早上打开电脑&#xff0c;我的第一件事就是浏览行业资讯、技术博客和社交媒体&#xff0c;把有价值的内容整理成简报。这个过程通常要花费30-45分钟&#xff0…...

COMSOL 6.1版本皮秒多脉冲激光烧蚀模型:双温变形几何烧蚀模拟系统——电子晶格温度清晰解...

COMSOL 6.1版本 皮秒多脉冲激光烧蚀模型 模型内容&#xff1a;涉及双温模型&#xff0c;变形几何&#xff0c;烧蚀&#xff0c;皮秒脉冲热源&#xff0c;电子、晶格温度 优势&#xff1a;模型注释清晰明了&#xff0c;各个情况都有涉及可参考性极强&#xff0c;可以修改&#x…...

RoboStudio6.08学习记录(1)

一.软件安装一、下载RobotStudio软件官方1. 请登陆网址&#xff1a;https://new.abb.com/products/robotics/robotstudio。2. 单击进入页面“下载RobotStudio软件”3. 单击填写信息后&#xff0c;可以获得下载链接二、安装RobotStudio软件1. 下载完成后&#xff0c;对压缩包进行…...

Phi-4-mini-reasoning部署避坑指南:CUDA OOM、端口映射、STARTING卡顿全解析

Phi-4-mini-reasoning部署避坑指南&#xff1a;CUDA OOM、端口映射、STARTING卡顿全解析 1. 模型简介 Phi-4-mini-reasoning是微软推出的3.8B参数轻量级开源模型&#xff0c;专为数学推理、逻辑推导和多步解题等强逻辑任务设计。这个模型主打"小参数、强推理、长上下文、…...

cv_resnet18_ocr-detection保姆级教程:从安装到批量处理图片文字

cv_resnet18_ocr-detection保姆级教程&#xff1a;从安装到批量处理图片文字 1. 快速上手&#xff1a;5分钟搞定OCR文字检测 你是不是经常需要从图片里提取文字&#xff1f;比如整理扫描的文档、识别截图里的信息&#xff0c;或者处理一堆商品图片上的标签。手动打字太慢&…...

会议纪要秒变问答库!WeKnora即时知识系统实战教程

会议纪要秒变问答库&#xff01;WeKnora即时知识系统实战教程 1. 为什么你需要一个"不跑题"的会议助手&#xff1f; 想象这些常见的工作场景&#xff1a; 项目复盘会上&#xff0c;有人问"三个月前那次迭代的排期是怎样的&#xff1f;"&#xff0c;所有…...

OpenClaw跨平台控制:Kimi-VL-A3B-Thinking远程执行多模态任务方案

OpenClaw跨平台控制&#xff1a;Kimi-VL-A3B-Thinking远程执行多模态任务方案 1. 为什么需要跨平台远程控制&#xff1f; 上周五晚上11点&#xff0c;我正躺在沙发上刷手机&#xff0c;突然想起有个紧急的竞品分析报告需要处理。电脑在书房&#xff0c;实在懒得起身。这时我意…...

OpenClaw安全实践:Kimi-VL-A3B-Thinking本地化部署的数据边界保障

OpenClaw安全实践&#xff1a;Kimi-VL-A3B-Thinking本地化部署的数据边界保障 1. 为什么选择本地化部署&#xff1f; 去年夏天&#xff0c;我接手了一个医疗影像分析项目&#xff0c;需要处理大量患者CT扫描图像和诊断报告。最初尝试使用公有云API服务时&#xff0c;每次上传…...