当前位置：首页 > news >正文

目标检测——数据处理

news 2026/2/8 12:51:28

1. `Mosaic` 数据增强

Mosaic 数据增强步骤:

(1). 选择四个图像：

从数据集中随机选择四张图像。这四张图像是用来组合成一个新图像的基础。

(2) 确定拼接位置：

设计一个新的画布(输入size的2倍)，在指定范围内找出一个随机点（如图1所示：范围在320 ~ 960之间）。
每一张小图按照长边resize到输入的输入size的大小，然后依次拼接到对应位置。

图示2

(3) 调整图像大小和裁剪：

对每个选定的图像进行缩放和裁剪，使其适合分配给它的区域。 这样可以确保每个图像都能很好地适应其对应的象限，并且不会超出边界。

(4) 调整标签：

如果你在进行目标检测任务，还需要调整每个图像中的目标框（bounding boxes）的坐标，使其适应新的复合图像的位置。具体来说，需要根据图像在复合图像中的位置重新计算目标框的位置和尺寸。

(5) 应用其他增强操作（可选）：

在生成的复合图像上可以进一步应用其他常见的数据增强技术，如颜色抖动（color jittering）、水平翻转（horizontal flipping）、旋转（rotation）等，以进一步丰富数据集。

2. `CutMix` 数据增强

CutMix是一种数据增强技术，旨在通过将两张图像的一部分区域进行混合，并相应地调整标签，来增加训练样本的多样性。这种方法不仅能够提高模型的泛化能力，还能有效防止过拟合。

CutMix 数据增强的具体步骤：

(1) 选择两张图像和标签：

从数据集中随机选择两张图像 image1 和 image2 及其对应的标签 label1 和 label2。

(2) 确定混合区域：

在 image1 中随机选择一个矩形区域 (x, y, w, h)，其中 (x, y) 是矩形的左上角坐标，(w, h)是矩形的宽度和高度。

通常使用均匀分布来随机选择这些参数，例如：

lam = np.random.beta(beta, beta)  # Beta分布参数，用于控制混合比例
x = np.random.randint(0, image1.shape[1])
y = np.random.randint(0, image1.shape[0])
w = int(image1.shape[1] * np.sqrt(1 - lam))
h = int(image1.shape[0] * np.sqrt(1 - lam))

(3) 裁剪并混合区域：

将 image2 中对应区域的图像裁剪出来，并将其粘贴到 image1 的选定区域中。

这一步可以通过简单的图像操作完成：

def cutmix(image1, image2, x, y, w, h):mixed_image = image1.copy()mixed_image[y:y+h, x:x+w] = image2[y:y+h, x:x+w]return mixed_image

(4) 调整标签：
对于分类任务，标签可以根据混合区域的比例进行线性插值。假设 lam 是混合区域占总面积的比例，则新图像的标签可以表示为：

new_label = lam * label1 + (1 - lam) * label2

对于目标检测任务，需要调整每个目标框的位置和标签，以反映混合后的图像内容。具体来说：

如果目标框完全位于混合区域之外，则保留原标签。
如果目标框部分位于混合区域之内，则需要根据交集区域调整目标框的位置和大小。

目标检测——数据处理

1. Mosaic 数据增强 Mosaic 数据增强步骤: (1). 选择四个图像： 从数据集中随机选择四张图像。这四张图像是用来组合成一个新图像的基础。 (2) 确定拼接位置： 设计一个新的画布(输入size的2倍)，在指定范围内找出一个随机点（如…...

编程日记 2025/3/3 13:54:02

深度学习工程师的技术图谱和学习路径

在构建一个深度学习工程师的技术图谱时，按照“技能树与能力模型”的结构可以帮助清晰地展示出技术体系的层次化关系，帮助学习者更好地理解每个技术点的依赖与顺序。深度学习工程师的技术图谱和学习路径以下是深度学习工程师的技能树，包括从基础到进阶的学习路径，以及对…...

编程日记 2025/3/3 13:53:00

Qt 文件操作+多线程+网络

文章目录 1. 文件操作1.1 API1.2 例子1，简单记事本1.3 例子2，输出文件的属性 2. Qt 多线程2.1 常用API2.2 例子1，自定义定时器 3. 线程安全3.1 互斥锁3.2 条件变量 4. 网络编程4.1 UDP Socket4.2 UDP Server4.3 UDP Client4.4 TCP Socket4.5 …...

编程日记 2025/3/3 13:51:58

如何使用ArcGIS Pro制作横向图例：详细步骤与实践指南

ArcGIS Pro，作为Esri公司推出的新一代地理信息系统（GIS）平台，以其强大的功能和灵活的操作界面，在地理数据处理、地图制作和空间分析等领域发挥着重要作用。在地图制作过程中，图例作为地图的重要组成部分&…...

编程日记 2025/3/3 13:50:56

Kotlin 嵌套类和内部类

在Kotlin中，嵌套类（Nested Class）和内部类（Inner Class）是两种不同的类，它们在定义和使用上有一些区别。 1.嵌套类（Nested Classes）默认是静态的（即等同于Java中的stati…...

编程日记 2025/3/3 13:48:54

蓝蝶（BlueStacks）模拟器Root、Magisk、LSPosed及Shamiko框架安装与过应用检测指南

蓝蝶（BlueStacks）模拟器Root、Magisk、LSPosed及Shamiko框架安装与过应用检测指南蓝蝶bluestacks模拟器root和magisk以及Lsposed和shamiko框架的安装过应用检测一、引言蓝蝶（BlueStacks）模拟器是一款广受欢迎的安卓模拟器&…...

编程日记 2025/3/3 13:44:48

OpenCV计算摄影学（6）高动态范围成像（HDR imaging）

操作系统：ubuntu22.04 OpenCV版本：OpenCV4.9 IDE:Visual Studio Code 编程语言：C11 算法描述高动态范围成像（HDR imaging）是一种图像处理技术，旨在通过增加图像的动态范围来更准确地表示真实世界的亮度差…...

编程日记 2025/3/3 13:43:47

[ComfyUI][AI生图]如何在Comfyui中安装插件管理器

如何在ComfyUI便携版中安装插件管理器在现代软件环境中，图形用户界面（GUI）提供了一种直观的方式来与应用程序交互。ComfyUI是一个出色的GUI框架，它使用户能够通过图形化方式配置和管理他们的应用程序。特别是ComfyUI的便携版，它允许用户在没有安装的情况下使用这一工具，…...

编程日记 2025/3/3 13:41:45

初探Ollama与deepseek

什么是Ollama？它与大模型有什么联系？ 简单说，Ollama就像是你电脑上的一个 “大模型小助手”。以前，很多强大的大语言模型，比如能回答各种问题、写文章、翻译等的那些模型，要么只能在网上的服务器上用&am…...

编程日记 2025/3/3 13:39:42

Linux top 常用参数记录

top命令经常用来监控linux的系统状况，能实时显示系统中各个进程、线程的资源占用情况，是常用的性能分析工具。一些常用参数记录 top的使用方式 top [-d number] | top [-bnp] # 5s 更新一次 top -d 5# 进行2次top命令的输出结果 top -n 2# 查看进程的…...

编程日记 2025/3/3 13:38:41

CCF-CSP认证 202104-1灰度直方图

题目描述思路首先输入矩阵长度、矩阵宽度和灰度范围，结果数组长度可固定，其中的元素要初始化为0。在输入灰度值的时候，结果数组中以该灰度值为索引的元素值1，即可统计每个灰度值的数量。代码 C版： #include <…...

编程日记 2025/3/3 13:37:39

安装 npm install --global yarn 是否安装成功 yarn -v Yarn 淘宝源安装，分别复制粘贴以下代码行到黑窗口运行即可 yarn config set registry https://registry.npm.taobao.org -g yarn config set sass_binary_site http://cdn.npm.taobao.org/dist/…...

编程日记 2025/3/3 13:35:36

Vulhub靶机 AppWeb认证绕过漏洞（CVE-2018-8715）（渗透测试详解）

一、开启vulhub环境 docker-compose up -d 启动docker ps 查看开放的端口影响版本 Appweb 7.0.2以及之前的版本二、访问靶机IP 8080端口访问IP会弹出个登录框 1、随便输个用户名，利用burp抓包 2、修改数据包 ，发包 Authorization: Digest usern…...

编程日记 2025/3/3 13:34:34

CSS 系列之：grid 布局

基本概念 <template><div class"parent"><div class"box">p1-1</div><div class"box">p1-2</div><div class"box">p1-3</div></div><div class"parent"><…...

编程日记 2025/3/3 13:32:32

DeepSeek MLA(Multi-Head Latent Attention)算法浅析

目录前言1. 从MHA、MQA、GQA到MLA1.1 MHA1.2 瓶颈1.3 MQA1.4 GQA1.5 MLA1.5.1 Part 11.5.2 Part 21.5.3 Part 3 结语参考前言学习 DeepSeek 中的 MLA 模块，究极缝合怪，东抄抄西抄抄，主要 copy 自苏神的文章，仅供自己参考&#…...

编程日记 2025/3/3 13:28:26

【计算机网络入门】初学计算机网络（七）

目录 1. 滑动窗口机制 2. 停止等待协议（S-W） 2.1 滑动窗口机制 2.2 确认机制 2.3 重传机制 2.4 为什么要给帧编号 3. 后退N帧协议（GBN） 3.1 滑动窗口机制 3.2 确认机制 3.3 重传机制 4. 选择重传协议（SR&a…...

编程日记 2025/3/3 13:25:20

Conda 环境搭建实战：从基础到进阶

在当今复杂多变的软件开发与数据科学领域，拥有一个稳定、可复现且易于管理的开发环境是项目成功的基石。Conda 作为一款强大的跨平台环境管理与包管理工具，为开发者提供了便捷高效的环境搭建与依赖管理解决方案。本文将深入探讨 Conda 环境搭建的实战技巧…...

编程日记 2025/3/3 13:24:18

大数据-236 离线数仓 - 会员活跃度 WDS 与 ADS 导出到 MySQL 与广告业务需求分析

点一下关注吧！！！非常感谢！！持续更新！！！ Java篇开始了！ 目前开始更新 MyBatis，一起深入浅出！ 目前已经更新到了： Hadoop&#xff0…...

编程日记 2025/3/3 13:19:12

fps项目总结：关于攻击与受击

文章目录战斗交互攻击方命中区间双方命中响应攻击方：指定攻击动画指定动画命中区间：在动画中指定攻击范围以及命中响应动画通知：动画中攻击的开关——调用蓝图攻击函数：实现攻击检测以及命中响应通道检测：——自定义…...

编程日记 2025/3/3 13:17:10

coze生成的工作流，发布后，利用cmd命令行执行。可以定时发日报，周报等。让他总结你飞书里面的表格。都可以

coze生成的工作流，发布后，利用cmd命令行执行。可以定时发日报，周报等。让他总结你飞书里面的表格。都可以。很简单。准备工作，先发布你的工作流，和发布应用。然后，点击扣子API 。申请一个&#xff0…...

编程日记 2025/3/3 13:15:08

云原生核心技术 (7/12): K8s 核心概念白话解读(上)：Pod 和 Deployment 究竟是什么？

大家好，欢迎来到《云原生核心技术》系列的第七篇！ 在上一篇，我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在，我们就像一个拥有了一块崭新数字土地的农场主，是时…...

编程新知 2025/12/14 22:32:59

Ubuntu系统下交叉编译openssl

一、参考资料 OpenSSL&&libcurl库的交叉编译 - hesetone - 博客园二、准备工作 1. 编译环境宿主机：Ubuntu 20.04.6 LTSHost：ARM32位交叉编译器：arm-linux-gnueabihf-gcc-11.1.0 2. 设置交叉编译工具链在交叉编译之前&#x…...

编程新知 2025/11/10 15:33:04

Java 语言特性(面试系列1)

一、面向对象编程 1. 封装（Encapsulation） 定义：将数据（属性）和操作数据的方法绑定在一起，通过访问控制符（private、protected、public）隐藏内部实现细节。示例： public …...

编程新知 2025/10/6 4:03:40

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

蛋白质结合剂（如抗体、抑制肽）在疾病诊断、成像分析及靶向药物递送等关键场景中发挥着不可替代的作用。传统上，高特异性蛋白质结合剂的开发高度依赖噬菌体展示、定向进化等实验技术，但这类方法普遍面临资源消耗巨大、研发周期冗长…...

编程新知 2026/1/25 13:18:12

spring：实例工厂方法获取bean

spring处理使用静态工厂方法获取bean实例，也可以通过实例工厂方法获取bean实例。实例工厂方法步骤如下： 定义实例工厂类（Java代码），定义实例工厂（xml），定义调用实例工厂&#xff…...

编程新知 2025/11/25 22:46:30

HBuilderX安装（uni-app和小程序开发）

下载HBuilderX 访问官方网站：https://www.dcloud.io/hbuilderx.html 根据您的操作系统选择合适版本： Windows版（推荐下载标准版） Windows系统安装步骤运行安装程序： 双击下载的.exe安装文件如果出现安全提示&…...

编程新知 2026/1/31 12:52:04

嵌入式学习笔记DAY33（网络编程——TCP）

一、网络架构 C/S （client/server 客户端/服务器）：由客户端和服务器端两个部分组成。客户端通常是用户使用的应用程序，负责提供用户界面和交互逻辑 ，接收用户输入，向服务器发送请求，并展示服务…...

编程新知 2026/2/7 11:00:30

在 Spring Boot 中使用 JSP

jsp？ 好多年没用了。重新整一下还费了点时间，记录一下。项目结构： pom: <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://ww…...

编程新知 2026/2/4 11:39:13

HTML前端开发：JavaScript 获取元素方法详解

作为前端开发者，高效获取 DOM 元素是必备技能。以下是 JS 中核心的获取元素方法，分为两大系列： 一、getElementBy... 系列传统方法，直接通过 DOM 接口访问，返回动态集合（元素变化会实时更新）。…...

编程新知 2025/10/6 18:44:24

CppCon 2015 学习:Reactive Stream Processing in Industrial IoT using DDS and Rx

“Reactive Stream Processing in Industrial IoT using DDS and Rx” 是指在工业物联网（IIoT）场景中，结合 DDS（Data Distribution Service） 和 Rx（Reactive Extensions） 技术，实现 …...

编程新知 2025/11/8 23:40:56

目标检测——数据处理

1. `Mosaic` 数据增强

2. `CutMix` 数据增强

相关文章：

目标检测——数据处理

深度学习工程师的技术图谱和学习路径

Qt 文件操作+多线程+网络

如何使用ArcGIS Pro制作横向图例：详细步骤与实践指南

Kotlin 嵌套类和内部类

蓝蝶（BlueStacks）模拟器Root、Magisk、LSPosed及Shamiko框架安装与过应用检测指南

OpenCV计算摄影学（6）高动态范围成像（HDR imaging）

[ComfyUI][AI生图]如何在Comfyui中安装插件管理器

初探Ollama与deepseek

Linux top 常用参数记录

CCF-CSP认证 202104-1灰度直方图

怎么下载安装yarn

Vulhub靶机 AppWeb认证绕过漏洞（CVE-2018-8715）（渗透测试详解）

CSS 系列之：grid 布局

DeepSeek MLA(Multi-Head Latent Attention)算法浅析

【计算机网络入门】初学计算机网络（七）

Conda 环境搭建实战：从基础到进阶

大数据-236 离线数仓 - 会员活跃度 WDS 与 ADS 导出到 MySQL 与广告业务需求分析

fps项目总结：关于攻击与受击

coze生成的工作流，发布后，利用cmd命令行执行。可以定时发日报，周报等。让他总结你飞书里面的表格。都可以

云原生核心技术 (7/12): K8s 核心概念白话解读(上)：Pod 和 Deployment 究竟是什么？

Ubuntu系统下交叉编译openssl

Java 语言特性(面试系列1)

8k长序列建模，蛋白质语言模型Prot42仅利用目标蛋白序列即可生成高亲和力结合剂

spring：实例工厂方法获取bean

HBuilderX安装（uni-app和小程序开发）

嵌入式学习笔记DAY33（网络编程——TCP）

在 Spring Boot 中使用 JSP

HTML前端开发：JavaScript 获取元素方法详解

CppCon 2015 学习:Reactive Stream Processing in Industrial IoT using DDS and Rx

1. Mosaic 数据增强

2. CutMix 数据增强

相关文章：

1. `Mosaic` 数据增强

2. `CutMix` 数据增强