人脸图像数据增强
为什么要做数据增强
在计算机视觉相关任务中,数据增强(Data Augmentation)是一种常用的技术,用于扩展训练数据集的多样性。它包括对原始图像进行一系列随机或有规律的变换,以生成新的训练样本。数据增强的主要目的是增加模型的泛化能力、提高模型的鲁棒性,并减轻过拟合的风险。以下是进行数据增强的几个重要原因:
-
增加数据样本数量:数据增强可以通过生成变体来增加训练样本的数量。这对于具有有限标记样本的任务非常重要,因为更多的数据样本有助于提高模型的性能。
-
泛化能力:数据增强可以引入多样性,使模型能够更好地泛化到新的、未见过的数据。这有助于模型在真实世界的各种情况下表现良好,而不仅仅是在训练时的数据分布中表现良好。
-
鲁棒性:通过对数据进行多样性的变换,模型可以更好地处理因噪声、光照变化、旋转、缩放等因素引起的图像变化。这提高了模型在复杂环境中的稳健性。
-
降低过拟合风险:数据增强可以减轻模型过拟合的风险,因为它迫使模型不仅仅学会记住训练数据,还要学会对数据的变化做出反应。这有助于提高模型对新数据的适应能力。
-
类别平衡:在多类别分类任务中,某些类别的样本数量可能较少。数据增强可以帮助平衡各个类别的样本数量,以防止模型偏向于出现频率较高的类别。
-
节省标注成本:在某些情况下,收集和标记大量的训练数据可能非常昂贵和耗时。通过数据增强,您可以使用较少的标记样本来训练模型,同时保持性能。
常见的数据增强技术包括图像翻转、旋转、缩放、裁剪、颜色变换、加噪声等。选择哪些数据增强技术以及如何应用它们通常取决于具体任务和数据集的特点。数据增强在许多计算机视觉任务中都被广泛使用,包括图像分类、目标检测、分割、人脸识别等。通过增强数据的多样性,可以提高模型的性能并使其更适应复杂的现实世界场景。
人脸图像数据增强
对于人脸图像数据增强,有多种方法可以提高模型的鲁棒性和性能。以下是一些常见的人脸图像数据增强方法:
- 旋转和翻转: 随机旋转或翻转图像,以改变人脸的角度和方向,使模型更具鲁棒性。
- 缩放和裁剪: 随机调整图像的大小并进行裁剪,以模拟不同尺度和视角下的人脸。
- 亮度和对比度调整: 修改图像的亮度、对比度和色彩平衡,以增加模型的鲁棒性。
- 噪声添加: 向图像中添加随机噪声,以模拟真实世界中的图像变化。
- 颜色扭曲: 扭曲图像的颜色通道,使图像对于不同的照明条件更具鲁棒性。
- 遮挡和变形: 在图像中添加遮挡物或变形,以增加模型对于不完整或变形人脸的处理能力。
- 人脸关键点扰动: 对图像中的人脸关键点进行随机扰动,以改变面部特征的位置。
- 风格迁移: 将不同图像的风格应用到人脸图像上,以增加多样性。
- 镜像对称: 镜像对称图像,以生成左右对称的人脸数据。
- 增加噪声数据: 引入合成噪声数据,以增加模型对于嘈杂环境下的鲁棒性。
这些增强方法可以单独使用,也可以组合使用。
实现
以下是个人实现的一些人脸增强方式,不会对原始人脸数据造成太大的干扰,进而不会引入脏数据:
- 旋转:范围在(-20°, 20°) 表示向左向右旋转
def rotate_image(image):rows, cols, _ = image.shapeangle = random.randint(-20, 20)M = cv2.getRotationMatrix2D((cols/2, rows/2), angle, 1)rotated_image = cv2.warpAffine(image, M, (cols, rows))return rotated_image
- 翻转:只水平翻转
def flip_image(image):return cv2.flip(image, 1)
- 缩放:范围是原先的(0.8, 1.2)之间
def scale_image(image, scale_factor):scale_factor = random.uniform(0.8, 1.2)rows, cols, _ = image.shapenew_size = (int(cols * scale_factor), int(rows * scale_factor))scaled_image = cv2.resize(image, new_size)return scaled_image
- 改变亮度对比度
def adjust_brightness_contrast(image):alpha = random.uniform(0.5, 1.5)beta = random.randint(10, 50)return cv2.convertScaleAbs(image, alpha=alpha, beta=beta)
- 改变颜色
def color_distortion(image, color_matrix):# color_matrix = np.array([[0.393, 0.769, 0.189], [0.349, 0.686, 0.168], [0.272, 0.534, 0.131]])return cv2.transform(image, color_matrix)
- 加椒盐噪声
def salt_and_pepper_noise(image, salt_prob=0.01, pepper_prob=0.01):noisy_image = image.copy()total_pixels = image.sizenum_salt = int(total_pixels * salt_prob)salt_coords = [np.random.randint(0, i-1, num_salt) for i in image.shape]noisy_image[salt_coords[0], salt_coords[1]] = 255num_pepper = int(total_pixels * pepper_prob)pepper_coords = [np.random.randint(0, i-1, num_pepper) for i in image.shape]noisy_image[pepper_coords[0], pepper_coords[1]] = 0return noisy_image
- 直方图均衡化
def equalizeHist_image(image):image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)return cv2.equalizeHist(image)
- 自适应直方图均衡化
def clahe_image(image):b, g, r = cv2.split(image)clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(5, 5))clahe_b = clahe.apply(b)clahe_g = clahe.apply(g)clahe_r = clahe.apply(r)return cv2.merge((clahe_b, clahe_g, clahe_r))
- 油画与非真实感渲染
def detailEnhance_image(image):return cv2.detailEnhance(image, None, 20, 0.8)
- 局部区域亮度调整
def illumination_change(image):img_zero = np.zeros(image.shape, dtype=np.uint8)return cv2.illuminationChange(image, mask=img_zero, alpha=0.2, beta=0.4)
- 人脸中心点加强或者变暗
def enhance_reduce(image, strength=100):# strength > 0 enhance, strength < 0 reducex, y, _ = image.shaperadius = np.random.randint(10, int(min(x, y)), 1)pos_x = np.random.randint(0, (min(x, y)-radius), 1)pos_y = np.random.randint(0, (min(x, y)-radius), 1)pos_x = int(pos_x[0])pos_y = int(pos_y[0])radius = int(radius[0])for j in range(pos_y-radius, pos_y+radius):for i in range(pos_x-radius, pos_x+radius):distance = math.pow((pos_x-i), 2) + math.pow((pos_y-j), 2)distance = np.sqrt(distance)if distance < radius:result = 1 - distance/radiusresult = result*strengthif strength > 0:image[i, j, 0] = min((image[i, j, 0]+result), 255)image[i, j, 1] = min((image[i, j, 1]+result), 255)image[i, j, 2] = min((image[i, j, 2]+result), 255)else:image[i, j, 0] = max((image[i, j, 0]+result), 0)image[i, j, 1] = max((image[i, j, 1]+result), 0)image[i, j, 2] = max((image[i, j, 2]+result), 0)image = image.astype(np.uint8)return image
- 遮盖
def mask(image, low=10, high=50):x, y, _ = image.shapemask_size = np.random.randint(low, high, 1)pos_x = np.random.randint(low, (min(x, y)-high), 1)pos_y = np.random.randint(low, (min(x, y)-high), 1)pos_x = int(pos_x[0])pos_y = int(pos_y[0])mask_size = int(mask_size[0])image[pos_x:pos_x+mask_size, pos_y:pos_y+mask_size] = 0return image
将上述合并为一个类:
import os
import cv2
import sys
import json
import math
import random
import numpy as npclass ImageAugment:def rotate_image(self, image):rows, cols, _ = image.shapeangle = random.randint(-20, 20)M = cv2.getRotationMatrix2D((cols/2, rows/2), angle, 1)rotated_image = cv2.warpAffine(image, M, (cols, rows))return rotated_imagedef flip_image(self, image):return cv2.flip(image, 1)def scale_image(self, image, scale_factor):scale_factor = random.uniform(0.8, 1.2)rows, cols, _ = image.shapenew_size = (int(cols * scale_factor), int(rows * scale_factor))scaled_image = cv2.resize(image, new_size)scaled_image = cv2.resize(scaled_image, (112, 112))return scaled_imagedef adjust_brightness_contrast(self, image):alpha = random.uniform(0.5, 1.5)beta = random.randint(10, 50)return cv2.convertScaleAbs(image, alpha=alpha, beta=beta)def color_distortion(self, image, color_matrix):return cv2.transform(image, color_matrix)def salt_and_pepper_noise(self, image, salt_prob=0.01, pepper_prob=0.01):noisy_image = image.copy()total_pixels = image.sizenum_salt = int(total_pixels * salt_prob)salt_coords = [np.random.randint(0, i-1, num_salt) for i in image.shape]noisy_image[salt_coords[0], salt_coords[1]] = 255num_pepper = int(total_pixels * pepper_prob)pepper_coords = [np.random.randint(0, i-1, num_pepper) for i in image.shape]noisy_image[pepper_coords[0], pepper_coords[1]] = 0return noisy_imagedef equalizeHist_image(self, image):image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)return cv2.equalizeHist(image)def clahe_image(self, image):b, g, r = cv2.split(image)clahe = cv2.createCLAHE(clipLimit=2.0, tileGridSize=(5, 5))clahe_b = clahe.apply(b)clahe_g = clahe.apply(g)clahe_r = clahe.apply(r)return cv2.merge((clahe_b, clahe_g, clahe_r))def detailEnhance_image(self, image):return cv2.detailEnhance(image, None, 20, 0.8)def illumination_change(self, image):img_zero = np.zeros(image.shape, dtype=np.uint8)return cv2.illuminationChange(image, mask=img_zero, alpha=0.2, beta=0.4)def enhance_reduce(self, image, strength=100):# strength > 0 enhance, strength < 0 reducex, y, _ = image.shaperadius = np.random.randint(10, int(min(x, y)), 1)pos_x = np.random.randint(0, (min(x, y)-radius), 1)pos_y = np.random.randint(0, (min(x, y)-radius), 1)pos_x = int(pos_x[0])pos_y = int(pos_y[0])radius = int(radius[0])for j in range(pos_y-radius, pos_y+radius):for i in range(pos_x-radius, pos_x+radius):distance = math.pow((pos_x-i), 2) + math.pow((pos_y-j), 2)distance = np.sqrt(distance)if distance < radius:result = 1 - distance/radiusresult = result*strengthif strength > 0:image[i, j, 0] = min((image[i, j, 0]+result), 255)image[i, j, 1] = min((image[i, j, 1]+result), 255)image[i, j, 2] = min((image[i, j, 2]+result), 255)else:image[i, j, 0] = max((image[i, j, 0]+result), 0)image[i, j, 1] = max((image[i, j, 1]+result), 0)image[i, j, 2] = max((image[i, j, 2]+result), 0)image = image.astype(np.uint8)return imagedef mask(self, image, low=10, high=50):x, y, _ = image.shapemask_size = np.random.randint(low, high, 1)pos_x = np.random.randint(low, (min(x, y)-high), 1)pos_y = np.random.randint(low, (min(x, y)-high), 1)pos_x = int(pos_x[0])pos_y = int(pos_y[0])mask_size = int(mask_size[0])image[pos_x:pos_x+mask_size, pos_y:pos_y+mask_size] = 0return imageif __name__ == '__main__':ia = ImageAugment()image_path = sys.argv[1]image = cv2.imread(image_path)rotated_image = ia.rotate_image(image)flipped_image = ia.flip_image(image)scaled_image = ia.scale_image(image, scale_factor=1.2)adjusted_image = ia.adjust_brightness_contrast(image)color_matrix = np.array([[0.393, 0.769, 0.189], [0.349, 0.686, 0.168], [0.272, 0.534, 0.131]])color_distorted_image = ia.color_distortion(image, color_matrix)salt_image = ia.salt_and_pepper_noise(image)equalize_image = ia.equalizeHist_image(image)clahe_image = ia.clahe_image(image)detailenhance_image = ia.detailEnhance_image(image)illumination_image = ia.illumination_change(image)enhance_image = ia.enhance_reduce(image, 100)reduce_image = ia.enhance_reduce(image, -100)mask_image = ia.mask(image)# savecv2.imwrite('rotated.jpg', rotated_image)cv2.imwrite('flipped.jpg', flipped_image)cv2.imwrite('scaled.jpg', scaled_image)cv2.imwrite('adjusted.jpg', adjusted_image)cv2.imwrite('colorDistorted.jpg', color_distorted_image)cv2.imwrite('salt.jpg', salt_image)cv2.imwrite('equalize.jpg', equalize_image)cv2.imwrite('clahe.jpg', clahe_image)cv2.imwrite('detailenhance.jpg', detailenhance_image)cv2.imwrite('illumination.jpg', illumination_image)cv2.imwrite('enhance.jpg', enhance_image)cv2.imwrite('reduce.jpg', reduce_image)cv2.imwrite('mask.jpg', mask_image)
结果如下:
-
origin image:

-
rotate:

- flip:

- scale:

- adjust:

- colorDistorted:

- salt:

- equalize:

- clahe:

- detailenhance:

- illumination:

- enhance and reduce:


- mask:

参考
- https://blog.csdn.net/qq_39450134/article/details/121886296
- https://blog.csdn.net/u011808673/article/details/90752958
- https://www.youbiguo.com/py/273.html
相关文章:
人脸图像数据增强
为什么要做数据增强 在计算机视觉相关任务中,数据增强(Data Augmentation)是一种常用的技术,用于扩展训练数据集的多样性。它包括对原始图像进行一系列随机或有规律的变换,以生成新的训练样本。数据增强的主要目的是增…...
Android 查看按键信息的常用命令详解
Android 查看按键信息的常用命令详解 文章目录 Android 查看按键信息的常用命令详解一、主要命令:二、命令详解1、getevent2、getevent -l3、dumsys input4、cat XXX.kl4、cat /dev/input/eventX5、getevent 其他命令6、input keyevent XX 三、简单示例修改四、总结…...
【Java 基础篇】Properties 结合集合类的使用详解
Java 中的 Properties 类是一个常见的用于管理配置信息的工具,它可以被看作是一种键值对的集合。虽然 Properties 通常用于处理配置文件,但它实际上也可以作为通用的 Map 集合来使用。在本文中,我们将详细探讨如何使用 Properties 作为 Map 集…...
数字孪生体标准编程
数字孪生体标准 括ISO TC184/SC4正在制定数字孪生制造标准ISO 23247、ISO/IEC JTC1/AG11正在推动数字孪生体标准、IEEE P2806正在做有关“数字表达”的标准。赢家通吃的标准战 卡尔夏皮罗和哈尔范里安撰写了《信息规则:网络经济战略指南》(Information R…...
力扣 -- 394. 字符串解码
解题方法: 参考代码: class Solution{ public:string decodeString(string s){stack<string> sst;stack<int> dst;//防止字符串栈为空的时候再追加字符串到栈顶元素sst.push("");int n s.size();int i 0;while(i<n)//最好不…...
面试官:什么是虚拟DOM?如何实现一个虚拟DOM?说说你的思路
🎬 岸边的风:个人主页 🔥 个人专栏 :《 VUE 》 《 javaScript 》 ⛺️ 生活的理想,就是为了理想的生活 ! 目录 一、什么是虚拟DOM 二、为什么需要虚拟DOM 三、如何实现虚拟DOM 小结 一、什么是虚拟DOM 虚拟 DOM (…...
Ubuntu安装中文拼音输入法
ubuntu安装中文拼音输入法 ubuntu版本为23.04 1、安装中文语言包 首先安装中文输入法必须要让系统支持中文语言,可以在 Language Support 中安装中文语言包。 添加或删除语音选项,添加中文简体,然后会有Applying changes的对话框&#x…...
高端知识竞赛中用到的软件和硬件有哪些
现在单位搞知识竞赛,已不满足于用PPT放题,找几个简单的抢答器、计分牌弄一下了,而是对现场效果和科技感要求更高了。大屏要分主屏侧屏,显示内容要求丰富炫酷;选手和评委也要用到平板等设备;计分要大气些&am…...
Vue 3.3 发布
本文为翻译 原文地址:宣布推出 Vue 3.3 |The Vue Point (vuejs.org) 今天我们很高兴地宣布 Vue 3.3 “Rurouni Kenshin” 的发布! 此版本侧重于开发人员体验改进 - 特别是 TypeScript 的 SFC <script setup> 使用。结合 Vue Language Tools&…...
算法|图论 3
LeetCode 130- 被围绕的区域 题目链接:力扣(LeetCode)官网 - 全球极客挚爱的技术成长平台 题目描述:给你一个 m x n 的矩阵 board ,由若干字符 X 和 O ,找到所有被 X 围绕的区域,并将这些区域…...
【数据结构】二叉树的层序遍历(四)
目录 一,层序遍历概念 二,层序遍历的实现 1,层序遍历的实现思路 2,创建队列 Queue.h Queue.c 3,创建二叉树 BTree.h BTree.c 4,层序遍历的实现 一,层序遍历概念 层序遍历:除了先序…...
macOS文件差异比较最佳工具:Beyond Compare 4
Beyond Compare for mac是一款Scooter Software研发的文件同步对比工具。你可以选择针对多字节的文本、文件夹、源代码,甚至是支持比对adobe文件、pdf文件或是整个驱动器,检查其文件大小、名称、日期等信息。你也可以选择使用Beyond Compare合并两个不同…...
Windows+Pycharm 如何创建虚拟环境
当我们开发一个别人的项目的时候,因为项目里有很多特有的包,比如 Pyqt5.我们不想破坏电脑上原来的包版本,这个时候,新建一个虚拟环境,专门针对这个项目就很有必要了. 简略步骤: 1.新建虚拟环境 1.打开 pycharm 终端(Terminal)安装虚拟环境工具: pip install virtualenv2.创…...
vant 按需导入 vue2
vant 按需导入 vue2 1、通过npm安装 # Vue 3 项目,安装最新版 Vant: npm i vant -S# Vue 2 项目,安装 Vant 2: npm i vantlatest-v2 -S2、自动按需引入组件 babel-plugin-import 是一款 babel 插件,它会在编译过程中…...
Java手写分治算法和分治算法应用拓展案例
Java手写分治算法和分治算法应用拓展案例 1. 算法思维导图 以下是用Mermanid代码表示的分治算法的实现原理: #mermaid-svg-nvJwIm97kPHEXQOR {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-nvJwIm97kP…...
学习 CodeWhisperer 的一些总结
目前一些常见的的 AI 工具 GitHub Copilot:GitHub 与 OpenAI 合作开发的一个人工智能助手。 Codeium:是一个免费的人工智能驱动的代码生成工具 Tabnine:一个自动代码生成工具,免费版本非常有限,只提供简短的代码完成…...
JavaScript 中的 `this` 指向问题与其在加密中的应用
JS中的 this 关键字是一个非常重要的概念,它在不同情况下会指向不同的对象或值。在本文中,我们将深入探讨 JavaScript 中 this 的各种情况,并思考如何将其应用于 JS加密中的一些有趣用途。 1. 全局上下文中的 this 在全局上下文中ÿ…...
深入理解算法的时间复杂度
文章目录 时间复杂度的定义时间复杂度的分类时间复杂度分析常见数据结构和算法的时间复杂度常见数据结构常见算法 常见排序算法说明冒泡排序(Bubble Sort)快速排序(Quick Sort)归并排序(Merge Sort)堆排序(Heap Sort) 时间复杂度的定义 时间复杂度就是一种用来描述算法在输入规…...
2023年度教育部人文社会科学研究一般项目评审结果,已公布!
【SciencePub学术】 9月15日,教育部社科司公示了2023年度教育部人文社会科学研究一般项目评审结果,共3482项。 其中,规划基金、青年基金、自筹经费项目共3029项通过专家评审;西部和边疆地区项目200项,新疆项目20项&a…...
十一、MySql的事务(上)
文章目录 一、引入(一)CURD不加控制,会有什么问题?(二)CURD满足什么属性,能解决上述问题? 二、什么是事务?三、事务的特性(一)原子性:…...
【Oracle APEX开发小技巧12】
有如下需求: 有一个问题反馈页面,要实现在apex页面展示能直观看到反馈时间超过7天未处理的数据,方便管理员及时处理反馈。 我的方法:直接将逻辑写在SQL中,这样可以直接在页面展示 完整代码: SELECTSF.FE…...
Go 语言接口详解
Go 语言接口详解 核心概念 接口定义 在 Go 语言中,接口是一种抽象类型,它定义了一组方法的集合: // 定义接口 type Shape interface {Area() float64Perimeter() float64 } 接口实现 Go 接口的实现是隐式的: // 矩形结构体…...
三体问题详解
从物理学角度,三体问题之所以不稳定,是因为三个天体在万有引力作用下相互作用,形成一个非线性耦合系统。我们可以从牛顿经典力学出发,列出具体的运动方程,并说明为何这个系统本质上是混沌的,无法得到一般解…...
【论文阅读28】-CNN-BiLSTM-Attention-(2024)
本文把滑坡位移序列拆开、筛优质因子,再用 CNN-BiLSTM-Attention 来动态预测每个子序列,最后重构出总位移,预测效果超越传统模型。 文章目录 1 引言2 方法2.1 位移时间序列加性模型2.2 变分模态分解 (VMD) 具体步骤2.3.1 样本熵(S…...
Reasoning over Uncertain Text by Generative Large Language Models
https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829https://ojs.aaai.org/index.php/AAAI/article/view/34674/36829 1. 概述 文本中的不确定性在许多语境中传达,从日常对话到特定领域的文档(例如医学文档)(Heritage 2013;Landmark、Gulbrandsen 和 Svenevei…...
Python竞赛环境搭建全攻略
Python环境搭建竞赛技术文章大纲 竞赛背景与意义 竞赛的目的与价值Python在竞赛中的应用场景环境搭建对竞赛效率的影响 竞赛环境需求分析 常见竞赛类型(算法、数据分析、机器学习等)不同竞赛对Python版本及库的要求硬件与操作系统的兼容性问题 Pyth…...
Vue 3 + WebSocket 实战:公司通知实时推送功能详解
📢 Vue 3 WebSocket 实战:公司通知实时推送功能详解 📌 收藏 点赞 关注,项目中要用到推送功能时就不怕找不到了! 实时通知是企业系统中常见的功能,比如:管理员发布通知后,所有用户…...
【把数组变成一棵树】有序数组秒变平衡BST,原来可以这么优雅!
【把数组变成一棵树】有序数组秒变平衡BST,原来可以这么优雅! 🌱 前言:一棵树的浪漫,从数组开始说起 程序员的世界里,数组是最常见的基本结构之一,几乎每种语言、每种算法都少不了它。可你有没有想过,一组看似“线性排列”的有序数组,竟然可以**“长”成一棵平衡的二…...
Python的__call__ 方法
在 Python 中,__call__ 是一个特殊的魔术方法(magic method),它允许一个类的实例像函数一样被调用。当你在一个对象后面加上 () 并执行时(例如 obj()),Python 会自动调用该对象的 __call__ 方法…...
【Java】Ajax 技术详解
文章目录 1. Filter 过滤器1.1 Filter 概述1.2 Filter 快速入门开发步骤:1.3 Filter 执行流程1.4 Filter 拦截路径配置1.5 过滤器链2. Listener 监听器2.1 Listener 概述2.2 ServletContextListener3. Ajax 技术3.1 Ajax 概述3.2 Ajax 快速入门服务端实现:客户端实现:4. Axi…...
