当前位置：首页 > news >正文

深度学习——划分自定义数据集

news 2025/7/7 20:35:01

深度学习——划分自定义数据集

以人脸表情数据集raf_db为例，初始目录如下：
在这里插入图片描述
需要经过处理后返回

train_images, train_label, val_images, val_label

定义 read_split_data(root: str, val_rate: float = 0.2) 方法来解决，代码如下：

# root：数据集所在路径
# val_rate：划分测试集的比例def read_split_data(root: str, val_rate: float = 0.2):random.seed(0)  # 保证随机结果可复现assert os.path.exists(root), "dataset root: {} does not exist.".format(root)# 遍历文件夹，一个文件夹对应一个类别file_class = [cla for cla in os.listdir(root) if os.path.isdir(os.path.join(root, cla))]# 排序，保证各平台顺序一致file_class.sort()# 生成类别名称以及对应的数字索引class_indices = dict((k, v) for v, k in enumerate(file_class))json_str = json.dumps(dict((val, key) for key, val in class_indices.items()), indent=4)with open('class_indices.json', 'w') as json_file:json_file.write(json_str)train_images = []  # 存储训练集的所有图片路径train_label = []  # 存储训练集图片对应索引信息val_images = []  # 存储验证集的所有图片路径val_label = []  # 存储验证集图片对应索引信息every_class_num = []  # 存储每个类别的样本总数supported = [".jpg", ".JPG", ".png", ".PNG"]  # 支持的文件后缀类型# 遍历每个文件夹下的文件for cla in file_class:cla_path = os.path.join(root, cla)# 遍历获取supported支持的所有文件路径images = [os.path.join(root, cla, i) for i in os.listdir(cla_path)if os.path.splitext(i)[-1] in supported]# 排序，保证各平台顺序一致images.sort()# 获取该类别对应的索引image_class = class_indices[cla]# 记录该类别的样本数量every_class_num.append(len(images))# 按比例随机采样验证样本val_path = random.sample(images, k=int(len(images) * val_rate))for img_path in images:if img_path in val_path:  # 如果该路径在采样的验证集样本中则存入验证集val_images.append(img_path)val_label.append(image_class)else:  # 否则存入训练集train_images.append(img_path)train_label.append(image_class)print("{} images were found in the dataset.".format(sum(every_class_num)))print("{} images for training.".format(len(train_images)))print("{} images for validation.".format(len(val_images)))assert len(train_images) > 0, "number of training images must greater than 0."assert len(val_images) > 0, "number of validation images must greater than 0."return train_images, train_label, val_images, val_label

此时可通过以下代码获得训练集和测试集数据：

train_images, train_label, val_images, val_label = read_split_data(data_path)

完结撒花。

深度学习——划分自定义数据集

深度学习——划分自定义数据集以人脸表情数据集raf_db为例，初始目录如下： 需要经过处理后返回 train_images, train_label, val_images, val_label 定义 read_split_data(root: str, val_rate: float 0.2) 方法来解决，代码如下&#xff1a…...

编程日记 2023/8/3 4:03:09

Jmeter性能测试之正则表达式提取器

目录前言 1. Jmeter正则表达式提取器 2. 入门实例 3. 进阶实例前言 Jmeter正则表达式提取器属于Jmeter后置处理器（post processors）的一种，用于将取样器请求到的结果以正则表达式的方式读取出来。 1. Jmeter正则表达式提取器 1. 作用…...

编程日记 2023/8/3 4:02:08

浅谈Kubernetes中Service网络实现（服务发现）

目录 CoreDNS（Kube-DNS） Kube-proxy kube-proxy的三种实现模式 iptables模式 IPVS模式之前的文章介绍了Kubernetes中基于service实现了集群内部的网络通信，这篇文章详细聊一下Kubernetes中的Service网络本身又是如何实现的。...

编程日记 2023/8/3 4:01:07

【重造轮子】golang实现可重入锁

造个可重入锁的轮子介绍目标正文sync.Mutexsync.Mutex介绍多协程计数器demo多协程计数器加锁源码剖析Mutex数据结构Lock()加锁核心逻辑 UnLock() 重入锁与可重入锁魔改 sync.Mutex 参考文档介绍开新坑啦！！ 从这篇文章开始，尝试造轮子&a…...

编程日记 2023/8/3 4:00:05

torch显存分析——对生成模型清除显存

torch显存分析——对生成模型清除显存 1. 问题介绍2. 应对方法 1. 问题介绍本文主要针对生成场景下，如何方便快捷地清除当前进程占用的显存。文章的重点不止是对显存的管理，还包括怎样灵活的使用自定义组件来控制生成过程。在之前的文章torch显存分析…...

编程日记 2023/8/3 3:59:04

electron+vue+ts窗口间通信

文章目录一. 目的二.逻辑分析三. 代码示例 "types/node": "^20.3.1","vitejs/plugin-vue": "^4.1.0","vueuse/electron": "^10.2.1","electron": "^25.2.0","electron-packager":…...

编程日记 2023/8/3 3:58:03

基于Fringe-Projection环形投影技术的人脸三维形状提取算法matlab仿真

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览 2.算法运行软件版本 matlab2022a 3.部分核心程序 .................................................................... figure; imshow(Im…...

编程日记 2023/8/3 3:57:02

如何使用Webman框架实现多语言支持和国际化功能？

如何使用Webman框架实现多语言支持和国际化功能？ Webman是一款轻量级的PHP框架，提供了丰富的功能和扩展性，使得开发人员能够更加高效地开发Web应用程序。其中，多语言支持和国际化功能是Web应用程序中非常重要的一项功能&#xff…...

编程日记 2023/8/3 3:56:01

接受平庸，特别是程序员

目录方向一：简述自己的感受方向二：聊聊你想怎么做方向三：如何调整自己的心态虽然清楚知识需要靠时间沉淀，但在看到自己做不出来的题别人会做，自己写不出的代码别人会写时还是会感到焦虑怎么办？ 你是…...

编程日记 2023/8/3 3:55:00

HTML兼容性

文章目录一、兼容性二、兼容问题1. 在IE6下，子级的宽度会撑开父级设置好的宽度2. IE6中，元素浮动，如果宽度需要内容撑开，需要给里面的块元素都添加浮动才可以3. 在IE6、7下，元素要通过浮动排在同一排，就需…...

编程日记 2023/8/3 3:52:56

Java日期和时间处理入门指南

文章目录 1. 日期操作 - java.util.Date1.1 构造方法1.2 常用方法 2. 日期格式化 - java.text.SimpleDateFormat2.1 获取对象2.2 方法 3. 获取时间分量 - java.util.Calendar3.1 时间分量3.2 创建对象3.3 常用的时间分量3.4 获取时间分量3.5 设置时间分量结语引言&#xff1a…...

编程日记 2023/8/3 3:51:53

如何将anndata拆分为k份 import scanpy as sc import anndata as adclass KSplitAnndata:staticmethoddef _base_split(data: object, k: int) -> list:adata data.copy()num adata.n_obs // kadata_list []for i in range(k):if num < adata.n_obs:adata_list.appen…...

编程日记 2023/8/3 3:50:52

深入解析项目管理中的用户流程图

介绍用户流程图用户流程图的定义用户流程图(User Flow Diagram)是一种可视化工具，它描绘了用户在应用或网站上完成任务的过程。这些任务可以是购物、注册账户、查找信息等，任何需要用户交互的动作都可以在用户流程图中找到。用户流程图的重要性用…...

编程日记 2023/8/3 3:49:49

Vue使用QrcodeVue生成二维码并下载

生成二维码 1、安装qrcode.vue组件 npm install --save qrcode.vue<template><div id"app"><qrcode-vue :valuevalue :sizesize></qrcode-vue><br /></div> </template><script> //导入组件 import QrcodeVue fro…...

编程日记 2023/8/3 3:48:45

“用户登录”测试用例总结

前言：作为测试工程师，你的目标是要保证系统在各种应用场景下的功能是符合设计要求的，所以你需要考虑的测试用例就需要更多、更全面。鉴于面试中经常会问“”如何测试用户登录“”，我们利用等价类划分、边界值分析等设计一些测试用…...

编程日记 2023/8/3 3:47:43

适应于Linux系统的三种安装包格式 .tar.gz、.deb、rpm

deb、rpm、tar.gz三种Linux软件包的区别 rpm包-在红帽LINUX、SUSE、Fedora可以直接进行安装，但在Ubuntu中却无法识别； deb包-是Ubuntu的专利，在Ubuntu中双击deb包就可以进入自动安装进程； tar.gz包-在所有的Linux版本中都能使用…...

编程日记 2023/8/3 3:46:42

Linux lvs负载均衡

LVS 介绍： Linux Virtual Server（LVS）是一个基于Linux内核的开源软件项目，用于构建高性能、高可用性的服务器群集。LVS通过将客户端请求分发到一组后端服务器上的不同节点来实现负载均衡，从而提高系统的可扩展性和可…...

编程日记 2023/8/3 3:45:40

Tomcat 创建https

打开CMD,按下列输入 keytool -genkeypair -alias www.bo.org -keyalg RSA -keystore d:\ambition.keystore -storetype pkcs12 输入密钥库口令:123456 再次输入新口令:123456 您的名字与姓氏是什么? [Unknown]: www.ambition.com 您的组织单位名称是什么? [Unknown…...

编程日记 2023/8/3 3:44:39

超导电性的基本现象和相关理论

超导体 Hg 超导电性的基本现象和相关理论超导体的基本特性低温零电阻突变（< 10^{-23 \Omega/m}） 良导体在 10^{-10} \Omega/m临界温度迈斯纳效应完全排磁通效应（完全抗磁性） 超导体物体内部不存在电场第一类超导体与第二类…...

编程日记 2023/8/3 3:43:37

在 PHP 中单引号（‘ ‘）和双引号（“ “）用法的区别

在 PHP 中，使用单引号（ ）和双引号（" "）可以创建字符串。这两种引号的用法有一些区别。单引号： 单引号用于创建简单的字符串，其中的变量和转义字符将不会被解析。单引号中的任何内容…...

编程日记 2023/8/3 3:42:37

【OSG学习笔记】Day 18: 碰撞检测与物理交互

物理引擎（Physics Engine） 物理引擎是一种通过计算机模拟物理规律（如力学、碰撞、重力、流体动力学等）的软件工具或库。它的核心目标是在虚拟环境中逼真地模拟物体的运动和交互，广泛应用于游戏开发、动画制作、虚…...

编程新知 2025/7/7 3:36:15

使用分级同态加密防御梯度泄漏

抽象联邦学习 （FL） 支持跨分布式客户端进行协作模型训练，而无需共享原始数据，这使其成为在互联和自动驾驶汽车 （CAV） 等领域保护隐私的机器学习的一种很有前途的方法。然而，最近的研究表明&…...

编程新知 2025/7/2 12:22:47

Ascend NPU上适配Step-Audio模型

1 概述 1.1 简述 Step-Audio 是业界首个集语音理解与生成控制一体化的产品级开源实时语音对话系统，支持多语言对话（如中文，英文，日语），语音情感（如开心，悲伤）&#x…...

编程新知 2025/7/6 22:37:23

Python如何给视频添加音频和字幕

在Python中，给视频添加音频和字幕可以使用电影文件处理库MoviePy和字幕处理库Subtitles。下面将详细介绍如何使用这些库来实现视频的音频和字幕添加，包括必要的代码示例和详细解释。环境准备在开始之前，需要安装以下Python库：…...

编程新知 2025/6/20 22:43:59

MySQL中【正则表达式】用法

MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现（两者等价），用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例： 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

编程新知 2025/7/5 20:12:33

ArcGIS Pro制作水平横向图例+多级标注

今天介绍下载ArcGIS Pro中如何设置水平横向图例。之前我们介绍了ArcGIS的横向图例制作：ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等（ArcGIS出图图例8大技巧），那这次我们看看ArcGIS Pro如何更加快捷的操作。…...

编程新知 2025/7/5 18:11:47

Java 二维码

Java 二维码 **技术：**谷歌 ZXing 实现首先添加依赖 <dependency><groupId>com.google.zxing</groupId><artifactId>core</artifactId><version>3.5.1</version></dependency><de…...

编程新知 2025/6/21 12:56:10

以光量子为例，详解量子获取方式

光量子技术获取量子比特可在室温下进行。该方式有望通过与名为硅光子学（silicon photonics）的光波导（optical waveguide）芯片制造技术和光纤等光通信技术相结合来实现量子计算机。量子力学中，光既是波又是粒子。光子本…...

编程新知 2025/7/5 12:24:36

Linux离线（zip方式）安装docker

目录基础信息操作系统信息docker信息安装实例安装步骤示例遇到的问题问题1：修改默认工作路径启动失败问题2 找不到对应组基础信息操作系统信息 OS版本：CentOS 7 64位内核版本：3.10.0 相关命令： uname -rcat /etc/os-rele…...

编程新知 2025/6/16 16:58:04

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join 1、依赖1.1、依赖版本1.2、pom.xml 2、代码2.1、SqlSession 构造器2.2、MybatisPlus代码生成器2.3、获取 config.yml 配置2.3.1、config.yml2.3.2、项目配置类 2.4、ftl 模板2.4.1、…...

编程新知 2025/6/19 0:27:55

深度学习——划分自定义数据集

深度学习——划分自定义数据集

相关文章：

深度学习——划分自定义数据集

Jmeter性能测试之正则表达式提取器

浅谈Kubernetes中Service网络实现（服务发现）

【重造轮子】golang实现可重入锁

torch显存分析——对生成模型清除显存

electron+vue+ts窗口间通信

基于Fringe-Projection环形投影技术的人脸三维形状提取算法matlab仿真

如何使用Webman框架实现多语言支持和国际化功能？

接受平庸，特别是程序员

HTML兼容性

Java日期和时间处理入门指南

anndata k折交叉

深入解析项目管理中的用户流程图

Vue使用QrcodeVue生成二维码并下载

“用户登录”测试用例总结

适应于Linux系统的三种安装包格式 .tar.gz、.deb、rpm

Linux lvs负载均衡

Tomcat 创建https

超导电性的基本现象和相关理论

在 PHP 中单引号（‘ ‘）和双引号（“ “）用法的区别

【OSG学习笔记】Day 18: 碰撞检测与物理交互

使用分级同态加密防御梯度泄漏

Ascend NPU上适配Step-Audio模型

Python如何给视频添加音频和字幕

MySQL中【正则表达式】用法

ArcGIS Pro制作水平横向图例+多级标注

Java 二维码

以光量子为例，详解量子获取方式

Linux离线（zip方式）安装docker

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join