当前位置：首页 > news >正文

label数据（或自定义数据集）转imagenet（用于mmclassification）

news 2026/2/10 11:41:11

理论上用于分类的图像一般都不需要用labelme来标注的，笔者是因为刚好手上有这么一组数据，所以就顺带处理了。labelme标注完的数据每张还包含了一个json文件，这个在分类任务中用不上。具体的mmclassification使用方法在我的另一篇文章里有，需要注意的是现在分类任务被集合在mmpretrain里了。用法也优点区别，不过也都是细微的修改，都还能用。
数据处理代码如下：

import os, random, shutil# 最开始train的文件夹路径
ori_path = r'F:\Data\doctor_research\Arthritis_mini'# label种类：
label_list = ['arthritis', 'normal']# 抽取比例  ******自己改*******
val_ratio, test_ratio = 0.1, 0.2  # 抽取比例  ******自己改*******# 处理好的数据集路径
result_path = os.path.join(ori_path, 'result')# 存放图片的文件地址
train_path = os.path.join(result_path, 'train')
test_path = os.path.join(result_path, 'test')
val_path = os.path.join(result_path, 'val')# meta文件夹地址
meta_path = os.path.join(result_path, 'meta')
# meta文件夹下的txt文件
train_txt = os.path.join(meta_path, 'train.txt')
test_txt = os.path.join(meta_path, 'test.txt')
val_txt = os.path.join(meta_path, 'val.txt')# 预留内容
traintxt = []
testtxt = []
valtxt = []# 如果没有就创建
if not os.path.exists(result_path):os.mkdir(result_path)if not os.path.exists(meta_path):os.makedirs(meta_path)if not os.path.exists(train_path):os.makedirs(train_path)if not os.path.exists(test_path):os.makedirs(test_path)if not os.path.exists(val_path):os.makedirs(val_path)# 在train  test  val 文件夹中创建对应的label文件夹：
for label in label_list:print(f'label:{label}')os.makedirs(os.path.join(train_path, label), exist_ok=True)# print(f'train_path:{train_path}')os.makedirs(os.path.join(test_path, label), exist_ok=True)# print(f'test_path:{test_path}')os.makedirs(os.path.join(val_path, label), exist_ok=True)# print(f'val_path:{val_path}')ori_pic_path = os.path.join(ori_path, label)print(f'ori_pic_path is : {ori_pic_path}')# 将该label下所有的图像文件名暂存在一个list里面：temp_path = []for pic in os.listdir(ori_pic_path):# 判断是否为图片if pic.endswith('.jpg') or pic.endswith('.jpeg') or pic.endswith('.png'):# 先全部计入到一个临时list里：print(f'pic is {pic}')temp_path.append(pic)# print(f'temp_path is {temp_path}')# 计算该类别下的所有图片数量以及对应的验证集、测试集图片数量print(f'{label} num is {len(temp_path)}')# 验证集数量val_number = int(len(temp_path) * val_ratio)# 测试集数量test_number = int(len(temp_path) * test_ratio)# 抽取val数据集val_sample = random.sample(temp_path, val_number)print(f'val_number is:{val_number}')print(f'val_sample is:{val_sample}')# 把抽取的val数据剔除# temp_path.remove(val_sample)temp_path = [item for item in temp_path if item not in val_sample]# 对应的val文件夹：goal_val_path = os.path.join(result_path, 'val', label)# 将文件移动到val文件夹for name1 in val_sample:goal_name1_path = os.path.join(goal_val_path, name1)shutil.copy(os.path.join(ori_pic_path, name1), goal_name1_path)# 同时将该文件地址记录到val.txt中val_content = goal_name1_path + " " + str(label_list.index(label))valtxt.append(val_content)# with open(val_txt, 'w') as f:#     f.write(goal_name1_path + " " + str(label_list.index(label)) + "\n")# 抽取test数据集test_sample = random.sample(temp_path, test_number)print(f'test_number is:{test_number}')# 把抽取的test数据剔除temp_path = [item for item in temp_path if item not in test_sample]# 对应的test文件夹goal_test_path = os.path.join(result_path, 'test', label)# 将文件移动到test文件夹for name2 in test_sample:goal_name2_path = os.path.join(goal_test_path, name2)shutil.copy(os.path.join(ori_pic_path, name2), goal_name2_path)# 同时将该文件地址记录到test.txt中# 同时将该文件地址记录到test.txt中test_content = goal_name2_path + " " + str(label_list.index(label))testtxt.append(test_content)# with open(test_txt, 'w') as f:#     f.write(goal_name2_path + " " + str(label_list.index(label)) + "\n")# 把剩下的数据移入train数据集goal_train_path = os.path.join(result_path, 'train', label)print(f'goal_train_path is : {goal_train_path}')for name3 in temp_path:goal_name3_path = os.path.join(goal_train_path, name3)shutil.copy(os.path.join(ori_pic_path, name3), goal_name3_path)# 同时将该文件地址记录到test.txt中train_content = goal_name3_path + " " + str(label_list.index(label))traintxt.append(train_content)with open(train_txt, 'w') as f:for item in traintxt:f.write(item + '\n')with open(test_txt, 'w') as f:for item in testtxt:f.write(item + '\n')with open(val_txt, 'w') as f:for item in valtxt:f.write(item + '\n')

label数据（或自定义数据集）转imagenet（用于mmclassification）

理论上用于分类的图像一般都不需要用labelme来标注的，笔者是因为刚好手上有这么一组数据，所以就顺带处理了。labelme标注完的数据每张还包含了一个json文件，这个在分类任务中用不上。具体的mmclassification使用方法在我的另一篇文章里有&…...

编程日记 2024/11/1 23:20:09

WebMvcConfigurer

WebMvcConfigurer是Spring MVC框架中的一个核心接口，它允许开发者自定义Spring MVC的配置，以满足应用程序的特定需求。通过实现这个接口，开发者可以注册拦截器、添加视图控制器、配置视图解析器等，而无需使用XML配置。以下是对Web…...

编程日记 2024/11/1 23:19:08

Sigrity Power SI VR noise Metrics check模式如何进行电源噪声耦合分析操作指导

SSigrity Power SI VR noise Metrics check模式如何进行电源噪声耦合分析操作指导 Sigrity Power SI的VR noise Metrics check模式本质上是用来评估和观测器件的电源网络的耦合对于信号的影响，输出S参数以及列出具体的贡献值。以下图为例...

编程日记 2024/11/1 23:16:05

Python+Appium+Pytest+Allure自动化测试框架-安装篇

文章目录安装安装ADT安装NodeJs安装python安装appium安装Appium Server（可选）安装Appium-Inspector（可选）安装allure安装pytest PythonAppiumPytestAllure框架的安装 Appium是一个开源工具，是跨平台的，用于…...

编程日记 2024/11/1 23:13:02

Python的socket使用

在 Python 中，可以使用 socket 模块编写一个支持多个客户端连接的服务端。常见的实现方式包括使用多线程、多进程或异步 I/O。下面以多线程为例展示如何编写一个服务端，来同时接收和处理多个客户端的连接。多线程服务端代码示例这个示例服务端代码中…...

编程日记 2024/11/1 23:09:59

如何快速搭建一个3D虚拟展厅？

随着元宇宙概念的兴起，一个全新的虚拟、立体数字空间正逐步成为我们生活的一部分。在这个空间里，用户可以沉浸其中，进行丰富的交互操作，体验前所未有的无限可能。而如何快速搭建一个属于自己的元宇宙3D虚拟展厅，正成为…...

编程日记 2024/11/1 23:05:55

Android webview 打开本地H5项目(Cocos游戏以及Unity游戏)

webview打开本地Html文件 1.在路径前面加上file:// String filePath"file://"path;webView.loadUrl( filePath);2.打开权限 <uses-permission android:name"android.permission.READ_EXTERNAL_STORAGE" />3.启用JavaScript 设置本地访问权限 webVi…...

编程日记 2024/11/1 23:03:53

解决项目中图片出不来的bug

在页面端图片呈现割裂状： 查看代码： 将代码改成： 即可正常显示图片。...

编程日记 2024/11/1 23:02:52

手机实时提取SIM卡打电话的信令声音-新的篇章(三、Android虚拟声卡探索)

手机实时提取SIM卡打电话的信令声音-新的篇章(三、Android虚拟声卡探索) 前言前面的篇章中，我们从理论方向和实际市面上出现的音频线传输声音的方式，讨论绕开手机对SIM卡电话通话声音的封锁场景的可行性，并实际选购几款数字和模拟的USB转接…...

编程日记 2024/11/1 23:01:51

REST APIs与微服务：关键差异

在构建基于微服务的应用程序时RESYful API和微服务这两个术语经常相伴出现。然而，它们指的是截然不同的东西。了解 RESTful API 和微服务之间差异的最简单方式是这样： 微服务：它们是构成更大规模基于微服务的应用程序的单个服务和功能&…...

编程日记 2024/11/1 23:00:50

【网安案例学习】反向蛮力攻击Reverse Brute Force Attack

【故事一】在一个温暖的秋日下午，Jack坐在旧金山一家宁静的咖啡馆里，准备开始他的最新写作项目：追溯反向蛮力攻击的起源和发展。这是一个他一直想深入挖掘的主题，因为它揭示了网络安全世界中一个鲜为人知却极具影响力的故事。 …...

编程日记 2024/11/1 22:59:48

TCP/IP网络编程：理解网络编程和套接字

TCP/IP网络编程：理解网络编程和套接字网络编程又叫做套接字编程，是因为在网络编程中依赖使用套接字(socket),网络编程一般是C/S架构，即客户端/服务器模式，在服务器端依赖套接字绑定自身接口，并开启监听客户端连接&am…...

编程日记 2024/11/1 22:58:46

CSS实现回到顶部且平滑过渡

背景最近同学在项目开发的时候问了我一个问题：小白，回到顶部该怎么做呀？我当时就愣住了，心想这不是很基础的一个功能吗，然后想到该同学没有系统学过网页三剑客，我就给他讲了该怎么实现这个虽然基础但在很多…...

编程日记 2024/11/1 22:55:40

10 go语言（golang） - 数据类型：哈希表（map）及原理(二)

扩容在 Go 语言中，当 map 的元素数量达到一定阈值时，会触发扩容操作以保持性能。这个过程称为 rehashing，即重新散列所有的键值对到一个更大的哈希表中。扩容的条件源码： func mapassign(t *maptype, h *hmap, key unsafe.…...

编程日记 2024/11/1 22:54:37

【论文解读】Med-BERT: 用于疾病预测的大规模结构化电子健康记录的预训练情境化嵌入

【论文解读】Med-BERT: 用于疾病预测的大规模结构化电子健康记录的预训练情境化嵌入 Med-BERT：pretrained contextualized embeddings on large-scale structured electronic health records for disease prediction 摘要：基于电子健康记录（EHR）的深度学习（DL）预…...

编程日记 2024/11/1 22:53:34

[POI2014] PTA-Little Bird（单调队列优化 DP）

luogu 传送门https://www.luogu.com.cn/problem/P3572 解题思路先设表示到的最小劳累值。很容易得出转移： 其中由和的大小关系决定，并且。很显然，直接暴力是的，会超时。于是，考虑优化。我们发现…...

编程日记 2024/11/1 22:52:33

【含开题报告+文档+PPT+源码】基于SpringBoot的体育馆管理系统的设计与实现

开题报告近年来，随着人们生活水平的提高和健康意识的增强，体育馆作为提供体育锻和休闲娱乐的重要场所，其使用频率和管理难度也在不断增加。传统的体育馆管理模式通常依赖于人工记录和手动操作，不仅效率低下，而且容易…...

编程日记 2024/11/1 22:51:32

Vue3学习：vue组件中的图片路径问题

今天在做一个案例的时候，图片放在assets/images文件夹下，如下路径，其中的图片不能正常显示。 list: [{ id: 1, name: 欧拉公式啤酒杯, price: 30.00, src: ./assets/images/Euler.png},{ id: 2, name: 高斯分布马克杯, price: 40.00, src: ./…...

编程日记 2024/11/1 22:50:31

openCV基础-图像预处理Day26

图像预处理在计算机视觉和图像处理领域，图像预处理是一个重要的步骤，它能够提高后续处理（如特征提取、目标检测等）的准确性和效率。OpenCV 提供了许多图像预处理的函数和方法，以下是一些常见的图像预处理操作&…...

编程日记 2024/11/1 22:47:28

给文件添加可读可写可执行权限

在Unix、Linux或类Unix操作系统中，你可以使用chmod命令来给文件添加可读、可写和可执行权限。权限通常分为三组：文件所有者（owner）、文件所属组（group）和其他用户（others）。每组都可…...

编程日记 2024/11/1 22:46:27

第19节 Node.js Express 框架

Express 是一个为Node.js设计的web开发框架，它基于nodejs平台。 Express 简介 Express是一个简洁而灵活的node.js Web应用框架, 提供了一系列强大特性帮助你创建各种Web应用，和丰富的HTTP工具。使用Express可以快速地搭建一个完整功能的网站。 Expre…...

编程新知 2026/2/8 6:37:43

C++初阶-list的底层

目录 1.std::list实现的所有代码 2.list的简单介绍 2.1实现list的类 2.2_list_iterator的实现 2.2.1_list_iterator实现的原因和好处 2.2.2_list_iterator实现 2.3_list_node的实现 2.3.1. 避免递归的模板依赖 2.3.2. 内存布局一致性 2.3.3. 类型安全的替代方案 2.3.…...

编程新知 2026/2/8 20:42:41

label-studio的使用教程(导入本地路径)

文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...

编程新知 2026/2/7 20:40:53

反向工程与模型迁移：打造未来商品详情API的可持续创新体系

在电商行业蓬勃发展的当下，商品详情API作为连接电商平台与开发者、商家及用户的关键纽带，其重要性日益凸显。传统商品详情API主要聚焦于商品基本信息（如名称、价格、库存等）的获取与展示，已难以满足市场对个性化、智能…...

编程新知 2025/9/15 5:56:53

渲染学进阶内容——模型

最近在写模组的时候发现渲染器里面离不开模型的定义，在渲染的第二篇文章中简单的讲解了一下关于模型部分的内容，其实不管是方块还是方块实体，都离不开模型的内容 🧱 一、CubeListBuilder 功能解析 CubeListBuilder 是 Minecraft Java 版模型系统的核心构建器，用于动态创…...

编程新知 2025/11/25 22:59:17

Linux云原生安全：零信任架构与机密计算

Linux云原生安全：零信任架构与机密计算构建坚不可摧的云原生防御体系引言：云原生安全的范式革命随着云原生技术的普及，安全边界正在从传统的网络边界向工作负载内部转移。Gartner预测，到2025年，零信任架构将成为超…...

编程新知 2025/8/17 17:11:47

相机Camera日志分析之三十一：高通Camx HAL十种流程基础分析关键字汇总（后续持续更新中）

【关注我，后续持续新增专题博文，谢谢！！！】上一篇我们讲了：有对最普通的场景进行各个日志注释讲解，但相机场景太多，日志差异也巨大。后面将展示各种场景下的日志。通过notepad++打开场景下的日志，通过下列分类关键字搜索，即可清晰的分析不同场景的相机运行流程差异…...

编程新知 2025/11/20 7:13:43

深入解析C++中的extern关键字：跨文件共享变量与函数的终极指南

🚀 C extern 关键字深度解析：跨文件编程的终极指南 📅 更新时间：2025年6月5日 🏷️ 标签：C | extern关键字 | 多文件编程 | 链接与声明 | 现代C 文章目录前言🔥一、extern 是什么？&…...

编程新知 2026/2/1 6:50:07

算法岗面试经验分享-大模型篇

文章目录 A 基础语言模型A.1 TransformerA.2 Bert B 大语言模型结构B.1 GPTB.2 LLamaB.3 ChatGLMB.4 Qwen C 大语言模型微调C.1 Fine-tuningC.2 Adapter-tuningC.3 Prefix-tuningC.4 P-tuningC.5 LoRA A 基础语言模型 A.1 Transformer （1）资源论文&a…...

编程新知 2026/1/23 11:58:06

手机平板能效生态设计指令EU 2023/1670标准解读

手机平板能效生态设计指令EU 2023/1670标准解读以下是针对欧盟《手机和平板电脑生态设计法规》(EU) 2023/1670 的核心解读，综合法规核心要求、最新修正及企业合规要点： 一、法规背景与目标生效与强制时间发布于2023年8月31日（OJ公报&…...

编程新知 2026/2/2 11:58:16

相关文章：