当前位置：首页 > news >正文

Python移动未标注的图片数据集

news 2026/2/11 4:20:40

Python移动未标注的图片数据集

前言
前提条件
相关介绍
实验环境
Python移动未标注的图片数据集
- 情况一：有图，无标注文件
- - 代码实现
  - 输出结果
- 情况二：有图，有标注文件，但标注信息为空
- - 代码实现
  - 输出结果
- 情况一与情况二同时都考虑
- - 代码实现
  - 输出结果
- 拓展：移动有标注文件却无对应图片的标注文件
- - 代码实现
  - 输出结果

在这里插入图片描述

前言

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
YOLOv8 Ultralytics：使用Ultralytics框架训练RT-DETR实时目标检测模型
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

前提条件

熟悉Python

实验环境

Python 3.x （面向对象的高级语言）

Python移动未标注的图片数据集

情况一：有图，无标注文件

在这里插入图片描述

代码实现

import os
import cv2
import json
import copy
import shutildef is_null_info_in_json(in_json_path):'''判断json文件的标注信息是否为空'''with open(in_json_path,'r') as f:json_data = json.load(f)# print(json_data)# 以查询label信息为例,比如输出'label' == "49"的标注信息json_data_shape =  copy.deepcopy(json_data['shapes'])if json_data_shape == []:return Truereturn Falsedef move_img_no_json(in_img_path,output_dir):'''情况一：有图，无标注文件,只移动图'''shutil.move(in_img_path,output_dir)def move_img_and_json(in_img_path,in_json_path,output_dir):'''情况二：有图，有标注文件，但标注信息为空，既移动图，也移动json文件'''shutil.move(in_img_path,output_dir)shutil.move(in_json_path,output_dir)if __name__=="__main__":in_img_dir = 'images/'in_json_dir = 'jsons/'output_dir = 'output/'if not os.path.exists(output_dir):os.mkdir(output_dir) img_name_list = [i for i in os.listdir(in_img_dir) if i.endswith('.png')]# print(img_name_list)json_name_list = [i for i in os.listdir(in_json_dir) if i.endswith('.json')]# print(json_name_list)for img_name in img_name_list:in_img_path = in_img_dir + img_namein_json_path = in_json_dir + img_name[:-4]+'.json'# 情况一：有图，无标注文件if not os.path.exists(in_json_path):move_img_no_json(in_img_path,output_dir)

输出结果

在这里插入图片描述

情况二：有图，有标注文件，但标注信息为空

在这里插入图片描述

{"version": "5.2.0.post4","flags": {},"shapes": [],"imagePath": "flower.png","imageData": null,"imageHeight": 394,"imageWidth": 850
}

代码实现

import os
import cv2
import json
import copy
import shutildef is_null_info_in_json(in_json_path):'''判断json文件的标注信息是否为空'''with open(in_json_path,'r') as f:json_data = json.load(f)# print(json_data)# 以查询label信息为例,比如输出'label' == "49"的标注信息json_data_shape =  copy.deepcopy(json_data['shapes'])if json_data_shape == []:return Truereturn Falsedef move_img_no_json(in_img_path,output_dir):'''情况一：有图，无标注文件,只移动图'''shutil.move(in_img_path,output_dir)def move_img_and_json(in_img_path,in_json_path,output_dir):'''情况二：有图，有标注文件，但标注信息为空，既移动图，也移动json文件'''shutil.move(in_img_path,output_dir)shutil.move(in_json_path,output_dir)if __name__=="__main__":in_img_dir = 'images/'in_json_dir = 'jsons/'output_dir = 'output/'if not os.path.exists(output_dir):os.mkdir(output_dir) img_name_list = [i for i in os.listdir(in_img_dir) if i.endswith('.png')]# print(img_name_list)json_name_list = [i for i in os.listdir(in_json_dir) if i.endswith('.json')]# print(json_name_list)for img_name in img_name_list:in_img_path = in_img_dir + img_namein_json_path = in_json_dir + img_name[:-4]+'.json'if not os.path.exists(in_json_path):passelse:# 情况二：有图，有标注文件，但标注信息为空if is_null_info_in_json(in_json_path):move_img_and_json(in_img_path,in_json_path,output_dir)

输出结果

在这里插入图片描述

情况一与情况二同时都考虑

在这里插入图片描述

代码实现

import os
import cv2
import json
import copy
import shutildef is_null_info_in_json(in_json_path):'''判断json文件的标注信息是否为空'''with open(in_json_path,'r') as f:json_data = json.load(f)# print(json_data)# 以查询label信息为例,比如输出'label' == "49"的标注信息json_data_shape =  copy.deepcopy(json_data['shapes'])if json_data_shape == []:return Truereturn Falsedef move_img_no_json(in_img_path,output_dir):'''情况一：有图，无标注文件,只移动图'''shutil.move(in_img_path,output_dir)def move_img_and_json(in_img_path,in_json_path,output_dir):'''情况二：有图，有标注文件，但标注信息为空，既移动图，也移动json文件'''shutil.move(in_img_path,output_dir)shutil.move(in_json_path,output_dir)if __name__=="__main__":in_img_dir = 'images/'in_json_dir = 'jsons/'output_dir = 'output/'if not os.path.exists(output_dir):os.mkdir(output_dir) img_name_list = [i for i in os.listdir(in_img_dir) if i.endswith('.png')]# print(img_name_list)json_name_list = [i for i in os.listdir(in_json_dir) if i.endswith('.json')]# print(json_name_list)for img_name in img_name_list:in_img_path = in_img_dir + img_namein_json_path = in_json_dir + img_name[:-4]+'.json'# 情况一：有图，无标注文件if not os.path.exists(in_json_path):move_img_no_json(in_img_path,output_dir)else:# 情况二：有图，有标注文件，但标注信息为空if is_null_info_in_json(in_json_path):move_img_and_json(in_img_path,in_json_path,output_dir)

输出结果

在这里插入图片描述

拓展：移动有标注文件却无对应图片的标注文件

在这里插入图片描述

代码实现

import os
import cv2
import json
import copy
import shutildef is_null_info_in_json(in_json_path):'''判断json文件的标注信息是否为空'''with open(in_json_path,'r') as f:json_data = json.load(f)# print(json_data)# 以查询label信息为例,比如输出'label' == "49"的标注信息json_data_shape =  copy.deepcopy(json_data['shapes'])if json_data_shape == []:return Truereturn Falsedef move_img_no_json(in_img_path,output_dir):'''情况一：有图，无标注文件,只移动图'''shutil.move(in_img_path,output_dir)def move_img_and_json(in_img_path,in_json_path,output_dir):'''情况二：有图，有标注文件，但标注信息为空，既移动图，也移动json文件'''shutil.move(in_img_path,output_dir)shutil.move(in_json_path,output_dir)def move_json_no_img(in_json_path,output_dir):'''移动有标注文件却无对应图片的标注文件'''shutil.move(in_json_path,output_dir)if __name__=="__main__":in_img_dir = 'images/'in_json_dir = 'jsons/'output_dir = 'output/'if not os.path.exists(output_dir):os.mkdir(output_dir) img_name_list = [i for i in os.listdir(in_img_dir) if i.endswith('.png')]# print(img_name_list)json_name_list = [i for i in os.listdir(in_json_dir) if i.endswith('.json')]# print(json_name_list)for json_name in json_name_list:in_img_path = in_img_dir + json_name[:-5] + '.png'in_json_path = in_json_dir + json_name# 移动有标注文件却无对应图片的标注文件if not os.path.exists(in_img_path):move_json_no_img(in_json_path,output_dir)

输出结果

在这里插入图片描述

由于本人水平有限，难免出现错漏，敬请批评改正。
更多精彩内容，可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
YOLOv8 Ultralytics：使用Ultralytics框架训练RT-DETR实时目标检测模型
基于DETR的人脸伪装检测
YOLOv7训练自己的数据集（口罩检测）
YOLOv8训练自己的数据集（足球检测）
YOLOv5：TensorRT加速YOLOv5模型推理
YOLOv5：IoU、GIoU、DIoU、CIoU、EIoU
玩转Jetson Nano（五）：TensorRT加速YOLOv5目标检测
YOLOv5：添加SE、CBAM、CoordAtt、ECA注意力机制
YOLOv5：yolov5s.yaml配置文件解读、增加小目标检测层
Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
YOLOv5：使用7.0版本训练自己的实例分割模型（车辆、行人、路标、车道线等实例分割）
使用Kaggle GPU资源免费体验Stable Diffusion开源项目

Python移动未标注的图片数据集

Python移动未标注的图片数据集前言前提条件相关介绍实验环境Python移动未标注的图片数据集情况一：有图，无标注文件代码实现输出结果情况二：有图，有标注文件，但标注信息为空代码实现输出结果情况一与情况二同时都考虑…...

编程日记 2023/12/16 0:34:04

判断css文字发生了截断，增加悬浮提示

示例： 固定显示宽度，溢出显示...，利用了css的属性，想要实现成下面这样： 针对溢出的文字，hover显示全部。提示很好加，使用tooltip组件就行了，难点是如何判断是否发生了文字溢出。…...

编程日记 2023/12/16 0:33:03

day33-37-SpringBootV12(整合Spring,SpringMVC,Mybatis,日志,api测试等框架)

ssm spring --> applicationContext.xml配置文件 springmvc --> springmvc.xml配置文件 mybatis —> mybatis-config.xml配置文件 —> springboot优化了之前的框架配置,思想是约定大于配置一、引言 1.1 初始化配置为了使用SSM框架去开发，准备SSM…...

编程日记 2023/12/16 0:32:02

如何处理好面试中的“压力测试”？

作为一名求职者，在面试时有时遇到的是压力测试，有时则遇到的是一些无良企业单位，究竟如何把握忍耐的限度，才合格当一个能经受压力的员工，才能避免对无良单位的一味隐忍! 压力面试是指有意制造紧张，以了解求…...

编程日记 2023/12/16 0:28:58

大数据----31.hbase安装启动

二.Hbase安装先前安装： Zookeeper 正常部署首先保证 Zookeeper 集群的正常部署，并启动之。三台机器都执行：zkServer.sh startHadoop 正常部署 Hadoop 集群的正常部署并启动。主节点上进行 ：start-all.sh 1.HBase 的获取一定…...

编程日记 2023/12/16 0:27:57

ChatGPT Plus重新开启订阅

12月14日凌晨，OpenAI首席执行官Sam Altman在社交平台宣布，终于找到了更多的GPU算力，重新开启订阅ChatGPT Plus。上个月15日，OpenAI就因为算力不足，以及用户激增等原因暂停了ChatGPT Plus订阅。 Sam表示，在…...

编程日记 2023/12/16 0:26:57

C#科学绘图之scottPlot绘制多个图像

文章目录示例移除图像图例信号图 scott系列：绘图初步示例从名字就能看出，ScottPlot的绘图函数AddScatter的作用是为图窗添加数据点，换言之，每调用一次AddScatter，就可以在图窗中添加一组图像。下面添加两个按钮&a…...

编程日记 2023/12/16 0:25:56

二百一十五、Flume——Flume拓扑结构之复制和多路复用的开发案例（亲测，附截图）

一、目的对于Flume的复制和多路复用拓扑结构，进行一个小的开发测试二、复制和多路复用拓扑结构 （一）结构含义 Flume 支持将事件流向一个或者多个目的地。 （二）结构特征这种模式可以将相同数据复制到多个channe…...

编程日记 2023/12/16 0:21:52

Leetcode—2962.统计最大元素出现至少 K 次的子数组【中等】

2023每日刷题（五十六） Leetcode—2962.统计最大元素出现至少 K 次的子数组滑动窗口算法思想参考的灵神思路实现代码 class Solution { public:long long countSubarrays(vector<int>& nums, int k) {int n nums.size();long long ans…...

编程日记 2023/12/16 0:16:48

MapReduce模拟统计每日车流量-解决方案

MapReduce模拟统计每日车流量-解决方案 1.Map阶段：将原始数据分割成若干个小块，每个小块由一个Map任务处理。Map任务将小块中的每个数据项映射成为一个键值对，其中键为时间戳，值为车流量。2.Shuffle阶段：将Map任务输出…...

编程日记 2023/12/16 0:12:44

【深度学习】强化学习（二）马尔可夫决策过程

文章目录一、强化学习问题1、交互的对象2、强化学习的基本要素3、策略（Policy）4、马尔可夫决策过程1. 基本元素2. 交互过程的表示3. 马尔可夫过程（Markov Process）4. 马尔可夫决策过程（MDP）5. 轨迹的概率计…...

编程日记 2023/12/16 0:11:44

Vue.js 使用基础知识

Vue.js 是一款用于构建用户界面的渐进式框架，它专注于视图层。Vue.js 不同于传统的 JavaScript 框架，它采用了组件化的开发方式，使得开发者可以更加高效和灵活地构建交互式的 Web 应用程序。目录什么是 Vue.js安装 Vue.jsVue 实例模板语法插…...

编程日记 2023/12/16 0:05:38

Linux---计划任务

本章主要介绍如何创建计划任务使用 at 创建计划任务使用 crontab 创建计划任务有时需要在某个指定的时间执行一个操作，此时就要使用计划任务了。计划任务有两种： 一个是at计划任务，另一个是 crontab计划任务。下面我们分别来看这两种计划…...

编程日记 2023/12/16 0:03:36

.NET微信网页开发之通过UnionID机制解决多应用用户帐号统一问题

背景随着公司微信相关业务场景的不断拓展，从最初的一个微信移动应用、然后发展成微信公众号应用、然后又有了微信小程序应用。但是随着应用的拓展，如何保证相同用户的微信用户在不同应用中登录的同一个账号呢？今天的主题就来了.NET微信网页…...

编程日记 2023/12/16 0:02:36

【docker】docker入门与安装

Docker 一、入门 Docker的主要目标是：Build, Ship and Run Any App, Anywhere，也就是通过对应用组件的封装、分发、部署、运行等生命周期的管理，使用户的APP及其运行环境能做到一次镜像,处处运行。 Docker运行速度快的原因 Docker有比虚拟…...

编程日记 2023/12/15 23:59:33

视觉学习笔记12——百度飞浆框架的PaddleOCR 安装、标注、训练以及测试

系列文章目录虚拟环境部署参考博客1 参考博客2 参考博客3 参考博客4 文章目录系列文章目录一、简单介绍1.OCR介绍2.PaddleOCR介绍二、安装1.anaconda基础环境1）anaconda的基本操作2）搭建飞浆的基础环境 2.安装paddlepaddle-gpu版本1）安装…...

编程日记 2023/12/15 23:56:31

深入分析ClassLocader工作机制

文章目录一、ClassLoader简介1. 概念2. ClassLoader类结构分析二、ClassLoader的双亲委派机制三、Class文件的加载流程1. 简介2. 加载字节码到内存3. 验证与解析4. 初始化Class对象四、常见加载类错误分析1. ClassNotFoundException2. NoClassDefFoundError3. UnsatisfiledL…...

编程日记 2023/12/15 23:52:27

算法通关村第十二关—字符串转换(青铜)

一、转换成小写字母 LeetCode709.给你一个字符串s，将该字符串中的大写字母转换成相同的小写字母，返回新的字符串。示例1： 输入：s"Hello" 输出："hello" 示例2： 输入：s&qu…...

编程日记 2023/12/15 23:49:25

C#基础与进阶扩展合集-基础篇（持续更新）

目录本文分两篇，进阶篇点击：C#基础与进阶扩展合集-进阶篇一、基础入门 Ⅰ 关键字 Ⅱ 特性 Ⅲ 常见异常 Ⅳ 基础扩展 1、哈希表 2、扩展方法 3、自定义集合与索引器 4、迭代器与分部类 5、yield return 6、注册表 7、不安全代码 8、方法…...

编程日记 2023/12/15 23:47:23

ReactJs笔记摘录

文章目录前言目录结构组件动态组件高阶组件 Hook函数useStateuseEffectuseContextuseReduceruseCallbackuseMemo JSX语法根元素与斜杠使用变量推荐使用className替代class属性写法三元表达式 vs &&antd和tailwindcss 组件通信父传子：props和自定义函数事件…...

编程日记 2023/12/15 23:44:19

Zustand 状态管理库：极简而强大的解决方案

Zustand 是一个轻量级、快速和可扩展的状态管理库，特别适合 React 应用。它以简洁的 API 和高效的性能解决了 Redux 等状态管理方案中的繁琐问题。核心优势对比基本使用指南 1. 创建 Store // store.js import create from zustandconst useStore create((set)…...

编程新知 2026/2/8 10:56:57

java 实现excel文件转pdf | 无水印 | 无限制

文章目录目录文章目录前言 1.项目远程仓库配置 2.pom文件引入相关依赖 3.代码破解二、Excel转PDF 1.代码实现 2.Aspose.License.xml 授权文件总结前言 java处理excel转pdf一直没找到什么好用的免费jar包工具，自己手写的难度，恐怕高级程序员花费一年的事件，也…...

编程新知 2025/11/5 4:10:42

Linux相关概念和易错知识点（42）（TCP的连接管理、可靠性、面临复杂网络的处理）

目录 1.TCP的连接管理机制（1）三次握手①握手过程②对握手过程的理解 （2）四次挥手（3）握手和挥手的触发（4）状态切换①挥手过程中状态的切换②握手过程中状态的切换 2.TCP的可靠性&…...

编程新知 2026/1/30 0:09:51

聊聊 Pulsar：Producer 源码解析

一、前言 Apache Pulsar 是一个企业级的开源分布式消息传递平台，以其高性能、可扩展性和存储计算分离架构在消息队列和流处理领域独树一帜。在 Pulsar 的核心架构中，Producer（生产者） 是连接客户端应用与消息队列的第一步。生产者…...

编程新知 2026/2/5 21:34:41

QT： `long long` 类型转换为 `QString` 2025.6.5

在 Qt 中，将 long long 类型转换为 QString 可以通过以下两种常用方法实现： 方法 1：使用 QString::number() 直接调用 QString 的静态方法 number()，将数值转换为字符串： long long value 1234567890123456789LL; …...

编程新知 2026/2/1 6:30:04

Spring是如何解决Bean的循环依赖：三级缓存机制

1、什么是 Bean 的循环依赖在 Spring框架中，Bean 的循环依赖是指多个 Bean 之间‌互相持有对方引用‌，形成闭环依赖关系的现象。多个 Bean 的依赖关系构成环形链路，例如：双向依赖：Bean A 依赖 Bean B，同时 Bean B 也依赖 Bean A（A↔B）。链条循环： Bean A → Bean…...

编程新知 2025/7/25 1:21:53

RabbitMQ入门4.1.0版本（基于java、SpringBoot操作）

RabbitMQ 一、RabbitMQ概述 RabbitMQ RabbitMQ最初由LShift和CohesiveFT于2007年开发，后来由Pivotal Software Inc.（现为VMware子公司）接管。RabbitMQ 是一个开源的消息代理和队列服务器，用 Erlang 语言编写。广泛应用于各种分布…...

编程新知 2026/1/31 3:52:49

MySQL：分区的基本使用

目录一、什么是分区二、有什么作用三、分类四、创建分区五、删除分区一、什么是分区 MySQL 分区（Partitioning）是一种将单张表的数据逻辑上拆分成多个物理部分的技术。这些物理部分（分区）可以独立存储、管理和优化，…...

编程新知 2026/2/2 18:52:32

华为OD机试-最短木板长度-二分法(A卷,100分)

此题是一个最大化最小值的典型例题， 因为搜索范围是有界的，上界最大木板长度补充的全部木料长度，下界最小木板长度； 即left0,right10^6; 我们可以设置一个候选值x(mid)，将木板的长度全部都补充到x，如果成功…...

编程新知 2026/2/4 17:42:50

Linux入门(十五)安装java安装tomcat安装dotnet安装mysql

安装java yum install java-17-openjdk-devel查找安装地址 update-alternatives --config java设置环境变量 vi /etc/profile #在文档后面追加 JAVA_HOME"通过查找安装地址命令显示的路径" #注意一定要加$PATH不然路径就只剩下新加的路径了，系统很多命…...

编程新知 2026/2/4 17:41:43

Python移动未标注的图片数据集

前言

前提条件

相关介绍

实验环境

Python移动未标注的图片数据集

情况一：有图，无标注文件

代码实现

输出结果

情况二：有图，有标注文件，但标注信息为空

代码实现

输出结果

情况一与情况二同时都考虑

代码实现

输出结果

拓展：移动有标注文件却无对应图片的标注文件

代码实现

输出结果

相关文章：