当前位置：首页 > news >正文

深度学习02-数据集格式转换

news 2026/2/9 3:33:42

背景：

通常搜集完数据图片后，我们会用labelimg进行图片标注，比较高版本的labelimg支持的标注格式有三种，PascalVOC、YOLO、CreateML，标注的时候可以根据自己的算法模型数据集需求选择相应的格式，当然，也可以三种方式同时标注，不过会耗时间一些。有时候我们仅仅标注了一种格式转，而实际算法建模的时候可能需要对相应的格式进行转换。

xml转json:

默认选用PascalVOC方式的话，标注的数据集格式为XML，实例如下(2.xml)：

<annotation><folder>Desktop</folder><filename>ng2.png</filename><path>C:\Users\Xiao\Desktop\ng2.png</path><source><database>Unknown</database></source><size><width>1892</width><height>851</height><depth>3</depth></size><segmented>0</segmented><object><name>1</name><pose>Unspecified</pose><truncated>0</truncated><difficult>0</difficult><bndbox><xmin>60</xmin><ymin>381</ymin><xmax>354</xmax><ymax>583</ymax></bndbox></object>
</annotation>

将该文档转换为json格式并保存的代码如下：

import xml.etree.ElementTree as ET
import jsondef xml_to_json(xml_file, json_file):tree = ET.parse(xml_file)root = tree.getroot()data = []for obj in root.findall('object'):obj_data = {}obj_data['name'] = obj.find('name').textobj_data['bbox'] = {'xmin': int(obj.find('bndbox/xmin').text),'ymin': int(obj.find('bndbox/ymin').text),'xmax': int(obj.find('bndbox/xmax').text),'ymax': int(obj.find('bndbox/ymax').text)}data.append(obj_data)json_data = {'filename': root.find('filename').text,'size': {'width': int(root.find('size/width').text),'height': int(root.find('size/height').text),'depth': int(root.find('size/depth').text)},'objects': data}with open(json_file, 'w') as f:json.dump(json_data, f, indent=4)# Example usage
xml_file = r'C:\Users\Xiao\Desktop\tools\2.xml'
json_file = r'C:\Users\Xiao\Desktop\tools\2.json'
xml_to_json(xml_file, json_file)
print('数据转换完成！')

实际使用的时候需要适当修改一下文档路径才可以。

转换完之后的json内容如下(2.json)：

{"filename": "ng2.png","size": {"width": 1892,"height": 851,"depth": 3},"objects": [{"name": "1","bbox": {"xmin": 60,"ymin": 381,"xmax": 354,"ymax": 583}}]
}

深度学习02-数据集格式转换

背景： 通常搜集完数据图片后，我们会用labelimg进行图片标注，比较高版本的labelimg支持的标注格式有三种，PascalVOC、YOLO、CreateML，标注的时候可以根据自己的算法模型数据集需求选择相应的格式，当然&…...

编程日记 2023/10/31 6:02:11

every blog every motto: You can do more than you think. https://blog.csdn.net/weixin_39190382?typeblog 0. 前言有关c操作opencv记录 1. 正文 1.1 图像读取、显示、保存 // 读取、显示、保存图像#include <opencv2/opencv.hpp> #include <iostream>us…...

编程日记 2023/10/31 6:01:10

【2023.10.30练习】C语言-循环右移字符

计算机能力挑战初赛2020.19题题目描述： 现要对一个由字符a-z和A-Z组成的字符串进行解密，已知加密规则是： 字符串中所有字符分别在大写或小写的字母表中被循环左移5位(fGh-->aBc)， 输入：一个加密过的字符串&#…...

编程日记 2023/10/31 6:00:09

C++ 自引用指针this（整理）

使用例子： #include <iostream> #include <Windows.h> using namespace std; class A { public:A(int x1){x x1;}void disp(){cout<<"this"<<this<<" when x"<<this->x<<endl;} private:int x;…...

编程日记 2023/10/31 5:59:09

pyzed.sl 突然 ImportError: DLL load failed while importing sl: 找不到指定的程序。的解决

问题描述 >>> import pyzed.sl Traceback (most recent call last):File "<stdin>", line 1, in <module> ImportError: DLL load failed while importing sl: 找不到指定的程序。解决 1 按网上说的，将bin文件夹下所有dll复制到py…...

编程日记 2023/10/31 5:58:08

STM32 Cube配置RS485 Modbus

STM32CUBUMX配置RS485 modbus STM32（从机）亲测可用 STM32开发（六）STM32F103 通信 —— RS485 Modbus通信编程详解...

编程日记 2023/10/31 5:57:07

global，nonlocal

1.global 在局部，引入全局变量，使得局部变量可以修改全局变量 a 10 # a为全局变量def func():global a #把外面的全局变量引入到局部a 20 #创建局部变量，修改全局变量func() print(a) #20 2.nonlocal 在局部，引入外层的…...

编程日记 2023/10/31 5:56:06

HTML5教程

HTML5读书笔记 jack 2023.10.24 来源：HTML5 Canvas | 菜鸟教程常识： HTML5 是下一代 HTML 标准。 HTML , HTML 4.01的上一个版本诞生于 1999 年 <!DOCTYPE html>用于声明下面代码是H5; 浏览器支持你可以让一些较早的浏览器（不支…...

编程日记 2023/10/31 5:54:03

vulnhub momentum 靶机复盘

环境配置到学校了原来的桥接配置要改这里记录几个点备忘 1.virtualbox 桥接未指定重新安装驱动VBoxNetLwf.inf 2.配置完靶机启动失败手动安装VBoxNetLwf.inf 不要用virtualbox自带的netlwfinstall 3.配置完nmap扫不到 rw init/bin/bash 进去看看网卡配置信息收集…...

编程日记 2023/10/31 5:53:01

c++和java实现策略模式的差异

一、C和java的差异实例化方式 c的对象有两种实例化方式，一种是局部变量中直接实例化。一种是new出来的。 MyClass myclass; //第一种方式 MyClass* myclassPtrnew MyClass(); //第二种方式java的对象构建，没有第一种方式，java的对象都…...

编程日记 2023/10/31 5:52:00

vim

简介 vim是一款多模式的文本编辑器，vim里面还有很多子命令，来进行代码的编写操作常用模式图命令模式光标移动 shif $ 光标定义到当前行的最右侧结尾 shift ^ 光标定义到当前行的最左侧开头 shift g 光标定位到文本最末尾…...

编程日记 2023/10/31 5:50:59

AcWing93. 递归实现组合型枚举：输出从1~n中随机选出的m个整数

题目从 1∼ n n n 这 n n n 个整数中随机选出 m m m 个，输出所有可能的选择方案。输入格式两个整数 n , m , n,m, n,m, 在同一行用空格隔开。输出格式按照从小到大的顺序输出所有方案，每行 1 个。首先，同一行内的数升序排列&a…...

编程日记 2023/10/31 5:49:58

Java修仙传之Flink篇

大道三千:最近我修Flink 目前个人理解： 处理有界，无界流的工具 FLINK： FLINK定义： Flink特点 Flink分层API 流的定义有界数据流（批处理）： 有界流：数据结束了，程序也…...

编程日记 2023/10/31 5:48:57

网络新闻发稿为何经久不衰？

有的老板可能看不到新闻营销的直接回报，一直不乐意在此方面投入，但是却看到竞争对手一直在搞新闻营销，也就安排个PR做做新闻公关。小马识途营销顾问观察，自互联网诞生以来，新闻营销一直是网络营销工作中的一个重点。如…...

编程日记 2023/10/31 5:47:55

Java SimpleDateFormat 中英文时间格式化转换

SimpleDateFormat是一个以与语言环境有关的方式来格式化和解析日期的具体类。它允许进行格式化（日期 -> 文本）、解析（文本 -> 日期）和规范化。 SimpleDateFormat使得可以选择任何用户定义的日期-时间格式的模式。但是&…...

编程日记 2023/10/31 5:46:54

机器学习-基本知识

 任务类型 ◼ 有监督学习(Supervised Learning) 每个训练样本x有人为标注的目标t，学习的目标是发现x到t的映射，如分类、回归。 ◼ 无监督学习(Unsupervised Learning) 学习样本没有人为标注，学习的目的是发现数据x本身的分布规律&#xf…...

编程日记 2023/10/31 5:44:52

Xilinx 7 系列 1.8V LVDS 和 2.5V LVDS 信号之间的 LVDS 兼容性

如果通过LVDS进行接口，可以按照以程图中的步骤操作，以确保满足正确使用LVDS的所有要求。 40191 - 7 系列 - 1.8V LVDS 和 2.5V LVDS 信号之间的 LVDS 兼容性与LVDS兼容驱动器和接收器连接时，7系列LVDS和LVDS_25输入和输出应该不存在兼容性问…...

编程日记 2023/10/31 5:43:51

R语言在生态环境领域中的实践技术应用

R语言作为新兴的统计软件，以开源、自由、免费等特点风靡全球。生态环境领域研究内容广泛，数据常多样而复杂。利用R语言进行多元统计分析，从复杂的现象中发现规律、探索机制正是R的优势。为此，以鱼类、昆虫、水文、地形等多样化的生…...

编程日记 2023/10/31 5:42:50

ChineseChess.2023.10.31.01

中国象棋残局模拟器：黑双卒压禁区中国象棋残局模拟器ChineseChess.2023.10.31.01...

编程日记 2023/10/31 5:41:48

数据库扩展语句和约束方式以及用户管理

数据库扩展语句和约束方式以及用户管理 create TABLE if not exists ky32 ( id int(4) zerofill primary key auto_increment, name varchar(10) not null, cradid int(18) not null unique key, hobby varchar (50) ); auto_increment：表示该字段可以自增长&…...

编程日记 2023/10/31 5:40:46

华为云AI开发平台ModelArts

华为云ModelArts：重塑AI开发流程的“智能引擎”与“创新加速器”！ 在人工智能浪潮席卷全球的2025年，企业拥抱AI的意愿空前高涨，但技术门槛高、流程复杂、资源投入巨大的现实，却让许多创新构想止步于实验室。数据科学家…...

编程新知 2026/2/8 4:37:19

日语AI面试高效通关秘籍：专业解读与青柚面试智能助攻

在如今就业市场竞争日益激烈的背景下，越来越多的求职者将目光投向了日本及中日双语岗位。但是，一场日语面试往往让许多人感到步履维艰。你是否也曾因为面试官抛出的“刁钻问题”而心生畏惧？面对生疏的日语交流环境，即便提前恶补了…...

编程新知 2026/2/8 4:37:01

云原生核心技术 (7/12): K8s 核心概念白话解读(上)：Pod 和 Deployment 究竟是什么？

大家好，欢迎来到《云原生核心技术》系列的第七篇！ 在上一篇，我们成功地使用 Minikube 或 kind 在自己的电脑上搭建起了一个迷你但功能完备的 Kubernetes 集群。现在，我们就像一个拥有了一块崭新数字土地的农场主，是时…...

编程新知 2025/12/14 22:32:59

shell脚本--常见案例

1、自动备份文件或目录 2、批量重命名文件 3、查找并删除指定名称的文件： 4、批量删除文件 5、查找并替换文件内容 6、批量创建文件 7、创建文件夹并移动文件 8、在文件夹中查找文件...

编程新知 2026/2/7 19:53:11

边缘计算医疗风险自查APP开发方案

核心目标：在便携设备（智能手表/家用检测仪）部署轻量化疾病预测模型，实现低延迟、隐私安全的实时健康风险评估。一、技术架构设计 #mermaid-svg-iuNaeeLK2YoFKfao {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg…...

编程新知 2026/1/28 10:02:54

云启出海，智联未来｜阿里云网络「企业出海」系列客户沙龙上海站圆满落地

借阿里云中企出海大会的东风，以**「云启出海，智联未来｜打造安全可靠的出海云网络引擎」为主题的阿里云企业出海客户沙龙云网络&安全专场于5.28日下午在上海顺利举办，现场吸引了来自携程、小红书、米哈游、哔哩哔哩、波克城市、…...

编程新知 2026/1/30 0:00:28

【解密LSTM、GRU如何解决传统RNN梯度消失问题】

解密LSTM与GRU：如何让RNN变得更聪明？ 在深度学习的世界里，循环神经网络（RNN）以其卓越的序列数据处理能力广泛应用于自然语言处理、时间序列预测等领域。然而，传统RNN存在的一个严重问题——梯度消失&#…...

编程新知 2025/12/24 1:45:14

【算法训练营Day07】字符串part1

文章目录反转字符串反转字符串II替换数字反转字符串题目链接：344. 反转字符串双指针法，两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...

编程新知 2025/8/27 14:38:58

c#开发AI模型对话

AI模型前面已经介绍了一般AI模型本地部署，直接调用现成的模型数据。这里主要讲述讲接口集成到我们自己的程序中使用方式。微软提供了ML.NET来开发和使用AI模型，但是目前国内可能使用不多，至少实践例子很少看见。开发训练模型就不介绍了&am…...

编程新知 2026/2/1 8:59:45

比较数据迁移后MySQL数据库和OceanBase数据仓库中的表

设计一个MySQL数据库和OceanBase数据仓库的表数据比较的详细程序流程，两张表是相同的结构，都有整型主键id字段，需要每次从数据库分批取得2000条数据，用于比较，比较操作的同时可以再取2000条数据，等上一次比较完成之后，开始比较，直到比较完所有的数据。比较操作需要比较…...

编程新知 2025/9/14 5:35:46

深度学习02-数据集格式转换

相关文章：

深度学习02-数据集格式转换

【c++|opencv】一、基础操作---1.图像读取

【2023.10.30练习】C语言-循环右移字符

C++ 自引用指针this（整理）

pyzed.sl 突然 ImportError: DLL load failed while importing sl: 找不到指定的程序。的解决

STM32 Cube配置RS485 Modbus

global，nonlocal

HTML5教程

vulnhub momentum 靶机复盘

c++和java实现策略模式的差异

vim

AcWing93. 递归实现组合型枚举：输出从1~n中随机选出的m个整数

Java修仙传之Flink篇

网络新闻发稿为何经久不衰？

Java SimpleDateFormat 中英文时间格式化转换

机器学习-基本知识

Xilinx 7 系列 1.8V LVDS 和 2.5V LVDS 信号之间的 LVDS 兼容性

R语言在生态环境领域中的实践技术应用

ChineseChess.2023.10.31.01

数据库扩展语句和约束方式以及用户管理

华为云AI开发平台ModelArts

日语AI面试高效通关秘籍：专业解读与青柚面试智能助攻

云原生核心技术 (7/12): K8s 核心概念白话解读(上)：Pod 和 Deployment 究竟是什么？

shell脚本--常见案例

边缘计算医疗风险自查APP开发方案

云启出海，智联未来｜阿里云网络「企业出海」系列客户沙龙上海站圆满落地

【解密LSTM、GRU如何解决传统RNN梯度消失问题】

【算法训练营Day07】字符串part1

c#开发AI模型对话

比较数据迁移后MySQL数据库和OceanBase数据仓库中的表