当前位置：首页 > article >正文

split_conversion将json转成yolo训练用的txt,在直接按照8：1：1的比例分成训练集，测试集，验证集

article 2026/2/8 13:17:55

第一章使用说明

类别自己在代码中改，其他四个参数

--json-folder:json文件夹路径

--txt-folder：转换成功后txt的存放路径

--images-dir：图片文件夹路径

--save-dir：转换完成分割后所有文件的路径

终端命令行：python split_conversion.py --json-folder "" --txt-folder "" --images-dir "" --save-dir ""

""处是四个路径

第二章导包

import json
import os
from tqdm import tqdm
import shutil
import random
import argparse

第三章转换格式函数

def labelme_json_to_yolo(txt_save_path, json_path, class_map):"""将LabelMe格式JSON转换为YOLO TXT标注文件:param txt_save_path: TXT保存路径:param json_path: LabelMe JSON文件路径:param class_map: 类别名映射字典（如{"person": 0}）"""with open(json_path, 'r', encoding='utf-8') as f:data = json.load(f)img_height = data["imageHeight"]img_width = data["imageWidth"]img_name = os.path.basename(data["imagePath"])  # 提取图片文件名txt_name = os.path.splitext(img_name)[0] + ".txt"txt_path = os.path.join(txt_save_path, txt_name)lines = []for shape in data["shapes"]:label = shape["label"]if label not in class_map:continue  # 跳过未定义类别cls_id = class_map[label]# 解析多边形/矩形标注为边界框（xmin, ymin, xmax, ymax）points = shape["points"]x_coords = [p[0] for p in points]y_coords = [p[1] for p in points]xmin = min(x_coords)ymin = min(y_coords)xmax = max(x_coords)ymax = max(y_coords)# 计算YOLO格式坐标（归一化中心坐标+宽高）x_center = (xmin + xmax) / (2 * img_width)y_center = (ymin + ymax) / (2 * img_height)w = (xmax - xmin) / img_widthh = (ymax - ymin) / img_height# 过滤无效坐标（避免越界）if 0 <= x_center <= 1 and 0 <= y_center <= 1 and w > 0 and h > 0:lines.append(f"{cls_id} {x_center:.6f} {y_center:.6f} {w:.6f} {h:.6f}")# 保存TXT文件with open(txt_path, 'w') as f:f.write('\n'.join(lines))

第四章划分函数

def batch_convert_labelme_to_yolo(json_folder, txt_folder, class_map):"""批量转换LabelMe格式JSON文件夹到YOLO TXT:param json_folder: JSON文件夹路径:param txt_folder: TXT保存路径:param class_map: 类别名映射字典（如{"person": 0}）"""os.makedirs(txt_folder, exist_ok=True)json_files = [f for f in os.listdir(json_folder) if f.lower().endswith('.json')]for json_file in tqdm(json_files, desc="转换中"):json_path = os.path.join(json_folder, json_file)labelme_json_to_yolo(txt_folder, json_path, class_map)print(f"批量转换完成！共处理{len(json_files)}个JSON文件，保存到：{txt_folder}")

第五章确认文件夹是否存在

def mkdir(path):if not os.path.exists(path):os.makedirs(path)

第六章主函数

def main(image_dir, txt_dir, save_dir):# 创建文件夹mkdir(save_dir)images_dir = os.path.join(save_dir, 'images')labels_dir = os.path.join(save_dir, 'labels')img_train_path = os.path.join(images_dir, 'train')img_test_path = os.path.join(images_dir, 'test')img_val_path = os.path.join(images_dir, 'val')label_train_path = os.path.join(labels_dir, 'train')label_test_path = os.path.join(labels_dir, 'test')label_val_path = os.path.join(labels_dir, 'val')mkdir(images_dir)mkdir(labels_dir)mkdir(img_train_path)mkdir(img_test_path)mkdir(img_val_path)mkdir(label_train_path)mkdir(label_test_path)mkdir(label_val_path)# 数据集划分比例，训练集80%，验证集10%，测试集10%，按需修改train_percent = 0.8val_percent = 0.1test_percent = 0.1total_txt = os.listdir(txt_dir)num_txt = len(total_txt)list_all_txt = range(num_txt)  # 范围 range(0, num)num_train = int(num_txt * train_percent)num_val = int(num_txt * val_percent)num_test = num_txt - num_train - num_valtrain = random.sample(list_all_txt, num_train)# 在全部数据集中取出trainval_test = [i for i in list_all_txt if not i in train]# 再从val_test取出num_val个元素，val_test剩下的元素就是testval = random.sample(val_test, num_val)print("训练集数目：{}, 验证集数目：{}, 测试集数目：{}".format(len(train), len(val), len(val_test) - len(val)))for i in list_all_txt:name = total_txt[i][:-4]srcImage = os.path.join(image_dir, name + '.jpg')srcLabel = os.path.join(txt_dir, name + '.txt')if i in train:dst_train_Image = os.path.join(img_train_path, name + '.jpg')dst_train_Label = os.path.join(label_train_path, name + '.txt')shutil.copyfile(srcImage, dst_train_Image)shutil.copyfile(srcLabel, dst_train_Label)elif i in val:dst_val_Image = os.path.join(img_val_path, name + '.jpg')dst_val_Label = os.path.join(label_val_path, name + '.txt')shutil.copyfile(srcImage, dst_val_Image)shutil.copyfile(srcLabel, dst_val_Label)else:dst_test_Image = os.path.join(img_test_path, name + '.jpg')dst_test_Label = os.path.join(label_test_path, name + '.txt')shutil.copyfile(srcImage, dst_test_Image)shutil.copyfile(srcLabel, dst_test_Label)

第七章主函数调用

if __name__ == "__main__":parser = argparse.ArgumentParser(description='Convert LabelMe JSON to YOLO TXT and split datasets')parser.add_argument('--json-folder', type=str, default=r'',help='LabelMe JSON folder path')parser.add_argument('--txt-folder', type=str, default=r'',help='YOLO TXT save path')parser.add_argument('--class-map', default={"自己的类别": 0}, type=dict,help='Class name mapping dictionary (e.g. {"person": 0})')parser.add_argument('--images-dir', type=str, default=r'', help='images path dir')parser.add_argument('--save-dir', default=r'', type=str, help='save dir')args = parser.parse_args()json_folder = args.json_foldertxt_folder = args.txt_folderclass_map = args.class_mapimage_dir = args.images_dirsave_dir = args.save_dir# 转换LabelMe JSON到YOLO TXTbatch_convert_labelme_to_yolo(json_folder, txt_folder, class_map)# 划分数据集main(image_dir, txt_folder, save_dir)

全部代码如下：

import json
import os
from tqdm import tqdm  # 可选进度条库
import shutil
import random
import argparsedef labelme_json_to_yolo(txt_save_path, json_path, class_map):"""将LabelMe格式JSON转换为YOLO TXT标注文件:param txt_save_path: TXT保存路径:param json_path: LabelMe JSON文件路径:param class_map: 类别名映射字典（如{"person": 0}）"""with open(json_path, 'r', encoding='utf-8') as f:data = json.load(f)img_height = data["imageHeight"]img_width = data["imageWidth"]img_name = os.path.basename(data["imagePath"])  # 提取图片文件名txt_name = os.path.splitext(img_name)[0] + ".txt"txt_path = os.path.join(txt_save_path, txt_name)lines = []for shape in data["shapes"]:label = shape["label"]if label not in class_map:continue  # 跳过未定义类别cls_id = class_map[label]# 解析多边形/矩形标注为边界框（xmin, ymin, xmax, ymax）points = shape["points"]x_coords = [p[0] for p in points]y_coords = [p[1] for p in points]xmin = min(x_coords)ymin = min(y_coords)xmax = max(x_coords)ymax = max(y_coords)# 计算YOLO格式坐标（归一化中心坐标+宽高）x_center = (xmin + xmax) / (2 * img_width)y_center = (ymin + ymax) / (2 * img_height)w = (xmax - xmin) / img_widthh = (ymax - ymin) / img_height# 过滤无效坐标（避免越界）if 0 <= x_center <= 1 and 0 <= y_center <= 1 and w > 0 and h > 0:lines.append(f"{cls_id} {x_center:.6f} {y_center:.6f} {w:.6f} {h:.6f}")# 保存TXT文件with open(txt_path, 'w') as f:f.write('\n'.join(lines))def batch_convert_labelme_to_yolo(json_folder, txt_folder, class_map):"""批量转换LabelMe格式JSON文件夹到YOLO TXT:param json_folder: JSON文件夹路径:param txt_folder: TXT保存路径:param class_map: 类别名映射字典（如{"person": 0}）"""os.makedirs(txt_folder, exist_ok=True)json_files = [f for f in os.listdir(json_folder) if f.lower().endswith('.json')]for json_file in tqdm(json_files, desc="转换中"):json_path = os.path.join(json_folder, json_file)labelme_json_to_yolo(txt_folder, json_path, class_map)print(f"批量转换完成！共处理{len(json_files)}个JSON文件，保存到：{txt_folder}")# 检查文件夹是否存在
def mkdir(path):if not os.path.exists(path):os.makedirs(path)def main(image_dir, txt_dir, save_dir):# 创建文件夹mkdir(save_dir)images_dir = os.path.join(save_dir, 'images')labels_dir = os.path.join(save_dir, 'labels')img_train_path = os.path.join(images_dir, 'train')img_test_path = os.path.join(images_dir, 'test')img_val_path = os.path.join(images_dir, 'val')label_train_path = os.path.join(labels_dir, 'train')label_test_path = os.path.join(labels_dir, 'test')label_val_path = os.path.join(labels_dir, 'val')mkdir(images_dir)mkdir(labels_dir)mkdir(img_train_path)mkdir(img_test_path)mkdir(img_val_path)mkdir(label_train_path)mkdir(label_test_path)mkdir(label_val_path)# 数据集划分比例，训练集80%，验证集10%，测试集10%，按需修改train_percent = 0.8val_percent = 0.1test_percent = 0.1total_txt = os.listdir(txt_dir)num_txt = len(total_txt)list_all_txt = range(num_txt)  # 范围 range(0, num)num_train = int(num_txt * train_percent)num_val = int(num_txt * val_percent)num_test = num_txt - num_train - num_valtrain = random.sample(list_all_txt, num_train)# 在全部数据集中取出trainval_test = [i for i in list_all_txt if not i in train]# 再从val_test取出num_val个元素，val_test剩下的元素就是testval = random.sample(val_test, num_val)print("训练集数目：{}, 验证集数目：{}, 测试集数目：{}".format(len(train), len(val), len(val_test) - len(val)))for i in list_all_txt:name = total_txt[i][:-4]srcImage = os.path.join(image_dir, name + '.jpg')srcLabel = os.path.join(txt_dir, name + '.txt')if i in train:dst_train_Image = os.path.join(img_train_path, name + '.jpg')dst_train_Label = os.path.join(label_train_path, name + '.txt')shutil.copyfile(srcImage, dst_train_Image)shutil.copyfile(srcLabel, dst_train_Label)elif i in val:dst_val_Image = os.path.join(img_val_path, name + '.jpg')dst_val_Label = os.path.join(label_val_path, name + '.txt')shutil.copyfile(srcImage, dst_val_Image)shutil.copyfile(srcLabel, dst_val_Label)else:dst_test_Image = os.path.join(img_test_path, name + '.jpg')dst_test_Label = os.path.join(label_test_path, name + '.txt')shutil.copyfile(srcImage, dst_test_Image)shutil.copyfile(srcLabel, dst_test_Label)if __name__ == "__main__":parser = argparse.ArgumentParser(description='Convert LabelMe JSON to YOLO TXT and split datasets')parser.add_argument('--json-folder', type=str, default=r'',help='LabelMe JSON folder path')parser.add_argument('--txt-folder', type=str, default=r'',help='YOLO TXT save path')parser.add_argument('--class-map', default={"自己的类别": 0}, type=dict,help='Class name mapping dictionary (e.g. {"person": 0})')parser.add_argument('--images-dir', type=str, default=r'', help='images path dir')parser.add_argument('--save-dir', default=r'', type=str, help='save dir')args = parser.parse_args()json_folder = args.json_foldertxt_folder = args.txt_folderclass_map = args.class_mapimage_dir = args.images_dirsave_dir = args.save_dir# 转换LabelMe JSON到YOLO TXTbatch_convert_labelme_to_yolo(json_folder, txt_folder, class_map)# 划分数据集main(image_dir, txt_folder, save_dir)

split_conversion将json转成yolo训练用的txt,在直接按照8：1：1的比例分成训练集，测试集，验证集

第一章使用说明类别自己在代码中改，其他四个参数 --json-folder:json文件夹路径 --txt-folder：转换成功后txt的存放路径 --images-dir：图片文件夹路径 --save-dir：转换完成分割后所有文件的路径终端命令行：p…...

编程日记 2025/12/4 4:10:49

响应式系统与Spring Boot响应式应用开发

响应式系统概述过去十年间，为应对移动和云计算的需求，软件行业通过改进开发流程来构建更稳定、健壮且灵活的软件系统。这种演进不仅服务于传统用户端（桌面/Web），还需支持多样化设备（手机、传感器等）。为应对这些挑战，多个组织共同制定了《响应式宣言》（2014年发布）…...

编程日记 2025/12/20 5:19:30

【第1章基础知识】1.8 在 Canvas 中使用 HTML 元素

文章目录前言示例-橡皮筋式选取框示例代码前言尽管我们可以说 Canvas 是 HTML5 之中最棒的功能，不过在实现网络应用程序时，很少会单独使用它。在绝大多数情况下，你都会将一个或更多的 canvas 元素与其他 HTML 控件结合起来使用&#xff0…...

编程日记 2026/1/28 22:47:40

c++流之sstream/堆or优先队列的应用[1]

目录 c流之sstream 解释注意事项 215.数据流的第k大问题分析修正代码主要修改点优先队列的比较规则代码中的比较逻辑为什么这样能维护第 k 大元素？ 举个例子总结 Python 实现（使用heapq库） Java 实现（使用P…...

编程日记 2026/2/5 2:29:44

SAR ADC 比较器噪声分析(二)

SAR ADC的比较器是非常重要的模块，需要仔细设计。主要考虑比较器的以下指标： 1)失调电压 2)输入共模范围 3)比较器精度 4)传输延时 5)噪声 6)功耗这里主要讲一下动态比较器的noise。动态比较器一般用于高速SAR ADC中，且精度不会超过12bit…...

编程日记 2026/1/26 23:51:44

c#与java的相同点和不同点

C# 和 Java 是两大主流的、面向对象的、托管型编程语言，它们共享许多相似的设计理念和语法，但也在细节、生态系统和运行平台上存在显著差异。以下是它们的相同点和不同点的详细对比： 一、相同点 (核心相似之处) 语法高度相似： 都源…...

编程日记 2025/11/29 20:02:48

phpmyadmin

安装PHPMyAdmin PHPMyAdmin通常可通过包管理器安装或手动部署。对于Linux系统（如Ubuntu），使用以下命令安装： sudo apt update sudo apt install phpmyadmin安装过程中会提示选择Web服务器（如Apache或Nginx&#xff0…...

编程日记 2025/12/23 13:18:14

机器学习Day5-模型诊断

实现机器学习算法的技巧。当我们训练模型或使用模型时，发现预测误差很大，可以考虑进行以下优化： （1）获取更多的训练样本 （2）使用更少的特征 （3）获取其他特征 &#xff…...

编程日记 2026/1/27 1:05:20

如何将 WSL 的 Ubuntu-24.04 迁移到其他电脑

在使用 Windows Subsystem for Linux (WSL) 时，我们可能会遇到需要将现有的 WSL 环境迁移到其他电脑的情况。无论是为了备份、更换设备，还是在不同电脑之间共享开发环境，掌握迁移 WSL 子系统的方法都是非常有用的。本文将以 Ubuntu-24.04 为例…...

编程日记 2025/11/26 2:42:24

金融欺诈有哪些检测手段

金融欺诈检测是一个多层次的动态防御过程，需要结合技术手段、数据分析、人工智能和人工审核。以下是当前主流的检测手段和技术分类。 ### **一、核心技术手段** 1. **规则引擎（Rule-Based Systems）** - **原理**：预设基于历史…...

编程日记 2025/11/29 21:55:06

HTML5 全面知识点总结

一、HTML 基础概念 HTML：超文本标记语言，用于创建网页和 Web 应用的结构。超文本：可以包含文字、图片、音频、视频、链接等多种媒体。标记语言：通过标签标记网页的各个部分。二、HTML5 的新特性（区别于 HTML4&am…...

编程日记 2025/11/22 9:38:31

vscode一直连接不上虚拟机或者虚拟机容器怎么办？

1. 检查并修复文件权限右键点击 C:\Users\20325\.ssh\config 文件，选择属性 → 安全选项卡。确保只有你的用户账户有完全控制权限，移除其他用户（如 Hena\Administrator）的权限。如果 .ssh 文件夹权限也有问题，同…...

编程日记 2026/2/5 5:11:03

初学c语言21（文件操作）

一.为什么使用文件之前我们写的程序的数据都是存储到内存里面的，当程序结束时，内存回收，数据丢失， 再次运行程序时，就看不到上次程序的数据，如果要程序的数据一直保存得使用文件二.文件文件一般可以…...

编程日记 2026/2/4 6:34:22

数学复习笔记 21

4.15 稍微有点难啊。克拉默法则忘掉了，然后第二类数学归纳法是第一次见。行列式和矩阵，向量和方程组。这是前面四章。现在考研只剩下一个大题。所以就是考最后两章，特征值和二次型。感觉看网课的作用就是辅助理解，自己看书的话&am…...

编程日记 2025/12/9 8:41:11

华为OD机试真题——数据分类（2025B卷：100分）Java/python/JavaScript/C++/C语言/GO六种最佳实现

2025 B卷 100分题型本文涵盖详细的问题分析、解题思路、代码实现、代码详解、测试用例以及综合分析；并提供Java、python、JavaScript、C++、C语言、GO六种语言的最佳实现方式！本文收录于专栏：《2025华为OD真题目录+全流程解析/备考攻略/经验分享》华为OD机试真题《数据…...

编程日记 2026/2/2 6:49:49

JavaWeb开发基础Servlet生命周期与工作原理

Servlet生命周期 Servlet的生命周期由Servlet容器(如Tomcat、Jetty等)管理，主要包括以下5个阶段： 加载Servlet类创建Servlet实例调用init方法调用service方法调用destroy方法加载(Loading)： 当Servlet容器启动或第一次接收到对某个…...

编程日记 2026/1/27 1:39:10

三防平板科普：有什么特殊功能？应用在什么场景？

在数字化浪潮席卷全球的今天，智能设备已成为现代工业、应急救援、户外作业等领域的核心工具。然而，常规平板电脑在极端环境下的脆弱性，如高温、粉尘、水浸或撞击，往往成为制约效率与安全的短板。三防平板（防水、防尘、…...

编程日记 2026/1/28 11:07:14

百度外链生态的优劣解构与优化策略深度研究

本文基于搜索引擎算法演进与外链建设实践，系统剖析百度外链的作用机制与价值模型。通过数据统计、案例分析及算法逆向工程，揭示不同类型外链在权重传递、流量获取、信任背书等维度的差异化表现，提出符合搜索引擎规则的外链建设技术方案&#…...

编程日记 2026/2/3 9:55:31

笔记：在WPF中ContentElement 和 UIElement 的主要区别

一、目的：简要姐扫在WPF中ContentElement 和 UIElement 的主要区别 ContentElement 和 UIElement 是 WPF 中的两个基类，它们在功能和用途上有显著的区别。二、主要区别 ContentElement 主要特点: • 没有视觉表示: ContentElement 本身不直接渲染任…...

编程日记 2025/10/31 12:07:09

项目中使用到了多个UI组件库，也使用了Tailwindcss，如何确保新开发的组件样式隔离?

在项目中使用多个组件库，同时使用 TailwindCSS，确保新开发的组件样式隔离是非常重要的。样式隔离可以避免样式冲突、全局污染以及意外的样式覆盖问题。以下是一些常见的策略和最佳实践： 1. 使用 TailwindCSS 的 layer 机制 TailwindCSS 提供…...

编程日记 2025/12/25 18:31:00

AI提示工程(Prompt Engineering)高级技巧详解

AI提示工程(Prompt Engineering)高级技巧详解文章目录一、基础设计原则二、高级提示策略三、输出控制技术四、工程化实践五、专业框架应用提示工程是与大型语言模型(LLM)高效交互的关键技术，精心设计的提示可以显著提升模型输出的质量和相关性。以下是经过验证的详细提示工…...

编程日记 2025/12/10 17:51:14

【速写】PPOTrainer样例与错误思考（少量DAPO）

文章目录序言1 TRL的PPO官方样例分析2 确实可行的PPOTrainer版本3 附录：DeepSeek关于PPOTrainer示例代码的对话记录Round 1（给定模型数据集，让它开始写PPO示例）Round 2 （指出PPOTrainer的参数问题）关键问题…...

编程日记 2026/1/25 14:14:19

5.26 面经整理 360共有云 golang

select … for update 参考：https://www.cnblogs.com/goloving/p/13590955.html select for update是一种常用的加锁机制，它可以在查询数据的同时对所选的数据行进行锁定，避免其他事务对这些数据行进行修改。比如涉及到金钱、库存等。一般这…...

编程日记 2026/1/30 21:20:40

中国移动咪咕助力第五届全国人工智能大赛“AI+数智创新”专项赛道开展

第五届全国人工智能大赛由鹏城实验室主办，新一代人工智能产业技术创新战略联盟承办，华为、中国移动、鹏城实验室科教基金会等单位协办，广东省人工智能与机器人学会支持。大赛发布“AI图像编码”、“AI增强视频质量评价”、“AI数智创新”三大…...

编程日记 2026/1/31 5:12:46

模具制造业数字化转型：精密模塑，以数字之力铸就制造基石

模具被誉为 “工业之母”，是制造业的重要基石，其精度直接决定了工业产品的质量与性能。在工业制造向高精度、智能化发展的当下，《模具制造业数字化转型：精密模塑，以数字之力铸就制造基石》这一主题，精准点明…...

编程日记 2026/1/28 11:00:16

PECVD 生成 SiO₂ 的反应方程式

在PECVD工艺中，沉积氧化硅薄膜以SiH₄基与TEOS基两种工艺路线为主。 IMD Oxide（USG） 这部分主要沉积未掺杂的SiO₂，也叫USG（Undoped Silicate Glass），常用于IMD（Inter-Metal Diele…...

编程日记 2026/1/31 12:26:12

React与Vue核心区别对比

React 和 Vue 都是当今最流行、功能强大的前端 JavaScript 框架，用于构建用户界面。它们有很多相似之处（比如组件化、虚拟 DOM、响应式数据绑定），但也存在一些核心差异。以下是它们的主要区别： 1. 核心设计与哲学 Rea…...

编程日记 2025/11/7 15:06:48

2024 CKA模拟系统制作 | Step-By-Step | 17、题目搭建-排查故障节点

目录免费获取题库配套 CKA_v1.31_模拟系统一、题目二、考点分析 1. Kubernetes 节点状态诊断 2. 节点故障修复技能 3. 持久化修复方案 4. SSH 特权操作三、考点详细讲解 1. 节点状态机制详解 2. 常见故障原因深度分析 3. 永久修复技术方案四、实验环境搭建步骤…...

编程日记 2026/1/28 8:23:54

如何将图像插入 PDF：最佳工具比较

无论您是编辑营销材料、写报告还是改写原来的PDF文件，将图像插入 PDF 都至关重要。幸运的是，有多种在线和离线工具可以简化此任务。在本文中，我们将比较一些常用的 PDF 添加图像工具，并根据您的使用场景推荐最佳解决方案&#xff…...

编程日记 2026/1/28 10:45:03

Linux 文件 IO 性能监控与分析指南

Linux 文件 I/O 性能监控与分析指南继 CPU 和网络之后，文件系统 I/O 是影响系统性能的第三大关键领域。无论是数据库响应缓慢、应用加载时间过长，还是日志写入延迟，其根源都可能指向磁盘 I/O 瓶颈。本章将深入探讨文件 I/O 的核心概念、监控…...

编程日记 2025/9/18 19:35:13

第一章 使用说明

第二章 导包

第三章 转换格式函数

第四章 划分函数

第五章 确认文件夹是否存在