当前位置：首页 > news >正文

json格式数据集转换成yolo的txt格式数据集

news 2026/2/9 16:32:52

这个代码是参考了两个博客我是感觉第一篇博客可能有问题，然后自己做了改进，如果我是错误的或者正确的，请各位评论区说一下，感谢

Json格式的数据集标签转化为有效的txt格式(data_coco)_train.json-CSDN博客

COCO（.json）格式转换为 YOLO（.txt）格式训练（详细介绍，避坑贴）_json to yolo-CSDN博客

# 处理同一个数据集下多个json文件时，仅运行一次class_txt即可
import json
import osdef convert2(size, box):dw = 1.0 / size[0]dh = 1.0 / size[1]x = (box[0] + box[1]) / 2.0y = (box[2] + box[3]) / 2.0w = box[1] - box[0]h = box[3] - box[2]x = x * dww = w * dwy = y * dhh = h * dhreturn (x, y, w, h)def convert(size, box):dw = 1. / (size[0])dh = 1. / (size[1])x = box[0] + box[2] / 2.0y = box[1] + box[3] / 2.0w = box[2] - box[0]h = box[3] - box[1]# round函数确定(xmin, ymin, xmax, ymax)的小数位数x = round(x * dw, 6)w = round(w * dw, 6)y = round(y * dh, 6)h = round(h * dh, 6)return (x, y, w, h)
"存储标签与预测框到txt文件中"
def json_txt(json_path, txt_path):"json_path: 需要处理的json文件的路径""txt_path: 将json文件处理后txt文件存放的文件夹名"# 生成存放json文件的路径if not os.path.exists(txt_path):os.mkdir(txt_path)# 读取json文件with open(json_path, 'r') as f:dict = json.load(f)# 得到images和annotations信息images_value = dict.get("images")  # 得到某个键下对应的值annotations_value = dict.get("annotations")  # 得到某个键下对应的值# 使用images下的图像名的id创建txt文件'''list=[]  # 将文件名存储在list中for i in images_value:open(txt_path + str(i.get("file_name")) + '.txt', 'w')list.append(i.get("id"))for i in images_value:for j in annotations_value:if j.get("image_id") == i.get("id"):# bbox标签归一化处理num = sum(j.get('bbox'))new_list = [round(m / num, 6) for m in j.get('bbox')]  # 保留六位小数with open(txt_path + str(i.get("file_name")) + '.txt', 'a') as file1:  # 写入txt文件中print(j.get("category_id"), new_list[0], new_list[1], new_list[2], new_list[3], file=file1)print("结束")
'''# 将id对应图片的bbox写入txt文件中for i in images_value:for j in annotations_value:if j.get("image_id") == i.get("id"):# bbox标签归一化处理w = i.get("width")h = i.get("height")bbox = j.get('bbox')  # 保留六位小数xmin = bbox[0]xmax = bbox[1]ymin = bbox[2]ymax = bbox[3]b = (float(xmin), float(xmax), float(ymin), float(ymax))new_list = convert((w, h), b)with open(txt_path + str(i.get("file_name")) + '.txt', 'a') as file1:  # 写入txt文件中print(j.get("category_id"), str(new_list[0]), str(new_list[1]), str(new_list[2]), str(new_list[3]), file=file1)print("结束")"将id对应的标签存储在class.txt中"
def class_txt(json_path, class_txt_path):"json_path: 需要处理的json文件的路径""txt_path: 将json文件处理后存放所需的txt文件名"# 生成存放json文件的路径with open(json_path, 'r') as f:dict = json.load(f)# 得到categories下对应的信息categories_value = dict.get("categories")  # 得到某个键下对应的值# 将每个类别id与类别写入txt文件中with open(class_txt_path, 'a') as file0:for i in categories_value:print(i.get("id"), i.get('name'), file=file0)print("结束")json_txt("./annotations/val.json", "train_labels/")
#class_txt("./annotations/train.json", "id_categories.txt")

json格式数据集转换成yolo的txt格式数据集

这个代码是参考了两个博客我是感觉第一篇博客可能有问题，然后自己做了改进，如果我是错误的或者正确的，请各位评论区说一下，感谢 Json格式的数据集标签转化为有效的txt格式(data_coco)_train.json-CSDN博客 COCO（.j…...

编程日记 2024/11/26 5:47:19

什么是Three.js，有什么特点

什么是 Three.js？ Three.js 是一个基于 WebGL 技术的 JavaScript 3D 库。它允许开发者在网页上创建和展示 3D 图形内容，而无需用户安装任何额外的插件或软件。Three.js 简化了 WebGL 的复杂性，使得即便是对图形编程不太熟悉的人也能快速上手…...

编程日记 2024/11/26 5:46:16

Linux笔记--基于OCRmyPDF将扫描件PDF转换为可搜索的PDF

1--官方仓库 https://github.com/ocrmypdf/OCRmyPDF 2--基本步骤 # 安装ocrmypdf库 sudo apt install ocrmypdf# 安装简体中文库 sudo apt-get install tesseract-ocr-chi-sim# 转换 # -l 表示使用的语言 # --force-ocr 防止出现以下错误：ERROR - PriorOcrFoundE…...

编程日记 2024/11/26 5:45:15

Unity 导出 Xcode 工程修改 Podfile 文件

Unity 导出 Xcode 工程修改 Podfile 文件在 Editor 文件夹下新建 xxx.cs 脚本实现静态方法 [PostProcessBuild]public static void OnPostprocessBuild(BuildTarget target, string pathToBuiltProject){// Unity 导出 Xcode 工程自动调用这个方法 }using System.IO; using…...

编程日记 2024/11/26 5:44:14

UE5 slate BlankProgram独立程序系列

源码版Engine\Source\Programs\中copy BlankProgram文件夹，重命名为ASlateLearning，修改所有文件命名及内部名称。 ASlateLearning.Target.cs // Copyright Epic Games, Inc. All Rights Reserved.using UnrealBuildTool; using System.Collections.Ge…...

编程日记 2024/11/26 5:42:13

内存不足引发C++程序闪退崩溃问题的分析与总结

目录 1、内存不足一般出现在32位程序中 2、内存不足时会导致malloc或new申请内存失败 2.1、malloc申请内存失败，返回NULL 2.2、new申请内存失败，抛出异常 3、内存不足项目实战案例中相关细节与要点说明 3.1、内存不足导致malloc申请内存失败&#…...

编程日记 2024/11/26 5:41:12

C++ —— 以真我之名如飞花般绚丽 - 智能指针

目录 1. RAII和智能指针的设计思路 2. C标准库智能指针的使用 2.1 auto_ptr 2.2 unique_ptr 2.3 简单模拟实现auto_ptr和unique_ptr的核心功能 2.4 shared_ptr 2.4.1 make_shared 2.5 weak_ptr 2.6 shared_ptr的缺陷：循环引用问题 3. shared_ptr 和 unique_…...

编程日记 2024/11/26 5:40:11

Linux中安装InfluxDB

什么是InfluxDB InfluxDB是一个开源的时间序列数据库，专为处理时间序列数据而设计。时间序列数据是指带有时间戳的数据点，例如传感器数据、应用程序日志、服务器指标等。InfluxDB 由 InfluxData 公司开发，广泛应用于物联网（IoT&am…...

编程日记 2024/11/26 5:39:10

nginx服务器实现上传文件功能_使用nginx-upload-module模块

目录 conf文件内容如下html文件内容如下上传文件功能展示 conf文件内容如下 #user nobody; worker_processes 1;error_log /usr/logs/error.log; #error_log /usr/logs/error.log notice; #error_log /usr/logs/error.log info;#pid /usr/logs/nginx.pid;events …...

编程日记 2024/11/26 5:38:08

ORB-SLAM2源码学习：Initializer.cc:Initializer::ComputeF21地图初始化——计算基础矩阵

前言在平面场景我们通过求解单应矩阵H来求解位姿，但是我们在实际中常见的都是非平面场景， 此时需要用基础矩阵F求解位姿。 1.函数声明 cv::Mat Initializer::ComputeF21(const vector<cv::Point2f> &vP1, const vector<cv::Point2f>…...

编程日记 2024/11/26 5:37:07

C# 读取多条数据记录导出到 Word标签模板之图片输出改造

目录应用需求设计范例运行环境配置Office DCOM 实现代码组件库引入核心代码调用示例小结应用需求在我的文章《C# 读取多条数据记录导出到 Word 标签模板》里，讲述读取多条数据记录结合 WORD 标签模板输出文件的功能，原有输出图片的…...

编程日记 2024/11/26 5:35:05

NSSCTF web刷题

1 虽然找到了flag,但是我要怎么去改他的代码,让他直接输出flag呢? (好像是要得到他的json代码,这题不让看) 2 wllm应该就是他的密码,进入许可了意思是服务器可以执行通过POST的请求方式传入参数为wllm的命令，那这就是典型的命令执行，当然&#xff0c…...

编程日记 2024/11/26 5:33:03

对象排序得到方式

java实现 list 排序的方式，有三种 ① 对象实现Comparable 接口，然后代码里直接调用Collections.sort(list) ②使用内部类Comparator ③使用stream.sort 代码如下实现Comparable接口的实体类 Data public class Student implements Comparable<Stud…...

编程日记 2024/11/26 5:32:02

Day2 洛谷1035+1047+1085+1089+1150+1151

零基础洛谷刷题记录 Day1 2024.11.18 Day2 2024.11.25 文章目录零基础洛谷刷题记录1035:题目描述1035：解答代码1035：学习成果1047：题目描述（成功写出）1047：解答代码1047：学习成果1085&#xf…...

编程日记 2024/11/26 5:31:01

Linux：进程间通信之进程池和日志

一、进程池的设计因为每一次我们要进行进程间通信都需要fork，和操作系统做交互是存在很大成本的，所以我们是不是可以提前fork出几个进程，然后当我们想要使用的时候直接去给他们安排任务，这样就减少了系统调用的次数从而提高了内存…...

编程日记 2024/11/26 5:29:57

详细介绍HTTP与RPC：为什么有了HTTP，还需要RPC？

目录一、HTTP 二、RPC 介绍工作原理核心功能如何服务寻址如何进行序列化和反序列化如何网络传输基于 TCP 协议的 RPC 调用基于 HTTP 协议的 RPC 调用实现方式优点和缺点使用场景常见框架示例三、问题问题一：是先有HTTP还是先有RPC&…...

编程日记 2024/11/26 5:28:55

Paddle Inference部署推理（十二）

十二：Paddle Inference推理 （python）API详解 15. PredictorPool 类 PredictorPool 对 Predictor 进行了简单的封装，通过传入 config 和 thread 的数目来完成初始化，在每个线程中，根据自己的线程 id 直接从…...

编程日记 2024/11/26 5:27:55

外观模式 (Facade Pattern)

外观模式 (Facade Pattern) 外观模式是一种结构型设计模式，通过为子系统中的一组接口提供一个统一的高层接口，简化了子系统的使用，让复杂系统更易于访问。原理核心思想： 提供一个统一的接口来访问子系统中的多个接口&#…...

编程日记 2024/11/26 5:26:53

人工智能-深度学习-Torch框架-手动构建回归流程

from sklearn.datasets import make_regression import math import random import torch from sklearn.datasets import make_regression: 导入make_regression函数，用于生成回归数据集。 import math: 导入math模块，用于进行数学计算，例如…...

编程日记 2024/11/26 5:24:50

SpringBoot源码解析(五)：准备应用环境

SpringBoot源码系列文章 SpringBoot源码解析(一)：SpringApplication构造方法 SpringBoot源码解析(二)：引导上下文DefaultBootstrapContext SpringBoot源码解析(三)：启动开始阶段 SpringBoot源码解析(四)：解析应用参数args Sp…...

编程日记 2024/11/26 5:21:47

Golang 面试经典题：map 的 key 可以是什么类型？哪些不可以？

Golang 面试经典题：map 的 key 可以是什么类型？哪些不可以？ 在 Golang 的面试中，map 类型的使用是一个常见的考点，其中对 key 类型的合法性是一道常被提及的基础却很容易被忽视的问题。本文将带你深入理解 Golang 中…...

编程新知 2025/12/20 7:42:02

基于ASP.NET+ SQL Server实现（Web）医院信息管理系统

医院信息管理系统 1. 课程设计内容在 visual studio 2017 平台上，开发一个“医院信息管理系统”Web 程序。 2. 课程设计目的综合运用 c#.net 知识，在 vs 2017 平台上，进行 ASP.NET 应用程序和简易网站的开发；初步熟悉开发一…...

编程新知 2026/1/23 12:16:56

通过Wrangler CLI在worker中创建数据库和表

官方使用文档：Getting started Cloudflare D1 docs 创建数据库在命令行中执行完成之后，会在本地和远程创建数据库： npx wranglerlatest d1 create prod-d1-tutorial 在cf中就可以看到数据库： 现在，您的Cloudfla…...

编程新知 2026/1/31 6:18:08

centos 7 部署awstats 网站访问检测

一、基础环境准备（两种安装方式都要做） bash # 安装必要依赖 yum install -y httpd perl mod_perl perl-Time-HiRes perl-DateTime systemctl enable httpd # 设置 Apache 开机自启 systemctl start httpd # 启动 Apache二、安装 AWStats&#xff0…...

编程新知 2026/1/23 8:33:56

RabbitMQ入门4.1.0版本（基于java、SpringBoot操作）

RabbitMQ 一、RabbitMQ概述 RabbitMQ RabbitMQ最初由LShift和CohesiveFT于2007年开发，后来由Pivotal Software Inc.（现为VMware子公司）接管。RabbitMQ 是一个开源的消息代理和队列服务器，用 Erlang 语言编写。广泛应用于各种分布…...

编程新知 2026/1/31 3:52:49

sshd代码修改banner

sshd服务连接之后会收到字符串： SSH-2.0-OpenSSH_9.5 容易被hacker识别此服务为sshd服务。是否可以通过修改此banner达到让人无法识别此服务的目的呢？ 不能。因为这是写的SSH的协议中的。也就是协议规定了banner必须这么写。 SSH- 开头&#xff0c…...

编程新知 2026/2/8 22:30:28

AxureRP-Pro-Beta-Setup_114413.exe （6.0.0.2887）

Name：3ddown Serial：FiCGEezgdGoYILo8U/2MFyCWj0jZoJc/sziRRj2/ENvtEq7w1RH97k5MWctqVHA 注册用户名：Axure 序列号：8t3Yk/zu4cX601/seX6wBZgYRVj/lkC2PICCdO4sFKCCLx8mcCnccoylVb40lP...

编程新知 2026/2/4 19:42:20

goreplay

1.github地址 https://github.com/buger/goreplay 2.简单介绍 GoReplay 是一个开源的网络监控工具，可以记录用户的实时流量并将其用于镜像、负载测试、监控和详细分析。 3.出现背景随着应用程序的增长，测试它所需的工作量也会呈指数级增长。GoRepl…...

编程新知 2026/2/1 6:17:17

shell脚本质数判断

shell脚本质数判断 shell输入一个正整数,判断是否为质数(素数）shell求1-100内的质数shell求给定数组输出其中的质数 shell输入一个正整数,判断是否为质数(素数） 思路： 1:1 2:1 2 3:1 2 3 4:1 2 3 4 5:1 2 3 4 5-------> 3:2 4:2 3 5:2 3…...

编程新知 2025/12/8 12:56:00

深度解析云存储：概念、架构与应用实践

在数据爆炸式增长的时代，传统本地存储因容量限制、管理复杂等问题，已难以满足企业和个人的需求。云存储凭借灵活扩展、便捷访问等特性，成为数据存储领域的主流解决方案。从个人照片备份到企业核心数据管理，云存储正重塑数据存储与…...

编程新知 2025/10/30 6:08:18

相关文章：