当前位置：首页 > news >正文

数据集制作——语义分割前png、jpg格式标签图转yolo格式.txt文件（附代码）

news 2026/2/10 19:13:25

💪 专业从事且热爱图像处理，图像处理专栏更新如下👇：
📝《图像去噪》
📝《超分辨率重建》
📝《语义分割》
📝《风格迁移》
📝《目标检测》
📝《暗光增强》
📝《模型优化》
📝《模型实战部署》

在这里插入图片描述

一、YOLO格式

YOLO格式的数据集通常包含两部分：图像文件和对应的文本标注文件。每个文本标注文件中包含了图像中每个物体的类别和位置信息。每一行代表一个物体，格式如下：

<class_id> <x_center> <y_center> <width> <height>

其中，<class_id>是物体类别的ID，<x_center>和<y_center>是物体中心点的坐标，和是物体的宽度和高度。所有的坐标和尺寸都需要被归一化，即除以图像的宽度和高度，因此它们的值都在0到1之间。

二、实现步骤

要将.png格式的标签图转换为YOLO格式的.txt文件，需要以下步骤：

（1）读取.png标签图，每个物体应该被标记为不同的颜色；

（2）解析标签图，对每种颜色进行遍历，找出所有像素点的坐标；

（3）对每种颜色的像素点坐标进行分析，计算出对应的bounding box（通过找到最小和最大的x，y坐标来实现）；

（4）将bounding box的坐标和尺寸归一化，然后保存为.txt文件。

三、代码

3.1 参数修改

在这里插入图片描述

3.2 代码

注：.png格式个标签图像，必须是单通道图像。

import os
import cv2
import numpy as npdef convert_segmentation_to_yolo(img_path, output_path, num_classes):# 读取标签图img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)height, width = img.shape# 创建用于存储YOLO格式的列表yolo_labels = []# 遍历每个类别for class_id in range(num_classes):# 找到当前类别的所有像素位置class_pixels = np.where(img == class_id)# 如果当前类别不存在，跳过if len(class_pixels[0]) == 0:continue# 找到类别的最小和最大边界x_min = np.min(class_pixels[1])x_max = np.max(class_pixels[1])y_min = np.min(class_pixels[0])y_max = np.max(class_pixels[0])# 计算中心点和宽高，并归一化x_center = (x_min + x_max) / 2 / widthy_center = (y_min + y_max) / 2 / heightbbox_width = (x_max - x_min) / widthbbox_height = (y_max - y_min) / height# 保存YOLO格式的标签yolo_labels.append(f"{class_id} {x_center} {y_center} {bbox_width} {bbox_height}")# 将YOLO标签写入.txt文件txt_file = os.path.splitext(os.path.basename(img_path))[0] + ".txt"with open(os.path.join(output_path, txt_file), "w") as f:for label in yolo_labels:f.write(label + "\n")# 示例调用
# img_folder = 'path/to/your/png/folder'
# output_folder = 'path/to/your/txt/folder'
img_folder = 'Images/Segment_Images/image_png'
output_folder = 'Images/Segment_Images/label_txt'
# num_classes = 21  # 假设有21个类别
num_classes = 2  # 假设有21个类别if not os.path.exists(output_folder):os.makedirs(output_folder)# 遍历标签图文件夹并转换
for img_file in os.listdir(img_folder):if img_file.endswith('.png'):img_path = os.path.join(img_folder, img_file)convert_segmentation_to_yolo(img_path, output_folder, num_classes)

四、转换结果

下面是原始的png格式标签图和转换后的yolo格式.txt文件。

在这里插入图片描述

五、总结

以上就是语义分割前png、jpg格式标签图转yolo格式.txt文件的详细过程，希望能帮到你！

感谢您阅读到最后！😊总结不易，多多支持呀🌹 点赞👍收藏⭐评论✍️，您的三连是我持续更新的动力💖

关注公众号「视觉研坊」，获取干货教程、实战案例、技术解答、行业资讯！

数据集制作——语义分割前png、jpg格式标签图转yolo格式.txt文件（附代码）

💪 专业从事且热爱图像处理，图像处理专栏更新如下👇： 📝《图像去噪》 📝《超分辨率重建》 📝《语义分割》 📝《风格迁移》 📝《目标检测》 📝《暗光增强》 &a…...

编程日记 2024/6/20 0:23:26

机器学习课程复习——ANN

Q：ANN？ 基本架构由输入层、隐藏层、输出层等构建前馈/反馈传播工作原理先加权求和：每个神经元的输出是输入加权和的激活再送入激活函数：激活函数的存在使得其能够拟合各类非线性任务联想：像adaboosting的加权求…...

编程日记 2024/6/20 0:22:24

棋盘问题 #include<bits/stdc.h> using namespace std; void func(int,int); bool tf(int,int); void c(); int n,k; char a[110][110]; int cnt20; int main() {cin>>n>>k;for(int i0;i<n;i){for(int j0;j<n;j){cin>>a[i][j];}}func(0,0);cout…...

编程日记 2024/6/20 0:20:22

流量有限、日活低的APP适合对接广告变现吗？

APP广告变现，总用户数和日活用户（DUA）是衡量APP价值和影响力的重要指标之一。 APP DUA过万，尤其是大几万时，通常具备了商业化价值，适合接入广告变现。日活1W意味着每天有1万名用户在使用这款应用&#xff…...

编程日记 2024/6/20 0:19:20

Shell 学习笔记 - 变量的类型 + 变量的赋值

1.6 Shell 变量的类型 Shell 变量分为四类，分别是自定义变量环境变量位置变量预定义变量根据工作要求临时定义的变量称为自定义变量； 环境变量一般是指用 export 内置命令导出的变量，用于定义 Shell 的运行环境，保证 Shell …...

编程日记 2024/6/20 0:17:18

vue播放flv格式的直播流

在ios无法播放，安卓可以安装 npm install flv.js --save页面 <template><div><videoref"videoElement"style"width: 100%; height: 100%"autoplayplaysinlinemuted></video></div> </template><scr…...

编程日记 2024/6/20 0:16:17

Qt入门小项目 | 实现一个图片查看器

文章目录一、实现一个图片查看软件一、实现一个图片查看软件需要实现的功能： 打开目录选择图片显示图片的名字显示图片在以上功能的基础上进行优化，需要解决如下问题： 如何记住上次打开的路径？ 将路径保存到配置文件中&#x…...

编程日记 2024/6/20 0:13:13

qt仿制qq登录界面

#include "mainwindow.h"MainWindow::MainWindow(QWidget *parent): QMainWindow(parent) {// 设置窗口大小this->resize(window_width, window_heigth);// 固定窗口大小this->setFixedSize(window_width, window_heigth);// 设置窗口图标this->se…...

编程日记 2024/6/20 0:12:12

HashMap详解(含动画演示)

目录 HashMap1、HashMap的继承体系2、HashMap底层数据结构3、HashMap的构造函数①、无参构造②、有参构造1 和有参构造2 (可以自定义初始容量和负载因子)③、有参构造3(接受一个Map参数)JDK 8之前版本的哈希方法：JDK 8版本的哈希方法 4、拉链法解决哈希冲突什么是拉…...

编程日记 2024/6/20 0:11:10

TVS的原理及选型

目录案例描述 TVS管的功能与作用： TVS选型注意事项： 高速TVS管选型最近项目中遇到TVS管选型错误的问题。在此对TVS的功能及选型做一个分享。案例描述项目中保护指标应为4-14V，而选型的TVS管位SMJ40CA，其保护电压为40V未…...

编程日记 2024/6/20 0:10:08

【机器学习】无监督学习：探索数据背后的隐藏模式

在机器学习的广阔领域中，监督学习因其直观的训练方式和广泛的应用场景，往往受到更多的关注。然而，随着数据量和数据类型的不断增长，无监督学习的重要性日益凸显。本文将详细介绍无监督学习的理论基础、常用算法及其在实际中的应用…...

编程日记 2024/6/20 0:08:05

使用Elasticsearch在同一索引中区分不同类型的文档

在使用Elasticsearch时，有时我们需要在同一个索引中存放不同类型的文档，并且这些文档的字段可能不一致。在早期版本中，我们可以使用types来实现，但在Elasticsearch 7.x及更高版本中，types概念已被弃用。本文将介绍如何…...

编程日记 2024/6/20 0:07:04

驾校在线考试系统源码手机+PC+平板自适应

Thinkphp在线考题源码驾校在线考试系统手机PC平板自适应，机动车驾驶培训学校驾校类网站源码带手机端运行环境：phpmysql 内附安装说明驾校在线考试系统源码手机PC平板自适应...

编程日记 2024/6/20 0:06:02

c++的多态,继承,抽象类,虚函数表,虚函数等题目+分析

目录题目代码题分析主观题题目代码题 class A { public:virtual void func(int val 1) {std::cout << "A->" << val << std::endl;}virtual void test() { func(); } };class B : public A { public:void func(int val 0) { std…...

编程日记 2024/6/20 0:05:01

利用 Qwen-VL 进行私有化部署第一个 AI 多模态大模型

Hi~！这里是奋斗的小羊，很荣幸您能阅读我的文章，诚请评论指点，欢迎欢迎 ~~ 💥💥个人主页：奋斗的小羊 💥💥所属专栏：C语言 🚀本系列文章为个人学习…...

编程日记 2024/6/20 0:04:00

王思聪隐形女儿曝光

王思聪"隐形"女儿曝光！黄一鸣独自面对怀孕风波，坚持生下爱情结晶近日，娱乐圈掀起了一场惊天波澜！前王思聪绯闻女友黄一鸣在接受专访时，大胆揭露了她与王思聪之间的爱恨纠葛，并首度公开承认&#…...

编程日记 2024/6/20 0:02:58

学习笔记——网络管理与运维——SNMP(SNMP原理)

四、SNMP原理 SNMP的工作原理基于客户端-服务器模型。其中，网络管理系统是客户端，而网络设备是服务器。客户端向服务器发送请求消息(即"Get"或"Set"命令)来获取或修改服务器的信息。服务器收到请求消息后，会返回相应的响…...

编程日记 2024/6/20 0:01:57

基于STM32和人工智能的自动驾驶小车系统

目录引言环境准备自动驾驶小车系统基础代码实现：实现自动驾驶小车系统 4.1 数据采集模块4.2 数据处理与分析4.3 控制系统4.4 用户界面与数据可视化应用场景：自动驾驶应用与优化问题解决方案与优化收尾与总结 1. 引言随着人工智能和嵌入式系统技术的…...

编程日记 2024/6/20 0:00:55

简单介绍vim

文章目录前言一、Vim的特点二、安装Vim三、设置Vim配置文件的位置：编辑配置文件：添加配置选项：保存并退出编辑器：快速配置验证设置： 总结前言 Vim是一款强大的文本编辑器，被广泛用于各种编程和文本编辑任…...

编程日记 2024/6/19 23:59:53

使用本地数据对transformers模型进行微调训练

模型 transformers模型是使用比较多的模型，奈何各个都是体积大，找了一个使用人多不是很大的模型进行训练。需要魔法 bert-base-uncased模型仓库地址 huggingface下的所有仓库都是git的，也就意味着你可以使用 git clone 可以下载仓库内所有的…...

编程日记 2024/6/19 23:58:52

浅谈 React Hooks

React Hooks 是 React 16.8 引入的一组 API，用于在函数组件中使用 state 和其他 React 特性（例如生命周期方法、context 等）。Hooks 通过简洁的函数接口，解决了状态与 UI 的高度解耦，通过函数式编程范式实现更灵活 Rea…...

编程新知 2025/9/23 15:13:40

XML Group端口详解

在XML数据映射过程中，经常需要对数据进行分组聚合操作。例如，当处理包含多个物料明细的XML文件时，可能需要将相同物料号的明细归为一组，或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码，增加了开…...

编程新知 2026/2/9 13:51:46

Spring Boot 实现流式响应（兼容 2.7.x）

在实际开发中，我们可能会遇到一些流式数据处理的场景，比如接收来自上游接口的 Server-Sent Events（SSE） 或流式 JSON 内容，并将其原样中转给前端页面或客户端。这种情况下，传统的 RestTemplate 缓存机制会…...

编程新知 2025/8/11 8:18:44

【网络安全产品大调研系列】2. 体验漏洞扫描

前言 2023 年漏洞扫描服务市场规模预计为 3.06（十亿美元）。漏洞扫描服务市场行业预计将从 2024 年的 3.48（十亿美元）增长到 2032 年的 9.54（十亿美元）。预测期内漏洞扫描服务市场 CAGR（增长率&…...

编程新知 2026/2/4 12:43:08

Keil 中设置 STM32 Flash 和 RAM 地址详解

文章目录 Keil 中设置 STM32 Flash 和 RAM 地址详解一、Flash 和 RAM 配置界面（Target 选项卡）1. IROM1（用于配置 Flash）2. IRAM1（用于配置 RAM）二、链接器设置界面（Linker 选项卡）1. 勾选“Use Memory Layout from Target Dialog”2. 查看链接器参数（如果没有勾选上面…...

编程新知 2026/2/7 0:28:16