当前位置: 首页 > article >正文

告别手动重标:基于Python脚本的Labelme数据集增强与JSON同步更新实战

1. 为什么我们需要自动化处理Labelme标注数据做计算机视觉项目的朋友都知道数据标注是个体力活。特别是使用Labelme这类工具进行语义分割标注时每张图片都要手动勾勒物体轮廓工作量巨大。更让人头疼的是当我们对原始图片进行数据增强比如镜像翻转、旋转时对应的JSON标注文件却不会自动更新。我最近就遇到了这个痛点。项目需要增加数据多样性打算对标注好的数据集做90°、180°、270°旋转增强。按照传统做法每旋转一张图片就得重新标注一次相当于工作量直接翻三倍这种重复劳动不仅效率低下还容易出错。好在Python脚本可以帮我们解决这个问题。通过编写自动化脚本我们可以在对图片进行几何变换的同时智能地更新对应的JSON标注文件。这样既保证了数据增强的效果又避免了重复标注的麻烦。下面我就分享下这个实战经验手把手教你如何用Python脚本实现Labelme数据集的智能增强。2. 环境准备与核心思路2.1 基础环境配置在开始之前我们需要准备好开发环境。这个方案主要依赖以下几个Python库Pillow用于图像处理glob用于文件路径匹配json用于JSON文件读写os用于系统路径操作math用于旋转计算安装命令很简单pip install pillow其他库都是Python标准库无需额外安装。建议使用Python 3.6版本我在3.8环境下测试通过。2.2 核心解决思路整个方案的核心逻辑其实很清晰遍历原始图片文件夹获取所有待处理的图片对每张图片执行几何变换镜像、旋转等同时读取对应的JSON标注文件根据相同的变换规则更新JSON中的标注点坐标保存变换后的图片和更新后的JSON文件关键在于第四步——如何准确计算变换后的标注点坐标。对于镜像翻转我们需要找到中轴线然后对称翻转所有点坐标对于旋转则需要使用三角函数进行坐标变换。3. 实战代码解析与常见坑点3.1 文件路径处理的正确姿势原始代码中第一个大坑就是文件路径处理。很多人在运行脚本时发现输出为空就是因为路径匹配出了问题。错误示范img_list glob.glob(path * file_format)这种写法有两个问题如果路径中包含特殊字符如下划线_通配符*可能匹配失败直接用拼接路径在不同操作系统下可能不兼容正确做法是使用os.path.joinimg_list glob.glob(os.path.join(path, *.jpg))同样输出文件路径也应该这样处理full_path os.path.join(save_path, LR file_name)3.2 镜像翻转的坐标计算对于左右镜像翻转我们需要先找到图片的中轴线然后将所有标注点对称翻转。具体算法如下获取图片宽度width计算中轴mid_width width / 2对于每个标注点(temp_x, temp_y)计算该点到中轴的距离dis新x坐标 中轴坐标 ± 距离根据原位置决定加减y坐标保持不变代码实现if temp_x mid_width: dis temp_x - mid_width new_x mid_width - dis elif temp_x mid_width: dis mid_width - temp_x new_x mid_width dis else: new_x temp_x new_y temp_y3.3 旋转操作的坐标变换旋转操作相对复杂些需要用到三角函数计算。核心公式是旋转矩阵新x (x - mid_x)*cosθ - (y - mid_y)*sinθ mid_x 新y (x - mid_x)*sinθ (y - mid_y)*cosθ mid_yPython实现new_x (temp_x - mid_width) * math.cos(math.radians(angel)) - (temp_y - mid_height) * math.sin(math.radians(angel)) mid_width new_y (temp_x - mid_width) * math.sin(math.radians(angel)) (temp_y - mid_height) * math.cos(math.radians(angel)) mid_height注意这里角度需要转换为弧度且旋转是绕图片中心点进行的。4. 完整代码实现与使用指南4.1 完整增强脚本下面是整合了所有功能的完整代码包含了左右镜像、上下镜像以及旋转增强from PIL import Image import os import glob import json import base64 import math # 配置参数 path your_dataset_path # 原始数据集路径 save_path your_output_path # 输出路径 file_format .jpg # 图片格式 replace_format .json # JSON文件格式 # 文件名前缀 LR lr_ # 左右镜像 TB tb_ # 上下镜像 R90 r90_ # 旋转90度 R180 r180_ # 旋转180度 R270 r270_ # 旋转270度 # 获取图片列表 img_list glob.glob(os.path.join(path, f*{file_format})) def mirror_lr(): 左右镜像增强 print(开始左右镜像处理...) for img_path in img_list: json_path img_path.replace(file_format, replace_format) if not os.path.exists(json_path): continue with open(json_path, encodingutf-8) as f: setting json.load(f) # 计算中轴并更新坐标 width setting[imageWidth] mid_width width / 2 for shape in setting[shapes]: for point in shape[points]: temp_x point[0] if temp_x mid_width: point[0] mid_width - (temp_x - mid_width) elif temp_x mid_width: point[0] mid_width (mid_width - temp_x) # 保存结果 file_name setting[imagePath] setting[imagePath] LR file_name img_save_path os.path.join(save_path, LR file_name) json_save_path img_save_path.replace(file_format, replace_format) # 处理图片 Image.open(img_path).transpose(Image.FLIP_LEFT_RIGHT).save(img_save_path) with open(img_save_path, rb) as f: setting[imageData] base64.b64encode(f.read()).decode() # 保存JSON with open(json_save_path, w, encodingutf-8) as f: json.dump(setting, f) def rotate(angle, prefix): 旋转增强 print(f开始旋转{angle}度处理...) rad math.radians(angle) cos_val math.cos(rad) sin_val math.sin(rad) for img_path in img_list: json_path img_path.replace(file_format, replace_format) if not os.path.exists(json_path): continue with open(json_path, encodingutf-8) as f: setting json.load(f) # 计算中心点并更新坐标 width setting[imageWidth] height setting[imageHeight] mid_width width / 2 mid_height height / 2 for shape in setting[shapes]: for point in shape[points]: x, y point[0] - mid_width, point[1] - mid_height point[0] x * cos_val - y * sin_val mid_width point[1] x * sin_val y * cos_val mid_height # 保存结果 file_name setting[imagePath] setting[imagePath] prefix file_name img_save_path os.path.join(save_path, prefix file_name) json_save_path img_save_path.replace(file_format, replace_format) # 处理图片 if angle 90: Image.open(img_path).transpose(Image.ROTATE_270).save(img_save_path) elif angle 180: Image.open(img_path).transpose(Image.ROTATE_180).save(img_save_path) elif angle 270: Image.open(img_path).transpose(Image.ROTATE_90).save(img_save_path) with open(img_save_path, rb) as f: setting[imageData] base64.b64encode(f.read()).decode() with open(json_save_path, w, encodingutf-8) as f: json.dump(setting, f) # 执行增强 mirror_lr() rotate(90, R90) rotate(180, R180) rotate(270, R270)4.2 使用说明修改脚本开头的路径配置path原始数据集路径save_path增强后数据保存路径file_format图片格式如.jpg、.png根据需要注释/取消注释最后的增强函数调用运行脚本后增强后的图片和JSON会自动保存到输出路径可以使用Labelme打开生成的JSON文件检查标注是否正确5. 实际应用中的优化建议5.1 批量处理与进度显示当处理大量图片时建议添加进度显示功能。可以这样修改total len(img_list) for idx, img_path in enumerate(img_list): print(f处理进度: {idx1}/{total} ({((idx1)/total)*100:.1f}%)) # 剩余处理代码...5.2 异常处理与日志记录为了增强脚本的健壮性应该添加异常处理try: with open(json_path, encodingutf-8) as f: setting json.load(f) except Exception as e: print(f处理{json_path}时出错: {str(e)}) continue5.3 多进程加速对于超大规模数据集可以使用多进程加速from multiprocessing import Pool def process_image(img_path): # 把原来的处理逻辑封装到这里 pass if __name__ __main__: with Pool(4) as p: # 4个进程 p.map(process_image, img_list)这个脚本我已经在实际项目中多次使用效果非常稳定。特别是在处理几千张图片的数据集时节省了数百小时的人工标注时间。最大的收获不仅是效率提升更重要的是保证了数据增强后标注的一致性——这是手动重标很难做到的。

相关文章:

告别手动重标:基于Python脚本的Labelme数据集增强与JSON同步更新实战

1. 为什么我们需要自动化处理Labelme标注数据 做计算机视觉项目的朋友都知道,数据标注是个体力活。特别是使用Labelme这类工具进行语义分割标注时,每张图片都要手动勾勒物体轮廓,工作量巨大。更让人头疼的是,当我们对原始图片进行…...

MT5中文增强工具多场景落地:保险条款通俗化改写与消费者理解度提升实践

MT5中文增强工具多场景落地:保险条款通俗化改写与消费者理解度提升实践 1. 项目概述与核心价值 MT5中文增强工具是一个基于Streamlit和阿里达摩院mT5模型构建的本地化NLP工具,专门针对中文文本进行语义改写和数据增强。这个工具的最大特点是能够在保持…...

大数据领域Spark的集群监控与管理

大数据领域Spark的集群监控与管理:从工厂仪表盘到智能调度的故事 关键词:Spark集群、监控指标、资源管理、性能调优、监控工具链 摘要:在大数据时代,Spark作为分布式计算的"超级引擎",支撑着企业从海量数据中…...

缺陷检测新利器:f-AnoGAN原理剖析与工业视觉实战

1. 工业视觉缺陷检测的痛点与挑战 在工业生产线上,产品表面缺陷检测一直是个让人头疼的问题。传统的人工检测方式效率低下,一个工人盯着传送带看8小时,漏检率能达到15%以上。我见过某家电企业质检车间,工人们需要检查微波炉门板上…...

ESP8266 AT指令实战:用NodeMCU连接WiFi并发送HTTP请求(2023最新版)

ESP8266 AT指令实战:用NodeMCU连接WiFi并发送HTTP请求(2023最新版) 当你拿起一块NodeMCU开发板时,它可能看起来只是块普通的电路板,但内置的ESP8266芯片让它成为了物联网开发的瑞士军刀。不同于Arduino需要额外WiFi模块…...

成长规划师 - OpenClaw助力个人发展

每周进步1%,一年后你会比现在优秀37倍你有没有过这样的感觉: 一周忙忙碌碌,周五回顾时却想不起做了什么重要的事?年初立下的flag,到了年底发现一个都没实现?羡慕别人技能满满,自己却不知道从哪里…...

从零开始构建你的渗透测试字典库:账号密码大字典与设备默认口令全解析

从零开始构建你的渗透测试字典库:账号密码大字典与设备默认口令全解析 在安全测试领域,一个高质量的字典库往往能决定渗透测试的效率上限。想象一下,当你面对一个需要爆破的系统时,手头拥有精准覆盖目标特征的字典,就…...

无GPU方案:星图平台OpenClaw镜像+百川2-13B-4bits的云端沙盒体验

无GPU方案:星图平台OpenClaw镜像百川2-13B-4bits的云端沙盒体验 1. 为什么选择云端沙盒方案 作为一个长期折腾本地AI部署的技术爱好者,我最近遇到了一个典型困境:想体验最新的OpenClaw智能体框架,但手头的MacBook Pro只有集成显…...

别再写重复代码了!手把手教你用StringRedisTemplate搞定Shop-Type缓存(附完整代码)

告别重复劳动:基于StringRedisTemplate的Shop-Type缓存通用方案设计 在电商系统开发中,店铺分类(Shop-Type)这类基础数据的缓存处理几乎每个项目都会遇到。许多开发者习惯在每个Service中重复编写相似的缓存逻辑——序列化、反序列化、缓存判空、数据库回…...

【限时开放】CPython核心团队亲授:2026 Python原生AOT编译接入Checklist(含12个预编译hook校验点)

第一章:Python原生AOT编译方案2026的演进背景与核心价值近年来,Python在云原生、边缘计算与实时系统场景中的部署瓶颈日益凸显:CPython解释器的启动延迟、内存开销及运行时JIT缺失,严重制约了其在低延迟服务、嵌入式Python模块和安…...

别再让WIFI信号‘水土不服’!Android 13高通平台国家码配置保姆级教程

Android 13高通平台WIFI国家码配置实战指南 当你的设备跨越国界,WIFI信号却开始"水土不服"——连接不稳定、速度骤降甚至完全无法使用。这背后往往不是硬件问题,而是国家码配置这个隐形门槛在作祟。作为深耕Android系统开发多年的技术专家&am…...

Python数据可视化实战:用matplotlib绘制专业级折线图(附完整代码)

Python数据可视化实战:用matplotlib绘制专业级折线图(附完整代码) 数据可视化是现代数据分析不可或缺的一环,而折线图作为最基础也最常用的图表类型之一,能够直观展示数据随时间或有序类别的变化趋势。对于Python开发者…...

别再傻傻匀速拖滑块了!用Python模拟真人鼠标轨迹,轻松过Geetest验证码

突破验证码防线:Python模拟人类行为轨迹的实战艺术 验证码系统正变得越来越智能,Geetest等平台已经能够通过分析用户行为模式来区分人类和机器。传统的匀速滑块操作在这些系统面前几乎无所遁形。本文将带你深入理解现代验证码系统的工作原理,…...

GAMES201实战:5分钟搞懂快速多极展开(FMM)在静电模拟中的应用

GAMES201实战:5分钟搞懂快速多极展开(FMM)在静电模拟中的应用 当你在游戏引擎中设计一个带电粒子系统时,是否遇到过这样的困境:随着粒子数量增加,计算速度呈指数级下降?传统N体问题计算需要处理每个粒子间的相互作用&a…...

避坑指南:RK3588 SD卡刷机时FAT32转EXT4的完整流程(含工具包)

RK3588大容量镜像烧写实战:突破FAT32限制的EXT4全流程解决方案 当你在RK3588开发板上尝试烧写超过4GB的Ubuntu或Debian镜像时,是否遇到过SD卡工具报错?这不是你的操作问题,而是FAT32文件系统的天然限制。本文将带你深入理解这一技…...

SQL注入的分类靶场实践

SQL注入的分类靶场实践 前言 SQL 注入(SQL Injection)是一种常见且危险的 Web 安全漏洞,攻击者通过在输入字段中插入恶意 SQL 代码,能够绕过应用程序的验证机制,直接操纵数据库。本文将介绍 SQL 注入的分类&#xff…...

Qwen3-0.6B-FP8在SolidWorks设计中的应用探索

Qwen3-0.6B-FP8在SolidWorks设计中的应用探索 1. 引言 作为一名机械设计师,你是否曾经遇到过这样的困扰:在SolidWorks中反复调整参数却始终达不到理想效果,或者设计完成后才发现某个关键尺寸存在冲突?传统的设计流程往往依赖设计…...

告别彻夜等待:SteamShutdown让游戏下载完成后自动关机的智能解决方案

告别彻夜等待:SteamShutdown让游戏下载完成后自动关机的智能解决方案 【免费下载链接】SteamShutdown Automatic shutdown after Steam download(s) has finished. 项目地址: https://gitcode.com/gh_mirrors/st/SteamShutdown 你是否也曾经历过这样的困扰&a…...

FPGA开发实战:GT收发器配置避坑指南(附8B10B与64B66B编码对比)

FPGA开发实战:GT收发器配置避坑指南(附8B10B与64B66B编码对比) 在高速数字电路设计中,GT收发器作为FPGA与外部世界的高速数据通道,其配置的精确性直接决定了系统稳定性。本文将深入探讨GT收发器配置中的关键细节&#…...

XMind快捷键背不会?试试我这套‘肌肉记忆’训练法,用这5个高频组合搞定80%的绘图

XMind快捷键肌肉记忆训练法:5个高频组合提升80%绘图效率 刚接触XMind时,我总在菜单栏里来回翻找功能按钮,每次画完一张思维导图手腕都隐隐发酸。直到发现产品总监小王能在十分钟内完成我半小时的工作量——他的双手几乎没离开过键盘&#xff…...

Blender材质渲染实战:从基础设置到Eevee引擎优化

1. Blender材质渲染基础入门 第一次打开Blender时,那个默认的灰色立方体看起来平平无奇,但这就是我们探索材质世界的起点。材质就像给3D模型穿衣服,决定了它看起来是金属、塑料还是玻璃。在Blender中操作材质其实很简单,我刚开始学…...

DanKoe 视频笔记:阅读:改变你生活的简单习惯:概述与引言

https://github.com/OpenDocCN/wealth-notes-zh/raw/master/docs/dankoe/img22971bb5176092c90f7464d7a7aa6e45.png 在本节课中,我们将学习如何通过培养阅读习惯来深刻地改变你的生活。我们将探讨阅读的重要性、如何选择书籍、如何有效阅读,以及如何将阅…...

别再只生成exe了:用MSFvenom制作更隐蔽的Windows 11后门(附检测与清除)

Windows 11高级渗透测试:从隐蔽后门构建到防御检测实战 在网络安全攻防演练中,传统的可执行文件Payload已经难以绕过现代终端防护系统。随着Windows 11安全机制的持续强化,红队需要掌握更隐蔽的渗透技术,而蓝队则必须了解这些新型…...

旧设备优化指南:iPhone 6s系统降级与性能提升全攻略

旧设备优化指南:iPhone 6s系统降级与性能提升全攻略 【免费下载链接】Legacy-iOS-Kit An all-in-one tool to downgrade/restore, save SHSH blobs, and jailbreak legacy iOS devices 项目地址: https://gitcode.com/gh_mirrors/le/Legacy-iOS-Kit 当你的iP…...

给SAP财务新人的年结实操笔记:从FAGLGVTR总账结转到F.07往来结转,一次讲清

SAP财务年结实战指南:从总账到往来的完整逻辑解析 刚接触SAP财务模块的新人面对年结时,往往会被一连串的事务代码和操作步骤弄得晕头转向。FAGLGVTR、AJRW、F.07这些看似冰冷的代码背后,其实蕴含着清晰的财务逻辑。本文将带你穿透操作表象&am…...

从一次数据精度丢失的坑说起:详解Pandas fillna的‘静默下转型’与infer_objects的正确用法

从数据精度陷阱到稳健处理:Pandas类型转换的深度防御实践 1. 当.fillna(0)成为数据分析的隐形杀手 凌晨三点的办公室,咖啡杯早已见底。数据分析师李明盯着屏幕上诡异的报表结果——所有百分比计算结果突然变成了整齐的整数。这个看似简单的数据清洗操作…...

唯品会数据采集API接口||电商API数据采集

唯品会数据采集,优先走合规第三方 API(个人 / 企业均可);企业可申请官方开放平台 API(仅限合作方)。一、合规路径选择(必看)1. 官方开放平台(企业级)入口&…...

全学科适用AI写作辅助网站排行榜(2026 实测推荐)

基于功能完整性、学术适配性、用户反馈及操作便捷性,以下是当前主流AI论文写作工具的实测排名,按综合使用价值从高到低依次呈现,并附上各平台的核心优势与适用人群。🏆 第一梯队:全流程学术解决方案(★★★…...

告别‘Illegal instruction’:为老旧ARM芯片(如鲲鹏920)定制MongoDB 4.4.9的完整避坑流程

为老旧ARM芯片定制MongoDB 4.4.9的完整避坑指南 当你在国产ARM服务器上部署MongoDB时,是否遇到过Illegal instruction错误?这个问题往往源于硬件与软件版本之间的指令集不匹配。本文将带你深入理解ARM架构的版本差异,并提供一套完整的解决方案…...

Fish-Speech-1.5 API调用教程:Python脚本批量生成语音

Fish-Speech-1.5 API调用教程:Python脚本批量生成语音 1. 为什么选择Fish-Speech-1.5进行批量语音生成 在日常工作中,我们经常遇到需要将大量文本转换为语音的场景。无论是为视频内容生成旁白,还是为电子书制作有声版本,传统的人…...