当前位置: 首页 > article >正文

Labelme标注遥感影像太麻烦?我的自动化预处理与格式统一脚本分享

遥感影像标注效率革命从Labelme JSON到训练就绪数据集的自动化流水线在计算机视觉项目中数据标注往往是耗时最长的环节。特别是对于遥感影像语义分割任务标注工作不仅需要专业知识还涉及大量重复性操作——格式转换、颜色映射调整、文件批量处理等。传统手工处理方式效率低下且容易出错这正是我们需要构建自动化流水线的原因。1. 为什么需要自动化标注后处理标注工具如Labelme虽然提供了友好的交互界面但生成的JSON文件并不能直接用于模型训练。典型问题包括格式不匹配Labelme默认输出多通道PNG而多数框架需要单通道灰度图颜色编码混乱不同标注者可能使用不同颜色值表示同类地物批量处理困难手动操作无法应对数百GB的遥感影像数据集元数据丢失原始标注中的多边形信息在转换过程中可能被简化我曾参与一个城市建筑物提取项目初始阶段团队花费70%时间在数据准备上。直到开发了这套自动化工具链效率提升了300%让我们能够专注于模型优化而非数据整理。2. 核心工具链与技术选型我们的自动化流水线基于以下技术栈构建工具/库用途优势Python 3.8流程控制丰富的生态库支持OpenCV图像处理高效的矩阵运算GDAL遥感数据读取专业级地理数据处理tqdm进度显示直观的批量处理反馈json标注解析原生支持Labelme格式# 基础依赖安装 pip install opencv-python gdal tqdm numpy对于Sentinel-2 MSI这类多光谱数据GDAL提供了比普通图像库更专业的波段处理能力。以下是读取16位遥感数据并转换为8位RGB的典型操作from osgeo import gdal import numpy as np def read_band(band_path): dataset gdal.Open(band_path) band dataset.GetRasterBand(1) return band.ReadAsArray() # 读取三波段并合并 blue read_band(B02_10m.jp2) green read_band(B03_10m.jp2) red read_band(B04_10m.jp2) # 动态范围调整到0-255 rgb_stack np.dstack([ ((red - red.min()) * 255 / (red.max() - red.min())).astype(uint8), ((green - green.min()) * 255 / (green.max() - green.min())).astype(uint8), ((blue - blue.min()) * 255 / (blue.max() - blue.min())).astype(uint8) ])3. Labelme标注转换全流程解析3.1 JSON解析与基础转换Labelme生成的JSON文件包含完整的标注元数据我们需要先提取这些信息import json import cv2 def parse_labelme_json(json_path): with open(json_path) as f: data json.load(f) # 创建空白标注画布 height, width data[imageHeight], data[imageWidth] label_img np.zeros((height, width), dtypenp.uint8) # 绘制每个多边形区域 for shape in data[shapes]: points np.array(shape[points], dtypenp.int32) cv2.fillPoly(label_img, [points], colorCLASS_COLORS[shape[label]]) return label_img注意CLASS_COLORS应为预定义的类别颜色映射字典确保不同类别使用统一颜色值3.2 批量处理与文件管理实际项目中需要处理成百上千个标注文件合理的文件组织至关重要dataset_root/ ├── raw_images/ # 原始影像 ├── labelme_json/ # Labelme原始标注 ├── processed_labels/ # 转换后的单通道标签 └── visualizations/ # 用于质检的可视化结果批量转换脚本核心逻辑from pathlib import Path from tqdm import tqdm def batch_convert(json_dir, output_dir): json_files list(Path(json_dir).glob(*.json)) for json_path in tqdm(json_files): label_img parse_labelme_json(json_path) output_path Path(output_dir) / f{json_path.stem}.png cv2.imwrite(str(output_path), label_img)3.3 高级颜色映射策略对于多类别语义分割建议采用可配置的颜色映射方案class ColorMapper: def __init__(self, config_path): with open(config_path) as f: self.config json.load(f) def map_color(self, label_name): return self.config[classes][label_name][color] def save_config(self, path): with open(path, w) as f: json.dump(self.config, f, indent2) # 示例配置文件 { classes: { building: {color: 1, train_id: 0}, road: {color: 2, train_id: 1}, water: {color: 3, train_id: 2} } }4. 遥感数据特殊处理技巧4.1 多光谱数据优化处理Sentinel-2 MSI数据时直接使用RGB波段可能丢失有价值信息def enhance_contrast(image, percentile1): 1%线性拉伸增强 min_val np.percentile(image, percentile) max_val np.percentile(image, 100-percentile) stretched 255 * (image - min_val) / (max_val - min_val) return np.clip(stretched, 0, 255).astype(uint8) # 对每个波段单独增强 enhanced_bands [enhance_contrast(band) for band in [red, green, blue]]4.2 大尺寸影像分块处理遥感影像通常尺寸巨大需要分块处理def tile_image(image, tile_size256): 将大图像分割为小方块 height, width image.shape[:2] tiles [] for y in range(0, height, tile_size): for x in range(0, width, tile_size): tile image[y:ytile_size, x:xtile_size] if tile.shape[0] tile_size and tile.shape[1] tile_size: tiles.append(tile) return tiles4.3 标注质量自动检查开发自动化质检脚本能大幅减少人工复核时间def validate_label(label_img, min_area10): 检查标注合理性 contours, _ cv2.findContours( label_img, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) issues [] for cnt in contours: area cv2.contourArea(cnt) if area min_area: issues.append({ area: area, bbox: cv2.boundingRect(cnt) }) return issues5. 实战端到端自动化流水线将所有组件整合为完整工作流class AnnotationPipeline: def __init__(self, config): self.config config self.color_mapper ColorMapper(config[color_map]) def process_single(self, image_path, json_path): # 1. 读取并增强原始影像 image self.load_image(image_path) # 2. 解析标注JSON label parse_labelme_json(json_path) # 3. 格式转换与颜色统一 train_label self.map_to_train_ids(label) # 4. 分块处理 image_tiles tile_image(image) label_tiles tile_image(train_label) return image_tiles, label_tiles def batch_process(self, image_dir, json_dir, output_dir): # 批量处理逻辑 pass典型使用场景pipeline AnnotationPipeline(config.json) image_tiles, label_tiles pipeline.process_single(image.tif, label.json) # 保存结果 for i, (img, lbl) in enumerate(zip(image_tiles, label_tiles)): cv2.imwrite(ftile_{i}_img.png, img) cv2.imwrite(ftile_{i}_lbl.png, lbl)在最近的地表覆盖分类项目中这套流水线帮助团队在2周内完成了原本需要2个月的数据准备工作。最关键的是它确保了所有输出数据格式统一完全避免了因手工操作导致的数据不一致问题。

相关文章:

Labelme标注遥感影像太麻烦?我的自动化预处理与格式统一脚本分享

遥感影像标注效率革命:从Labelme JSON到训练就绪数据集的自动化流水线 在计算机视觉项目中,数据标注往往是耗时最长的环节。特别是对于遥感影像语义分割任务,标注工作不仅需要专业知识,还涉及大量重复性操作——格式转换、颜色映射…...

天池金融数据赛保姆级复盘:从数据清洗到LightGBM调参,手把手教你拿下银行客户预测0.9676

金融数据竞赛实战:从数据清洗到模型调优的完整方法论 在数据科学竞赛中,金融领域的预测问题往往具有独特的挑战性——高维度特征、类别不平衡以及业务逻辑的复杂性。本文将以天池教学赛"银行客户认购产品预测"为例,系统梳理一个完整…...

Blender 3.6 玻璃材质避坑指南:从‘塑料感’到通透‘凹凸渐变玻璃’的完整心路

Blender 3.6 玻璃材质进阶实战:从塑料感到艺术级通透效果的深度解析 第一次在Blender中尝试制作玻璃材质时,我满怀期待地点击了渲染按钮,结果却得到了一个看起来像廉价塑料杯的模型。这种挫败感可能很多Blender用户都经历过——明明按照基础教…...

从Android 7.0到11:APK签名方案V1到V4的演进与实战踩坑记录

Android签名方案演进:从V1到V4的技术深潜与实战指南 在移动应用开发领域,APK签名机制如同数字世界的身份证,它不仅是应用合法性的证明,更是Android生态安全架构的基石。作为一名经历过从Android 7.0到11完整迭代周期的开发者&…...

Sqoop增量导入实战:如何只同步MySQL里新增和变化的数据?

Sqoop增量导入实战:如何高效同步MySQL新增与变更数据 在大数据生态系统中,数据同步的实时性往往决定了分析结果的时效价值。想象这样一个场景:每天有数百万条订单数据涌入MySQL,而你的Hive数据仓库需要保持近乎实时的更新。全表导…...

ESP32接HC-SR04超声波模块,5V Echo信号怎么安全处理?一个电阻分压电路搞定

ESP32与HC-SR04超声波模块的5V信号安全处理实战指南 引言 第一次使用ESP32连接HC-SR04超声波模块时,我犯了一个几乎所有初学者都会犯的错误——直接将Echo引脚接到ESP32的GPIO上。结果?一块价值不菲的开发板就这样报废了。这个惨痛教训让我深刻认识到5V信…...

Mac M1芯片避坑实录:手把手教你搞定ModelScope深度学习库(附TensorFlow兼容方案)

Mac M1芯片避坑实录:手把手教你搞定ModelScope深度学习库(附TensorFlow兼容方案) 当苹果推出搭载M1芯片的Mac设备时,整个开发者社区都为它的性能表现而兴奋。然而,这份喜悦很快被一个现实问题冲淡——许多深度学习工具…...

网络不稳定时,如何手动下载Chocolatey 1.1.0 nupkg文件完成离线安装(保姆级避坑)

网络不稳定环境下Chocolatey离线安装全指南:从nupkg下载到避坑实战 Windows系统下的软件包管理工具Chocolatey因其便捷性深受开发者喜爱,但当网络环境不稳定时,官方一键安装脚本常常因下载超时而失败。本文将手把手教你如何通过手动下载nupkg…...

NodeMCU PyFlasher:5分钟快速掌握ESP8266固件烧录的终极图形化工具

NodeMCU PyFlasher:5分钟快速掌握ESP8266固件烧录的终极图形化工具 【免费下载链接】nodemcu-pyflasher Self-contained NodeMCU flasher with GUI based on esptool.py and wxPython. 项目地址: https://gitcode.com/gh_mirrors/no/nodemcu-pyflasher NodeM…...

从一次Docker镜像构建失败说起:深入理解ldconfig在容器环境下的特殊用法

从一次Docker镜像构建失败说起:深入理解ldconfig在容器环境下的特殊用法 那天凌晨三点,监控系统突然报警——我们刚部署的微服务在Kubernetes集群中频繁崩溃。查看日志发现全是libxxx.so.1: cannot open shared object file这类错误。奇怪的是&#xff0…...

逆向与爬虫实战:手把手教你用mitmproxy+MuMu模拟器抓取APP数据(Python脚本入门)

移动端数据抓取实战:从零构建mitmproxy与MuMu模拟器的自动化抓包系统 在移动互联网时代,应用数据抓取已成为开发者必备的核心技能之一。无论是进行竞品分析、接口调试,还是构建自动化测试流程,能够精准捕获并解析APP的网络请求都显…...

从‘画面撕裂’到‘自适应同步’:聊聊游戏图形API(OpenGL/DirectX)里控制垂直同步的那几行代码

从‘画面撕裂’到‘自适应同步’:游戏图形API中的垂直同步实战解析 第一次在屏幕上看到自己编写的3D场景动起来时,那种兴奋感至今难忘。但当镜头快速旋转,画面突然出现一道明显的水平裂痕——就像有人用刀划开了显示屏——我才意识到图形编程…...

StarRailCopilot终极指南:专业级崩坏星穹铁道自动化脚本解决方案

StarRailCopilot终极指南:专业级崩坏星穹铁道自动化脚本解决方案 【免费下载链接】StarRailCopilot 崩坏:星穹铁道脚本 | Honkai: Star Rail auto bot (简体中文/繁體中文/English/Espaol) 项目地址: https://gitcode.com/gh_mirrors/st/StarRailCopil…...

C# WinForm 工作流设计 工作流程图拖拽设计 +GDI 绘制工作流程图 大概功能说明一...

C# WinForm 工作流设计 工作流程图拖拽设计 GDI 绘制工作流程图 大概功能说明一下:1.支持拖动绘制工作节点2.支持移动每个节点的移动3.支持直线连接节点4.支持节点移动连接线自动跟随5.支持高亮显示选中的节点连线6.支持能删除选中节点和连线7.支持选中节点能显示节…...

别再用官方教程了!用Awesome-Backbones库5分钟搞定EfficientNetV2图像分类(附花卉数据集实战)

5分钟极速实战:用Awesome-Backbones解锁EfficientNetV2图像分类新姿势 当你第一次接触图像分类任务时,是否曾被PyTorch官方教程中复杂的代码结构和繁琐的配置步骤劝退?现在,一个名为Awesome-Backbones的开源库正在改变这一现状。这…...

【进阶指南】3dMax散布(Scatter)工具:从基础随机到可控艺术化分布

1. 理解Scatter工具的核心逻辑 3dMax的Scatter工具本质上是一个空间分布控制器,它解决的不仅是"如何放"的问题,更是"如何放得好看"的问题。很多人在使用这个工具时容易陷入两个极端:要么完全依赖默认的随机分布&#xff…...

从MASM到NASM:为什么我换了汇编编译器?聊聊开源NASM的几大爽点

从MASM到NASM:为什么我换了汇编编译器?聊聊开源NASM的几大爽点 记得第一次用MASM写汇编时,光是段定义和伪指令就折腾了半小时。当屏幕上终于跳出"Hello World"时,成就感还没持续三秒,就被同事一句"试试…...

从‘找色块’到‘追小球’:用K210实现一个简易颜色追踪机器人(代码开源)

从静态识别到动态追踪:K210颜色追踪机器人开发实战 在创客教育和小型机器人开发领域,视觉追踪一直是个令人着迷的技术方向。想象一下,你的机器人能够像宠物一样跟随彩色小球移动,或者自动追踪特定颜色的目标——这正是K210芯片结合…...

车载以太网DoIP网关:是选透传还是非透传?一次讲清TBOX与诊断仪的不同配置策略

车载以太网DoIP网关:透传与非透传模式的技术决策指南 当工程师第一次面对车载以太网诊断架构设计时,往往会在边缘节点的配置策略上陷入两难——选择透传模式还是非透传模式?这个看似简单的选择题背后,实则牵动着整车电子电气架构的…...

别再死记硬背了!用Vector Configurator Pro搞定AutoSar BSW_ECUC配置的保姆级流程

Vector Configurator Pro实战:AutoSar BSW_ECUC配置从入门到精通 第一次打开Vector Configurator Pro时,面对密密麻麻的配置项和晦涩的AutoSar术语,大多数工程师都会感到无从下手。ECUC模块作为BSW层的基础配置核心,直接影响着整个…...

Windows安卓应用安装器终极指南:告别臃肿模拟器,轻量级跨平台解决方案

Windows安卓应用安装器终极指南:告别臃肿模拟器,轻量级跨平台解决方案 【免费下载链接】APK-Installer An Android Application Installer for Windows 项目地址: https://gitcode.com/GitHub_Trending/ap/APK-Installer 你是否曾经遇到过这样的困…...

如何在Linux系统上轻松读取Microsoft Access数据库:MDB Tools完整指南

如何在Linux系统上轻松读取Microsoft Access数据库:MDB Tools完整指南 【免费下载链接】mdbtools MDB Tools - Read Access databases on *nix 项目地址: https://gitcode.com/gh_mirrors/md/mdbtools 你是否曾经需要在Linux或macOS系统上处理Microsoft Acce…...

超维计算与DECOHD:高维向量压缩技术解析

1. 超维计算基础与DECOHD创新概述超维计算(Hyperdimensional Computing, HDC)是一种革命性的计算范式,它利用高维空间(通常维度D在1,000-10,000之间)的数学特性来实现高效的信息表示和处理。与传统机器学习方法不同&am…...

TensorFlow图像识别优化:从数据增强到模型部署

1. 项目概述与核心目标在上一篇文章中,我们已经完成了TensorFlow环境搭建和基础图像分类模型的构建。这次我们将深入探讨如何优化这个简单的图像识别系统,使其具备更高的准确率和更强的实用性。本教程适合已经掌握TensorFlow基础操作,希望提升…...

Linux内核驱动开发踩坑记:为什么我的Makefile一编译就报错?原来是-Werror在搞鬼

Linux内核驱动开发实战:当-Werror让编译崩溃时如何精准排雷 深夜两点,屏幕上的红色错误信息格外刺眼——昨天还能正常编译的内核模块,今天突然因为几个"无关紧要"的未使用变量报错退出。这种场景对Linux内核开发者来说再熟悉不过&a…...

AI时代内存层次重构:从五分钟规则到秒级缓存决策

1. 内存层次重构:从五分钟规则到秒级缓存决策1987年,Jim Gray和Gianfranco Putzolu提出了著名的五分钟规则,这个简单的经济学启发式方法指导我们何时应该将数据保留在DRAM中,而不是从存储设备中获取。这个规则的核心思想是&#x…...

免费音乐解锁工具:3分钟搞定QQ音乐、网易云加密文件解密

免费音乐解锁工具:3分钟搞定QQ音乐、网易云加密文件解密 【免费下载链接】unlock-music 在浏览器中解锁加密的音乐文件。原仓库: 1. https://github.com/unlock-music/unlock-music ;2. https://git.unlock-music.dev/um/web 项目地址: htt…...

SAP ABAP表控件(Table Control)实战:从向导生成到手工打造可编辑数据表格

SAP ABAP表控件深度实战:从快速生成到高级交互设计 在SAP Dialog程序开发中,Table Control(表控件)是实现数据批量维护的核心组件。不同于简单的数据显示控件,Table Control需要开发者深入理解ABAP屏幕编程中的PBO/PAI…...

别再手动改PR了!教你写个ABAP报表,一键批量处理采购申请审批与信息更新

告别低效操作:用ABAP打造智能采购申请批量处理系统 每天面对数百条采购申请的状态更新和文本修改,你是否已经厌倦了重复的点击和等待?在SAP系统中,采购申请的日常维护往往成为业务人员的时间黑洞。本文将带你从零开始构建一个智能…...

Python之基础函数案例详解

函数的定义格式:12def 函数名():函数代码使用当前文件的函数我们直接定义一个函数然后运行程序, 函数并不会被调用12def hello():print(hello)想要函数被执行, 需要使用函数名来调用函数1234567# 定义函数def hello():print(hello)# 调用函数hello()需要注意的是, 在有些语言中…...