红外变电站分割数据集,标注为json格式,总共有5类,避雷器(289张),绝缘子(919张),电流互感器(413张),套管(161张),电压互感器(153张)

红外变电站分割数据集,标注为json格式,总共有5类

避雷器(289张),绝缘子(919张),电流互感器(413张),套管(161张),电压互感器(153张)


红外变电站分割数据集 (Infrared Substation Segmentation Dataset)
数据集概述
该数据集是一个专门用于训练和评估红外图像中变电站设备分割模型的数据集。数据集包含约1935张红外图像,每张图像都带有详细的标注信息,标注格式为JSON格式。这些图像涵盖了五种不同类型的变电站设备:避雷器、绝缘子、电流互感器、套管和电压互感器。适用于基于深度学习的语义分割任务,通过这个数据集,可以训练出能够在红外图像中准确分割和识别不同类型变电站设备的模型,从而帮助进行电力设施维护、故障检测等应用。
数据集特点
- 高质量红外图像:数据集中的图像均为红外成像,具有高分辨率,能够提供丰富的温度分布信息,特别适合变电站设备的特征分析。
- 带标注:每张图像都有详细的标注信息,包括设备的位置和边界。
- JSON格式标注:标注信息以JSON格式提供,方便直接使用于支持JSON格式的语义分割框架。
- 实际应用场景:适用于需要精确分割和识别红外图像中变电站设备的场景,如电力设施维护、故障检测系统等。
数据集结构
infrared_substation_segmentation_dataset/
├── images/ # 图像文件
│ ├── 00001.jpg # 示例图像
│ ├── 00002.jpg
│ └── ...
├── annotations/ # JSON格式标注文件
│ ├── 00001.json # 示例JSON标注文件
│ ├── 00002.json
│ └── ...
├── data.yaml # 类别描述文件
├── README.md # 数据集说明
└── model/ # 预训练模型文件夹(可选)└── infrared_substation_segmentation_model.pth # 预训练模型(如果有的话)
数据集内容
-
images/- 功能:存放图像文件。
- 内容:
00001.jpg:示例图像。00002.jpg:另一张图像。- ...
-
annotations/- 功能:存放JSON格式的标注文件。
- 内容:
00001.json:示例JSON标注文件。00002.json:另一张图像的JSON标注文件。- ...
-
data.yaml- 功能:定义数据集的类别和其他相关信息。
- 内容: yaml
深色版本
train: infrared_substation_segmentation_dataset/images val: infrared_substation_segmentation_dataset/images nc: 5 names: ['arrester', 'insulator', 'current transformer', 'bushing', 'voltage transformer']
-
README.md- 功能:数据集的详细说明文档。
- 内容:
- 数据集的来源和用途。
- 数据集的结构和内容。
- 如何使用数据集进行模型训练和评估。
- 其他注意事项和建议。
-
model/(可选)- 功能:存放预训练模型文件。
- 内容:
infrared_substation_segmentation_model.pth:预训练的模型文件(如果有的话)。
数据集统计

- 总图像数量:约1935张
- 类别:5类
- 类别列表及图像数量:
arrester(避雷器):289张insulator(绝缘子):919张current transformer(电流互感器):413张bushing(套管):161张voltage transformer(电压互感器):153张
使用说明
- 环境准备:确保安装了常用的深度学习库,例如
torch,torchvision,numpy等。 - 数据集路径设置:将数据集解压到项目目录下,并确保路径正确。
- 加载预训练模型:如果有预训练模型,可以直接加载并对其进行微调或直接使用。
- 数据增强:可以通过随机翻转、旋转等方法增加数据多样性,提高模型鲁棒性。
- 超参数调整:根据实际情况调整学习率、批大小等超参数,以获得最佳训练效果。
- 硬件要求:建议使用GPU进行训练和推理,以加快处理速度。如果没有足够的计算资源,可以考虑使用云服务提供商的GPU实例。
- 类别平衡:虽然数据集中各类别的样本数量相对均衡,但在实际应用中可能需要进一步检查并处理类别不平衡问题,例如通过过采样或欠采样方法。
关键代码示例
以下是一个使用PyTorch和torchvision库进行红外变电站设备分割的示例代码。我们将使用预训练的DeepLab v3+模型,并对其进行微调以适应我们的数据集。
import torch
import torchvision
from torchvision.models.segmentation import deeplabv3_resnet101
from torchvision.transforms import functional as F
from torch.utils.data import DataLoader, Dataset
from PIL import Image
import os
import json
import numpy as np# 自定义数据集类
class InfraredSubstationSegmentationDataset(Dataset):def __init__(self, root, transforms=None):self.root = rootself.transforms = transformsself.imgs = list(sorted(os.listdir(os.path.join(root, "images"))))self.annotations = list(sorted(os.listdir(os.path.join(root, "annotations"))))def __getitem__(self, idx):img_path = os.path.join(self.root, "images", self.imgs[idx])annotation_path = os.path.join(self.root, "annotations", self.annotations[idx])img = Image.open(img_path).convert("RGB")with open(annotation_path, 'r') as f:annotation = json.load(f)mask = np.zeros((img.height, img.width), dtype=np.uint8)for obj in annotation['objects']:class_id = {'arrester': 1,'insulator': 2,'current transformer': 3,'bushing': 4,'voltage transformer': 5}[obj['class']]polygon = np.array(obj['polygon'])cv2.fillPoly(mask, [polygon], class_id)mask = Image.fromarray(mask)if self.transforms is not None:img, mask = self.transforms(img, mask)return F.to_tensor(img), F.to_tensor(mask)def __len__(self):return len(self.imgs)# 数据预处理
def get_transform(train):transforms = []if train:transforms.append(torchvision.transforms.RandomHorizontalFlip(0.5))return torchvision.transforms.Compose(transforms)# 加载数据集
dataset = InfraredSubstationSegmentationDataset(root='infrared_substation_segmentation_dataset', transforms=get_transform(train=True))
dataset_test = InfraredSubstationSegmentationDataset(root='infrared_substation_segmentation_dataset', transforms=get_transform(train=False))indices = torch.randperm(len(dataset)).tolist()
dataset = torch.utils.data.Subset(dataset, indices[:-193])
dataset_test = torch.utils.data.Subset(dataset_test, indices[-193:])data_loader = DataLoader(dataset, batch_size=2, shuffle=True, num_workers=4, collate_fn=lambda x: tuple(zip(*x)))
data_loader_test = DataLoader(dataset_test, batch_size=1, shuffle=False, num_workers=4, collate_fn=lambda x: tuple(zip(*x)))# 定义模型
model = deeplabv3_resnet101(pretrained=True)
model.classifier[-1] = torch.nn.Conv2d(256, 6, kernel_size=(1, 1), stride=(1, 1)) # 5类 + 背景
model.aux_classifier[-1] = torch.nn.Conv2d(256, 6, kernel_size=(1, 1), stride=(1, 1)) # 5类 + 背景# 设置设备
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)# 定义优化器
params_to_optimize = [{"params": [p for p in model.backbone.parameters() if p.requires_grad]},{"params": [p for p in model.classifier.parameters() if p.requires_grad]},
]
optimizer = torch.optim.SGD(params_to_optimize, lr=0.005, momentum=0.9, weight_decay=0.0005)# 训练模型
num_epochs = 10
for epoch in range(num_epochs):model.train()for images, targets in data_loader:images = list(image.to(device) for image in images)targets = list(target.to(device) for target in targets)optimizer.zero_grad()outputs = model(images)loss = torch.nn.functional.cross_entropy(outputs['out'], targets)if 'aux' in outputs:loss += 0.5 * torch.nn.functional.cross_entropy(outputs['aux'], targets)loss.backward()optimizer.step()print(f'Epoch {epoch+1}/{num_epochs}, Loss: {loss.item()}')# 验证模型model.eval()with torch.no_grad():for images, targets in data_loader_test:images = list(image.to(device) for image in images)targets = list(target.to(device) for target in targets)outputs = model(images)# 保存模型
torch.save(model.state_dict(), 'infrared_substation_segmentation_model.pth')
注意事项
- 数据格式:确保输入的数据格式正确,特别是图像文件和标注文件的格式。
- 超参数调整:根据实际情况调整学习率、批大小等超参数,以获得最佳训练效果。
- 硬件要求:建议使用GPU进行训练和推理,以加快处理速度。如果没有足够的计算资源,可以考虑使用云服务提供商的GPU实例。
- 数据增强:可以通过数据增强技术(如随机翻转、旋转等)来增加模型的鲁棒性。
- 模型选择:除了DeepLab v3+,还可以尝试其他语义分割模型,如U-Net、FCN等,以找到最适合当前任务的模型。
- 类别平衡:虽然数据集中各类别的样本数量相对均衡,但在实际应用中可能需要进一步检查并处理类别不平衡问题,例如通过过采样或欠采样方法。
通过上述步骤,你可以成功地使用这个高质量的红外变电站分割数据集进行模型训练和评估。该数据集不仅适用于学术研究,还可以应用于实际的电力设施维护、故障检测系统等领域,帮助提升对红外图像中变电站设备的分割准确性和效率。希望这个数据集能帮助你更好地理解和应用最新的深度学习技术。

相关文章:
红外变电站分割数据集,标注为json格式,总共有5类,避雷器(289张),绝缘子(919张),电流互感器(413张),套管(161张),电压互感器(153张)
红外变电站分割数据集,标注为json格式,总共有5类 避雷器(289张),绝缘子(919张),电流互感器(413张),套管(161张)࿰…...
HBase 性能优化 详解
HBase 是基于 Hadoop HDFS 之上的分布式 NoSQL 数据库,具有高伸缩性和强大的读写能力。然而,由于其分布式架构和复杂的数据存储模式,在高并发、大规模数据场景下,HBase 性能优化至关重要。从底层原理和源代码层面理解 HBase 的特性…...
杭电2041-2050
2041 这里进入递归专题了 #include<bits/stdc.h> #include<iostream> //简单递归 using namespace std; long long int M[45]; int main() {int n;M[1]1;M[2]1;for(int i3;i<45;i){M[i]M[i-1]M[i-2];}while(cin>>n){while(n--){int m;cin>>m;cout…...
Ambari搭建Hadoop集群 — — 问题总结
Ambari搭建Hadoop集群 — — 问题总结 一、部署教程: 参考链接:基于Ambari搭建大数据分析平台-CSDN博客 二、问题总结: 1. VMwear Workstation 查看网关 2. 资源分配 参考: 硬盘:master(29 GBÿ…...
如何用python抓取豆瓣电影TOP250
1.如何获取网站信息? (1)调用requests库、bs4库 #检查库是否下载好的方法:打开终端界面(terminal)输入pip install bs4, 如果返回的信息里有Successfully installed bs4 说明安装成功(request…...
鸽笼原理与递归 - 离散数学系列(四)
目录 1. 鸽笼原理 鸽笼原理的定义 鸽笼原理的示例 鸽笼原理的应用 2. 递归的定义与应用 什么是递归? 递归的示例 递归与迭代的对比 3. 实际应用 鸽笼原理的实际应用 递归的实际应用 4. 例题与练习 例题1:鸽笼原理应用 例题2:递归…...
Ubuntu 20.04常见配置(含yum源替换、桌面安装、防火墙设置、ntp配置)
Ubuntu 20.04常见配置 1. yum源配置2. 安装桌面及图形化2.1 安装图形化桌面2.1.1 选择安装gnome桌面2.1.2 选择安装xface桌面 2.2 安装VNC-Server 3. ufw防火墙策略4. 时区设置及NTP时间同步4.1 时区设置4.2 NTP安装及时间同步4.2.1 服务端(例:172.16.32…...
AI学习指南深度学习篇-生成对抗网络的基本原理
AI学习指南深度学习篇-生成对抗网络的基本原理 引言 生成对抗网络(Generative Adversarial Networks, GANs)是近年来深度学习领域的一个重要研究方向。GANs通过一种创新的对抗训练机制,能够生成高质量的样本,其应用范围广泛&…...
什么是网络安全
网络安全是指通过采取必要措施,防范对网络的攻击、侵入、干扰、破坏和非法使用以及意外事故,使网络处于稳定可靠运行的状态,以及保障网络数据的完整性、保密性、可用性的能力。 网络安全涉及多个层面,包括硬件、软件及其系统中数…...
Redis list 类型
list类型 类型介绍 列表类型 list 相当于 数组或者顺序表 list内部的编码方式更接近于 双端队列 ,支持头插 头删 尾插 尾删。 需要注意的是,Redis的下标支持负数下标。 比如数组大小为5,那么要访问下标为 -2 的值可以理解为访问 5 - 2 3 …...
Linux更改固定IP地址
1.VMware里更改虚拟网络 一: 二: 三:确定就好了 2.修改Linux系统的固定IP 一:进入此文件 效果如下: 执行以下命令: 此时IP已更改 3.远程连接 这个是前提!!! 更改网络编辑器后网络适配器可能会修改,我就是遇着这个,困住我了一会 一:可以以主机IP对应连接 连接成功 二:主机名连…...
Qt+大恒相机回调图片刷新使用方式
一、前言 上篇文章介绍了如何调用大恒SDK获得回调图片,这篇介绍如何使用这些图片并刷新到界面上。考虑到相机的帧率很高,比如200fps是很高的回调频率。那么我们的刷新频率是做不到这么快,也没必要这么快。一般刷新在60帧左右就够了。 二、思路…...
Docker 环境下 PostgreSQL 监控实战:从 Exporter 到 Prometheus 的部署详解
Docker 环境下 PostgreSQL 监控实战:从 Exporter 到 Prometheus 的部署详解 文章目录 Docker 环境下 PostgreSQL 监控实战:从 Exporter 到 Prometheus 的部署详解一 节点简述二 节点监控部署1)创建 PostgreSQL 的 exporter 账号2)…...
构建带有调试符号的srsRAN 4G
### 构建带有调试符号 首先确保已下载srsRAN 4G,并已创建并导航至构建文件夹: bash git clone https://github.com/srsran/srsran_4g.git cd srsRAN_4G mkdir build cd build 若srsRAN 4G已构建完成,应清除原有构建文件夹后继续。 可以使…...
算法题总结(十)——二叉树上
#二叉树的递归遍历 // 前序遍历递归LC144_二叉树的前序遍历 class Solution {public List<Integer> preorderTraversal(TreeNode root) {List<Integer> result new ArrayList<Integer>(); //也可以把result 作为全局变量,只需要一个函数即可。…...
【MySQL】MySQL 数据库主从复制详解
目录 1. 基本概念1.1 主从架构1.2 复制类型 2. 工作原理2.1 复制过程2.2 主要组件 3. 配置步骤3.1 准备工作3.2 在主服务器上配置3.3 在从服务器上配置 4. 监控和维护4.1 监控复制状态4.2 处理复制延迟4.3 故障恢复 5. 备份策略5.1 逻辑备份与物理备份5.2 增量备份 6. 使用场景…...
一种格式化printf hex 数据的方法
格式化输出HEX数据 调试过程中通常需要个格式化输出16进制数据,为了方便美观可以参考如下方法。 #define __is_print(ch) ((unsigned int)((ch) - ) < 127u - )/*** dump_hex* * brief hex打印* * param buf: 需要打印的原始数据* param size: 原始数据类型*…...
在LabVIEW中如何读取EXCEL
在LabVIEW中读取Excel文件通常使用“报告生成工具包”(Report Generation Toolkit)。以下是详细步骤: 安装工具包:确保已安装“报告生成工具包”。这通常随LabVIEW一起提供,但需要单独安装。 创建VI: 打…...
布匹瑕疵检测数据集 4类 2800张 布料缺陷 带标注 voc yolo
布匹瑕疵检测数据集 4类 2800张 布料缺陷 带标注 voc yolo 对应标注,格式VOC (XML),选配Y0L0(TXT) label| pic_ num| box_ _num hole: (425, 481) suspension_ wire: (1739, 1782) topbasi: (46, 46) dirty: (613&…...
灵动微高集成度电机MCU单片机
由于锂电技术的持续进步、消费者需求的演变、工具种类的革新以及应用领域的扩展,电动工具行业正呈现出无绳化、锂电化、大功率化、小型化、智能化和一机多能化的发展趋势。无绳化和锂电化的电动工具因其便携性和高效能的特性,已成为市场增长的重要驱动力…...
MA730/MT6835/MT6825/MT6709磁编码器SPI通信实战:从寄存器配置到角度解析
1. 磁编码器SPI通信基础与选型指南 磁编码器作为现代电机控制和机器人系统中的核心传感器,其精度和响应速度直接影响整个系统的性能。MA730、MT6835、MT6825和MT6709这几款磁编码器在工业界应用广泛,它们都采用SPI接口进行通信,但在具体实现上…...
告别Socket编程烦恼:用libhv的UdpServer类5分钟搞定一个C++回显服务
告别Socket编程烦恼:用libhv的UdpServer类5分钟搞定一个C回显服务 在C网络编程领域,原生Socket API的复杂性一直是开发者面临的痛点。从繁琐的地址结构体处理到易错的IO多路复用机制,传统方法往往需要数百行代码才能实现一个基础功能。而libh…...
别再傻傻分不清了!Numpy里ndarray和array到底啥区别?新手避坑指南
别再傻傻分不清了!Numpy里ndarray和array到底啥区别?新手避坑指南 刚接触Numpy的Python开发者,几乎都会在ndarray和array()这两个概念上栽跟头。明明看起来都能创建数组,为什么文档里一会儿用np.array(),一会儿又冒出个…...
ElevenLabs藏文语音生成上线仅72小时:开发者必须立即掌握的5个API调用避坑要点
更多请点击: https://intelliparadigm.com 第一章:ElevenLabs藏文语音生成上线背景与技术意义 藏语作为中国官方认可的少数民族语言之一,拥有超过600万母语使用者,主要分布在西藏、青海、四川、甘肃和云南等地区。长期以来&…...
Cursor智能体学习工具:构建专属AI编程知识库的完整指南
1. 项目概述:一个为开发者量身定制的Cursor智能体学习工具如果你是一名开发者,并且最近正在尝试使用Cursor这款AI编程工具,那么你很可能和我一样,经历过一个既兴奋又有点迷茫的阶段。Cursor的强大毋庸置疑,它能理解上下…...
基于Belullama框架构建可定制化本地AI模型服务:从原理到实践
1. 项目概述:一个本地化、可定制的AI对话模型部署方案最近在折腾本地AI部署的朋友,可能都绕不开一个名字:Ollama。它确实让拉取和运行各种开源大模型变得像docker pull一样简单。但不知道你有没有遇到过这样的困扰:Ollama默认的AP…...
AI智能体配置管理实战:基于agent-config-manager的解决方案
1. 项目概述与核心价值最近在折腾一个多智能体协作的项目,发现配置文件的管理简直是个灾难。每个智能体(Agent)都有自己的一堆参数:API密钥、模型选择、系统提示词、温度值、最大token数……更别提不同环境(开发、测试…...
Ubuntu 20.04上virt-manager报GDBus错误?别慌,三步排查法搞定它
Ubuntu 20.04 virt-manager报GDBus错误的深度排查指南 当你正准备用virt-manager管理KVM虚拟机时,突然弹出一个令人困惑的GDBus错误——这种场景对于Linux虚拟化用户来说并不陌生。这个看似简单的错误背后,其实涉及Linux桌面环境中多个关键组件的协同工作…...
深入TEA5767数据手册:51单片机I²C驱动FM收音模块的避坑指南与调试心得
深入解析TEA5767:51单片机驱动FM收音模块的实战技巧 在嵌入式开发领域,能够独立解读芯片手册并实现功能驱动是工程师的核心能力之一。TEA5767作为一款经典的FM收音芯片,因其低功耗、高集成度和简单的IC接口而广受欢迎。本文将从一个实际开发者…...
诺和诺德牵手OpenAI,能否夺回“药王”之位?
01 诺和诺德牵手OpenAI就在最近,诺和诺德(Novo Nordisk)宣布与OpenAI合作,消息发布后,诺和诺德股价短线上涨近4%。很多人或许不知道“诺和诺德”,但“司美格鲁肽”却广为人知,诺和诺德正是研发出…...
