当前位置：首页 > news >正文

MMSegmentation笔记

news 2026/5/12 2:50:36

如何训练自制数据集？

首先需要在 mmsegmentation/mmseg/datasets 目录下创建一个自制数据集的配置文件，以我的苹果叶片病害分割数据集为例，创建了mmsegmentation/mmseg/datasets/appleleafseg.py

可以看到，这个配置文件主要定义了自制数据集中的 METAINFO , 包括标签的类别，以及对应的 palette 调色板色彩数值，还定义了原始图像和标签图像的文件后缀，分别是 jpg 和 png，以及设置 reduce_zero_label 属性 (是否忽略背景)

from mmseg.registry import DATASETS
from .basesegdataset import BaseSegDataset@DATASETS.register_module()
class AppleLeafSegDataset(BaseSegDataset):METAINFO = dict(classes=('background', 'Alternaria_Boltch', 'Brown_spot', 'Frogeye_leaf_spot', 'Grey_spot', 'Mosaic', 'Powdery_mildew', 'Rust', 'Scab', 'Health'),palette=[[0, 0, 0], [170, 0, 0], [99, 102, 129], [249, 193, 0], [160, 180, 0],[115, 82, 59], [217, 213, 180], [51, 142, 137], [218, 147, 70], [234, 132, 163]])def __init__(self,img_suffix='.jpg',seg_map_suffix='.png',reduce_zero_label=False,# 因为上面METAINFO已经将背景0作为一种类别并且设置掩码色彩为0,0,0所以这里的reduce_zero_label需要设置为false**kwargs) -> None:super().__init__(img_suffix=img_suffix,seg_map_suffix=seg_map_suffix,reduce_zero_label=reduce_zero_label,**kwargs)

然后将 AppleLeafSegDataset 添加到 `mmseg/datasets/init.py` 中的`all`里

__all__ = ['BaseSegDataset', 'BioMedical3DRandomCrop', 'BioMedical3DRandomFlip','CityscapesDataset', 'PascalVOCDataset', 'ADE20KDataset','PascalContextDataset', 'PascalContextDataset59', 'ChaseDB1Dataset','DRIVEDataset', 'HRFDataset', 'STAREDataset', 'DarkZurichDataset','NightDrivingDataset', 'COCOStuffDataset', 'LoveDADataset','MultiImageMixDataset', 'iSAIDDataset', 'ISPRSDataset', 'PotsdamDataset','LoadAnnotations', 'RandomCrop', 'SegRescale', 'PhotoMetricDistortion','RandomRotate', 'AdjustGamma', 'CLAHE', 'Rerange', 'RGB2Gray','RandomCutOut', 'RandomMosaic', 'PackSegInputs', 'ResizeToMultiple','LoadImageFromNDArray', 'LoadBiomedicalImageFromFile','LoadBiomedicalAnnotation', 'LoadBiomedicalData', 'GenerateEdge','DecathlonDataset', 'LIPDataset', 'ResizeShortestEdge','BioMedicalGaussianNoise', 'BioMedicalGaussianBlur','BioMedicalRandomGamma', 'BioMedical3DPad', 'RandomRotFlip','SynapseDataset', 'REFUGEDataset', 'MapillaryDataset_v1','MapillaryDataset_v2', 'Albu', 'LEVIRCDDataset','LoadMultipleRSImageFromFile', 'LoadSingleRSImageFromFile','ConcatCDInput', 'BaseCDDataset', 'DSDLSegDataset', 'BDD100KDataset','NYUDataset', 'HSIDrive20Dataset', 'AppleLeafSegDataset'
]

接下来，需要在 mmsegmentation/mmseg/utils/class_names.py 中补充数据集元信息

我的苹果树叶病害数据集相关片段如下：

def appleleafdiseases_classes():"""BDD100K class names for external use(the class name is compatible withCityscapes )."""return ['background', 'Alternaria_Boltch', 'Brown_spot', 'Frogeye_leaf_spot', 'Grey_spot', 'Mosaic','Powdery_mildew', 'Rust', 'Scab', 'Health']def appleleafdiseases_palette():"""bdd100k palette for external use(same with cityscapes)"""return [[0, 0, 0], [170, 0, 0], [99, 102, 129], [249, 193, 0], [160, 180, 0],[115, 82, 59], [217, 213, 180], [51, 142, 137], [218, 147, 70], [234, 132, 163]]dataset_aliases = {'cityscapes': ['cityscapes'],'ade': ['ade', 'ade20k'],'voc': ['voc', 'pascal_voc', 'voc12', 'voc12aug'],'pcontext': ['pcontext', 'pascal_context', 'voc2010'],'loveda': ['loveda'],'potsdam': ['potsdam'],'vaihingen': ['vaihingen'],'cocostuff': ['cocostuff', 'cocostuff10k', 'cocostuff164k', 'coco-stuff','coco-stuff10k', 'coco-stuff164k', 'coco_stuff', 'coco_stuff10k','coco_stuff164k'],'isaid': ['isaid', 'iSAID'],'stare': ['stare', 'STARE'],'lip': ['LIP', 'lip'],'mapillary_v1': ['mapillary_v1'],'mapillary_v2': ['mapillary_v2'],'bdd100k': ['bdd100k'],'hsidrive': ['hsidrive', 'HSIDrive', 'HSI-Drive', 'hsidrive20', 'HSIDrive20','HSI-Drive20'],'appleleafdiseases': ['appleleafdiseases']
}

然后，需要在`mmsegmentation/configs/_base_/datasets/`目录下创建一个新的数据集配置文件 `mmsegmentation/configs/_base_/datasets/apple.py`

这个数据集配置文件代码如下，可以看到，主要是告诉模型训练和测试的一些配置信息，包括数据集类和数据集路径，训练，测试的pipiline数据增强，不同的dataloader(训练集，验证集，测试集)，验证集测试集的评价指标计算。

# dataset settings
dataset_type = 'AppleLeafSegDataset'
data_root = 'AppleLeafSegDataset/' # 自己数据集所在位置
img_scale = (320, 640) # img_scale是指图像在处理管道中将被调整到的尺寸
crop_size = (160, 320)
train_pipeline = [dict(type='LoadImageFromFile'),dict(type='LoadAnnotations', reduce_zero_label=False), # 不忽略背景dict(type='RandomResize',scale=img_scale,ratio_range=(0.5, 2.0),keep_ratio=True),dict(type='RandomCrop', crop_size=crop_size, cat_max_ratio=0.75),dict(type='RandomFlip', prob=0.5),dict(type='PhotoMetricDistortion'),dict(type='PackSegInputs')
]
test_pipeline = [dict(type='LoadImageFromFile'),dict(type='Resize', scale=img_scale, keep_ratio=True),# add loading annotation after ``Resize`` because ground truth# does not need to do resize data transformdict(type='LoadAnnotations', reduce_zero_label=False),dict(type='PackSegInputs')
]
img_ratios = [0.5, 0.75, 1.0, 1.25, 1.5, 1.75]
# 测试时增强 (TTA) 是一种在测试阶段使用的数据增强策略。它对同一张图片应用不同的增强，例如翻转和缩放，用于模型推理，然后将每个增强后的图像的预测结果合并，以获得更准确的预测结果。
tta_pipeline = [dict(type='LoadImageFromFile', backend_args=None),dict(type='TestTimeAug',transforms=[[dict(type='Resize', scale_factor=r, keep_ratio=True)for r in img_ratios],[dict(type='RandomFlip', prob=0., direction='horizontal'),dict(type='RandomFlip', prob=1., direction='horizontal')], [dict(type='LoadAnnotations')], [dict(type='PackSegInputs')]])
]
train_dataloader = dict(batch_size=4,num_workers=4,persistent_workers=True,sampler=dict(type='InfiniteSampler', shuffle=True),dataset=dict(type=dataset_type,data_root=data_root,data_prefix=dict(img_path='images/training', seg_map_path='annotations/training'),pipeline=train_pipeline))
val_dataloader = dict(batch_size=1,num_workers=4,persistent_workers=True,sampler=dict(type='DefaultSampler', shuffle=False),dataset=dict(type=dataset_type,data_root=data_root,data_prefix=dict(img_path='images/validation',seg_map_path='annotations/validation'),pipeline=test_pipeline))
test_dataloader = val_dataloaderval_evaluator = dict(type='IoUMetric', iou_metrics=['mIoU'])
test_evaluator = val_evaluator

最后，我们需要创建一个总的配置文件，mmsegmentation/configs/unet/unet_s5-d16_deeplabv3_4xb4-40k_appleleafdiseases-320×640.py

这里可以选择mmsegmentation/configs/目录下的不同模型进行实验，这里以unet为例，我创建的这个文件代码如下：
可以看到，_base_定义了模型配置，数据集配置，调度策略配置，运行时配置。
然后也定义了裁剪大小，数据预处理。

_base_ = ['../_base_/models/apple_deeplabv3_unet_s5-d16.py', '../_base_/datasets/apple.py','../_base_/default_runtime.py', '../_base_/schedules/schedule_40k.py'
]
crop_size = (160, 320)
data_preprocessor = dict(size=crop_size)
model = dict(data_preprocessor=data_preprocessor,test_cfg=dict(crop_size=(160, 320), stride=(85, 85)))

然后，创建一个`mmsegmentation/configs/_base_/models/apple_deeplabv3_unet_s5-d16.py`

代码如下, 可以看到定义了数据预处理，模型结构，backbone类型，解码器头和辅助解码器头：

# model settings
norm_cfg = dict(type='BN', requires_grad=True)
data_preprocessor = dict(type='SegDataPreProcessor',mean=[123.675, 116.28, 103.53],std=[58.395, 57.12, 57.375],bgr_to_rgb=True,pad_val=0,seg_pad_val=255)
model = dict(type='EncoderDecoder',data_preprocessor=data_preprocessor,pretrained=None,backbone=dict(type='UNet',in_channels=3,base_channels=64,num_stages=5,strides=(1, 1, 1, 1, 1),enc_num_convs=(2, 2, 2, 2, 2),dec_num_convs=(2, 2, 2, 2),downsamples=(True, True, True, True),enc_dilations=(1, 1, 1, 1, 1),dec_dilations=(1, 1, 1, 1),with_cp=False,conv_cfg=None,norm_cfg=norm_cfg,act_cfg=dict(type='ReLU'),upsample_cfg=dict(type='InterpConv'),norm_eval=False),decode_head=dict(type='ASPPHead',in_channels=64,in_index=4,channels=16,dilations=(1, 12, 24, 36),dropout_ratio=0.1,num_classes=10,norm_cfg=norm_cfg,align_corners=False,loss_decode=dict(type='LovaszLoss', reduction='none', loss_weight=1.0)),auxiliary_head=dict(type='FCNHead',in_channels=128,in_index=3,channels=64,num_convs=1,concat_input=False,dropout_ratio=0.1,num_classes=10,norm_cfg=norm_cfg,align_corners=False,loss_decode=dict(type='LovaszLoss', reduction='none', loss_weight=0.4)),# model training and testing settingstrain_cfg=dict(),test_cfg=dict(mode='slide', crop_size=128, stride=85))

然后，重新启动

python setup.py install
pip install -v -e .

开始训练

python tools/train.py configs/unet/unet_s5-d16_deeplabv3_4xb4-40k_appleleafdiseases-320×640.py --work-dir mmseg_log

MMSegmentation笔记

如何训练自制数据集？ 首先需要在 mmsegmentation/mmseg/datasets 目录下创建一个自制数据集的配置文件，以我的苹果叶片病害分割数据集为例，创建了mmsegmentation/mmseg/datasets/appleleafseg.py 可以看到，这个配置文件主要定义…...

编程日记 2024/7/10 19:27:52

Python基础语法：变量和数据类型详解（整数、浮点数、字符串、布尔值）①

文章目录变量和数据类型详解（整数、浮点数、字符串、布尔值）一、变量二、数据类型1. 整数（int）2. 浮点数（float）3. 字符串（str）4. 布尔值（bool） 三、类型转换…...

编程日记 2024/7/10 19:26:51

【C++航海王：追寻罗杰的编程之路】关联式容器的底层结构——红黑树

目录 1 -> 红黑树 1.1 -> 红黑树的概念 1.2 -> 红黑树的性质 1.3 -> 红黑树节点的定义 1.4 -> 红黑树的结构 1.5 -> 红黑树的插入操作 1.6 -> 红黑树的验证 1.8 -> 红黑树与AVL树的比较 2 -> 红黑树模拟实现STL中的map与set 2.1 -> 红…...

编程日记 2024/7/10 19:25:50

MySQL DDL

数据库 1 创建数据库 CREATE DATABASE 数据库名 CREATE DATABASE IF NOT EXISTS 数据库名;（判断是否存在) CREATE DATABASE 数据库名 CHARACTER SET 字符 2 查看数据库 SHOW DATABASES; 查看某个数据库的信息 SHOW CAEATE DATABASE 数据库名 3 修改数据库 …...

编程日记 2024/7/10 19:23:48

从模型到应用：李彦宏解读AI时代的新趋势与挑战

如何理解李彦宏说的“不要卷模型，要卷应用” 开源项目的机遇与挑战 7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议在上海世博中心举办。在产业发展主论坛上，百度创始人、董事长兼首席执行官李彦宏呼吁：“大家不要卷…...

编程日记 2024/7/10 19:22:46

C++ STL 随机数用法介绍

目录一：C语言中的随机数二：C中的随机数 1. 生成随机数的例子 2. 随机数引擎 3. 随机数引擎适配器 4. C中预定义的随机数引擎，引擎适配器 5. 随机数分布一：C语言中的随机数 <stdlib.h>//初始化随机种子 srand(static_ca…...

编程日记 2024/7/10 19:21:45

容器之docker compose

Docker Compose 是一个用于定义和运行多容器 Docker 应用的工具。通过一个 YAML 文件，您可以配置应用程序需要的所有服务，并使用单个命令来创建和启动这些服务。以下是对 Docker Compose 的详细介绍： 核心概念服务（Services&am…...

编程日记 2024/7/10 19:19:42

MIT机器人运动控制原理浅析-人形机器人

MIT人形机器人基于开发改进的执行器全新设计，通过可感知执行器运动动力学移动规划器(Actuator-Aware Kino-Dynamic Motion Planner)及着地控制器(Landing Controller)等实现机器人的运动控制。机器人设计机器人高0.7米，21KG(四肢重量 25%)，…...

编程日记 2024/7/10 19:17:40

开源 WAF 解析：选择最适合你的防护利器

前言随着网络安全风险的增加，Web 应用防火墙（WAF）成为保护网站和应用程序免受攻击的关键工具。在众多的选择中，开源 WAF 以其灵活性、可定制性和成本效益备受青睐。本文将深入探讨几种主流开源 WAF 解决方案，帮助你选…...

编程日记 2024/7/10 19:16:39

AirPods Pro新功能前瞻：iOS 18的五大创新亮点

随着科技的不断进步，苹果公司一直在探索如何通过创新提升用户体验。iOS 18的推出，不仅仅是iPhone的一次系统更新，更是苹果生态链中重要一环——AirPods Pro的一次重大升级。据悉，iOS 18将为AirPods Pro带来五项新功能&#xff0…...

编程日记 2024/7/10 19:14:38

JavaScript中的可选链操作符

在JavaScript中，?. 被称为可选链操作符（Optional Chaining Operator）。它允许你访问对象的深层属性而不必显式地检查每一层属性是否存在。如果链中的某个属性不存在，表达式将短路返回undefined，而不是抛出一个TypeErr…...

编程日记 2024/7/10 19:10:33

huggingface笔记：gpt2

0 使用的tips GPT-2是一个具有绝对位置嵌入的模型，因此通常建议在输入的右侧而不是左侧填充GPT-2是通过因果语言建模（CLM）目标进行训练的，因此在预测序列中的下一个标记方面非常强大利用这一特性，GPT-2可以生成语法连…...

编程日记 2024/7/10 19:09:32

一次业务的批量数据任务的处理优化

文章目录一次业务的批量数据任务的处理优化业务背景1.0版本分批处理模式2.0版本平衡任务队列模式3.0版本优化调度平衡任务队列模式总结一次业务的批量数据任务的处理优化业务背景一个重新生成所有客户的财务业务指标数据的批量数据处理任务。 1.0版本分批处理模式 …...

编程日记 2024/7/10 19:08:31

新能源汽车充电站远程监控系统S275钡铼技术无线RTU

新能源汽车充电站的远程监控系统在现代城市基础设施中扮演着至关重要的角色，而钡铼技术的S275无线RTU作为一款先进的物联网数据监测采集控制短信报警终端，为充电站的安全运行和高效管理提供了强大的技术支持。技术特点和功能钡铼S275采用了基于UCOSI…...

编程日记 2024/7/10 19:07:30

海外视频媒体发布/发稿：如何在国外媒体以视频的形式宣发

1. 背景介绍在如今数字化时代，每个国家都拥有着各自的视频媒体平台，而主流媒体也都纷纷加入了视频发布的行列。视频媒体的宣发形式主要包括油管Youtube等视频分享平台，以及图文配合的发布方式。通过在视频中夹带链接，媒体可以以…...

编程日记 2024/7/10 19:06:29

HTML 【实用教程】（2024最新版）

核心思想 —— 语义化【面试题】如何理解 HTML 语义化 ?仅通过标签便能判断内容的类型，特别是区分标题、段落、图片和表格增加代码可读性，让人更容易读懂对SEO更加友好，让搜索引擎更容易读懂 html 文件的基本结构 html 文件的文件后缀为 …...

编程日记 2024/7/10 19:05:28

How to Describe Figures in a Research Article

How to Describe Figures in a Research Article DateAuthorVersionNote2024.07.10Dog TaoV1.0Finish the document. 文章目录 How to Describe Figures in a Research ArticleGeneral GuidelinesDetailed DescriptionsCommon Describing Phrases Effective communication of …...

编程日记 2024/7/10 19:04:27

如何训练自制数据集？

首先需要在 mmsegmentation/mmseg/datasets 目录下创建一个自制数据集的配置文件，以我的苹果叶片病害分割数据集为例，创建了mmsegmentation/mmseg/datasets/appleleafseg.py

然后将 AppleLeafSegDataset 添加到 mmseg/datasets/__init__.py 中的__all__里