当前位置：首页 > news >正文

Pytorch语义分割（1）-----加载数据

news 2026/2/9 16:35:23

在语义分割中用到的数据无非就是原始图片（image）和标注后得到的mask图片，所以在读取数据的时候只要返回图片和标签信息就OK 了。

import torch
import os
import numpy as np
from torch.utils.data import Dataset
from utils_func import seg_utils as ut
import cv2
from torchvision.transforms.functional import rotate as tensor_rotate
from torchvision.transforms.functional import vflip, hflip
from torchvision.transforms.functional import adjust_brightness
import random
import base64
import json
import os
import os.path as ospdevice = torch.device("cuda" if torch.cuda.is_available() else "cpu")class train_data(Dataset):def __init__(self, image_folder, img_size, category_types):self.image_folder = image_folderself.img_size = img_sizeself.category_types = category_typesself.num_classes = len(category_types)self.data_list = self.generate_mask()# print(self.data_list)self.img_and_mask = []for idx, data in enumerate(self.data_list):img_tensor, mask_tensor = self.get_image_and_label(data[0], data[1], self.img_size)self.img_and_mask.append([img_tensor, mask_tensor])def __len__(self):return len(self.img_and_mask)def __getitem__(self, index):img_tensor = self.img_and_mask[index][0].to(device)mask_tensor = self.img_and_mask[index][1].to(device)# 如果有数据增强就在这里处理return img_tensor, mask_tensordef data_augment(self, img_tensor, mask_tensor, aug_flag):if aug_flag[0] == 0:angel = random.choice(aug_flag[1])img_tensor = tensor_rotate(img_tensor, int(angel))mask_tensor = tensor_rotate(mask_tensor, int(angel))elif aug_flag[0] == 1:factor = aug_flag[1]img_tensor = adjust_brightness(img_tensor, factor)elif aug_flag[0] == 2:flip_type = random.choice(aug_flag[1])if flip_type == 1:img_tensor = vflip(img_tensor)mask_tensor = vflip(mask_tensor)else:img_tensor = hflip(img_tensor)mask_tensor = hflip(mask_tensor)return img_tensor, mask_tensordef generate_mask(self):data_lists = []for file_name in os.listdir(self.image_folder):if file_name.endswith("json"):json_path = os.path.join(self.image_folder, file_name)img_path = osp.join(self.image_folder, "%s.jpg" % file_name.split(".")[0])data_lists.append([img_path, json_path])return data_listsdef get_image_and_label(self, img_path, labelme_json_path, img_size):# print("==================================================")# print(img_path)# print("==================================================")img = ut.p2i(img_path)h, w = img.shape[:2]img = cv2.resize(img, (img_size[0], img_size[1]))# cv2.imwrite(r"C:\Users\HJ\Desktop\test\%s.jpg"%img_path.split(".")[0][-7:], img)img_tensor = ut.i2t(img)mask_array = np.zeros([self.num_classes, h, w, 1], dtype=np.uint8)with open(labelme_json_path, "r") as f:json_data = json.load(f)shapes = json_data["shapes"]for shape in shapes:category = shape["label"]category_idx = self.category_types.index(category)points = shape["points"]points_array = np.array(points, dtype=np.int32)temp = mask_array[category_idx, ...]mask_array[category_idx, ...] = cv2.fillPoly(temp, [points_array], 255)mask_array = np.transpose(mask_array, (1, 2, 0, 3)).squeeze(axis=-1)mask_array = cv2.resize(mask_array, (self.img_size[0], self.img_size[1])).astype(np.uint8)mask_tensor = ut.i2t(mask_array, False)return img_tensor, mask_tensorif __name__ == '__main__':img_folder = r"D:\finish_code\SegmentationProject\datasets\data2"img_size1 = [256, 512]category_types = ["background", "person", "car", "road"]t = train_data(img_folder, img_size1, category_types)t.__getitem__(1)

Pytorch语义分割（1）-----加载数据

在语义分割中用到的数据无非就是原始图片（image）和标注后得到的mask图片，所以在读取数据的时候只要返回图片和标签信息就OK 了。 import torch import os import numpy as np from torch.utils.data import Dataset from utils_func import …...

编程日记 2024/6/5 0:48:29

Java中加号的多种用途

在Java中， 符号有多种用途，主要根据上下文而定。以下是在Java中的一些主要用途： 加法运算符： 这是最常见的用途，用于数字相加。 int a 5;int b 3;int sum a b; // sum is 8 字符串连接符： 当用…...

编程日记 2024/6/5 0:47:28

React useCallback用法

useCallback 是 React 中的一个 Hook，它用于优化性能，通过缓存函数的引用来避免在组件的每次渲染时都创建新的函数实例。这对于避免不必要的子组件重新渲染特别有用，因为如果传递给子组件的回调函数在每次渲染时都不同，即使子组件…...

编程日记 2024/6/5 0:46:27

Flutter 中的 ErrorWidget 小部件：全面指南

Flutter 中的 ErrorWidget 小部件：全面指南 Flutter 是一个由 Google 开发的跨平台 UI 框架，它允许开发者使用 Dart 语言构建高性能、美观的应用。在 Flutter 的丰富组件库中，ErrorWidget 是一个特殊的组件，用于在渲染过程中捕获…...

编程日记 2024/6/5 0:42:23

【数据结构】穿梭在二叉树的时间隧道：顺序存储的实现

专栏引入哈喽大家好，我是野生的编程萌新，首先感谢大家的观看。数据结构的学习者大多有这样的想法：数据结构很重要，一定要学好，但数据结构比较抽象，有些算法理解起来很困难，学的很累。我想让大家…...

编程日记 2024/6/5 0:41:22

【数据结构与算法经典例题】链表的回文结构（图文详解）

💓 博客主页：倔强的石头的CSDN主页 📝Gitee主页：倔强的石头的gitee主页 ⏩ 文章专栏：《数据结构与算法经典例题》C语言期待您的关注目录一、问题描述二、解题思路三、C语言代码实现一、问题描述二、解…...

编程日记 2024/6/5 0:40:20

通过DirectML和ONNXRuntime运行Phi-3模型

更多精彩内容，欢迎关注我的公众号“ONE生产力”！ 上篇我们讲到通过Intel Core Ultra系列处理器内置的NPU加速运行Phi-3模型，有朋友评论说他没有Intel处理器是否有什么办法加速Phi-3模型。通常，使用GPU特别是NVIDA的GPU加速AI模型…...

编程日记 2024/6/5 0:39:19

C语言经典例题-18

1.判断是不是字母题目描述: KK想判断输入的字符是不是字母，请帮他编程实现。输入描述: 多组输入，每一行输入一个字符。输出描述: 针对每组输入，输出单独占一行，判断输入字符是否为字母，输出内容详见输出样例。输…...

编程日记 2024/6/5 0:38:17

计算机网络之crc循环冗余校验、子网划分、rip协议路由转发表、时延计算、香浓定理奈氏准则、TCP超时重传 RTO

crc循环冗余校验异或运算 : 相同得0,相异得1 从多项式获取除数在原数据的末端补0 , 0的个数等于最高次项的阶数如果最后结果的有效位数较少时，前面应该补0，补到个数与阶位相同子网划分子网掩码：用于识别IP地址中的网络号和主机号的…...

编程日记 2024/6/5 0:35:14

揭秘高效人事财务对接新方案！

一、客户介绍某生物医药科技有限公司是一家专注于生物创新药物研发与生产的科技型企业。公司的主要业务范围包括技术开发、技术服务、医学研究与试验发展、经济信息咨询、企业管理等。公司凭借其强大的技术实力、丰富的研发经验和优秀的团队阵容，在生物创新药领域…...

编程日记 2024/6/5 0:34:12

Unity中的MVC框架

基本概念 MVC全名是Model View Controller 是模型(model)-视图(view)-控制器(controller)的缩写是一种软件设计规范，用一种业务逻辑、数据、界面显示分离的方法组织代码将业务逻辑聚集到一个部件里面，在改进和个性化定制界面及用户交互的同时&#x…...

编程日记 2024/6/5 0:33:11

网工内推 | 上市公司网工，Base广东，思科DE/IE认证优先

01 广州赛意信息科技股份有限公司 🔷招聘岗位：技术架构师 🔷职责描述： 1、设计、开发和维护工业数据库及其架构，包括数据采集、存储、处理和分析的工具和系统。 2、开发和维护数据管道和工作流程，确保数据…...

编程日记 2024/6/5 0:32:09

ZYNQ AXI4 FDMA内存读写

1 概述如果用过ZYNQ的都知道，要直接操作PS的DDR 通常是DMA 或者VDMA,然而用过XILINX 的DMA IP 和 VDMA IP，总有一种遗憾，那就是不够灵活，还需要对寄存器配置，真是麻烦。对于我们搞 FPGA 的人来说，最喜欢直接了当，直接用FPGA代码搞定。现在XILINX 的总线接口是AXI4总线…...

编程日记 2024/6/5 0:30:08

签名安全规范：解决【请求对象json序列化时，时间字段被强制转换成时间戳的问题】

文章目录引言I 签名安全规范1.1 签名生成的通用步骤1.2 签名运算（加密规则）1.3 对所有传入参数按照字段名的 ASCII 码从小到大排序（字典序）1.4 允许的请求头字段1.5 签名校验工具II 注解校验签名2.1 获取请求数据，并校验签名数据2.2 解决时间格式被强制转换成时间戳的问题…...

编程日记 2024/6/5 0:29:05

Web3.0区块链技术开发方案丨ICO与IDO代币开发

在Web3.0时代的到来下，区块链技术不仅改变着金融领域的格局，也在资金筹集和代币发行方面掀起了一场变革。初始代币发行（ICO）和去中心化代币发行（IDO）成为了项目融资的主要方式，其基于区块链技术…...

编程日记 2024/6/5 0:26:01

spring boot 3.x版本引入 swagger2启动时报错

一，问题 Spring Boot 3.x版本的项目里，准备引入Swagger2作为接口文档，但是项目启动报错： java.lang.TypeNotPresentException: Type javax.servlet.http.HttpServletRequest not present at java.base/sun.reflect.generics.…...

编程日记 2024/6/5 0:22:58

华为机械工程师面试问题

在机械工程师的面试中，面试官可能会提出一系列问题，以评估应聘者的专业知识、技能、经验以及解决问题的能力。以下是一些可能的面试题：基础知识与技能：请解释机械工程中常用的几种传动方式，并比较它们的优缺点。描述一下你在机械设计过程中常用的软件，并举例说明你是如…...

编程日记 2024/6/5 0:20:55

一个简单并完整的springboot项目项目地址1：https://download.csdn.net/download/qq_38234785/89398614 项目地址2：https://mbd.pub/o/buranxin/work 一、接口 curl --location --request POST http://localhost:8080/api/test \ --header Cookie: USER…...

编程日记 2024/6/5 0:18:53

SASS基础知识

什么是SASS 1. SASS与CSS的关系 SASS（Syntactically Awesome Stylesheets）是一种强大的CSS扩展语言，它允许开发者使用变量、嵌套规则、混合宏和更多功能，这些在纯CSS中是不可能做到的。SASS旨在简化CSS代码的维护，并…...

编程日记 2024/6/5 0:17:52

基于C#开发web网页管理系统模板流程-主界面管理员入库和出库功能完善

前言紧接上篇->基于C#开发web网页管理系统模板流程-主界面管理员录入和编辑功能完善-CSDN博客本篇将完善主界面的管理员入库和出库功能，同样的，管理员入库和出库的设计套路适用于动态表的录入和编辑首先还是介绍一下本项目将要实现的功能 &#xf…...

编程日记 2024/6/5 0:14:47

[特殊字符] 智能合约中的数据是如何在区块链中保持一致的？

🧠 智能合约中的数据是如何在区块链中保持一致的？ 为什么所有区块链节点都能得出相同结果？合约调用这么复杂，状态真能保持一致吗？本篇带你从底层视角理解“状态一致性”的真相。一、智能合约的数据存储在哪里&#xf…...

编程新知 2025/10/25 17:23:41

大数据零基础学习day1之环境准备和大数据初步理解

学习大数据会使用到多台Linux服务器。一、环境准备 1、VMware 基于VMware构建Linux虚拟机是大数据从业者或者IT从业者的必备技能之一也是成本低廉的方案所以VMware虚拟机方案是必须要学习的。 （1）设置网关打开VMware虚拟机，点击编辑…...

编程新知 2026/1/25 14:43:07

OkHttp 中实现断点续传 demo

在 OkHttp 中实现断点续传主要通过以下步骤完成，核心是利用 HTTP 协议的 Range 请求头指定下载范围： 实现原理 Range 请求头：向服务器请求文件的特定字节范围（如 Range: bytes1024-） 本地文件记录：保存已…...

编程新知 2025/12/12 0:56:22

【服务器压力测试】本地PC电脑作为服务器运行时出现卡顿和资源紧张（Windows/Linux）

要让本地PC电脑作为服务器运行时出现卡顿和资源紧张的情况，可以通过以下几种方式模拟或触发： 1. 增加CPU负载运行大量计算密集型任务，例如： 使用多线程循环执行复杂计算（如数学运算、加密解密等）。运行图…...

编程新知 2025/11/30 10:30:15

招商蛇口 | 执笔CID，启幕低密生活新境

作为中国城市生长的力量，招商蛇口以“美好生活承载者”为使命，深耕全球111座城市，以央企担当匠造时代理想人居。从深圳湾的开拓基因到西安高新CID的战略落子，招商蛇口始终与城市发展同频共振，以建筑诠释对土地与生活的…...

编程新知 2026/1/26 8:13:33

C++ 设计模式《小明的奶茶加料风波》

👨‍🎓 模式名称：装饰器模式（Decorator Pattern） 👦 小明最近上线了校园奶茶配送功能，业务火爆，大家都在加料： 有的同学要加波霸 🟤，有的要加椰果…...

编程新知 2026/1/31 8:45:21

群晖NAS如何在虚拟机创建飞牛NAS

套件中心下载安装Virtual Machine Manager 创建虚拟机配置虚拟机飞牛官网下载 https://iso.liveupdate.fnnas.com/x86_64/trim/fnos-0.9.2-863.iso 群晖NAS如何在虚拟机创建飞牛NAS - 个人信息分享...

编程新知 2026/1/30 6:19:54

抽象类和接口（全）

一、抽象类 1.概念：如果⼀个类中没有包含⾜够的信息来描绘⼀个具体的对象，这样的类就是抽象类。像是没有实际⼯作的⽅法,我们可以把它设计成⼀个抽象⽅法，包含抽象⽅法的类我们称为抽象类。 2.语法在Java中，⼀个类如果被 abs…...

编程新知 2026/2/5 4:38:22

Xela矩阵三轴触觉传感器的工作原理解析与应用场景

Xela矩阵三轴触觉传感器通过先进技术模拟人类触觉感知，帮助设备实现精确的力测量与位移监测。其核心功能基于磁性三维力测量与空间位移测量，能够捕捉多维触觉信息。该传感器的设计不仅提升了触觉感知的精度，还为机器人、医疗设备和制造业的智…...

编程新知 2026/2/6 12:27:51

Python网页自动化Selenium中文文档

1. 安装 1.1. 安装 Selenium Python bindings 提供了一个简单的API，让你使用Selenium WebDriver来编写功能/校验测试。通过Selenium Python的API，你可以非常直观的使用Selenium WebDriver的所有功能。 Selenium Python bindings 使用非常简洁方便的A…...

编程新知 2026/1/23 18:15:21

相关文章：