当前位置：首页 > news >正文

pytorch复现_UNet

news 2026/4/3 14:26:35

什么是UNet
U-Net由收缩路径和扩张路径组成。收缩路径是一系列卷积层和汇集层，其中要素地图的分辨率逐渐降低。扩展路径是一系列上采样层和卷积层，其中特征地图的分辨率逐渐增加。
在扩展路径中的每一步，来自收缩路径的对应特征地图与当前特征地图级联。
在这里插入图片描述
主干结构解析
左边为特征提取网络（编码器），右边为特征融合网络（解码器）

高分辨率—编码—低分辨率—解码—高分辨率

特征提取网络
高分辨率—编码—低分辨率

前半部分是编码, 它的作用是特征提取(获取局部特征,并做图片级分类)，得到抽象语义特征

由两个3x3的卷积层（RELU）再加上一个2x2的maxpooling层组成一个下采样的模块，一共经过4次这样的操作

特征融合网络
低分辨率—解码—高分辨率

利用前面编码的抽象特征来恢复到原图尺寸的过程, 最终得到分割结果(掩码图片)

代码：

import torch.nn as nn
import torch# 编码器(论文中称之为收缩路径)的基本单元
def contracting_block(in_channels, out_channels):block = torch.nn.Sequential(# 这里的卷积操作没有使用padding,所以每次卷积后图像的尺寸都会减少2个像素大小nn.Conv2d(kernel_size=(3, 3), in_channels=in_channels, out_channels=out_channels),nn.BatchNorm2d(out_channels),nn.ReLU(),nn.Conv2d(kernel_size=(3, 3), in_channels=out_channels, out_channels=out_channels),nn.BatchNorm2d(out_channels),nn.ReLU())return block# 解码器（论文中称之为扩张路径）的基本单元
class expansive_block(nn.Module):def __init__(self, in_channels, mid_channels, out_channels):super(expansive_block, self).__init__()# 每进行一次反卷积，通道数减半，尺寸扩大2倍self.up = nn.ConvTranspose2d(in_channels, in_channels // 2, kernel_size=(3, 3), stride=2, padding=1,output_padding=1)self.block = nn.Sequential(# 这里的卷积操作没有使用padding,所以每次卷积后图像的尺寸都会减少2个像素大小nn.Conv2d(kernel_size=(3, 3), in_channels=in_channels, out_channels=mid_channels),nn.BatchNorm2d(mid_channels),nn.ReLU(),nn.Conv2d(kernel_size=(3, 3), in_channels=mid_channels, out_channels=out_channels),nn.BatchNorm2d(out_channels),nn.ReLU())def forward(self, e, d):d = self.up(d)# concat# e是来自编码器部分的特征图，d是来自解码器部分的特征图，它们的形状都是[B,C,H,W]diffY = e.size()[2] - d.size()[2]diffX = e.size()[3] - d.size()[3]# 裁剪时，先计算e与d在高和宽方向的差距diffY和diffX，然后对e高方向进行裁剪，具体方法是两边分别裁剪diffY的一半，# 最后对e宽方向进行裁剪，具体方法是两边分别裁剪diffX的一半，# 具体的裁剪过程见下图一e = e[:, :, diffY // 2:e.size()[2] - diffY // 2, diffX // 2:e.size()[3] - diffX // 2]cat = torch.cat([e, d], dim=1)  # 在特征通道上进行拼接out = self.block(cat)return out# 最后的输出卷积层
def final_block(in_channels, out_channels):block = nn.Conv2d(kernel_size=(1, 1), in_channels=in_channels, out_channels=out_channels)return blockclass UNet(nn.Module):def __init__(self, in_channel, out_channel):super(UNet, self).__init__()# 编码器 (Encode)self.conv_encode1 = contracting_block(in_channels=in_channel, out_channels=64)self.conv_pool1 = nn.MaxPool2d(kernel_size=2, stride=2)self.conv_encode2 = contracting_block(in_channels=64, out_channels=128)self.conv_pool2 = nn.MaxPool2d(kernel_size=2, stride=2)self.conv_encode3 = contracting_block(in_channels=128, out_channels=256)self.conv_pool3 = nn.MaxPool2d(kernel_size=2, stride=2)self.conv_encode4 = contracting_block(in_channels=256, out_channels=512)self.conv_pool4 = nn.MaxPool2d(kernel_size=2, stride=2)# 编码器与解码器之间的过渡部分(Bottleneck)self.bottleneck = nn.Sequential(nn.Conv2d(kernel_size=(3, 3), in_channels=512, out_channels=1024),nn.BatchNorm2d(1024),nn.ReLU(),nn.Conv2d(kernel_size=(3, 3), in_channels=1024, out_channels=1024),nn.BatchNorm2d(1024),nn.ReLU())# 解码器(Decode)self.conv_decode4 = expansive_block(1024, 512, 512)self.conv_decode3 = expansive_block(512, 256, 256)self.conv_decode2 = expansive_block(256, 128, 128)self.conv_decode1 = expansive_block(128, 64, 64)self.final_layer = final_block(64, out_channel)def forward(self, x):# Encodeencode_block1 = self.conv_encode1(x)encode_pool1 = self.conv_pool1(encode_block1)encode_block2 = self.conv_encode2(encode_pool1)encode_pool2 = self.conv_pool2(encode_block2)encode_block3 = self.conv_encode3(encode_pool2)encode_pool3 = self.conv_pool3(encode_block3)encode_block4 = self.conv_encode4(encode_pool3)encode_pool4 = self.conv_pool4(encode_block4)# Bottleneckbottleneck = self.bottleneck(encode_pool4)# Decodedecode_block4 = self.conv_decode4(encode_block4, bottleneck)decode_block3 = self.conv_decode3(encode_block3, decode_block4)decode_block2 = self.conv_decode2(encode_block2, decode_block3)decode_block1 = self.conv_decode1(encode_block1, decode_block2)final_layer = self.final_layer(decode_block1)return final_layerif __name__ == '__main__':image = torch.rand((1, 3, 572, 572))unet = UNet(in_channel=3, out_channel=2)mask = unet(image)print(mask.shape)#输出结果：torch.Size([1, 2, 388, 388])

pytorch复现_UNet

什么是UNet U-Net由收缩路径和扩张路径组成。收缩路径是一系列卷积层和汇集层，其中要素地图的分辨率逐渐降低。扩展路径是一系列上采样层和卷积层，其中特征地图的分辨率逐渐增加。在扩展路径中的每一步，来自收缩路径的对应特征地图与当前特征…...

编程日记 2023/11/8 10:55:20

定岗定编设计：企业职能部门定岗定编设计项目成功案例

一、客户背景及现状分析某大型车辆公司隶属于某央企集团，建于20世纪60年代，是中国高速、重载、专用铁路车辆生产经营的优势企业，轨道车辆制动机研发制造的主导企业，是隶属于国内最大的轨道交通设备制造上市企业的骨干二级公司。公…...

编程日记 2023/11/8 10:53:18

鸿蒙原生应用开发-DevEco Studio本地模拟器的使用

使用Local Emulator运行应用/服务 DevEco Studio提供的Local Emulator可以运行和调试Phone、TV和Wearable设备的HarmonyOS应用/服务。在Local Emulator上运行应用/服务兼容签名与不签名两种类型的HAP。 Local Emulator相比于Remote Emulator的区别：Local Emulator是…...

编程日记 2023/11/8 10:51:15

QT blockingFilter blockingMap blockingMapped

blockingFilter 主要作用是筛选出符合条件的项值结果集,并与之替换原有序列列表 blockingMap 可以直接修改容器的每一项 blockingMapped 不直接修改容器的每一项,而是将处理后的结果返回一个新的容器 blockingMappedReduced ResultType QtConcurrent::blockingMappedRed…...

编程日记 2023/11/8 10:49:13

【ARFoundation学习笔记】平面检测

写在前面的话本系列笔记旨在记录作者在学习Unity中的AR开发过程中需要记录的问题和知识点。难免出现纰漏，更多详细内容请阅读原文。文章目录平面检测属性可视化平面平面检测的开关控制显示与隐藏已检测平面平面检测属性 AR中检测平面的原理：AR Fou…...

编程日记 2023/11/8 10:48:12

Python---ljust()--左对齐、rjust()--右对齐、center()--居中对齐

作用：返回原字符串左对齐、右对齐以及居中对齐，不足的使用指定字符进行填充。 ljust 左对齐 rjust 右对齐 center 居中对齐类似于Excel、Word文档中的对齐。基本语法： 字符串序列.ljust(长度, 填充字符) 案例： …...

编程日记 2023/11/8 10:47:11

spdk用户态块层详解

先通过回顾内核态的通用块层来详细介绍SPDK通用块层，包括通用块层的架构、核心数据结构、数据流方面的考量等。最后描述基于通用块层之上的两个特性：一是逻辑卷的支持，基于通用块设备的Blobstore和各种逻辑卷的特性，精简配置&…...

编程日记 2023/11/8 10:46:09

双通道 H 桥电机驱动芯片AT8833，软硬件兼容替代DRV8833，应用玩具、打印机等应用

上期小编给大家分享了单通道 H 桥电机驱动芯片，现在来讲一讲双通道的驱动芯片。双通道 H 桥电机驱动芯片能通过控制电机的正反转、速度和停止等功能，实现对电机的精确控制。下面介绍双通道H桥电机驱动芯片的工作原理和特点。一、工作原理双通道 H 桥电…...

编程日记 2023/11/8 10:45:09

Refer：WPF从假入门到真的入门 - 知乎 (zhihu.com) Refer：WPF从假入门到真的入门 - 知乎 (zhihu.com) https://www.zhihu.com/column/c_1397867519101755392 https://blog.csdn.net/qq_44034384/article/details/106154954 https://www.cnblogs.com/mq0…...

编程日记 2023/11/8 10:43:06

复杂逻辑的开发利器—Mendix快速实现AQL质量抽检

Mendix低代码开发平台适用于复杂的业务逻辑场景，这句话大家早有耳闻，本期小编就为您打开智慧之光，仅从AQL小侧面，来管窥一二——Mendix如何形成第五代编程语言，来完成数据逻辑与建模、业务算法逻辑与建模的。&#xff…...

编程日记 2023/11/8 10:42:06

RFID系统

目录在物联网应用中有三项关键技术读写器电子标签工作原理阅读器的组成及作用： 电子标签的组成及作用： RFID系统的组成接口方式在物联网应用中有三项关键技术在物联网应用中有三项关键技术 1、传感器技术：这也是计算机应用中…...

编程日记 2023/11/8 10:41:05

Markov Chain Fingerprinting to Classify Encrypted Traffic 论文笔记

0.Abstract 在本文中，提出了用于SSL/TLS会话中传输的应用程序流量的随机指纹。这个指纹基于一阶齐次马尔可夫链，模型识别应用程序的准确率，并提供了检测异常对话的可能性。 1.Introduction 通过SSL/TLS会话时的头部信息创建统计指纹&#xff…...

编程日记 2023/11/8 10:38:02

vue 跨标签页的数据共享(即跨标签页通信)

跨标签页通信的常见方案 LocalStorage 或 SessionStorage BroadCast Channel Service Worker Shared Worker Window.postMessage() Cookies IndexedDB 什么是跨标签页通信？ 指在同一个浏览器窗口中的多个标签页之间进行数据交流和信息传递的过程。通常情况…...

编程日记 2023/11/8 10:37:01

什么是拉宾-斯科特定理？

拉宾-斯科特定理(Rabin-Scott theorem )是数学上最深刻的数学结果之一。拉宾-斯科特定理是人们最喜欢的计算机科学概念之一。当正确理解拉宾-斯科特定理时，它会以一种相当基本的方式改变你对现实的看法。然而，它典型的教科书式的呈现方式掩盖了这种深…...

编程日记 2023/11/8 10:35:59

Java并发编程第11讲——AQS设计思想及核心源码分析

Java并发包（JUC）中提供了很多并发工具，比如前面介绍过的ReentrantLock、ReentrantReadWriteLock、CountDownLatch、Semaphore、FutureTask等锁或者同步部件，它们的实现都用到了一个共同的基类——AbstractQueuedSynchronizer&…...

编程日记 2023/11/8 10:34:58

什么是数据库？数据库有哪些基本分类和主要特点？

数据库是以某种有组织的方式存储的数据集合。本文从数据库的基本概念出发，详细解读了数据库的主要类别和基本特点，并就大模型时代备受瞩目的数据库类型——向量数据库进行了深度剖析，供大家在了解数据库领域的基本概念时起到一点参考作用。 …...

编程日记 2023/11/8 10:33:57

flutter显示出底部控件的引导页

需求：同一个页面的两个不同的入口，同一个控件的位置有变化，显示引导页时对应这个控件的引导内容的位置也需要改变；同时半透明底部显示出真实的页面内容。这样的需要如果切图然后再往页面上贴位置无法精确的对准。思路&#xff1…...

编程日记 2023/11/8 10:32:56

常用设计模式——模板方法模式

什么是模板方法模式模板方法模式：定义一个操作中的算法的骨架，而将一些步骤延迟到子类中。模板方法使得子类可以不改变一个算法的结构即可重定义该算法的某些特定步骤。主要解决：一些方法通用，却要在每一个子类都重写这些方法…...

编程日记 2023/11/8 10:31:55

idea使用git删除本地提交（未推送）

1、找到reset head 2、打开弹窗，在HEAD后面输入^ 结果为HEAD^ 注释： Reset Type 有三种： Mixed（默认方式），保留本地源码，回退 commit 和 index 信息，最常用的方式Soft 回退到某个版本…...

编程日记 2023/11/8 10:30:54

centos 7部署Mysql8.0主从

Mysql官网中关于部署主从的网址环境准备： 搭建虚拟机和安装Mysql之前的文章中已经涉及，在此不再赘述。主从IPMysql账号密码主192.168.213.4root/Root1234!从192.168.213.5root/Root1234! 1、主数据库设置配置my.cnf 一般存放于/etc/。主从配…...

编程日记 2023/11/8 10:28:52

Laravel Stats Tracker迁移升级指南：从旧版本平滑过渡到新版本的完整方案

Laravel Stats Tracker迁移升级指南：从旧版本平滑过渡到新版本的完整方案【免费下载链接】tracker Laravel Stats Tracker 项目地址: https://gitcode.com/gh_mirrors/tr/tracker Laravel Stats Tracker是一款功能强大的Laravel统计跟踪工具，能够…...

编程新知 2026/4/3 13:35:10

3步诊断显存故障：memtest_vulkan如何帮你精准定位显卡问题？

3步诊断显存故障：memtest_vulkan如何帮你精准定位显卡问题？ 【免费下载链接】memtest_vulkan Vulkan compute tool for testing video memory stability 项目地址: https://gitcode.com/gh_mirrors/me/memtest_vulkan 在显卡稳定性测试领域&#…...

编程新知 2026/4/3 12:14:23

VisualCppRedist AIO：一站式解决Windows软件运行依赖问题的终极指南

VisualCppRedist AIO：一站式解决Windows软件运行依赖问题的终极指南【免费下载链接】vcredist AIO Repack for latest Microsoft Visual C Redistributable Runtimes 项目地址: https://gitcode.com/gh_mirrors/vc/vcredist 你是否曾经遇到过这样的情况&…...

编程新知 2026/4/3 11:05:42

d2s-editor：让暗黑破坏神2存档修改变得高效而简单

d2s-editor：让暗黑破坏神2存档修改变得高效而简单【免费下载链接】d2s-editor 项目地址: https://gitcode.com/gh_mirrors/d2/d2s-editor 在暗黑破坏神2的冒险旅程中，玩家常常面临三大痛点：反复刷装备消耗大量时间、测试不同职业bui…...

编程新知 2026/4/3 10:55:36

D3KeyHelper：如何通过智能操作优化解放暗黑3玩家双手的效率工具

D3KeyHelper：如何通过智能操作优化解放暗黑3玩家双手的效率工具【免费下载链接】D3keyHelper D3KeyHelper是一个有图形界面，可自定义配置的暗黑3鼠标宏工具。项目地址: https://gitcode.com/gh_mirrors/d3/D3keyHelper 一、问题场景&#xff1a…...

编程新知 2026/4/3 10:53:34

Cursor Free VIP破解指南：智能绕过AI编程助手使用限制的完整方案

Cursor Free VIP破解指南：智能绕过AI编程助手使用限制的完整方案【免费下载链接】cursor-free-vip [Support 0.45]（Multi Language 多语言）自动注册 Cursor Ai ，自动重置机器ID ， 免费升级使用Pro 功能: Youve reache…...

编程新知 2026/4/3 10:39:27

2026年成都上门回收黄金新趋势：安全便捷更放心

随着经济的发展和人们生活水平的提高，黄金作为一种重要的投资和保值手段，越来越受到人们的青睐。然而，在黄金回收的过程中，用户常常面临诸多痛点，如价格不透明、流程复杂、门店选择困难等。为了解决这些问题&#xff0…...

编程新知 2026/4/3 9:56:57

vLLM+ERNIE-4.5-0.3B-PT部署全攻略：环境准备、服务启动、前端调用

vLLMERNIE-4.5-0.3B-PT部署全攻略：环境准备、服务启动、前端调用 1. 环境准备与模型部署 1.1 硬件与系统要求在开始部署ERNIE-4.5-0.3B-PT模型前，需要确保你的系统满足以下最低配置要求： CPU：4核及以上，推荐支持A…...

编程新知 2026/4/3 9:46:54

OpenCore Legacy Patcher终极指南：老款Mac焕新升级的完整解决方案

OpenCore Legacy Patcher终极指南：老款Mac焕新升级的完整解决方案【免费下载链接】OpenCore-Legacy-Patcher Experience macOS just like before 项目地址: https://gitcode.com/GitHub_Trending/op/OpenCore-Legacy-Patcher OpenCore Legacy Patcher是一款…...

编程新知 2026/4/3 9:08:02

Wallpaper Engine下载器革新：突破创意工坊壁纸获取瓶颈的高效解决方案

Wallpaper Engine下载器革新：突破创意工坊壁纸获取瓶颈的高效解决方案【免费下载链接】Wallpaper_Engine 一个便捷的创意工坊下载器项目地址: https://gitcode.com/gh_mirrors/wa/Wallpaper_Engine 你是否曾因Steam创意工坊复杂的下载流程而放弃心仪的动态…...

编程新知 2026/4/3 8:10:55

pytorch复现_UNet

相关文章：

pytorch复现_UNet

定岗定编设计：企业职能部门定岗定编设计项目成功案例

鸿蒙原生应用开发-DevEco Studio本地模拟器的使用

QT blockingFilter blockingMap blockingMapped

【ARFoundation学习笔记】平面检测

Python---ljust()--左对齐、rjust()--右对齐、center()--居中对齐

spdk用户态块层详解

双通道 H 桥电机驱动芯片AT8833，软硬件兼容替代DRV8833，应用玩具、打印机等应用

WPF布局与控件分类

复杂逻辑的开发利器—Mendix快速实现AQL质量抽检

RFID系统

Markov Chain Fingerprinting to Classify Encrypted Traffic 论文笔记

vue 跨标签页的数据共享(即跨标签页通信)

什么是拉宾-斯科特定理？

Java并发编程第11讲——AQS设计思想及核心源码分析

什么是数据库？数据库有哪些基本分类和主要特点？

flutter显示出底部控件的引导页

常用设计模式——模板方法模式

idea使用git删除本地提交（未推送）

centos 7部署Mysql8.0主从

Laravel Stats Tracker迁移升级指南：从旧版本平滑过渡到新版本的完整方案

3步诊断显存故障：memtest_vulkan如何帮你精准定位显卡问题？

VisualCppRedist AIO：一站式解决Windows软件运行依赖问题的终极指南

d2s-editor：让暗黑破坏神2存档修改变得高效而简单

D3KeyHelper：如何通过智能操作优化解放暗黑3玩家双手的效率工具

Cursor Free VIP破解指南：智能绕过AI编程助手使用限制的完整方案

2026年成都上门回收黄金新趋势：安全便捷更放心

vLLM+ERNIE-4.5-0.3B-PT部署全攻略：环境准备、服务启动、前端调用

OpenCore Legacy Patcher终极指南：老款Mac焕新升级的完整解决方案

Wallpaper Engine下载器革新：突破创意工坊壁纸获取瓶颈的高效解决方案