当前位置：首页 > news >正文

【图像分割】理论篇（2）经典图像分割网络基于vgg16的Unet

news 2026/2/9 13:01:23

UNet 是一种用于图像分割任务的深度学习架构，最早由 Olaf Ronneberger、Philipp Fischer 和 Thomas Brox 在2015年的论文 "U-Net: Convolutional Networks for Biomedical Image Segmentation" 中提出。UNet 在医学图像分割等领域取得了显著的成功，但也可以用于其他图像分割任务。

UNet 的核心思想是将编码器和解码器结合在一起，形成一个 U 字形的网络结构。编码器部分用于逐渐减少空间分辨率和提取高级特征，而解码器部分则逐渐恢复分辨率并生成与输入图像相同大小的分割结果。UNet 的设计使得它能够在较小的数据集上有效地训练，并且在医学图像等领域中表现优异。

一、整体网络构架

二、网络实现细节

三、代码实现

import torch
import torch.nn as nn
import torch.nn.functional as F
from torchvision.models import vgg16class unetUp(nn.Module):def __init__(self, in_size, out_size):super(unetUp, self).__init__()self.conv1 = nn.Conv2d(in_size, out_size, kernel_size=3, padding=1)self.conv2 = nn.Conv2d(out_size, out_size, kernel_size=3, padding=1)self.up = nn.UpsamplingBilinear2d(scale_factor=2)def forward(self, inputs1, inputs2):outputs = torch.cat([inputs1, self.up(inputs2)], 1)outputs = self.conv1(outputs)outputs = self.conv2(outputs)return outputsclass Unet(nn.Module):def __init__(self, num_classes=2, in_channels=3, pretrained=False):super(Unet, self).__init__()self.vgg = vgg16(pretrained=pretrained)# self.vgg=self.vgg.featuresin_filters = [192, 384, 768, 1024]out_filters = [64, 128, 256, 512]# upsamplingself.up_concat4 = unetUp(in_filters[3], out_filters[3])self.up_concat3 = unetUp(in_filters[2], out_filters[2])self.up_concat2 = unetUp(in_filters[1], out_filters[1])self.up_concat1 = unetUp(in_filters[0], out_filters[0])# final conv (without any concat)self.final = nn.Conv2d(out_filters[0], num_classes, 1)def forward(self, inputs):feat1 = self.vgg.features[:4](inputs)feat2 = self.vgg.features[4:9](feat1)feat3 = self.vgg.features[9:16](feat2)feat4 = self.vgg.features[16:23](feat3)feat5 = self.vgg.features[23:-1](feat4)up4 = self.up_concat4(feat4, feat5)up3 = self.up_concat3(feat3, up4)up2 = self.up_concat2(feat2, up3)up1 = self.up_concat1(feat1, up2)final = self.final(up1)return finaldef _initialize_weights(self, *stages):for modules in stages:for module in modules.modules():if isinstance(module, nn.Conv2d):nn.init.kaiming_normal_(module.weight)if module.bias is not None:module.bias.data.zero_()elif isinstance(module, nn.BatchNorm2d):module.weight.data.fill_(1)module.bias.data.zero_()if __name__=="__main__":model=Unet()# model=model.cuda()image=torch.randn((1,3,512,512))# image=image.cuda()print(model(image))output=model(image)print(output.size())print(model)

【图像分割】理论篇（2）经典图像分割网络基于vgg16的Unet

一、整体网络构架

二、网络实现细节

三、代码实现

相关文章：

【图像分割】理论篇（2）经典图像分割网络基于vgg16的Unet

vue插入重复的html内容

计算机网络-物理层(三)-信道的极限容量

Http/Websocket协议的长连接和短连接的错误认识详细解读（史上最通俗）

两两交换链表中的节点

HTTP与RPC的取舍

微前端学习（上）

【Axure视频教程】标签版多选下拉列表

Sharepoint2013必备软件安装路径

C++day4（关系运算符的重载）

农业水价综合改革系统主要组成

使用批处理文件(.bat)启动多个CMD窗口并执行命令

开源项目-会议室预约管理系统

Flask路由注册route的几种方式

Elasticsearch 查询之Function Score Query

【3D激光SLAM】LOAM源代码解析--scanRegistration.cpp

解锁ChatGLM-6B的潜力：优化大语言模型训练，突破任务困难与答案解析难题

Apipost：提升API开发效率的利器

论文解读：Image-Adaptive YOLO for Object Detection in Adverse Weather Conditions

springboot 基于JAVA的动漫周边商城的设计与实现64n21

国防科技大学计算机基础课程笔记02信息编码

springboot 百货中心供应链管理系统小程序

云启出海，智联未来｜阿里云网络「企业出海」系列客户沙龙上海站圆满落地

如何在看板中体现优先级变化

django filter 统计数量按属性去重

Redis：现代应用开发的高效内存数据存储利器

Python 高效图像帧提取与视频编码：实战指南

热烈祝贺埃文科技正式加入可信数据空间发展联盟

使用SSE解决获取状态不一致问题

02-性能方案设计