当前位置：首页 > news >正文

Easy Deep Learning——池化层

news 2026/5/12 5:43:39

池化是什么？它有什么作用？

还是草地的场景，把草地分成一块块的网格，数量还是太多了，如何继续简化输入数据呢?

这时候可以只取一块网格中所有的小草的大小形状的平均值或者最大值作为一个输入数据，这样就大大简化了数据数量。

池化（Pooling）是卷积神经网络中的一种常用操作，其目的是通过减小特征图的空间大小来降低模型的复杂度。在池化操作中，我们将特征图划分为多个子区域，然后对每个子区域进行聚合操作，生成一个较小的特征图。

通常，池化操作的聚合操作可以是取最大值（Max Pooling）、取平均值（Average Pooling）等，其中最大值池化是最常用的一种。

池化的作用有以下几点：

减小特征图的空间大小，降低模型复杂度，减少计算量。
增强模型对平移不变性的学习能力，即使目标在图像中稍微移动一点，也能保持对它的识别能力。
缓解过拟合，减少模型对噪声的敏感性，提高模型的泛化能力。

在实际应用中，池化操作通常会与卷积操作交替进行，以构建一个完整的卷积神经网络。同时，由于池化操作的缩小特征图的空间大小，因此在池化操作之前，可以通过增加卷积层的数量或通道数来提高模型的表达能力，从而保持对目标的识别能力。

Pytorch中常用的池化操作的函数

还是上一篇的例子，我们把每一个卷积核的结果进行最大值或平均值池化，可得到如下结果

这样数据量明显减小。以下是python代码

import numpy as np
import torch
import torch.nn as nn
import matplotlib.pyplot as plt
from PIL import Image# 读取图像并将其转换为灰度图
img = Image.open("/home/cbc/图片/2.png")
imgGray = np.array(img.convert("L"), dtype=np.float32)  # convert("L") 转换为单通道图片imh,imw = imgGray.shape
# 将二维的灰度图像转换成四维的张量，维度为(1, 1, imh, imw)，表示一个batch，一个通道，高为imh，宽为imw
imgGray_torch = torch.from_numpy(imgGray.reshape((1,1,imh,imw)))
print(imgGray_torch.shape)
# 定义卷积核大小和卷积核矩阵，其中心为24，其余为-1
kersize = 5
ker = torch.ones(kersize, kersize, dtype=torch.float32) * -1
ker[2, 2] = 24
ker = ker.reshape((1, 1, kersize, kersize))# 将卷积核矩阵转换成张量，维度为(1, 1, kersize, kersize)，表示一个batch，一个通道，卷积核的高和宽分别为kersize
ker = ker.reshape((1, 1, kersize, kersize))# 定义一个2D卷积层，输入通道数为1，输出通道数为2，卷积核的大小为(kersize,kersize)，不使用偏置项
conv2d = nn.Conv2d(1, 2, (kersize, kersize), bias=False)# 将卷积核张量赋值给卷积层的权重，第一个通道的权重为ker
conv2d.weight.data[0] = ker# 对灰度图像进行卷积操作
imconv2dout = conv2d(imgGray_torch)
maxpoll2 = nn.MaxPool2d(2,stride=2)
pool2_out = maxpoll2(imconv2dout)# 将卷积和池化的结果的张量降维成二维数组
imconv2dout_im = pool2_out.data.squeeze()# 打印卷积结果的形状
print("卷积后的尺寸:", imconv2dout_im.shape)# 绘制卷积结果的两个通道
plt.figure(figsize=(12, 6))
plt.subplot(1, 2, 1)
plt.imshow(imconv2dout_im[0], cmap=plt.cm.gray)
plt.axis(False)
plt.subplot(1, 2, 2)
plt.imshow(imconv2dout_im[1], cmap=plt.cm.gray)
plt.axis(False)
plt.show()

可以看出，由于池化后的输入数据量减少，图像也变得模糊了。

Easy Deep Learning——池化层

池化是什么？它有什么作用？

Pytorch中常用的池化操作的函数

相关文章：

Easy Deep Learning——池化层

TryHackMe-VulnNet: Active（ez 域渗透）

TencentOS Server 安装 PostgreSQL

多线程的风险 --- 线程安全

Linux信号详解

JAVA使用POI操作EXCEL

只做笔记有必要买apple pencil吗？苹果笔的代替笔推荐

Hive---sqoop安装教程及sqoop操作

【C++】register 关键字

剑指 Offer II 024. 反转链表

从Linux内核中学习高级C语言宏技巧

详解Python的装饰器

k8s-Pod域名学习总结

0405习题总结-不定积分

QT 常用控件类型命名参考

MATLAB与图像处理的那点小事儿~

第十四届蓝桥杯模拟赛（第三期）Java组个人题解

Go语言之条件判断循环语句（if-else、switch-case、for、goto、break、continue）

深入理解AQS

JVM学习笔记十：执行引擎

自动驾驶安全迷思：从94%人为错误统计到ADAS与系统安全工程实践

PS4游戏存档管理终极指南：如何使用Apollo工具轻松备份和修改游戏进度

spawnfile：轻量级进程编排工具，提升本地开发与测试效率

ComfyUI-Impact-Pack完整安装指南：解决AI图像增强插件功能缺失问题

手把手教你用Gstreamer和V4L2在Zynq MPSoC上搭建视频流Pipeline（HDMI IN to DP OUT）

003-VXLAN集中式网关实验（命令详解版）

从荧光灯到充电器：剖析MJE13001高压小功率三极管的实战选型与参数验证

Matlab实战：基于EGM2008模型与球谐函数解析全球重力梯度场

别再只调参了！搞懂MaxPool2D的padding=‘same‘和‘valid‘，让你的CNN模型效果立竿见影

可穿戴ESD监测：从被动防护到主动感知的静电管理革命