当前位置：首页 > news >正文

CNN卷积详解（三）

news 2026/2/11 5:02:20

一、卷积层的计算

4 $*$ 4的输入矩阵 $I$ 和 3 $*$ 3 的卷积核 $K$ :

在步长（stride）为 1 时，输出的大小为 ( 4 − 3 + 1 ) × ( 4 − 3 + 1)

计算公式：
● 输入图片矩阵 $I$ 大小： $w \times w$
● 卷积核 $K$ ： $k \times k$
● 步长 $S$ ： $s$
● 填充大小（padding）： $p$

$\frac{(w − k + 2p )}{s}+1$

输出图片大小为： $o \times o$
● 步长为2，卷积核为33，p=0的卷积情况如下：

当卷积函数中padding='same’时，会动态调整 $p$ 值，确保 $o = w$ ，即保证输入与输出一致。例如：输入是 28281 输出也为 28281 。
● 步长为1，卷积核为33，padding='same’的卷积情况如下：

在这里插入图片描述

🔍实例：
$7 * 7$ 的 input， $3 * 3$ 的 kernel，无填充（padding=0），步长为1，则 $\frac{(7 − 3 )}{1}+1$ 也即 output size 为 $5 * 5$
在这里插入图片描述
$7 * 7$ 的 input， $3 * 3$ 的 kernel，无填充（padding=0），步长为2，则 $\frac{(7 − 3 )}{2}+1$ 也即 output size 为 $3 * 3$

二、卷积层运算量的计算

在这里插入图片描述
对于第一个卷积过程涉及的计算量计算过程如下：

首先，我们需要计算卷积层的参数量。对于一个卷积核大小为 $\times k$ ，输入特征图大小为 $\times w \times c_{in}$ ，输出特征图大小为 $\times w' \times c_{out}$ 的卷积层，其参数量为：

𝑃𝑎𝑟𝑎𝑚 = $k^2 \times c_{in} \times c_{out}$ + $c_{out}$

其中最后的 $c_{out}$ 是bias的数量

引自： [假设卷积核的大小为 k*k, 输入channel为M，输出channel为N。]
（1）bias为True时：参数数量为： $k \times k \times M \times N + N$ （bias的数量与输出channel的数量是一样的）

（2）bias为False时：参数数量为： $k \times k \times M \times N$

（3）当使用BN时，还有两个可学习的参数α和β，参数量均为N 则参数数量为： $k \times k \times M \times N + 3 \times N$

对于本题，输入特征图大小为 $100 \times 100 \times 128$ ，输出特征图大小为 $100 \times 100 \times 256$ ，卷积核大小为 $\times 5$ ，且填充为 2，步长为 1，输出通道数为 256。因此，每个卷积层的参数量为：

𝑃𝑎𝑟𝑎𝑚 = $5^2 \times 128 \times 256$ + 256 ≈ $8.192 \times 10^5$

参数量会计算了，那么 $F L OP s$ 其实也是很简单的，就一个公式：

$FLOPs_{total}$ = 𝑃𝑎𝑟𝑎𝑚 $\times h' \times w'$ = $8.192 \times 10^5 \times 100 \times 100$ = $8.192 \times 10^9$

因此，经过具有 256 个输出的 5x5 卷积层之后，输出数据为 100x100x256 的计算量是约为 $8.192 \times 10^{9} FLOPs$ 。

对于第二个卷积过程涉及的计算量计算过程如下：

首先考虑 1x1 卷积层的计算量。套用上面的公式，输入特征图大小为 $100 \times 100 \times 128$ ，输出通道数为 32，因此经过 1x1 卷积层后，输出特征图大小为 $100 \times 100 \times 32$ ，这里的bias值很小我直接省了，计算量为：

$FLOPs_{1\times1}$ = $1^2 \times 128 \times 32 \times 100 \times 100 = 4.096 \times 10^7$

接下来考虑 5x5 卷积层的计算量，经过 1x1 卷积层后，输出特征图大小为 $100 \times 100 \times 32$ ，输入通道数为 32，输出通道数为 256，卷积核大小为 5x5，填充为 2，步长为 1，这里的bias值很小我直接省了，计算量为：

$FLOPs_{5\times5}$ = $5^2 \times 32 \times 256 \times 100 \times 100= 2.048 \times 10^{9}$

因此，经过具有 32 个 1x1大小的卷积核的卷积层和具有 256 个5x5大小的卷积核的卷积层之后，输出数据为 100x100x256 的计算量为

$FLOPs_{1\times1} + FLOPs_{5\times5}$ ≈ $2.048 \times 10^{9}$

CNN卷积详解（三）

一、卷积层的计算

二、卷积层运算量的计算

相关文章：

CNN卷积详解（三）

使用 Amazon Redshift Serverless 和 Toucan 构建数据故事应用程序

CentOS 上快速安装包管理工具Conda

opencv-手势识别

【SA8295P 源码分析】10 - HQX Display（OpenWFD）qcdisplaycfg_ADP_STAR_LA.xml 配置文件解析

达梦数据库权限和预定角色介绍

Python编程从入门到实践_8-8 用户的专辑_答案

HummingBird 基于 Go 开源超轻量级 IoT 物联网平台

10.小程序样式

Flink 流式读写文件、文件夹

【SA8295P 源码分析】64 - QNX 与 Android GVM 显示 Dump 图片方法汇总

字符串旋转（1）

【SA8295P 源码分析】13 - Android GVM 虚拟机 QUPv3 UART / SPI / I2C功能配置及透传配置

STM32 F103C8T6学习笔记10：OLED显示屏GIF动图取模—简易时钟—动图手表的制作~

大数据课程K3——Spark的常用案例

85-最大矩阵

8.3 【C语言】通过指针引用数组

基于Flink CDC实时同步PostgreSQL与Tidb【Flink SQL Client模式下亲测可行，详细教程】

Vue-5.编译器Idea

qiuzhiji3

深度学习在微纳光子学中的应用

RocketMQ延迟消息机制

23-Oracle 23 ai 区块链表（Blockchain Table）

可靠性+灵活性：电力载波技术在楼宇自控中的核心价值

全志A40i android7.1 调试信息打印串口由uart0改为uart3

处理vxe-table 表尾数据是单独一个接口，表格tableData数据更新后，需要点击两下，表尾才是正确的

【C++进阶篇】智能指针

高考志愿填报管理系统---开发介绍

Linux 下 DMA 内存映射浅析

Python 高级应用10：在python 大型项目中 FastAPI 和 Django 的相互配合