当前位置：首页 > news >正文

借助CIFAR10模型结构理解卷积神经网络及Sequential的使用

news 2026/5/18 10:59:20

CIFAR10模型搭建

0. input : 3@32x32，3通道32x32的图片 --> 特征图(Feature maps) : 32@32x32
即经过32个3@5x5的卷积层，输出尺寸没有变化（有x个特征图即有x个卷积核。卷积核的通道数与输入的通道数相等，即3@5x5）。
两种方法推导出padding = 2、stride = 1的值：

•公式法：

𝐻𝑜𝑢𝑡=32，𝐻𝑖𝑛=32，dilation = 1(默认值，此时没有空洞)，kernel_size = 5

•理论法：为保持输出尺寸不变，padding都是卷积核大小的一半，则有padding=kernel_size/2；奇数卷积核把中心格子对准图片第一个格子，卷积核在格子外有两层那么padding=2。

1.input : 32@32x32 --> output : 32@16x16
即经过2x2的最大池化层，stride = 2（池化层的步长为池化核的尺寸），padding = 0，特征图尺寸减小一半。
2.input : 32@16x16 --> output : 32@16x16
即即经过32个3@5x5的卷积层，输出尺寸没有变化。padding = 2、stride = 1。
3.input : 32@16x16 --> output : 32@8x8
即经过2x2的最大池化层，stride = 2，padding = 0，通道数不变，特征图尺寸减小一半。
4.input : 32@8x8 --> output : 64@8x8
即即经过64个3@5x5的卷积层，输出尺寸没有变化。padding = 2、stride = 1。
5.input : 64@8x8 --> output : 64@4x4
即经过2x2的最大池化层，stride = 2，padding = 0，通道数不变，特征图尺寸减小一半。
6.input：64@4x4-->output :1×1024
即经过展平层 Flatten 作用，将64@4x4的特征图依次排开。
7.input：1×1024-->output :1×64
即经过线性层Linear1的作用。
8.input：1×64-->output：1×10
即经过线性层Linear2的作用。

代码验证：
按照网络结构一层一层搭建网络结构。
示例1：

# 导入需要用到的库
import torch
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear# 搭建CIFAR10模型网络
class Tudui(nn.Module):def __init__(self):super(Tudui, self).__init__()self.conv1 = Conv2d(3, 32, 5, padding=2) # 第一个卷积层self.maxpool1 = MaxPool2d(2) # 第一个最大池化层self.conv2 = Conv2d(32, 32, 5, padding=2) # 第二个卷积层self.maxpool2 = MaxPool2d(2) # 第二个最大池化层self.conv3 = Conv2d(32, 64, 5, padding=2) # 第三个卷积层self.maxpool3 = MaxPool2d(2) # 第三个最大池化层self.flatten = Flatten() # 展平层# 两个线性层self.linear1 = Linear(1024, 64) # 第一个线性层self.linear2 = Linear(64, 10) # 第二个线性层def forward(self, x):x = self.conv1(x)x = self.maxpool1(x)x = self.conv2(x)x = self.maxpool2(x)x = self.conv3(x)x = self.maxpool3(x)x = self.flatten(x)x = self.linear1(x)x = self.linear2(x)return xtudui = Tudui() # 实例化
print(tudui) # 观察网络信息
input = torch.ones((64, 3, 32, 32)) # 为网络创建假想输入，目的是检查网络是否正确
output = tudui(input) # 输出
print(output.shape) # torch.Size([64, 10])，结果与图片结果一致

运行结果：

# 两个print出的内容分别为：
Tudui((conv1): Conv2d(3, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))(maxpool1): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)(conv2): Conv2d(32, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))(maxpool2): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)(conv3): Conv2d(32, 64, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))(maxpool3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)(flatten): Flatten(start_dim=1, end_dim=-1)(linear1): Linear(in_features=1024, out_features=64, bias=True)(linear2): Linear(in_features=64, out_features=10, bias=True)
)
torch.Size([64, 10])

Sequential的使用

当模型中只是简单的前馈网络时，即上一层的输出直接作为下一层的输入，这时可以采用torch.nn.Sequential()模块来快速搭建模型，而不必手动在forward()函数中一层一层地前向传播。因此，如果想快速搭建模型而不考虑中间过程的话，推荐使用torch.nn.Sequential()模块。

接下来用torch.nn.Sequential()改写示例 1，示例 2 如下。
示例2：

# 导入需要用到的库
import torch
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential# 搭建CIFAR10模型网络
class Tudui(nn.Module):def __init__(self):super(Tudui, self).__init__()self.model1 = Sequential(Conv2d(3, 32, 5, padding=2),  # 第一个卷积层MaxPool2d(2),  # 第一个最大池化层Conv2d(32, 32, 5, padding=2), # 第二个卷积层MaxPool2d(2), # 第二个最大池化层Conv2d(32, 64, 5, padding=2),  # 第三个卷积层MaxPool2d(2),  # 第三个最大池化层Flatten(),  # 展平层# 两个线性层Linear(1024, 64),  # 第一个线性层Linear(64, 10)  # 第二个线性层)def forward(self, x):x = self.model1(x)return xtudui = Tudui() # 实例化
print(tudui) # 观察网络信息
input = torch.ones((64, 3, 32, 32)) # 为网络创建假想输入，目的是检查网络是否正确
output = tudui(input) # 输出
print(output.shape) # torch.Size([64, 10])，结果与图片结果一致

运行结果：

# 两个print出来的结果分别为：
Tudui((model1): Sequential((0): Conv2d(3, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))(1): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)(2): Conv2d(32, 32, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))(3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)(4): Conv2d(32, 64, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))(5): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)(6): Flatten(start_dim=1, end_dim=-1)(7): Linear(in_features=1024, out_features=64, bias=True)(8): Linear(in_features=64, out_features=10, bias=True))
)
torch.Size([64, 10])

我们发现，使用Sequential之后得到的结果（示例2）与按照前向传播一层一层搭建得到的结果（示例1）一致，使用Sequential之后可以使得forward函数中的内容得以简化。

使用tensorboard实现网络结构可视化

# 导入需要用到的库
import torch
from torch import nn
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear
from torch.utils.tensorboard import SummaryWriter# 搭建CIFAR10模型网络class Tudui(nn.Module):def __init__(self):super(Tudui, self).__init__()self.conv1 = Conv2d(3, 32, 5, padding=2) # 第一个卷积层self.maxpool1 = MaxPool2d(2) # 第一个最大池化层self.conv2 = Conv2d(32, 32, 5, padding=2) # 第二个卷积层self.maxpool2 = MaxPool2d(2) # 第二个最大池化层self.conv3 = Conv2d(32, 64, 5, padding=2) # 第三个卷积层self.maxpool3 = MaxPool2d(2) # 第三个最大池化层self.flatten = Flatten() # 展平层# 两个线性层self.linear1 = Linear(1024, 64) # 第一个线性层self.linear2 = Linear(64, 10) # 第二个线性层def forward(self, x):x = self.conv1(x)x = self.maxpool1(x)x = self.conv2(x)x = self.maxpool2(x)x = self.conv3(x)x = self.maxpool3(x)x = self.flatten(x)x = self.linear1(x)x = self.linear2(x)return xtudui = Tudui() # 实例化
print(tudui) # 观察网络信息
input = torch.ones((64, 3, 32, 32)) # 为网络创建假想输入，目的是检查网络是否正确
output = tudui(input) # 输出
print(output.shape) # torch.Size([64, 10])，结果与图片结果一致# 使用tensorboard实现网络可视化
writer = SummaryWriter("./log_sequential")
writer.add_graph(tudui, input)
writer.close()

运行上述代码，则会在项目文件夹CIFAR10model中出现对应的日志文件夹log_sequential。

随后打开Terminal，如下图所示。

输入tensorboard --logdir=log_sequential，如下图所示。

按下Enter键，得到一个网址，如下图所示。

打开这个网址，得到可视化界面。

我们点开搭建好的网络Tudui，可以得到更具体的网络每一层，如下图所示。

我们将其放大，如下图所示。

借助CIFAR10模型结构理解卷积神经网络及Sequential的使用

CIFAR10模型搭建 CIFAR10模型结构 0. input : 332x32，3通道32x32的图片 --> 特征图(Feature maps) : 3232x32即经过32个35x5的卷积层，输出尺寸没有变化（有x个特征图即有x个卷积核。卷积核的通道数与输入的通道数相等，即35x5&am…...

编程日记 2023/9/7 5:25:56

Java # Java基础八股

1、JVM、JRE、JDK之间的关系个人理解：JVM可以帮助屏蔽底层的操作系统，使程序一次编译到处都可以运行，JVM可以运行class文件。JRE是java文件运行的环境，但不能新建程序，JRE包含JVM。JDK功能最齐全，包含了编…...

编程日记 2023/9/7 5:24:55

【Spring Boot】SpringBoot 2.6.6 集成 SpringDoc 1.6.9 生成swagger接口文档

文章目录前言一、SpringDoc是什么？二、使用步骤1.引入库2.配置类3.访问测试总结其他配置立个Flag 前言之前常用的SpringFox在2020年停止更新了，新项目集成SpringFox出来一堆问题，所以打算使用更活跃的SpringDoc，这里简单介绍一…...

编程日记 2023/9/7 5:23:54

【算法】快速排序详解

快速排序详解快速排序1. 挖坑法2. 左右指针法 （Hoare 法）3. 前后指针法4. 快排非递归代码优化排序： 排序，就是使一串记录，按照其中的某个或某些关键字的大小，递增或递减的排列起来的操作。稳定性&…...

编程日记 2023/9/7 5:22:53

架构师spring boot 面试题

spring boot 微服务有哪些特点？ Spring Boot 微服务具有以下特点： 独立性：每个微服务都是独立的部署单元，有自己的代码库和数据库。这使得微服务可以独立开发、测试、部署和扩展。分布式：微服务架构将一个大型应用程…...

编程日记 2023/9/7 5:21:52

电商系统架构设计系列（十一）：在电商的交易类系统中，如何正确地使用 Redis 这样的缓存系统呢？需要考虑哪些问题？

上篇文章中，我给你留了一个思考题：在电商的交易类系统中，如何正确地使用 Redis 这样的缓存系统呢？需要考虑哪些问题？ 这篇文章，我们来聊聊。引言我们知道，大部分面向公众用户的互联网系统&a…...

编程日记 2023/9/7 5:20:51

MySQL数据库和表的操作

数据库基础存储数据用文件就可以了，为什么还要弄个数据库? 文件保存数据有以下几个缺点： 1、文件的安全性问题 2、文件不利于数据查询和管理 3、文件不利于存储海量数据 4、文件在程序中控制不方便数据库存储介质： 磁盘内存为了解决上…...

编程日记 2023/9/7 5:19:50

DAY-01--分布式微服务基础概念

一、项目简介了解整体项目包含后端、前端、周边维护。整个项目的框架知识。二、分布式基础概念 1、微服务将应用程序基于业务拆分为多个小服务，各小服务单独部署运行，采用http通信。 2、集群&分布式&节点集群是个物理形态，…...

编程日记 2023/9/7 5:18:49

记：一次关于paddlenlp、python、版本之间的兼容性问题

兼容版本 Python 3.10.8 absl-py1.4.0 accelerate0.19.0 addict2.4.0 aiofiles23.1.0 aiohttp3.8.3 aiosignal1.3.1 alembic1.10.4 aliyun-python-sdk-core2.13.36 aliyun-python-sdk-kms2.16.0 altair4.2.2 altgraph0.17.3 aniso86019.0.1 antlr4-python3-runtime4.9.3 anyi…...

编程日记 2023/9/7 5:17:48

MyBatis配置及单表操作

文章目录一. MyBatis概述二. MyBatis项目的创建1. 准备一个数据表2. 创建项目三. MyBatis的使用1. 基本使用2. SpringBoot单元测试四. 使用MyBatis实现单表操作1. 查询2. 修改3. 删除4. 新增五. 基于注解完成SQL 一. MyBatis概述 MyBatis 是一款优秀的持久层框架&#xff…...

编程日记 2023/9/7 5:16:48

python基础教程：深浅copy的详细用法

前言嗨喽，大家好呀~这里是爱看美女的茜茜呐 1.先看赋值运算 l1 [1,2,3,[barry,alex]] l2 l1l1[0] 111 print(l1) # [111, 2, 3, [barry, alex]] print(l2) # [111, 2, 3, [barry, alex]]l1[3][0] wusir print(l1) # [111, 2, 3, [wusir, alex]] print(l2)…...

编程日记 2023/9/7 5:15:47

【算法篇】动态规划（二）

文章目录分割回文字符串编辑距离不同的子序列动态规划解题思路分割回文字符串 class Solution { public:bool isPal(string& s,int begin,int end){while(begin<end){if(s[begin]!s[end]){return false;}begin;end--;}return true;}int minCut(string s) {int lens.si…...

编程日记 2023/9/7 5:14:46

数据库 SQL高级查询语句：聚合查询,多表查询，连接查询

目录创建学生表聚合查询聚合函数直接查询设置别名查询设置条件查询常用的聚合函数分组查询单个字段Group by报错分组查询多字段分组查询多表查询直接查询重命名查询Students表新建一列CourseID 连接（JOIN）查询INNER JOINRIGHT JOIN, LEFT JOINFULL J…...

编程日记 2023/9/7 5:13:45

pytorch-构建卷积神经网络

构建卷积神经网络卷积网络中的输入和层与传统神经网络有些区别，需重新设计，训练模块基本一致 import torch import torch.nn as nn import torch.optim as optim import torch.nn.functional as F from torchvision import datasets,transforms impor…...

编程日记 2023/9/7 5:12:44

点云从入门到精通技术详解100篇-点云滤波算法及单木信息提取（续）

目录 3.3 点云滤波算法原理概述 3.3.1 坡度滤波算法 3.3.2 基于不规则三角网滤波 3.3.3 数学形态学滤波...

编程日记 2023/9/7 5:11:43

Gartner发布中国科技报告：数据编织和大模型技术崭露头角

近日，全球知名科技研究和咨询机构Gartner发布了关于中国数据分析与人工智能技术的最新报告。报告指出，中国正迎来数据分析与人工智能领域的蓬勃发展，预计到2026年，将有超过30%的白领工作岗位重新定义，生成式人工智能技…...

编程日记 2023/9/7 5:10:43

java八股文面试[数据库]——explain

使用 EXPLAIN 关键字可以模拟优化器来执行SQL查询语句，从而知道MySQL是如何处理我们的SQL语句的。分析出查询语句或是表结构的性能瓶颈。 MySQL查询过程通过explain我们可以获得以下信息： 表的读取顺序数据读取操作的操作类型哪些索引可以被使用 …...

编程日记 2023/9/7 5:09:42

Kafka3.0.0版本——增加副本因子

目录一、服务器信息二、启动zookeeper和kafka集群2.1、先启动zookeeper集群2.2、再启动kafka集群三、增加副本因子3.1、增加副本因子的概述3.2、增加副本因子的示例3.2.1、创建topic(主题)3.2.2、手动增加副本存储一、服务器信息四台服务器原始服务器名称原始服务器ip节点…...

编程日记 2023/9/7 5:08:41

升级iOS 17出现白苹果、不断重启等系统问题怎么办？

iOS 17发布后了，很多果粉都迫不及待的将iphone/ipad升级到最新iOS17系统，体验新系统功能。但部分果粉因硬件、软件的各种情况，导致升级系统后出现故障，比如白苹果、不断重启、卡在系统升级界面等等问题。如果遇到了这些系统问题…...

编程日记 2023/9/7 5:07:39

6. `Java` 并发基础之`ReentrantReadLock`

前言：随着多线程程序的普及，线程同步的问题变得越来越常见。Java中提供了多种同步机制来确保线程安全，其中之一就是ReentrantLock。ReentrantLock是Java中比较常用的一种同步机制，它提供了一系列比synchronized更加灵活和可控的操…...

编程日记 2023/9/7 5:06:38

从SolidWorks到Geant4仿真：我的第一个粒子探测器CAD模型导入全记录（含CADMesh避坑点）

从SolidWorks到Geant4仿真：我的第一个粒子探测器CAD模型导入全记录（含CADMesh避坑点） 作为一名刚接触粒子探测器仿真的研究生，我花了整整两周时间才成功将SolidWorks设计的模型导入Geant4进行模拟。这个过程远比想象中复杂&#x…...

编程新知 2026/5/17 11:06:07

ChatGPT资源宝库：从提示工程到项目实践的完整指南

1. 项目概述：一份关于ChatGPT的“Awesome”清单意味着什么？如果你最近在GitHub上搜索过任何与ChatGPT、AI或提示工程相关的内容，那么你大概率见过一个以“awesome-”开头的仓库。而sindresorhus/awesome-chatgpt无疑是这个领域里最知名、最常…...

编程新知 2026/5/17 11:06:01

从零构建现代化Web控制面板：安全架构与实时监控实践

1. 项目概述：一个为开发者设计的现代化控制面板最近在GitHub上看到一个挺有意思的项目，叫clawpanel，作者是kweephyo-pmt。光看名字，你可能会联想到“爪子”和“面板”，感觉像是个带点攻击性或工具属性的管理界面。实际…...

编程新知 2026/5/18 10:44:28

δ - mem：提升大型语言模型内存效率，得分最高可达 1.31 倍！

快速通道可了解 arXiv 成为独立非营利组织的情况，也能直达康奈尔大学官网。同时，还能通过链接进行捐赠，支持 arXiv 的发展。搜索与导航提供了多种搜索途径，可在所有字段（标题、作者、摘要等）进行搜索。还有…...

编程新知 2026/5/18 10:34:37

Java 大厂面试 200 题完整版含答案解析

前言本文整理了近两年从阿里、腾讯、字节、美团、京东、拼多多等大厂面试中高频出现的 200 道 Java 面试题，覆盖 Java 基础、集合、并发、JVM、Spring、MySQL、Redis、消息队列、分布式、场景设计等核心模块，每题都附有简明扼要的答案解析，助…...

编程新知 2026/5/18 9:55:32

C++定时器避坑指南：线程安全、资源泄漏与时间轮参数怎么调？一次讲清楚

C定时器避坑指南：线程安全、资源泄漏与时间轮参数调优实战在分布式系统和高并发场景中，定时器如同系统的心跳机制，其稳定性直接决定服务可靠性。去年某电商平台大促期间，由于定时任务堆积导致的雪崩效应，造成近千万损…...

编程新知 2026/5/17 8:15:07

Unity游戏开发集成MCP协议：AI助手自动化操作指南

1. 项目概述：Unity游戏开发中的MCP革命如果你是一名Unity开发者，最近可能已经注意到一个名为“CoderGamester/mcp-unity”的项目在GitHub上悄然走红。这不仅仅是一个普通的插件或工具包，它代表了一种全新的工作流范式，旨在将大型语…...

编程新知 2026/5/17 8:04:28

企业级后端四层架构实战：从理论到代码的清晰落地

1. 项目概述：一个四层架构的实战蓝图最近在GitHub上看到一个挺有意思的项目，叫BTawaifi/four-layer-system。光看名字，你可能会觉得这又是一个老生常谈的“四层架构”理论教程，无非是Controller、Service、Repository那套东西。但…...

编程新知 2026/5/17 6:08:25

从零构建现代化工作流引擎：架构、实战与生产级部署指南

1. 项目概述：一个为专业开发者打造的现代化工作流引擎最近在GitHub上看到一个挺有意思的项目，叫rohitg00/pro-workflow。光看名字，你可能觉得这又是一个“工作流”工具，市面上这类工具已经多如牛毛了。但当我深入去研究它的源码、…...

编程新知 2026/5/17 5:31:40

ComfyUI-Manager终极指南：3步掌握AI绘画插件管理技巧

ComfyUI-Manager终极指南：3步掌握AI绘画插件管理技巧【免费下载链接】ComfyUI-Manager ComfyUI-Manager is an extension designed to enhance the usability of ComfyUI. It offers management functions to install, remove, disable, and enable various custom…...

编程新知 2026/5/17 5:29:34

CIFAR10模型搭建

Sequential的使用

使用tensorboard实现网络结构可视化

相关文章：