深度学习:如何复现神经网络
深度学习:如何复现神经网络
要复现图中展示的卷积神经网络(CNN),我们需详细了解和配置每层网络的功能与设计理由。以下将具体解释各层的配置以及设计选择的原因,确保网络设计的合理性与有效性。
详细的网络层配置与设计理由
输入层
- 规格: 3x32x32,代表处理的是32x32像素的彩色图像,有3个颜色通道(RGB)。这是标准的图像输入尺寸,适合大多数基于图像的深度学习应用,特别是在较小的数据集如CIFAR-10上。
第一卷积层
- 卷积核大小: 5x5,可以捕捉到图片中的小特征(如边缘和角落)。
- 输出通道: 32,这意味着网络将从输入图像中学习32种不同的特征表示。
- 填充: 2,为了保持输出特征图的空间尺寸与输入相同,从而不丢失边缘信息。
- 激活函数: ReLU,用于引入非线性,帮助网络学习复杂的模式。
- 设计理由: 第一层通常设计为能捕捉基本特征的层,使用较大的卷积核来获取更广泛的输入区域信息,并增加输出通道以捕捉多样的特征。
第一最大池化层
- 核大小和步长: 2x2,步长通常与核大小相同,用于降低特征图的空间尺寸,减少计算量,并帮助抵抗输入的小幅度位移。
- 设计理由: 池化层跟在卷积层后面,用于压缩数据和参数的数量,并减小过拟合的风险。
第二卷积层
- 参数与第一卷积层相同,保持32个通道,这样可以在不过度增加计算负担的前提下,进一步分析由第一层检测到的特征。
- 设计理由: 重复使用相同配置的卷积层可以深化特征的层次,提高特征提取的效果。
第二最大池化层
- 配置与第一池化层相同,继续降低特征图的空间维度,并增强模型的抽象能力。
- 设计理由: 继续压缩数据,准备更深层次的特征提取。
第三卷积层
- 输出通道: 64,增加输出通道数,可以捕捉更复杂的特征。
- 设计理由: 在网络的更深层次增加更多的通道,以便网络可以学习更复杂、更抽象的特征表示。
第三最大池化层
- 配置与前两个池化层相同,进一步降低特征图尺寸,简化网络输出之前的计算需求。
- 设计理由: 最后一次池化减少最终特征的空间尺寸,为全连接层处理准备。
展平操作
- 功能: 将多维的卷积或池化输出转换成一维数组,以便作为全连接层的输入。
- 设计理由: 展平是从卷积层到全连接层的桥梁,它将二维特征图转换为一维特征向量。
全连接层
- 第一层: 输入来自展平后的1024维向量(由64个4x4的特征图展平得到),输出到64个神经元,这一转换通过全连接层学习特征的全局模式。
- 第二层: 将64维的输出映射到10个输出类别,对应于分类任务中的类别数。
- 设计理由: 全连接层在网络末端,用于根据提取的特征执行分类任务。
结合PyTorch代码实现
import torch
import torch.nn as nn
import torch.nn.functional as Fclass CustomCNN(nn.Module):def __init__(self):super(CustomCNN, self).__init__()# 初始化模块,继承nn.Module# 第一层:卷积层# 输入通道3(RGB图像),输出通道32,卷积核大小5x5,填充2# 使用填充2是为了保持图像尺寸不变,便于堆叠多层卷积self.layer1 = nn.Sequential(nn.Conv2d(3, 32, 5, padding=2),nn.ReLU(), # ReLU激活函数增加非线性,有助于学习复杂模式nn.MaxPool2d(2, 2) # 最大池化层,核大小2x2,步长2,用于降低特征图维度)# 第二层:卷积层# 保持相同的通道数32,卷积核大小5x5,填充2self.layer2 = nn.Sequential(nn.Conv2d(32, 32, 5, padding=2),nn.ReLU(),nn.MaxPool2d(2, 2))# 第三层:卷积层# 增加输出通道至64,以提高网络的学习能力self.layer3 = nn.Sequential(nn.Conv2d(32, 64, 5, padding=2),nn.ReLU(),nn.MaxPool2d(2, 2))# 全连接层# 展平后的数据大小为64*4*4,因为最后的特征图大小为4x4,通道数为64self.fc1 = nn.Linear(64 * 4 * 4, 64) # 第一个全连接层,从1024维到64维self.fc2 = nn.Linear(64, 10) # 第二个全连接层,从64维输出到10维,对应10个类别def forward(self, x):# 定义网络的前向传播路径x = self.layer1(x) # 通过第一层卷积、ReLU和池化x = self.layer2(x) # 通过第二层卷积、ReLU和池化x = self.layer3(x) # 通过第三层卷积、ReLU和池化x = x.view(-1, 64 * 4 * 4) # 展平操作,为全连接层准备x = F.relu(self.fc1(x)) # 通过第一个全连接层并应用ReLU激活函数x = self.fc2(x) # 通过第二个全连接层得到最终的分类结果return x# 实例化模型并打印出模型结构
model = CustomCNN()
print(model)
模型结构说明
连接层得到最终的分类结果
return x
实例化模型并打印出模型结构
model = CustomCNN()
print(model)
### 模型结构说明此代码定义了一个典型的卷积神经网络,它通过多个卷积层和池化层逐步提取图像特征,然后通过全连接层进行分类。每个卷积层后都跟有ReLU激活函数以及最大池化操作,目的是增强网络的非线性处理能力和减少特征维度,从而抑制过拟合并提高泛化能力。最终通过全连接层输出预测结果,适用于多类分类任务。
相关文章:

深度学习:如何复现神经网络
深度学习:如何复现神经网络 要复现图中展示的卷积神经网络(CNN),我们需详细了解和配置每层网络的功能与设计理由。以下将具体解释各层的配置以及设计选择的原因,确保网络设计的合理性与有效性。 详细的网络层配置与设…...

Spring Boot与MyBatis-Plus的高效集成
Spring Boot与MyBatis-Plus的高效集成 引言 在现代 Java 开发中,MyBatis-Plus 作为 MyBatis 的增强工具,以其简化 CRUD 操作和无需编写 XML 映射文件的特点,受到了开发者的青睐。本篇文章将带你一步步整合 Spring Boot 与 MyBatis-Plus&…...

【Unity ShaderGraph实现流体效果之Function入门】
Unity ShaderGraph实现流体效果之Node入门(一) 前言Shader Graph NodePosition NodeSplit NodeSubtract NodeBranch Node 总结 前言 Unity 提供的Shader Graph在很大程度上简化了开发者对于编写Shader的工作,只需要拖拽即可完成一个视觉效果…...
Spark RDD sortBy算子执行时进行数据 “采样”是什么意思?
一、sortBy 和 RangePartitioner sortBy 在 Spark 中会在执行排序时采用 rangePartitioner 进行分区,这会影响数据的分区方式,并且这一步骤是通过对数据进行 “采样” 来计算分区的范围。不过,重要的是,sortBy 本身仍然是一个 tr…...
React-useRef与DOM操作
#题引:我认为跟着官方文档学习不会走歪路 ref使用 组件重新渲染时,react组件函数里的代码会重新执行,返回新的JSX,当你希望组件“记住”某些信息,但又不想让这些信息触发新的渲染时,你可以使用ref&#x…...

Mistral AI 发布 Pixtral Large 模型:多模态时代的开源先锋
Mistral AI 最新推出的 Pixtral Large 模型,带来了更强的多模态能力。作为一款开源的多模态模型,它不仅在参数量上达到 1240 亿,更在文本和图像理解上实现了质的飞跃。 模型亮点 1. 多模态能力再升级 Pixtral Large 配备了 123B 参数的解码器…...
Windows、Linux多系统共享蓝牙设备
Windows、Linux多系统共享蓝牙设备 近来遇到一个新问题,就是双系统共享蓝牙鼠标。因为一直喜欢在Windows、Linux双系统之间来回切换,而每次切换系统蓝牙就必须重新配对,当然,通过网络成功解决了问题。 通过这个问题,稍…...

C语言 | Leetcode C语言题解之第564题寻找最近的回文数
题目: 题解: #define MAX_STR_LEN 32 typedef unsigned long long ULL;void reverseStr(char * str) {int n strlen(str);for (int l 0, r n-1; l < r; l, r--) {char c str[l];str[l] str[r];str[r] c;} }ULL * getCandidates(const char * n…...

wsl虚拟机中的dockers容器访问不了物理主机
1 首先保证wsl虚拟机能够访问宿主机IP地址,wsl虚拟机通过vEthernet (WSL)的地址访问,着意味着容器也要通过此IP地址访问物理主机。 2 遇到的问题:wsl虚拟机中安装了docker,用在用到docker容器内的开发环境,但是虚拟机…...
Spark RDD 的宽依赖和窄依赖
通俗地理解 Spark RDD 的 宽依赖 和 窄依赖,可以通过以下比喻和解释: 1. 日常生活比喻 假设你在管理多个团队完成工作任务: 窄依赖:每个团队只需要关注自己的分工,完成自己的任务。例如,一个人将纸张折好&…...

二进制转十进制
解题思路分析 二进制转十进制原理:二进制数转换为十进制数的基本原理是按位权展开相加。对于一个二进制数,从右往左每一位的位权依次是将每一位上的数字(0 或 1)乘以其对应的位权,然后把所有结果相加,就得…...
深度学习:神经网络中的非线性激活的使用
深度学习:神经网络中的非线性激活的使用 在神经网络中,非线性激活函数是至关重要的组件,它们使网络能够捕捉和模拟输入数据中的复杂非线性关系。这些激活函数的主要任务是帮助网络解决那些无法通过简单的线性操作(如权重相乘和偏…...
Python缓存:两个简单的方法
缓存是一种用于提高应用程序性能的技术,它通过临时存储程序获得的结果,以便在以后需要时重用它们。 在本文中,我们将学习Python中的不同缓存技术,包括functools模块中的 lru_cache和 cache装饰器。 简单示例:Python缓…...

原生微信小程序在顶部胶囊左侧水平设置自定义导航兼容各种手机模型
无论是在什么手机机型下,自定义的导航都和右侧的胶囊水平一条线上。如图下 以上图iphone12,13PRo 以上图是没有带黑色扇帘的机型 以下是调试器看的wxml的代码展示 注意:红色阔里的是自定义导航(或者其他的logo啊,返回之…...
经验笔记:远端仓库和本地仓库之间的连接(以Gitee为例)
经验笔记:远端仓库和本地仓库之间的连接 方法一:先创建远端仓库,再克隆到本地 创建远端仓库 登录到你的Git托管平台(如Gitee、GitHub、GitLab、Bitbucket等)。点击“New Repository”或类似按钮,创建一个新…...

利用RAGflow和LM Studio建立食品法规问答系统
前言 食品企业在管理标准、法规,特别是食品原料、特殊食品法规时,难以通过速查法规得到准确的结果。随着AI技术的发展,互联网上出现很多AI知识库的解决方案。 经过一轮测试,找到问题抓手、打通业务底层逻辑、对齐行业颗粒度、沉…...
ffplay音频SDL播放处理
1、从解码数组获取到解码后的数据 static int audio_decode_frame(VideoState *is) {int data_size, resampled_data_size;av_unused double audio_clock0;int wanted_nb_samples;Frame *af;if (is->paused)return -1;//音频数组队列获取数据do { #if defined(_WIN32)while …...

自动化仪表故障排除法
自动化仪表主要是指在企业的实际生产工程当中,开展检测、控制、执行以及显示等一系列仪表的总称。合理地利用自动化仪表能够及时地掌握企业生产的动态,并获取相应的数据,从而推动生产过程的有序运行。 在自动化控制系统中,自动化…...
WPF 中 MultiConverter ——XAML中复杂传参方式
1. XAML代码 <!-- 数据库表格 --> <!-- RowHeaderWidth"0": 把默认的行表头隐藏 --> <DataGridx:Name"xDataGrid"Grid.Row"2"hc:DataGridAttach.ShowRowNumber"True"ItemsSource"{Binding WaferInfos, ModeT…...

实验室管理现代化:Spring Boot技术方案
4系统概要设计 4.1概述 本系统采用B/S结构(Browser/Server,浏览器/服务器结构)和基于Web服务两种模式,是一个适用于Internet环境下的模型结构。只要用户能连上Internet,便可以在任何时间、任何地点使用。系统工作原理图如图4-1所示: 图4-1系统工作原理…...
k8s从入门到放弃之Ingress七层负载
k8s从入门到放弃之Ingress七层负载 在Kubernetes(简称K8s)中,Ingress是一个API对象,它允许你定义如何从集群外部访问集群内部的服务。Ingress可以提供负载均衡、SSL终结和基于名称的虚拟主机等功能。通过Ingress,你可…...

DBAPI如何优雅的获取单条数据
API如何优雅的获取单条数据 案例一 对于查询类API,查询的是单条数据,比如根据主键ID查询用户信息,sql如下: select id, name, age from user where id #{id}API默认返回的数据格式是多条的,如下: {&qu…...

【电力电子】基于STM32F103C8T6单片机双极性SPWM逆变(硬件篇)
本项目是基于 STM32F103C8T6 微控制器的 SPWM(正弦脉宽调制)电源模块,能够生成可调频率和幅值的正弦波交流电源输出。该项目适用于逆变器、UPS电源、变频器等应用场景。 供电电源 输入电压采集 上图为本设计的电源电路,图中 D1 为二极管, 其目的是防止正负极电源反接, …...
BLEU评分:机器翻译质量评估的黄金标准
BLEU评分:机器翻译质量评估的黄金标准 1. 引言 在自然语言处理(NLP)领域,衡量一个机器翻译模型的性能至关重要。BLEU (Bilingual Evaluation Understudy) 作为一种自动化评估指标,自2002年由IBM的Kishore Papineni等人提出以来,…...

Android写一个捕获全局异常的工具类
项目开发和实际运行过程中难免会遇到异常发生,系统提供了一个可以捕获全局异常的工具Uncaughtexceptionhandler,它是Thread的子类(就是package java.lang;里线程的Thread)。本文将利用它将设备信息、报错信息以及错误的发生时间都…...

JDK 17 序列化是怎么回事
如何序列化?其实很简单,就是根据每个类型,用工厂类调用。逐个完成。 没什么漂亮的代码,只有有效、稳定的代码。 代码中调用toJson toJson 代码 mapper.writeValueAsString ObjectMapper DefaultSerializerProvider 一堆实…...

简约商务通用宣传年终总结12套PPT模版分享
IOS风格企业宣传PPT模版,年终工作总结PPT模版,简约精致扁平化商务通用动画PPT模版,素雅商务PPT模版 简约商务通用宣传年终总结12套PPT模版分享:商务通用年终总结类PPT模版https://pan.quark.cn/s/ece1e252d7df...

性能优化中,多面体模型基本原理
1)多面体编译技术是一种基于多面体模型的程序分析和优化技术,它将程序 中的语句实例、访问关系、依赖关系和调度等信息映射到多维空间中的几何对 象,通过对这些几何对象进行几何操作和线性代数计算来进行程序的分析和优 化。 其中࿰…...

解密鸿蒙系统的隐私护城河:从权限动态管控到生物数据加密的全链路防护
摘要 本文以健康管理应用为例,展示鸿蒙系统如何通过细粒度权限控制、动态权限授予、数据隔离和加密存储四大核心机制,实现复杂场景下的用户隐私保护。我们将通过完整的权限请求流程和敏感数据处理代码,演示鸿蒙系统如何平衡功能需求与隐私安…...

SDU棋界精灵——硬件程序ESP32实现opus编码
一、 音频处理框架 该项目基于Espressif的音频处理框架构建,核心组件包括 ESP-ADF 和 ESP-SR,以下是完整的音频处理框架实现细节: 1.核心组件 (1) 音频前端处理 (AFE - Audio Front-End) main/components/audio_pipeline/afe_processor.c功能: 声学回声…...