深度学习:如何复现神经网络
深度学习:如何复现神经网络
要复现图中展示的卷积神经网络(CNN),我们需详细了解和配置每层网络的功能与设计理由。以下将具体解释各层的配置以及设计选择的原因,确保网络设计的合理性与有效性。
详细的网络层配置与设计理由
输入层
- 规格: 3x32x32,代表处理的是32x32像素的彩色图像,有3个颜色通道(RGB)。这是标准的图像输入尺寸,适合大多数基于图像的深度学习应用,特别是在较小的数据集如CIFAR-10上。
第一卷积层
- 卷积核大小: 5x5,可以捕捉到图片中的小特征(如边缘和角落)。
- 输出通道: 32,这意味着网络将从输入图像中学习32种不同的特征表示。
- 填充: 2,为了保持输出特征图的空间尺寸与输入相同,从而不丢失边缘信息。
- 激活函数: ReLU,用于引入非线性,帮助网络学习复杂的模式。
- 设计理由: 第一层通常设计为能捕捉基本特征的层,使用较大的卷积核来获取更广泛的输入区域信息,并增加输出通道以捕捉多样的特征。
第一最大池化层
- 核大小和步长: 2x2,步长通常与核大小相同,用于降低特征图的空间尺寸,减少计算量,并帮助抵抗输入的小幅度位移。
- 设计理由: 池化层跟在卷积层后面,用于压缩数据和参数的数量,并减小过拟合的风险。
第二卷积层
- 参数与第一卷积层相同,保持32个通道,这样可以在不过度增加计算负担的前提下,进一步分析由第一层检测到的特征。
- 设计理由: 重复使用相同配置的卷积层可以深化特征的层次,提高特征提取的效果。
第二最大池化层
- 配置与第一池化层相同,继续降低特征图的空间维度,并增强模型的抽象能力。
- 设计理由: 继续压缩数据,准备更深层次的特征提取。
第三卷积层
- 输出通道: 64,增加输出通道数,可以捕捉更复杂的特征。
- 设计理由: 在网络的更深层次增加更多的通道,以便网络可以学习更复杂、更抽象的特征表示。
第三最大池化层
- 配置与前两个池化层相同,进一步降低特征图尺寸,简化网络输出之前的计算需求。
- 设计理由: 最后一次池化减少最终特征的空间尺寸,为全连接层处理准备。
展平操作
- 功能: 将多维的卷积或池化输出转换成一维数组,以便作为全连接层的输入。
- 设计理由: 展平是从卷积层到全连接层的桥梁,它将二维特征图转换为一维特征向量。
全连接层
- 第一层: 输入来自展平后的1024维向量(由64个4x4的特征图展平得到),输出到64个神经元,这一转换通过全连接层学习特征的全局模式。
- 第二层: 将64维的输出映射到10个输出类别,对应于分类任务中的类别数。
- 设计理由: 全连接层在网络末端,用于根据提取的特征执行分类任务。
结合PyTorch代码实现
import torch
import torch.nn as nn
import torch.nn.functional as Fclass CustomCNN(nn.Module):def __init__(self):super(CustomCNN, self).__init__()# 初始化模块,继承nn.Module# 第一层:卷积层# 输入通道3(RGB图像),输出通道32,卷积核大小5x5,填充2# 使用填充2是为了保持图像尺寸不变,便于堆叠多层卷积self.layer1 = nn.Sequential(nn.Conv2d(3, 32, 5, padding=2),nn.ReLU(), # ReLU激活函数增加非线性,有助于学习复杂模式nn.MaxPool2d(2, 2) # 最大池化层,核大小2x2,步长2,用于降低特征图维度)# 第二层:卷积层# 保持相同的通道数32,卷积核大小5x5,填充2self.layer2 = nn.Sequential(nn.Conv2d(32, 32, 5, padding=2),nn.ReLU(),nn.MaxPool2d(2, 2))# 第三层:卷积层# 增加输出通道至64,以提高网络的学习能力self.layer3 = nn.Sequential(nn.Conv2d(32, 64, 5, padding=2),nn.ReLU(),nn.MaxPool2d(2, 2))# 全连接层# 展平后的数据大小为64*4*4,因为最后的特征图大小为4x4,通道数为64self.fc1 = nn.Linear(64 * 4 * 4, 64) # 第一个全连接层,从1024维到64维self.fc2 = nn.Linear(64, 10) # 第二个全连接层,从64维输出到10维,对应10个类别def forward(self, x):# 定义网络的前向传播路径x = self.layer1(x) # 通过第一层卷积、ReLU和池化x = self.layer2(x) # 通过第二层卷积、ReLU和池化x = self.layer3(x) # 通过第三层卷积、ReLU和池化x = x.view(-1, 64 * 4 * 4) # 展平操作,为全连接层准备x = F.relu(self.fc1(x)) # 通过第一个全连接层并应用ReLU激活函数x = self.fc2(x) # 通过第二个全连接层得到最终的分类结果return x# 实例化模型并打印出模型结构
model = CustomCNN()
print(model)
模型结构说明
连接层得到最终的分类结果
return x
实例化模型并打印出模型结构
model = CustomCNN()
print(model)
### 模型结构说明此代码定义了一个典型的卷积神经网络,它通过多个卷积层和池化层逐步提取图像特征,然后通过全连接层进行分类。每个卷积层后都跟有ReLU激活函数以及最大池化操作,目的是增强网络的非线性处理能力和减少特征维度,从而抑制过拟合并提高泛化能力。最终通过全连接层输出预测结果,适用于多类分类任务。
相关文章:

深度学习:如何复现神经网络
深度学习:如何复现神经网络 要复现图中展示的卷积神经网络(CNN),我们需详细了解和配置每层网络的功能与设计理由。以下将具体解释各层的配置以及设计选择的原因,确保网络设计的合理性与有效性。 详细的网络层配置与设…...

Spring Boot与MyBatis-Plus的高效集成
Spring Boot与MyBatis-Plus的高效集成 引言 在现代 Java 开发中,MyBatis-Plus 作为 MyBatis 的增强工具,以其简化 CRUD 操作和无需编写 XML 映射文件的特点,受到了开发者的青睐。本篇文章将带你一步步整合 Spring Boot 与 MyBatis-Plus&…...

【Unity ShaderGraph实现流体效果之Function入门】
Unity ShaderGraph实现流体效果之Node入门(一) 前言Shader Graph NodePosition NodeSplit NodeSubtract NodeBranch Node 总结 前言 Unity 提供的Shader Graph在很大程度上简化了开发者对于编写Shader的工作,只需要拖拽即可完成一个视觉效果…...
Spark RDD sortBy算子执行时进行数据 “采样”是什么意思?
一、sortBy 和 RangePartitioner sortBy 在 Spark 中会在执行排序时采用 rangePartitioner 进行分区,这会影响数据的分区方式,并且这一步骤是通过对数据进行 “采样” 来计算分区的范围。不过,重要的是,sortBy 本身仍然是一个 tr…...
React-useRef与DOM操作
#题引:我认为跟着官方文档学习不会走歪路 ref使用 组件重新渲染时,react组件函数里的代码会重新执行,返回新的JSX,当你希望组件“记住”某些信息,但又不想让这些信息触发新的渲染时,你可以使用ref&#x…...

Mistral AI 发布 Pixtral Large 模型:多模态时代的开源先锋
Mistral AI 最新推出的 Pixtral Large 模型,带来了更强的多模态能力。作为一款开源的多模态模型,它不仅在参数量上达到 1240 亿,更在文本和图像理解上实现了质的飞跃。 模型亮点 1. 多模态能力再升级 Pixtral Large 配备了 123B 参数的解码器…...
Windows、Linux多系统共享蓝牙设备
Windows、Linux多系统共享蓝牙设备 近来遇到一个新问题,就是双系统共享蓝牙鼠标。因为一直喜欢在Windows、Linux双系统之间来回切换,而每次切换系统蓝牙就必须重新配对,当然,通过网络成功解决了问题。 通过这个问题,稍…...

C语言 | Leetcode C语言题解之第564题寻找最近的回文数
题目: 题解: #define MAX_STR_LEN 32 typedef unsigned long long ULL;void reverseStr(char * str) {int n strlen(str);for (int l 0, r n-1; l < r; l, r--) {char c str[l];str[l] str[r];str[r] c;} }ULL * getCandidates(const char * n…...

wsl虚拟机中的dockers容器访问不了物理主机
1 首先保证wsl虚拟机能够访问宿主机IP地址,wsl虚拟机通过vEthernet (WSL)的地址访问,着意味着容器也要通过此IP地址访问物理主机。 2 遇到的问题:wsl虚拟机中安装了docker,用在用到docker容器内的开发环境,但是虚拟机…...
Spark RDD 的宽依赖和窄依赖
通俗地理解 Spark RDD 的 宽依赖 和 窄依赖,可以通过以下比喻和解释: 1. 日常生活比喻 假设你在管理多个团队完成工作任务: 窄依赖:每个团队只需要关注自己的分工,完成自己的任务。例如,一个人将纸张折好&…...

二进制转十进制
解题思路分析 二进制转十进制原理:二进制数转换为十进制数的基本原理是按位权展开相加。对于一个二进制数,从右往左每一位的位权依次是将每一位上的数字(0 或 1)乘以其对应的位权,然后把所有结果相加,就得…...
深度学习:神经网络中的非线性激活的使用
深度学习:神经网络中的非线性激活的使用 在神经网络中,非线性激活函数是至关重要的组件,它们使网络能够捕捉和模拟输入数据中的复杂非线性关系。这些激活函数的主要任务是帮助网络解决那些无法通过简单的线性操作(如权重相乘和偏…...
Python缓存:两个简单的方法
缓存是一种用于提高应用程序性能的技术,它通过临时存储程序获得的结果,以便在以后需要时重用它们。 在本文中,我们将学习Python中的不同缓存技术,包括functools模块中的 lru_cache和 cache装饰器。 简单示例:Python缓…...

原生微信小程序在顶部胶囊左侧水平设置自定义导航兼容各种手机模型
无论是在什么手机机型下,自定义的导航都和右侧的胶囊水平一条线上。如图下 以上图iphone12,13PRo 以上图是没有带黑色扇帘的机型 以下是调试器看的wxml的代码展示 注意:红色阔里的是自定义导航(或者其他的logo啊,返回之…...
经验笔记:远端仓库和本地仓库之间的连接(以Gitee为例)
经验笔记:远端仓库和本地仓库之间的连接 方法一:先创建远端仓库,再克隆到本地 创建远端仓库 登录到你的Git托管平台(如Gitee、GitHub、GitLab、Bitbucket等)。点击“New Repository”或类似按钮,创建一个新…...

利用RAGflow和LM Studio建立食品法规问答系统
前言 食品企业在管理标准、法规,特别是食品原料、特殊食品法规时,难以通过速查法规得到准确的结果。随着AI技术的发展,互联网上出现很多AI知识库的解决方案。 经过一轮测试,找到问题抓手、打通业务底层逻辑、对齐行业颗粒度、沉…...
ffplay音频SDL播放处理
1、从解码数组获取到解码后的数据 static int audio_decode_frame(VideoState *is) {int data_size, resampled_data_size;av_unused double audio_clock0;int wanted_nb_samples;Frame *af;if (is->paused)return -1;//音频数组队列获取数据do { #if defined(_WIN32)while …...

自动化仪表故障排除法
自动化仪表主要是指在企业的实际生产工程当中,开展检测、控制、执行以及显示等一系列仪表的总称。合理地利用自动化仪表能够及时地掌握企业生产的动态,并获取相应的数据,从而推动生产过程的有序运行。 在自动化控制系统中,自动化…...
WPF 中 MultiConverter ——XAML中复杂传参方式
1. XAML代码 <!-- 数据库表格 --> <!-- RowHeaderWidth"0": 把默认的行表头隐藏 --> <DataGridx:Name"xDataGrid"Grid.Row"2"hc:DataGridAttach.ShowRowNumber"True"ItemsSource"{Binding WaferInfos, ModeT…...

实验室管理现代化:Spring Boot技术方案
4系统概要设计 4.1概述 本系统采用B/S结构(Browser/Server,浏览器/服务器结构)和基于Web服务两种模式,是一个适用于Internet环境下的模型结构。只要用户能连上Internet,便可以在任何时间、任何地点使用。系统工作原理图如图4-1所示: 图4-1系统工作原理…...
内存分配函数malloc kmalloc vmalloc
内存分配函数malloc kmalloc vmalloc malloc实现步骤: 1)请求大小调整:首先,malloc 需要调整用户请求的大小,以适应内部数据结构(例如,可能需要存储额外的元数据)。通常,这包括对齐调整,确保分配的内存地址满足特定硬件要求(如对齐到8字节或16字节边界)。 2)空闲…...
日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする
日语学习-日语知识点小记-构建基础-JLPT-N4阶段(33):にする 1、前言(1)情况说明(2)工程师的信仰2、知识点(1) にする1,接续:名词+にする2,接续:疑问词+にする3,(A)は(B)にする。(2)復習:(1)复习句子(2)ために & ように(3)そう(4)にする3、…...

Mybatis逆向工程,动态创建实体类、条件扩展类、Mapper接口、Mapper.xml映射文件
今天呢,博主的学习进度也是步入了Java Mybatis 框架,目前正在逐步杨帆旗航。 那么接下来就给大家出一期有关 Mybatis 逆向工程的教学,希望能对大家有所帮助,也特别欢迎大家指点不足之处,小生很乐意接受正确的建议&…...

渗透实战PortSwigger靶场-XSS Lab 14:大多数标签和属性被阻止
<script>标签被拦截 我们需要把全部可用的 tag 和 event 进行暴力破解 XSS cheat sheet: https://portswigger.net/web-security/cross-site-scripting/cheat-sheet 通过爆破发现body可以用 再把全部 events 放进去爆破 这些 event 全部可用 <body onres…...

dedecms 织梦自定义表单留言增加ajax验证码功能
增加ajax功能模块,用户不点击提交按钮,只要输入框失去焦点,就会提前提示验证码是否正确。 一,模板上增加验证码 <input name"vdcode"id"vdcode" placeholder"请输入验证码" type"text&quo…...

1.3 VSCode安装与环境配置
进入网址Visual Studio Code - Code Editing. Redefined下载.deb文件,然后打开终端,进入下载文件夹,键入命令 sudo dpkg -i code_1.100.3-1748872405_amd64.deb 在终端键入命令code即启动vscode 需要安装插件列表 1.Chinese简化 2.ros …...
MySQL中【正则表达式】用法
MySQL 中正则表达式通过 REGEXP 或 RLIKE 操作符实现(两者等价),用于在 WHERE 子句中进行复杂的字符串模式匹配。以下是核心用法和示例: 一、基础语法 SELECT column_name FROM table_name WHERE column_name REGEXP pattern; …...

Spring Cloud Gateway 中自定义验证码接口返回 404 的排查与解决
Spring Cloud Gateway 中自定义验证码接口返回 404 的排查与解决 问题背景 在一个基于 Spring Cloud Gateway WebFlux 构建的微服务项目中,新增了一个本地验证码接口 /code,使用函数式路由(RouterFunction)和 Hutool 的 Circle…...

保姆级【快数学会Android端“动画“】+ 实现补间动画和逐帧动画!!!
目录 补间动画 1.创建资源文件夹 2.设置文件夹类型 3.创建.xml文件 4.样式设计 5.动画设置 6.动画的实现 内容拓展 7.在原基础上继续添加.xml文件 8.xml代码编写 (1)rotate_anim (2)scale_anim (3)translate_anim 9.MainActivity.java代码汇总 10.效果展示 逐帧…...

若依登录用户名和密码加密
/*** 获取公钥:前端用来密码加密* return*/GetMapping("/getPublicKey")public RSAUtil.RSAKeyPair getPublicKey() {return RSAUtil.rsaKeyPair();}新建RSAUti.Java package com.ruoyi.common.utils;import org.apache.commons.codec.binary.Base64; im…...