当前位置：首页 > article >正文

DAY09：【pytorch】nn网络层

article 2026/2/8 10:40:42

1、卷积层

1.1 Convolution

1.1.1 卷积操作

卷积运算：卷积核在输入信号（图像）上滑动，相应位置上进行乘加
卷积核：又称为滤波器、过滤器，可认为是某种模式、某种特征

1.1.2 卷积维度

一般情况下，卷积核在几个维度上滑动就是几维卷积

一维卷积
二维卷积
三维卷积

1.2 `nn.Conv2d`

在这里插入图片描述

# nn.Conv2d(
#     in_channels,
#     out_channels,
#     kernel_size,
#     stride=1,
#     padding=0,
#     dilation=1,
#     groups=1,
#     bias=True,
#     padding_mode='zeros'
# )

1.2.1 基本介绍

功能：对多个二维信号进行二维卷积
主要参数：

in_channels：输入通道数
out_channels：输出通道数，等价于卷积核个数
kernel_size：卷积核尺寸
stride：步长
padding：填充个数
dilation：空洞卷积大小
groups：分组卷积设置，默认为1，即不分组
bias：是否使用偏置

尺寸计算：
$H_{out} = \lfloor \frac{H_{in} + 2 \times padding[0] - dilation[0] \times (kernel\_size[0] - 1) - 1}{stride[0]} + 1 \rfloor$

1.2.2 代码框架

    conv_layer = nn.Conv2d(3, 1, 3)   # input:(i, o, size) weights:(o, i , h, w)nn.init.xavier_normal_(conv_layer.weight.data)img_conv = conv_layer(img_tensor)

1.3 `nn.ConvTranspose`

# nn.ConvTranspose(
#     in_channels,
#     out_channels,
#     kernel_size,
#     stride=1,
#     padding=0,
#     output_padding=0,
#     groups=1,
#     bias=True,
#     dilation=1,
#     padding_mode='zeros'
# )

1.3.1 基本介绍

功能：用于对图像进行上采样

对比：

正常卷积：假设图像尺寸为4×4，卷积核为3×3，padding=0，stride=1，
则图像： $I_{16*1}$ ，卷积核： $K_{4*16}$ ，输出： $O_{4*1}=K_{4*16}×I_{16*1}$
转置卷积：假设图像尺寸为2×2，卷积核为3×3，padding=0，stride=1，
则图像： $I_{4*1}$ ，卷积核： $K_{16*4}$ ，输出： $O_{16*1}=K_{16*4}×I_{4*1}$

主要参数：

in_channels：输入通道数
out_channels：输出通道数
kernel_size：卷积核大小
stride：步长
padding：填充
dilation：空洞卷积大小
groups：分组卷积
bias：是否使用偏置

尺寸计算： $H_{out} = (H_{in} - 1) \times stride[0] - 2 \times padding[0] + dilation[0] \times (kernel\_size[0] - 1) + output\_padding[0] + 1$

1.3.2 代码框架

	conv_layer = nn.ConvTranspose2d(3, 1, 3, stride=2)   # input:(i, o, size)nn.init.xavier_normal_(conv_layer.weight.data)img_conv = conv_layer(img_tensor)

2、池化层

2.1 概念

在这里插入图片描述

对信息进行收集并总结，类似水池收集水资源，因而得名池化层

收集：多变少
总结：最大值/平均值

2.2 `nn.MaxPool2d`

# nn.MaxPool2d(
#     kernel_size,
#     stride=None,
#     padding=0,
#     dilation=1,
#     return_indices=False,
#     ceil_mode=False,
# )

2.2.1 基本介绍

功能：对二维信号（图像）进行最大值池化
主要参数：

kernel_size：池化核大小
stride：步长
padding：填充
dilation：池化核间隔大小
return_indices：是否返回最大值索引
ceil_mode：是否向上取整

2.2.2 代码框架

MaxPool2d

	maxpool_layer = nn.MaxPool2d((2, 2), stride=(2, 2))   # input:(i, o, size) weights:(o, i , h, w)img_pool = maxpool_layer(img_tensor)

MaxPool2d unpool

    # poolingimg_tensor = torch.randint(high=5, size=(1, 1, 4, 4), dtype=torch.float)maxpool_layer = nn.MaxPool2d((2, 2), stride=(2, 2), return_indices=True)img_pool, indices = maxpool_layer(img_tensor)# unpoolingimg_reconstruct = torch.randn_like(img_pool, dtype=torch.float)maxunpool_layer = nn.MaxUnpool2d((2, 2), stride=(2, 2))img_unpool = maxunpool_layer(img_reconstruct, indices)

2.3 `nn.AvgPool2d`

# nn.AvgPool2d(
#     kernel_size,
#     stride=None,
#     padding=0,
#     ceil_mode=False,
#     count_include_pad=True,
#     divisor_override=None
# )

2.3.1 基本介绍

功能：对二维信号（图像）进行平均值池化
主要参数：

kernel_size：池化核大小
stride：步长
padding：填充
ceil_mode：是否向上取整
count_include_pad：是否包含填充的像素
divisor_override：除数重写

2.3.2 代码框架

AvgPool2d

	avgpoollayer = nn.AvgPool2d((2, 2), stride=(2, 2))   # input:(i, o, size) weights:(o, i , h, w)img_pool = avgpoollayer(img_tensor)

AvgPool2d divisor_override

	img_tensor = torch.ones((1, 1, 4, 4))avgpool_layer = nn.AvgPool2d((2, 2), stride=(2, 2), divisor_override=3)img_pool = avgpool_layer(img_tensor)

3、线性层

3.1 概念

在这里插入图片描述

又称全连接层，其每个神经元与上一层所有神经元相连实现对前一层的线性组合、线性变换

3.2 `nn.Linear`

# nn.Linear(
#     in_features,
#     out_features,
#     bias=True
# )

3.2.1 基本介绍

功能：对一维信号（向量）进行线性组合

主要参数：

in_features：输入结点数
out_features：输出结点数
bias：是否使用偏置

计算公式： $y = xW^T + bias$

3.2.2 代码框架

	inputs = torch.tensor([[1., 2, 3]])linear_layer = nn.Linear(3, 4)linear_layer.weight.data = torch.tensor([[1., 1., 1.],[2., 2., 2.],[3., 3., 3.],[4., 4., 4.]])linear_layer.bias.data.fill_(0.5)output = linear_layer(inputs)

4、激活函数层

4.1 `nn.Sigmoid`

在这里插入图片描述

计算公式： $\frac{1}{1 + e^{-x}}$

梯度公式： $y^{`} = y \times (1 - y)$

特性：

输出值在(0, 1)，符合概率
导数范围是[0, 0.25]，易导致梯度消失
输出为非0，破坏数据分布

4.2 `nn.tanh`

在这里插入图片描述
计算公式： $\frac{sinx}{cosx} = \frac{e^x - e^{-x}}{e^{-} + e^{-x}} = \frac{2}{1 + e^{-2x}} + 1$

梯度公式： $y^{`} = 1 - y^2$

特性：

输出值在(-1, 1)，数据符合0均值
导数范围是(0, 1)，易导致梯度消失

4.3 `nn.ReLU`

在这里插入图片描述
计算公式： $y = ma x (0, x)$

梯度公式：
$\begin{cases} 1, & x > 0 \\ \text{undefined}, & x = 0 \\ 0, & x < 0 \end{cases}$

特性：

输出值均为正数，负半轴导致死神经元
导数是1，缓解梯度消失，但易引发梯度爆炸

在这里插入图片描述

4.3.1 `nn.LeakuReLU`

negative_slope: 负斜率的值，默认为0.01，即负斜率

4.3.2 `nn.PReLU`

init：可学习斜率

4.3.3 `nn.RReLU`

lower：均匀分布下限
upper：均匀分布上限

微语录：黑暗中有人擎花而来，惊动火焰，燃烧万千蝴蝶迷了眼。

DAY09：【pytorch】nn网络层

1、卷积层 1.1 Convolution 1.1.1 卷积操作卷积运算：卷积核在输入信号（图像）上滑动，相应位置上进行乘加卷积核：又称为滤波器、过滤器，可认为是某种模式、某种特征 1.1.2 卷积维度一般情况下&#xf…...

编程日记 2026/2/1 22:26:06

大模型面试题

分布式训练相关面试题解答什么是分布式训练？ 分布式训练是一种利用多个计算节点（如多个 GPU 或多个机器）协同工作来加速训练机器学习模型的方法。它通过将训练任务分配给多个计算资源并行执行，以减少训练时间和处理大规模数据。…...

编程日记 2026/2/3 20:40:29

跟康师傅学Java-面向对象（基础）

跟康师傅学Java-面向对象(基础) 学习面向对象内容的三条主线（非官方） ①Java类及类的成员：（重点）属性、方法、构造器；（熟悉）代码块、内部类 ②面向对象的特征：封装、继承、多态、（抽象） ③其他关键字的使用：this、super、package、import、static、final、inte…...

编程日记 2026/2/1 12:15:41

2000-2017年各省国有经济煤气生产和供应业固定资产投资数据

2000-2017年各省国有经济煤气生产和供应业固定资产投资数据 1、时间：2000-2017年 2、来源：国家统计局、能源年鉴 3、指标：行政区划代码、城市、年份、国有经济煤气生产和供应业固定资产投资 4、范围：31省 5、指标说明&#x…...

编程日记 2026/2/1 2:25:45

线性代数 | 知识点整理 Ref 3

注：本文为 “线性代数 | 知识点整理” 相关文章合辑。因 csdn 篇幅合并超限分篇连载，本篇为 Ref 3。略作重排，未整理去重。图片清晰度限于引文原状。如有内容异常，请看原文。《线性代数》总复习要点、公式、重要结论与重点释…...

编程日记 2026/1/30 18:10:46

从原理到实践：NFS复杂故障处理方法论

#作者：孙德新文章目录一、nfs使用概述二、疑难故障现象描述三、原理分析四、解决方案五、优化服务器资源配置：六、故障案例总结七、故障预防建议八、nfs优化方法一、nfs使用概述 NFS（Network File System）是一种分布式文件系…...

编程日记 2025/12/1 20:45:17

网络层IP协议知识大梳理

全是通俗易懂的讲解，如果你本节之前的知识都掌握清楚，那就速速来看我的IP协议笔记吧~ 自己写自己的八股！让未来的自己看懂！ （全文手敲，受益良多） 网路基础3 网路层 TCP并没有把数据发到网路…...

编程日记 2026/1/31 7:37:28

【Web前端技术】第二节—HTML标签（上）

hello！好久不见—— 做出一个属于自己的网站！ 云边有个稻草人-个人主页 Web前端技术—本篇文章所属专栏目录一、HTML 语法规范 1.1 基本语法概述 1.2 标签关系二、HTML 基本结构标签 2.1 第一个 HTML 网页 2.2 基本结构标签总结三、网页开发…...

编程日记 2026/1/28 9:13:55

1.Axum 与 Tokio：异步编程的完美结合

摘要深入解析 Axum 核心架构与 Tokio 异步运行时的集成，掌握关键原理与实践技巧。一、引言在当今的软件开发领域，高并发和高性能是衡量一个系统优劣的重要指标。对于 Web 服务器而言，能够高效地处理大量并发请求是至关重要的。Rust 语言…...

编程日记 2025/12/1 18:16:36

08软件测试需求分析案例-删除用户

删除用户是后台管理菜单的一个功能模块，只有admin才有删除用户的权限。不可删除admin。 1.1 通读文档通读需求规格说明书是提取信息，提出问题，输出具有逻辑、规则、流程的业务步骤。信息：此功能应为用户提供确认删除的功能。…...

编程日记 2026/1/31 13:59:23

SDL基础

SDL SDL（Simple DirectMedia Layer）是一个开源的跨平台多媒体开发库，主要用于开发需要图形、音频和输入设备支持的应用程序。它使用C语言编写，提供了简单易用的API，**能够帮助开发者快速实现跨平台的多媒体功能。**SD…...

编程日记 2025/12/2 3:22:58

十三种通信接口芯片——《器件手册--通信接口芯片》

目录通信接口芯片简述基本功能常见类型应用场景详尽阐述 1 RS485/RS422芯片 1. RS485和RS422标准 2. 芯片功能 3. 典型芯片及特点 4. 应用场景 5. 设计注意事项 6. 选型建议 2 RS232芯片 1. RS232标准 2. 芯片功能 3. 典型芯片及特点 4. 应用场景 5. 设计注意事项 6…...

编程日记 2026/1/31 5:44:10

用数组栈实现 void Reverse(char *C, int len) {top -1;for(int i 0; i < len; i){push(C[i]);}for(int i 0; i < len; i){C[i] Top();pop();} } 全部函数 #include <stdio.h> #include <stdlib.h> #include <string.h>#define MAX_SIZE 101int …...

编程日记 2026/1/31 5:55:02

从GPT到Gemini 大模型进化史

从GPT到Gemini：大模型进化史在过去的几年里，人工智能领域经历了翻天覆地的变化，其中最引人注目的莫过于大规模语言模型的发展。从最初的GPT系列到最近的Gemini，这些模型不仅在技术上取得了重大突破，还在实际应用中展…...

编程日记 2026/1/26 1:32:02

【限流算法】计数器、漏桶、令牌桶算法

1 计数器使用计数器实现限流，可限制在指定时间间隔内请求数小于阈值的情况，但存在临界问题。如图1-17所示，假设每分钟系统限流500个请求，在XX:00:59时刻系统接收到500个请求，在XX:01:00时刻系统又接收到500个请求&am…...

编程日记 2026/1/30 5:28:32

秘密任务 2.0：如何利用 WebSockets + DTOs 设计实时操作

在之前的文章中，我们探讨了为什么 DTO 是提升 API 效率和安全性的秘密武器。现在，我们进入了一个全新的场景——我们将深入探讨如何通过 WebSockets DTOs 实现实时操作！ Agent X 正在进行一项高风险的卧底任务。突然，总部更新了…...

编程日记 2026/1/30 4:06:20

‌RAII 技术详解

1. 核心概念‌ ‌定义‌：RAII（Resource Acquisition Is Initialization，资源获取即初始化）是 C 中通过对象生命周期管理资源的核心机制，核心思想是将资源的获取与对象构造绑定、资源释放与对象析构绑定，确…...

编程日记 2026/2/4 21:29:46

Windows快速切换屏幕/桌面

windows自带的切屏需要winctrl 小键盘左右键但是！ Windows使用还是键盘加鼠标舒服！ 教程安装autohotkey 代码 ~LWin & LButton::{SendInput "^#{Left}" ; 发送 Win Ctrl Left (切换到左侧虚拟桌面) } ; 使用花括号包裹命令&a…...

编程日记 2026/1/24 18:04:37

SpringAI+DeepSeek大模型应用开发——3 SpringAI简介

SpringAI整合了全球（主要是国外）的大多数大模型，而且对于大模型开发的三种技术架构都有比较好的封装和支持，开发起来非常方便； 不同的模型能够接收的输入类型、输出类型不一定相同。SpringAI根据模型的输入和输出类型…...

编程日记 2026/2/4 21:30:36

使用 Function 来编写策略模式：优雅而高效的设计模式实践

引言：为什么选择策略模式？ 策略模式（Strategy Pattern）是行为设计模式中的经典之一，它允许我们定义一系列的算法或操作，并使得它们可以互换使用。策略模式的关键思想是将算法的实现与使用它们的上下文分离…...

编程日记 2025/12/4 23:14:19

Java字符串处理

Java字符串处理全解析：String、StringBuilder与StringBuffer 一、String类基础 1. String的本质不可变对象：Java中的String对象一旦创建就不能修改底层实现：基于private final char value[]字符数组字符串池：JVM维护的特殊存储…...

编程日记 2025/12/2 10:39:08

JS实现RSA加密

目录目标环境实现RSA加解密计算RSA加密允许的最大字节长度目标使用JS实现RSA加密解密。计算RSA加密允许的最大字节长度。环境 node-rsa 实现RSA加解密 const NodeRSA require(node-rsa);function getKey() {const keyLength512// 创建 RSA 密钥对const key new …...

编程日记 2025/12/2 4:27:50

MySQL GTID集合运算函数总结

MySQL GTID 有一些运算函数可以帮助我们在运维工作中提高运维效率。 1 GTID内置函数 MySQL 包含GTID_SUBSET、GTID_SUBTRACT、WAIT_FOR_EXECUTED_GTID_SET、WAIT_UNTIL_SQL_THREAD_AFTER_GTIDS 4个内置函数，用于GTID集合的基本运算。 1.1 GTID_SUBSET(set1,set2) …...

编程日记 2026/2/4 21:30:05