当前位置：首页 > news >正文

卷积的计算——nn.Conv2d（Torch.nn里的Convolution Layers模块里的Conv2d类）

news 2026/2/11 3:58:14

**前置知识：

1、张量和通道

张量：多维数组，用来表示数据（图像、视频等）

通道：图像数据的一部分，表示不同的颜色或特征层

通道只是张量的其中一个维度

以一张RGB图像为例，

该图像数据可以用一个三维张量（shape等于（C,H,W））来表示

其中C表示通道数（对于RGB图像，C=3），H表示高度，W表示宽度

再以一批64张图像组成的数据对象来看，

它可以用一个四维张量（shape等于（N,C,H,W））来表示

其中N表示批次大小（一批次图像的数量）

关于通道的补充：

2、Reshape：输入数据和卷积核张量的重塑

input = torch.reshape(input, (1, 1, 5, 5))

1：第一个 1 表示有 1 张图片（批量大小）
1：第二个 1 表示输入的通道数（这里是单通道，表示灰度图像）
5 和 5：分别表示图像的高度和宽度

kernel = torch.reshape(kernel, (1, 1, 3, 3))

1：第一个 1 表示有 1 个卷积核（输出通道数）
1：第二个 1 表示卷积核的输入通道数（与input的输入通道数匹配）
3 和 3：分别表示卷积核的高度和宽度

通过重塑，增加的信息主要是关于批量大小和通道数，

这使得输入和卷积核符合 conv2d 函数的要求

（输入张量必须是四维的，形状为 (N, C, H, W)，

卷积核（权重）必须是四维的，形状为 (out_channels, in_channels, kernel_height, kernel_width)：）

补充：

一张2*2RGB图像与一个3*3卷积核的卷积：

reshape后：

input的形状是（1，3，2，2），1表示1张图片

卷积核的形状是（1，3，3，3），1表示1个输出通道

3、output=F.conv2d(input,kernel,stride=1,padding=1)

input	输入张量（4维）
kernel	卷积核（4维）
stride	卷积核移动的步幅（可以是一个整数或元组，默认为 1）
padding	在输入的边缘添加零填充（帮助保持输出的空间尺寸）

**代码：

步骤：

import torch.nn.functional as F

定义input、kernel——>修改成四维形状reshape——>使用conv2d进行卷积

灰度图像的卷积：帮助识别图像中的特定特征，如边缘或纹理

import torch
import torch.nn.functional as Finput=torch.tensor([[1,2,0,3,1],[0,1,2,3,1],[1,2,1,0,0],[5,2,3,1,1],[2,1,0,1,1]
])#卷积核
kernel=torch.tensor([[1,2,1],[0,1,0],[2,1,0]
])print(input.shape)
print(kernel.shape)input=torch.reshape(input,(1,1,5,5))  #图片数，图层数（通道数），宽，高
kernel=torch.reshape(kernel,(1,1,3,3))print(input.shape)
print(kernel.shape)output1=F.conv2d(input,kernel,stride=1)
print(output1)output2=F.conv2d(input,kernel,stride=2)
print(output2)output3=F.conv2d(input,kernel,stride=1,padding=1)
print(output3)

卷积的计算——nn.Conv2d（Torch.nn里的Convolution Layers模块里的Conv2d类）

**前置知识： 1、张量和通道张量：多维数组，用来表示数据（图像、视频等） 通道：图像数据的一部分，表示不同的颜色或特征层通道只是张量的其中一个维度以一张RGB图像为例， 该图像…...

编程日记 2024/10/11 0:21:35

确保接口安全：六大方案有效解决幂等性问题

文章目录六大方案解决接口幂等问题什么是接口幂等？天然幂等不做幂等会怎么样？ 解决方案1）insert前先select2）使用唯一索引3）去重表加悲观锁4）加乐观锁之版本号机制5）使用 Redisson 分布式锁6&a…...

编程日记 2024/10/11 0:19:33

代码随想录算法训练营第二十九天| 93. 复原 IP 地址，78. 子集， 90. 子集 II

93. 复原 IP 地址，78. 子集， 90. 子集 II 93. 复原 IP 地址78. 子集90. 子集 II 93. 复原 IP 地址有效 IP 地址正好由四个整数（每个整数位于 0 0 0 到 255 255 255之间组成，且不能含有前导 0 0 0），整…...

编程日记 2024/10/11 0:18:32

【WebGis开发 - Cesium】三维可视化项目教程---初始化场景

系列文章目录【WebGis开发 - Cesium】三维可视化项目教程—图层管理基础【WebGis开发 - Cesium】三维可视化项目教程—视点管理目录系列文章目录引言一、Cesium引入项目1.1 下载资源1.2 项目引入Cesium 二、初始化地球2.1 创建基础文件2.1.1 创建Cesium工具方法文件2.1.2 创…...

编程日记 2024/10/11 0:17:31

点云中ICP算法的详解

ICP（Iterative Closest Point）算法是一种用于刚性点云配准的经典算法。其核心思想是通过迭代地寻找两个点云之间的最近点对，并计算最优的刚性变换（包括旋转和平移），使得源点云在目标点云的坐标系下对齐。IC…...

编程日记 2024/10/11 0:16:30

抽象类Abstart Class

抽象类其实就是一种不完全的设计图必须用abstract修饰模板方法：建议使用final修饰，不能被重写。...

编程日记 2024/10/11 0:14:28

Redis：通用命令数据类型

Redis：通用命令 & 数据类型通用命令SETGETKEYSEXISTSDELEXPIRETTLTYPEFLUSHALL 数据类型 Redis的客户端提供了很多命令用于操控Redis，在Redis中，key的类型都是字符串，而value有多种类型，每种类型都有自己的操作命…...

编程日记 2024/10/11 0:12:25

【Python高级编程】探索Python库：创建引人入胜的交互界面

1.制作交互界面常用到的库在 Python 中，有多个库可以用于创建交互界面（GUI）。以下是一些常用的 Python GUI 库： Tkinter: Python 的标准 GUI 库，通常随 Python 一起安装。简单易用，适合快速开发小型应用…...

编程日记 2024/10/11 0:10:21

OpenCV Canny()函数

OpenCV Canny()函数被用来检测图像物体的边缘。其算法原理如下： 高斯滤波：使用高斯滤波器平滑图像以减少噪声。高斯滤波器是一种线性滤波器，可以消除图像中的高频噪声，同时保留边缘信息。计算梯度强度和方向：使用Sobe…...

编程日记 2024/10/11 0:08:19

Java基础（3）

基本数据类型 Java 中的几种基本数据类型了解么？ Java 中有 8 种基本数据类型，分别为： 6 种数字类型： 4 种整数型：byte、short、int、long2 种浮点型：float、double1 种字符类型：char1 种布尔…...

编程日记 2024/10/11 0:03:14

【C语言】VS调试技巧

文章目录什么是bug什么是调试（debug）debug和releaseVS调试快捷键监视和内存观察编程常见错误归类什么是bug bug本意是“昆虫”或“虫子”，现在一般是指在电脑系统或程序中，隐藏着的一些未被发现的缺陷或问题，简称程…...

编程日记 2024/10/11 0:02:13

【华为HCIP实战课程七】OSPF邻居关系排错MTU问题，网络工程师

一、MTU MUT默认1500，最大传输单元，一致性检测 [R3-GigabitEthernet0/0/1]mtu 1503//更改R3的MTU为1503 查看R3和SW1之间的OSPF邻居关系正常：默认华为设备没有开启MTU一致性检测！ [R3-GigabitEthernet0/0/1]ospf mtu-enable //手动开启MTU检测 [SW1-Vlanif30]ospf mtu…...

编程日记 2024/10/11 0:01:12

速盾：休闲类游戏如何选择高防cdn？

休闲类游戏的流行度日益增长，越来越多的玩家在业余时间里选择放松自己，享受游戏带来的乐趣。然而，在休闲类游戏中，网络延迟和游戏载入速度的问题常常会影响到玩家的游戏体验。为了解决这些问题，选择一个高防CDN&#x…...

编程日记 2024/10/10 23:59:10

电脑插上U盘不显示怎么回事？怎么解决？

平时使用电脑的时候经常会使用U盘来传输数据或是备份文件，有时候会遇到一个令头疼的问题，比如，将U盘插入电脑的USB口后，设备却显示不出来。电脑上插入U盘后却不显示会影响我们的正常工作。接下来，我们一起分析一下故障…...

编程日记 2024/10/10 23:58:09

Python 如何使用 SQLAlchemy 进行复杂查询

Python 如何使用 SQLAlchemy 进行复杂查询一、引言 SQLAlchemy 是 Python 生态系统中非常流行的数据库处理库，它提供了一种高效、简洁的方式与数据库进行交互。SQLAlchemy 是一个功能强大的数据库工具，支持结构化查询语言（SQL）…...

编程日记 2024/10/10 23:57:08

nginx主配置文件

Nginx的主配置文件nginx.conf，一般定义了Nginx的基本设置和全局配置。下面是对这个配置文件的详细解释： 文件结构 #user nobody; worker_processes 1;#error_log logs/error.log; #error_log logs/error.log notice; #error_log logs/error.log …...

编程日记 2024/10/10 23:52:48

使用数据库：

数据库： 1.为何需要数据库？ 存储数据方法第一种：用大脑记住数据， 第二种：写纸上， 第三种：写在计算机的内存中， 第四种：写出磁盘文件 2.数据库能做什么&#xff1…...

编程日记 2024/10/10 23:45:39

python list, tuple dict,set的区别以及**kwargs 的基本用法

在python中, list, tuple, dict, set有什么区别, 主要应用在什么样的场景? 定义: list:链表,有序的项目, 通过索引进行查找,使用方括号”[]”; tuple:元组,元组将多样的对象集合到一起,不能修改,通过索引进行查找, 使用括号”()”; dict:字典,字典是一组键(key)和值(value…...

编程日记 2024/10/10 23:43:36

实用生活英语口语学习成人零基础入门柯桥专业外语培训

“秋裤”的英语表达首先，秋裤肯定不是autumn pants，chill cool就更离谱了！ 最地道的美语说法一定会用到“thermal”这个单词： ▼ “thermal”的意思是“热的、保温的”，由此延伸出“秋裤、保暖内衣”的表达&#xff…...

编程日记 2024/10/10 23:42:35

FLINK SQL数据类型

Flink SQL支持非常完善的数据类型，以满足不同的数据处理需求。以下是对Flink SQL数据类型的详细归纳： 一、原子数据类型字符串类型 CHAR、CHAR(n)：定长字符串，n代表字符的定长，取值范围为[1, 2147483647]。如果不指…...

编程日记 2024/10/10 23:41:33

AI-调查研究-01-正念冥想有用吗？对健康的影响及科学指南

点一下关注吧！！！非常感谢！！持续更新！！！ 🚀 AI篇持续更新中！（长期更新） 目前2025年06月05日更新到： AI炼丹日志-28 - Aud…...

编程新知 2026/2/8 5:11:39

【Linux】C语言执行shell指令

在C语言中执行Shell指令在C语言中，有几种方法可以执行Shell指令： 1. 使用system()函数这是最简单的方法，包含在stdlib.h头文件中： #include <stdlib.h>int main() {system("ls -l"); // 执行ls -l命令retu…...

编程新知 2025/11/20 18:42:48

ESP32 I2S音频总线学习笔记（四）： INMP441采集音频并实时播放

简介前面两期文章我们介绍了I2S的读取和写入，一个是通过INMP441麦克风模块采集音频，一个是通过PCM5102A模块播放音频，那如果我们将两者结合起来，将麦克风采集到的音频通过PCM5102A播放，是不是就可以做一个扩音器了呢…...

编程新知 2026/2/9 20:01:01

数据链路层的主要功能是什么

数据链路层（OSI模型第2层）的核心功能是在相邻网络节点（如交换机、主机）间提供可靠的数据帧传输服务，主要职责包括： 🔑 核心功能详解： 帧封装与解封装封装： 将网络层下发…...

编程新知 2026/2/1 7:31:51

【python异步多线程】异步多线程爬虫代码示例

claude生成的python多线程、异步代码示例，模拟20个网页的爬取，每个网页假设要0.5-2秒完成。代码 Python多线程爬虫教程核心概念多线程：允许程序同时执行多个任务，提高IO密集型任务（如网络请求）的效率…...

编程新知 2025/12/16 18:04:55

数据库分批入库

今天在工作中，遇到一个问题，就是分批查询的时候，由于批次过大导致出现了一些问题，一下是问题描述和解决方案： 示例： // 假设已有数据列表 dataList 和 PreparedStatement pstmt int batchSize 1000; // …...

编程新知 2026/1/8 11:38:36

智能仓储的未来：自动化、AI与数据分析如何重塑物流中心

当仓库学会“思考”，物流的终极形态正在诞生想象这样的场景： 凌晨3点，某物流中心灯火通明却空无一人。AGV机器人集群根据实时订单动态规划路径；AI视觉系统在0.1秒内扫描包裹信息；数字孪生平台正模拟次日峰值流量压力…...

编程新知 2026/2/1 2:49:30

Python 包管理器 uv 介绍

Python 包管理器 uv 全面介绍 uv 是由 Astral（热门工具 Ruff 的开发者）推出的下一代高性能 Python 包管理器和构建工具，用 Rust 编写。它旨在解决传统工具（如 pip、virtualenv、pip-tools）的性能瓶颈，同时…...

编程新知 2026/2/7 10:47:09

MySQL 部分重点知识篇

一、数据库对象 1. 主键定义 ：主键是用于唯一标识表中每一行记录的字段或字段组合。它具有唯一性和非空性特点。作用 ：确保数据的完整性，便于数据的查询和管理。示例 ：在学生信息表中，学号可以作为主键&#xff…...

编程新知 2025/8/19 22:24:50

Java求职者面试指南：Spring、Spring Boot、Spring MVC与MyBatis技术解析

Java求职者面试指南：Spring、Spring Boot、Spring MVC与MyBatis技术解析一、第一轮基础概念问题 1. Spring框架的核心容器是什么？它的作用是什么？ Spring框架的核心容器是IoC（控制反转）容器。它的主要作用是管理对…...

编程新知 2025/7/17 8:16:30

**前置知识：

1、张量和通道

2、Reshape：输入数据和卷积核张量的重塑

3、output=F.conv2d(input,kernel,stride=1,padding=1)

**代码：

相关文章：