当前位置：首页 > news >正文

【构建卷积神经网络】

news 2026/2/11 4:22:42

构建卷积神经网络

卷积网络中的输入和层与传统神经网络有些区别，需重新设计，训练模块基本一致

全连接层：batch784，各个像素点之间都是没有联系的。
卷积层：batch12828，各个像素点之间是有联系的。

import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torchvision import datasets,transforms 
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

首先读取数据

分别构建训练集和测试集（验证集）
DataLoader来迭代取数据

# 定义超参数 
input_size = 28  #图像的总尺寸28*28
num_classes = 10  #标签的种类数
num_epochs = 3  #训练的总循环周期
batch_size = 64  #一个撮（批次）的大小，64张图片# 训练集
train_dataset = datasets.MNIST(root='./data',  train=True,   transform=transforms.ToTensor(),  download=True) # 测试集
test_dataset = datasets.MNIST(root='./data', train=False, transform=transforms.ToTensor())# 构建batch数据
train_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=True)

卷积网络模块构建

一般卷积层，relu层，池化层可以写成一个套餐
注意卷积最后结果还是一个特征图，需要把图转换成向量才能做分类或者回归任务

图像是二维卷积 conv2
视频是三维卷积 conv3
单向量是一维卷积 conv1
官网有关conv2d的输出宽度和长度的计算公式
在这里插入图片描述

class CNN(nn.Module):def __init__(self):super(CNN, self).__init__()self.conv1 = nn.Sequential(         # 输入大小 (1, 28, 28)nn.Conv2d(in_channels=1,              # 1：灰度图；3：RGBout_channels=16,            # 要得到几多少个特征图,即是卷积核的个数 kernel_size=5,              # 卷积核大小stride=1,                   # 步长padding=2,                  # 如果希望卷积后大小跟原来一样，需要设置padding=(kernel_size-1)/2 if stride=1),                              # 输出的特征图为 (16, 28, 28)nn.ReLU(),                      # relu层nn.MaxPool2d(kernel_size=2),    # 进行池化操作（2x2 区域）, 输出结果为： (16, 14, 14))self.conv2 = nn.Sequential(         # 下一个套餐的输入 (16, 14, 14)nn.Conv2d(16, 32, 5, 1, 2),     # 输出 (32, 14, 14)nn.ReLU(),                      # relu层nn.Conv2d(32, 32, 5, 1, 2),nn.ReLU(),nn.MaxPool2d(2),                # 输出 (32, 7, 7))self.conv3 = nn.Sequential(         # 下一个套餐的输入 (32, 7, 7)nn.Conv2d(32, 64, 5, 1, 2),     # 输出 (64, 7, 7)nn.ReLU(),             # 输出 (64, 7, 7))self.out = nn.Linear(64 * 7 * 7, 10)   # 全连接层得到的结果def forward(self, x):x = self.conv1(x)x = self.conv2(x)x = self.conv3(x)x = x.view(x.size(0), -1)           # flatten操作，结果为：(batch_size, 64 * 7 * 7)output = self.out(x)return output

准确率作为评估标准

def accuracy(predictions, labels):pred = torch.max(predictions.data, 1)[1] rights = pred.eq(labels.data.view_as(pred)).sum() return rights, len(labels)

训练网络模型

# 实例化
net = CNN() 
#损失函数
criterion = nn.CrossEntropyLoss() 
#优化器
optimizer = optim.Adam(net.parameters(), lr=0.001) #定义优化器，普通的随机梯度下降算法#开始训练循环
for epoch in range(num_epochs):#当前epoch的结果保存下来train_rights = [] for batch_idx, (data, target) in enumerate(train_loader):  #针对容器中的每一个批进行循环net.train()                             output = net(data) loss = criterion(output, target) optimizer.zero_grad() loss.backward() optimizer.step() right = accuracy(output, target) train_rights.append(right) if batch_idx % 100 == 0: net.eval() val_rights = [] for (data, target) in test_loader:output = net(data) right = accuracy(output, target) val_rights.append(right)#准确率计算train_r = (sum([tup[0] for tup in train_rights]), sum([tup[1] for tup in train_rights]))val_r = (sum([tup[0] for tup in val_rights]), sum([tup[1] for tup in val_rights]))print('当前epoch: {} [{}/{} ({:.0f}%)]\t损失: {:.6f}\t训练集准确率: {:.2f}%\t测试集正确率: {:.2f}%'.format(epoch, batch_idx * batch_size, len(train_loader.dataset),100. * batch_idx / len(train_loader), loss.data, 100. * train_r[0].numpy() / train_r[1], 100. * val_r[0].numpy() / val_r[1]))

在这里插入图片描述

练习

再加入一层卷积，效果怎么样？
当前任务中为什么全连接层是3277 其中每一个数字代表什么含义

【构建卷积神经网络】

构建卷积神经网络卷积网络中的输入和层与传统神经网络有些区别，需重新设计，训练模块基本一致全连接层：batch784，各个像素点之间都是没有联系的。卷积层：batch12828，各个像素点之间是有联系的。 impor…...

编程日记 2023/8/9 6:26:31

SSH 认证原理

SSH协议登录服务器： $ ssh userhost 主要有两种登录方式：第一种为密码口令登录，第二种为公钥登录密码口令登录通过密码进行登录，主要流程为： 1、客户端连接上服务器之后，服务器把自己的公钥传给客户端…...

编程日记 2023/8/9 6:25:31

基于DETR (DEtection TRansformer)开发构建MSTAR雷达影像目标检测系统

关于DETR相关的实践在之前的文章中很详细地介绍过，感兴趣的话可以自行移步阅读即可： 《DETR (DEtection TRansformer)基于自建数据集开发构建目标检测模型超详细教程》《书接上文——DETR评估可视化》基于MSTAR雷达影像数据开发构建目标检测系统&am…...

编程日记 2023/8/9 6:24:28

Java分布式微服务1——注册中心（Eureka/Nacos）

文章目录基础知识注册中心Eureka注册中心与Ribbon负载均衡1、Eureka注册中心2、Eureka的搭建3、Eureka服务注册4、复制服务实例5、拉取服务6、Ribbon负载均衡的流程及Eureka规则调整：7、Ribbon负载均衡饥饿加载 Nacos注册中心1、服务端Nacos安装与启动2、客户端Nac…...

编程日记 2023/8/9 6:23:26

(文章复现)建筑集成光储系统规划运行综合优化方法matlab代码

参考文献： [1]陈柯蒙,肖曦,田培根等.一种建筑集成光储系统规划运行综合优化方法[J].中国电机工程学报,2023,43(13):5001-5012. 1.基本原理本文建立的双层耦合模型内、外层分别对应求解容量配置与能量调度问题。外层模型设置光伏与储能容量备选集并将容量配置组合…...

编程日记 2023/8/9 6:22:25

【Redis】——RDB快照

Redis 是内存数据库，但是它为数据的持久化提供了两个技术，一个是AOF日志，另一个是RDB快照： AOF 文件的内容是操作命令；RDB 文件的内容是二进制数据。 RDB 快照就是记录某一个瞬间的内存数据，记录的是实际…...

编程日记 2023/8/9 6:21:24

微服务监控技术skywalking的部署与使用（亲测无坑）

微服务监控技术skywalking的部署与使用 1. 前期准备2. skywalking安装部署2.1 Java Agent2.2 apache/skywalking-oap-server2.3 apache/skywalking-ui 3. 项目启动4.效果展示 1. 前期准备注：本篇文章采用docker部署，采用8.2.0版本，版本一定…...

编程日记 2023/8/9 6:20:22

DLA 神经网络的极限训练方法：gradient checkpointing

gradient checkpointing 一般来说，训练的过程需要保存中间结果（不管是GPU还是CPU）。前向传播根据输入(bottom_data)计算输出(top_data)，后向传播由top_diff计算bottom_diff（如果某个变量打开梯度进行训练的话&#xff…...

编程日记 2023/8/9 6:19:21

python excel 操作

excel文件内容如下： 一、xlrd 读Excel 操作 1、打开Excel文件读取数据 filexlrd.open_workbook(filename)#文件名以及路径，如果路径或者文件名有中文给前面加一个 r 2、常用函数 （1）获取一个sheet工作表 table file.sheets(…...

编程日记 2023/8/9 6:18:20

记一次Linux启动Mysql异常解决

文章目录第一步： netstat -ntlp 查看端口情况2、启动Mysql3、查看MySQL日志 tail -100f /var/log/mysqld.log4、查看磁盘占用情况：df -h5、思路小结第一步： netstat -ntlp 查看端口情况并没有发现3306数据库端口 2、启动Mysql service …...

编程日记 2023/8/9 6:17:19

ATFX汇市：美联储年内或仍将加息依次，美指向下空间不大

环球汇市行情摘要—— 昨日，美元指数上涨0.08%，收盘在102.08点， 欧元贬值0.07%，收盘价1.1003点； 日元贬值0.51%，收盘价142.47点； 英镑升值0.28%，收盘价1.2784点； 瑞…...

编程日记 2023/8/9 6:16:18

【博客687】k8s informer的list-watch机制剖析

k8s informer的list-watch机制剖析 1、list-watch场景： client-go中的reflector模块首先会list apiserver获取某个资源的全量信息，然后根据list到的rv来watch资源的增量信息。希望使用client-go编写的控制器组件在与apiserver发生连接异常时&#xff0c…...

编程日记 2023/8/9 6:15:17

用Python获取链家二手房房源数据，做可视化图分析数据

前言数据采集的步骤是固定: 发送请求, 模拟浏览器对于url地址发送请求获取数据, 获取网页数据内容 --> 请求那个链接地址, 返回服务器响应数据解析数据, 提取我们需要的数据内容保存数据, 保存本地文件所需模块 win R 输入cmd 输入安装命令 pip install 模块名 (如果你…...

编程日记 2023/8/9 6:14:16

Yield Guild Games：社区更新 — 2023 年第二季度

本文重点介绍了 Yield Guild Games (YGG) 2023 年第二季度社区更新中涵盖的关键主题，包括公会发展计划 (GAP) 第 3 季的总结、YGG 领导团队的新成员以及 YGG 的最新消息地区公会网络和广泛的游戏合作伙伴生态系统。在 YGG 品牌焕然一新的基础上，第二季…...

编程日记 2023/8/9 6:13:15

Stable Diffusion - 运动服 (Gymwear Leggings) 风格服装与背景的 LoRA 配置

欢迎关注我的CSDN：https://spike.blog.csdn.net/ 本文地址：https://spike.blog.csdn.net/article/details/132179050 测试模型：DreamShaper 8 运动裤 (Gymwear Leggings) 是紧身的裤子，通常用于健身、瑜伽、跑步等运动。运动裤的…...

编程日记 2023/8/9 6:12:13

js-7：javascript原型、原型链及其特点

1、原型 JavaScript常被描述为一种基于原型的语言-每个对象拥有一个原型对象。当试图访问一个对象的属性时，它不仅仅在该对象上搜寻，还会搜寻该对象的原型，以及该对象的原型的原型，依次层层向上搜索，直到找到一个名字…...

编程日记 2023/8/9 6:11:12

可以在 while 和 foreach 循环中使用continue语句。 continue - 语法带有 while 循环的 continue 语句的语法如下- while(condition) {statement(s); } continue {statement(s); } 具有 foreach 循环的 continue 语句的语法如下- foreach $a (listA) {statement(s); } co…...

编程日记 2023/8/9 6:10:11

【贪心算法】leetcode刷题

贪心算法无固定套路。核心思想：先找局部最优，再扩展到全局最优。 455.分发饼干两种思路： 1、从大到小。局部最优就是大饼干喂给胃口大的，充分利用饼干尺寸喂饱一个，全局最优就是喂饱尽可能多的小孩。先遍历的胃口&a…...

编程日记 2023/8/9 6:09:10

PyMySQL库版本引起的python执行sql编码错误

前言长话短说，之前在A主机（centos7.9）上运行的py脚本拿到B主机上（centos7.9）运行报错： UnicodeEncodeError: latin-1 codec cant encode characters in position 265-266: ordinal not in range(256)两个…...

编程日记 2023/8/9 6:08:08

第二章-算法

第二章-算法数据结构和算法的关系算法是解决特定问题求解步骤的描述，在计算机中表现为指令的有限序列，并且每条指令表示一个或多个操作。算法的特性算法有五个基本特征：输入、输出、有穷性、确定性和可行性。输入：算法具…...

编程日记 2023/8/9 6:07:07

变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析

一、变量声明设计：let 与 mut 的哲学解析 Rust 采用 let 声明变量并通过 mut 显式标记可变性，这种设计体现了语言的核心哲学。以下是深度解析： 1.1 设计理念剖析安全优先原则：默认不可变强制开发者明确声明意图 let x 5; …...

编程新知 2025/9/28 20:12:12

国防科技大学计算机基础课程笔记02信息编码

1.机内码和国标码国标码就是我们非常熟悉的这个GB2312,但是因为都是16进制，因此这个了16进制的数据既可以翻译成为这个机器码，也可以翻译成为这个国标码，所以这个时候很容易会出现这个歧义的情况； 因此，我们的这个国…...

编程新知 2026/2/8 4:37:15

Leetcode 3576. Transform Array to All Equal Elements

Leetcode 3576. Transform Array to All Equal Elements 1. 解题思路2. 代码实现题目链接：3576. Transform Array to All Equal Elements 1. 解题思路这一题思路上就是分别考察一下是否能将其转化为全1或者全-1数组即可。至于每一种情况是否可以达到&#xf…...

编程新知 2025/9/17 7:25:07

中南大学无人机智能体的全面评估！BEDI：用于评估无人机上具身智能体的综合性基准测试

作者：Mingning Guo, Mengwei Wu, Jiarun He, Shaoxian Li, Haifeng Li, Chao Tao单位：中南大学地球科学与信息物理学院论文标题：BEDI: A Comprehensive Benchmark for Evaluating Embodied Agents on UAVs论文链接：https://arxiv.…...

编程新知 2026/1/22 15:36:10

如何将联系人从 iPhone 转移到 Android

从 iPhone 换到 Android 手机时，你可能需要保留重要的数据，例如通讯录。好在，将通讯录从 iPhone 转移到 Android 手机非常简单，你可以从本文中学习 6 种可靠的方法，确保随时保持连接，不错过任何信息。第 1…...

编程新知 2026/1/31 5:09:27

docker 部署发现spring.profiles.active 问题

报错： org.springframework.boot.context.config.InvalidConfigDataPropertyException: Property spring.profiles.active imported from location class path resource [application-test.yml] is invalid in a profile specific resource [origin: class path re…...

编程新知 2025/9/20 12:14:18

Web中间件--tomcat学习

Web中间件–tomcat Java虚拟机详解什么是JAVA虚拟机 Java虚拟机是一个抽象的计算机，它可以执行Java字节码。Java虚拟机是Java平台的一部分，Java平台由Java语言、Java API和Java虚拟机组成。Java虚拟机的主要作用是将Java字节码转换为机器代码&#x…...

编程新知 2025/9/13 18:20:34

脑机新手指南（七）：OpenBCI_GUI：从环境搭建到数据可视化（上）

一、OpenBCI_GUI 项目概述 （一）项目背景与目标 OpenBCI 是一个开源的脑电信号采集硬件平台，其配套的 OpenBCI_GUI 则是专为该硬件设计的图形化界面工具。对于研究人员、开发者和学生而言，首次接触 OpenBCI 设备时，往…...

编程新知 2026/2/3 4:26:32

TSN交换机正在重构工业网络，PROFINET和EtherCAT会被取代吗？

在工业自动化持续演进的今天，通信网络的角色正变得愈发关键。 2025年6月6日，为期三天的华南国际工业博览会在深圳国际会展中心（宝安）圆满落幕。作为国内工业通信领域的技术型企业，光路科技（Fiberroad&…...

编程新知 2026/1/26 5:57:43

深度学习之模型压缩三驾马车：模型剪枝、模型量化、知识蒸馏

一、引言在深度学习中，我们训练出的神经网络往往非常庞大（比如像 ResNet、YOLOv8、Vision Transformer），虽然精度很高，但“太重”了，运行起来很慢，占用内存大，不适合部署到手机、摄…...

编程新知 2025/9/24 3:56:34

【构建卷积神经网络】

构建卷积神经网络

首先读取数据

卷积网络模块构建

准确率作为评估标准

训练网络模型

练习

相关文章：

【构建卷积神经网络】

SSH 认证原理

基于DETR (DEtection TRansformer)开发构建MSTAR雷达影像目标检测系统

Java分布式微服务1——注册中心（Eureka/Nacos）

(文章复现)建筑集成光储系统规划运行综合优化方法matlab代码

【Redis】——RDB快照

微服务监控技术skywalking的部署与使用（亲测无坑）

DLA 神经网络的极限训练方法：gradient checkpointing

python excel 操作

记一次Linux启动Mysql异常解决

ATFX汇市：美联储年内或仍将加息依次，美指向下空间不大

【博客687】k8s informer的list-watch机制剖析

用Python获取链家二手房房源数据，做可视化图分析数据

Yield Guild Games：社区更新 — 2023 年第二季度

Stable Diffusion - 运动服 (Gymwear Leggings) 风格服装与背景的 LoRA 配置

js-7：javascript原型、原型链及其特点

无涯教程-Perl - continue 语句函数

【贪心算法】leetcode刷题

PyMySQL库版本引起的python执行sql编码错误

第二章-算法

变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析

国防科技大学计算机基础课程笔记02信息编码

Leetcode 3576. Transform Array to All Equal Elements

中南大学无人机智能体的全面评估！BEDI：用于评估无人机上具身智能体的综合性基准测试

如何将联系人从 iPhone 转移到 Android

docker 部署发现spring.profiles.active 问题

Web中间件--tomcat学习

脑机新手指南（七）：OpenBCI_GUI：从环境搭建到数据可视化（上）

TSN交换机正在重构工业网络，PROFINET和EtherCAT会被取代吗？

深度学习之模型压缩三驾马车：模型剪枝、模型量化、知识蒸馏