当前位置：首页 > news >正文

LeNet-5(fashion-mnist)

news 2026/2/11 2:43:36

文章目录

前言
LeNet
模型训练

前言

LeNet是最早发布的卷积神经网络之一。该模型被提出用于识别图像中的手写数字。

LeNet

LeNet-5由以下两个部分组成

卷积编码器（2）
全连接层（3）
卷积块由一个卷积层、一个sigmoid激活函数和一个平均汇聚层组成。
第一个卷积层有6个输出通道，第二个卷积层有16个输出通道。采用2×2的汇聚操作，且步幅为2.
3个全连接层分别有120，84，10个输出。
此处对原始模型做出部分修改，去除最后一层的高斯激活。

net=nn.Sequential(nn.Conv2d(1,6,kernel_size=5,padding=2),nn.Sigmoid(),nn.AvgPool2d(kernel_size=2,stride=2),nn.Conv2d(6,16,kernel_size=5),nn.Sigmoid(),nn.AvgPool2d(kernel_size=2,stride=2),nn.Flatten(),nn.Linear(16*5*5,120),nn.Sigmoid(),nn.Linear(120,84),nn.Sigmoid(),nn.Linear(84,10))

模型训练

为了加快训练，使用GPU计算测试集上的精度以及训练过程中的计算。
此处采用xavier初始化模型参数以及交叉熵损失函数和小批量梯度下降。

batch_size=256
train_iter,test_iter=data_iter.load_data_fashion_mnist(batch_size)

将数据送入GPU进行计算测试集准确率

def evaluate_accuracy_gpu(net,data_iter,device=None):"""使用GPU计算模型在数据集上的精度"""if isinstance(net,torch.nn.Module):net.eval()if not device:device=next(iter(net.parameters())).device# 正确预测的数量，预测的总数eva = 0.0y_num = 0.0with torch.no_grad():for X,y in data_iter:if isinstance(X,list):X=[x.to(device) for x in X]else:X=X.to(device)y=y.to(device)eva += accuracy(net(X), y)y_num += y.numel()return eva/y_num

训练过程同样将数据送入GPU计算

def train_epoch_gpu(net, train_iter, loss, updater,device):# 训练损失之和，训练准确数之和，样本数train_loss_sum = 0.0train_acc_sum = 0.0num_samples = 0.0# timer = d2l.torch.Timer()for i, (X, y) in enumerate(train_iter):# timer.start()updater.zero_grad()X, y = X.to(device), y.to(device)y_hat = net(X)l = loss(y_hat, y)l.backward()updater.step()with torch.no_grad():train_loss_sum += l * X.shape[0]train_acc_sum += evaluation.accuracy(y_hat, y)num_samples += X.shape[0]# timer.stop()return train_loss_sum/num_samples,train_acc_sum/num_samplesdef train_gpu(net,train_iter,test_iter,num_epochs,lr,device):def init_weights(m):if type(m)==torch.nn.Linear or type(m)==torch.nn.Conv2d:torch.nn.init.xavier_uniform_(m.weight)net.apply(init_weights)net.to(device)print('training on',device)optimizer=torch.optim.SGD(net.parameters(),lr=lr)loss=torch.nn.CrossEntropyLoss()# num_batches=len(train_iter)tr_l=[]tr_a=[]te_a=[]for epoch in range(num_epochs):net.train()train_metric=train_epoch_gpu(net,train_iter,loss,optimizer,device)test_accuracy = evaluation.evaluate_accuracy_gpu(net, test_iter)train_loss, train_acc = train_metrictrain_loss = train_loss.cpu().detach().numpy()tr_l.append(train_loss)tr_a.append(train_acc)te_a.append(test_accuracy)print(f'epoch: {epoch + 1}, train_loss: {train_loss}, train_acc: {train_acc}, test_acc:{test_accuracy}')x = torch.arange(num_epochs)plt.plot((x + 1), tr_l, '-', label='train_loss')plt.plot(x + 1, tr_a, '--', label='train_acc')plt.plot(x + 1, te_a, '-.', label='test_acc')plt.legend()plt.show()print(f'on {str(device)}')

lr,num_epochs=0.9,10
Train.train_gpu(net,train_iter,test_iter,num_epochs,lr,device='cuda')

在这里插入图片描述

LeNet-5(fashion-mnist)

文章目录前言LeNet模型训练前言 LeNet是最早发布的卷积神经网络之一。该模型被提出用于识别图像中的手写数字。 LeNet LeNet-5由以下两个部分组成卷积编码器（2）全连接层（3） 卷积块由一个卷积层、一个sigmoid激活函数和一个…...

编程日记 2024/1/11 6:23:19

Unity中URP下开启和使用深度图

文章目录前言一、在Unity中打开URP下的深度图二、在Shader中开启深度图1、使用不透明渲染队列才可以使用深度图2、半透明渲染队列深度图就会关闭三、URP深度图和 BRP深度图的区别四、在Shader中，使用深度图1、定义纹理和采样器2、在片元着色器对深度图采样并且输…...

编程日记 2024/1/11 6:19:16

类似东郊到家上门预约系统需要具备哪些功能，预约系统应该怎么做

随着上门服务需求的持续增长，各类APP小程序应运而生。吸引了无数商家投资者，纷纷想要开发一款类似于"东郊到家"这样的上门服务软件。要想成功，这样的软件需具备以下核心功能： 1. 快速注册与登录：用户能通过手…...

编程日记 2024/1/11 6:18:15

鸿蒙APP和Android的区别

鸿蒙（HarmonyOS）和Android是两个不同的操作系统，它们有一些区别，包括架构、开发者支持、应用生态和一些设计理念。以下是鸿蒙APP和Android APP之间的一些主要区别，希望对大家有所帮助。北京木奇移动技术有限公司&#…...

编程日记 2024/1/11 6:15:13

给Flutter + FireBase 增加 badge 徽章，App启动器通知红点。

在此之前需要配置好 firebase 在flutter 在项目中。（已经配置好的可以忽略此提示） Firebase 配置教程：flutter firebase 云消息通知教程 (android-安卓、ios-苹果)_flutter firebase_messaging ios环境配置-CSDN博客由于firebase 提供的消息…...

编程日记 2024/1/11 6:14:11

2024年中国杭州|网络安全技能大赛（CTF）正式开启竞赛报名

前言一、CTF简介 CTF（Capture The Flag）中文一般译作夺旗赛，在网络安全领域中指的是网络安全技术人员之间进行技术竞技的一种比赛形式。CTF起源于1996年DEFCON全球黑客大会，以代替之前黑客们通过互相发起真实攻击进行技术比拼的…...

编程日记 2024/1/11 6:13:11

112.Qt中的窗口类

我们在通过Qt向导窗口基于窗口的应用程序的项目过程中倒数第二步让我们选择跟随项目创建的第一个窗口的基类, 下拉菜单中有三个选项, 分别为: QMainWindow、QDialog、QWidget如下图： 常用的窗口类有3个在创建Qt窗口的时候, 需要让自己的窗口类继承上述三个窗口类的…...

编程日记 2024/1/11 6:12:10

如何设置电脑桌面提醒，电脑笔记软件哪个好？

对于大多数上班族来说，每天要完成的待办事项实在太多了，如果不能及时去处理，很容易因为各种因素导致忘记，从而给自己带来不少麻烦。所以，我们往往会借助一些提醒类的软件将各项任务逐一记录下来，然后设置上…...

编程日记 2024/1/11 6:11:09

C# HttpClient Get Post简单封装

文章目录前言封装好的代码测试接口测试代码前言微软官方有Get和Post请求，我把他简单化处理一下封装好的代码 public class MyHttpHelper{private string baseUrl;/// <summary>/// 基础Api/// </summary>public string BaseUrl{get{return baseUr…...

编程日记 2024/1/11 6:10:08

创建网格（Grid/GridItem）

目录 1、概述 2、布局与约束 3、设置排列方式 3.1设置行列数量与占比 3.2、设置子组件所占行列数 3.3、设置主轴方向 3.4、在网格布局中显示数据 3.5、设置行列间距 4、构建可滚动的网格布局 5、实现简单的日历功能 6、性能优化 1、概述网格布局是由“行”和“列”分…...

编程日记 2024/1/11 6:09:07

思科路由器忘记密码怎么重置

断电重启路由器，在开机过程中按下CtrlPause/break，或者只按下Pause/break（没有测试），在PT（Cisco Packet Tracert）中则需要按CtrlC。路由器会进入rommon >模式。切换到0x2142模式&#xff0…...

编程日记 2024/1/11 6:08:06

JVM基础（2）——JVM内存模型

一、简介 JVM会加载类到内存中，所以 JVM 中必然会有一块内存区域来存放我们写的那些类。Java中有类对象、普通对象、本地变量、方法信息等等各种对象信息，所以JVM会对内存区域进行划分： JDK1.8及以后，上图中的方法区变成了Metasp…...

编程日记 2024/1/11 6:07:05

使用 Process Explorer 和 Windbg 排查软件线程堵塞问题

目录 1、问题说明 2、线程堵塞的可能原因分析 3、使用Windbg和Process Explorer确定线程中发生了死循环 4、根据Windbg中显示的函数调用堆栈去查看源码，找到问题 4.1、在Windbg定位发生死循环的函数的方法 4.2、在Windbg中查看变量的值去辅助分析 4.3、是循环…...

编程日记 2024/1/11 6:05:04

做科技类的展台3d模型用什么材质比较好---模大狮模型网

对于科技类展台3D模型，以下是几种常用的材质选择： 金属材质：金属材质常用于科技展台的现代感设计，如不锈钢、铝合金或镀铬材质。金属材质可以赋予展台一个科技感和高档感，同时还可以反射光线，增加模型的真实…...

编程日记 2024/1/11 6:03:02

EasyExcel简单实例（未完待续）

EasyExcel简单实例准备工作场景一：读取 Student 表需求1：简单读取需求2：读取到异常信息时不中断需求3：读取所有的sheet工作表需求4：读取指定的sheet工作表需求5：从指定的行开始读取场景二：写入…...

编程日记 2024/1/11 6:01:00

ROS2学习笔记一：安装及测试

目录前言 1 ROS2安装与卸载 1.1 安装虚拟机 1.2 ROS2 humble安装 2 ROS2测试 2.1 topic测试 2.2 小海龟测试 2.3 RQT可视化 2.4 占用空间前言 ROS2的前身是ROS，ROS即机器人操作系统（Robot Operating System）,ROS为了“提高机器人…...

编程日记 2024/1/11 5:59:59

Xcode14.3.1真机调试iOS17的方法

Hello，大家好我是咕噜铁蛋！Xcode 是苹果官方开发工具，它提供了完整的开发环境和工具集，支持开发 iOS、macOS、watchOS 和 tvOS 应用程序。对于 iOS 开发者来说，Xcode 是必备的工具之一。而随着 iOS 系统的不断更新和升…...

编程日记 2024/1/11 5:57:57

主流大语言模型从预训练到微调的技术原理

引言本文设计的内容主要包含以下几个方面： 比较 LLaMA、ChatGLM、Falcon 等大语言模型的细节：tokenizer、位置编码、Layer Normalization、激活函数等。大语言模型的分布式训练技术：数据并行、张量模型并行、流水线并行、3D 并行、零冗余优…...

编程日记 2024/1/11 5:50:51

Linux中vim查看文件某内容

一、编辑文件命令 [rootyinheqilin ~]# vim test.txt 1，在编辑的文件中连续按2次键盘的【g】键，光标会移动到文档开头第一行 2，输入一个大写 G，光标会跳转到文件的最后一行第一列（末行) 二、查看文件内容命令 gre…...

编程日记 2024/1/11 5:48:49

阿里云提示服务器ip暴露该怎么办？-速盾网络（sudun）

当阿里云提示服务器IP暴露的时候，这意味着您的服务器可能面临安全风险，因为黑客可以通过知道服务器的IP地址来尝试入侵您的系统。在这种情况下，您应该立即采取措施来保护您的服务器和数据。以下是一些建议： 更改服务器IP地址&…...

编程日记 2024/1/11 5:47:48

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造，完美适配AGV和无人叉车。同时，集成以太网与语音合成技术，为各类高级系统（如MES、调度系统、库位管理、立库等）提供高效便捷的语音交互体验。 L…...

编程新知 2026/2/10 23:40:34

Lombok 的 @Data 注解失效，未生成 getter/setter 方法引发的HTTP 406 错误

HTTP 状态码 406 (Not Acceptable) 和 500 (Internal Server Error) 是两类完全不同的错误，它们的含义、原因和解决方法都有显著区别。以下是详细对比： 1. HTTP 406 (Not Acceptable) 含义： 客户端请求的内容类型与服务器支持的内容类型不匹…...

编程新知 2026/2/1 20:49:03

阿里云ACP云计算备考笔记 (5)——弹性伸缩

目录第一章概述第二章弹性伸缩简介 1、弹性伸缩 2、垂直伸缩 3、优势 4、应用场景 ① 无规律的业务量波动 ② 有规律的业务量波动 ③ 无明显业务量波动 ④ 混合型业务 ⑤ 消息通知 ⑥ 生命周期挂钩 ⑦ 自定义方式 ⑧ 滚的升级 5、使用限制第三章主要定义 …...

编程新知 2026/1/22 6:07:24

QMC5883L的驱动

简介本篇文章的代码已经上传到了github上面，开源代码作为一个电子罗盘模块，我们可以通过I2C从中获取偏航角yaw，相对于六轴陀螺仪的yaw，qmc5883l几乎不会零飘并且成本较低。参考资料 QMC5883L磁场传感器驱动 QMC5883L磁力计…...

编程新知 2026/1/2 4:05:05

Keil 中设置 STM32 Flash 和 RAM 地址详解

文章目录 Keil 中设置 STM32 Flash 和 RAM 地址详解一、Flash 和 RAM 配置界面（Target 选项卡）1. IROM1（用于配置 Flash）2. IRAM1（用于配置 RAM）二、链接器设置界面（Linker 选项卡）1. 勾选“Use Memory Layout from Target Dialog”2. 查看链接器参数（如果没有勾选上面…...

编程新知 2026/2/7 0:28:16

【Go】3、Go语言进阶与依赖管理

前言本系列文章参考自稀土掘金上的【字节内部课】公开课，做自我学习总结整理。 Go语言并发编程 Go语言原生支持并发编程，它的核心机制是 Goroutine 协程、Channel 通道，并基于CSP（Communicating Sequential Processes&#xff0…...

编程新知 2025/10/7 0:32:40

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院查看报告小程序

一、开发环境准备工具安装： 下载安装DevEco Studio 4.0（支持HarmonyOS 5）配置HarmonyOS SDK 5.0确保Node.js版本≥14 项目初始化： ohpm init harmony/hospital-report-app 二、核心功能模块实现 1. 报告列表…...

编程新知 2026/2/1 4:17:33

学习STC51单片机31（芯片为STC89C52RCRC）OLED显示屏1

每日一言生活的美好，总是藏在那些你咬牙坚持的日子里。硬件：OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写，"1306" 是产品编号。驱动 OLED 屏幕的 IIC 总线数据传输格式示意图 …...

编程新知 2026/1/30 4:16:26

【Oracle】分区表

个人主页：Guiat 归属专栏：Oracle 文章目录 1. 分区表基础概述1.1 分区表的概念与优势1.2 分区类型概览1.3 分区表的工作原理 2. 范围分区 (RANGE Partitioning)2.1 基础范围分区2.1.1 按日期范围分区2.1.2 按数值范围分区 2.2 间隔分区 (INTERVAL Partit…...

编程新知 2026/1/20 21:59:36

今日学习：Spring线程池|并发修改异常|链路丢失|登录续期|VIP过期策略|数值类缓存

文章目录优雅版线程池ThreadPoolTaskExecutor和ThreadPoolTaskExecutor的装饰器并发修改异常并发修改异常简介实现机制设计原因及意义使用线程池造成的链路丢失问题线程池导致的链路丢失问题发生原因常见解决方法更好的解决方法设计精妙之处登录续期登录续期常见实现方式特…...

编程新知 2026/1/27 16:41:02

文章目录

前言

LeNet

模型训练

相关文章：