经典卷积神经网络LeNet实现(pytorch版)
LeNet卷积神经网络
- 一、理论部分
- 1.1 核心理论
- 1.2 LeNet-5 网络结构
- 1.3 关键细节
- 1.4 后期改进
- 1.6 意义与局限性
- 二、代码实现
- 2.1 导包
- 2.1 数据加载和处理
- 2.3 网络构建
- 2.4 训练和测试函数
- 2.4.1 训练函数
- 2.4.2 测试函数
- 2.5 训练和保存模型
- 2.6 模型加载和预测
一、理论部分
LeNet是一种经典的
卷积神经网络(CNN),由Yann LeCun等人于1998年提出,最初用于手写数字识别(如MNIST数据集)。它是CNN的奠基性工作之一,其核心思想是通过局部感受野、共享权重和空间下采样来提取有效特征
1.1 核心理论
-
局部感受野(Local Receptive Fields):
卷积层通过小尺寸的滤波器(如5×5)扫描输入图像,每个神经元仅连接输入图像的局部区域,从而捕捉局部特征(如边缘、纹理) -
共享权重(Weight Sharing):
同一卷积层的滤波器在整张图像上共享参数,显著减少参数量,增强平移不变性 -
空间下采样(Subsampling):
池化层(如平均池化)降低特征图的分辨率,减少计算量并增强对微小平移的鲁棒性 -
多层特征组合:
通过交替的卷积和池化层,逐步组合低层特征(边缘)为高层特征(数字形状)
1.2 LeNet-5 网络结构
LeNet-5是LeNet系列中最著名的版本,其结构如下(输入为32×32灰度图像):
| 层类型 | 参数说明 | 输出尺寸 |
|---|---|---|
| 输入层 | 灰度图像 | 32×32×1 |
| C1层 | 卷积层:6个5×5滤波器,步长1,无填充 | 28×28×6 |
| S2层 | 平均池化:2×2窗口,步长2 | 14×14×6 |
| C3层 | 卷积层:16个5×5滤波器,步长1 | 10×10×16 |
| S4层 | 平均池化:2×2窗口,步长2 | 5×5×16 |
| C5层 | 卷积层:120个5×5滤波器 | 1×1×120 |
| F6层 | 全连接层:84个神经元 | 84 |
| 输出层 | 全连接 + Softmax(10类) | 10 |
1.3 关键细节
-
激活函数:
原始LeNet使用Tanh或Sigmoid,现代实现常用ReLU -
池化方式:
原始版本使用平均池化,后续改进可能用最大池化 -
参数量优化:
C3层并非全连接至S2的所有通道,而是采用部分连接(如论文中的连接表),减少计算量 -
输出处理:
最后通过全连接层(F6)和Softmax输出分类概率(如0-9数字)
1.4 后期改进
- ReLU替代Tanh:解决梯度消失问题,加速训练
- 最大池化:更关注显著特征,抑制噪声
- Batch Normalization:稳定训练过程
- Dropout:防止过拟合(原LeNet未使用)
1.6 意义与局限性
-
意义:
证明了CNN在视觉任务中的有效性,启发了现代深度学习模型(如AlexNet、ResNet) -
局限性:
参数量小、层数浅,对复杂数据(如ImageNet)表现不足,需更深的网络结构
LeNet的设计思想至今仍是CNN的基础,理解它有助于掌握现代卷积神经网络的演变逻辑
二、代码实现
- LeNet 是一个经典的卷积神经网络(CNN),由 Yann LeCun 等人于 1998 年提出,主要用于手写数字识别(如 MNIST 数据集)
- MNIST数据集是机器学习领域中非常经典的一个数据集,由60000个训练样本和10000个测试样本组成,每个样本都是一张28 * 28像素的灰度手写数字图片
- 总体来看,LeNet(LeNet-5)由两个部分组成:(1)
卷积编码器:由两个卷积层组成(2)全连接层密集块:由三个全连接层组成
2.1 导包
import torch
import torch.nn as nn
import torchvision
from tqdm import tqdm
from torchsummary import summary
2.1 数据加载和处理
# 加载 MNIST 数据集
def load_data(batch_size=64):transform = torchvision.transforms.Compose([torchvision.transforms.ToTensor(), # 将图像转换为张量torchvision.transforms.Normalize((0.5,), (0.5,)) # 归一化])# 下载训练集和测试集train_dataset = torchvision.datasets.MNIST(root='./data', train=True, download=True, transform=transform)test_dataset = torchvision.datasets.MNIST(root='./data', train=False, download=True, transform=transform)# 创建 DataLoadertrain_loader = torch.utils.data.DataLoader(dataset=train_dataset, batch_size=batch_size, shuffle=True)test_loader = torch.utils.data.DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)return train_loader, test_loader
2.3 网络构建
- LeNet 的网络结构如下:
- 卷积层 1:输入通道 1,输出通道 6,卷积核大小 5x5
- 池化层 1:2x2 的最大池化
- 卷积层 2:输入通道 6,输出通道 16,卷积核大小 5x5。
- 池化层 2:2x2 的最大池化。
- 全连接层 1:输入 16x5x5,输出 120
- 全连接层 2:输入 120,输出 84
- 全连接层 3:输入 84,输出 10(对应 10 个类别)
#定义LeNet网络架构
class LeNet(nn.Module):def __init__(self):super(LeNet,self).__init__()self.net=nn.Sequential(#卷积层1nn.Conv2d相关文章:
经典卷积神经网络LeNet实现(pytorch版)
LeNet卷积神经网络 一、理论部分1.1 核心理论1.2 LeNet-5 网络结构1.3 关键细节1.4 后期改进1.6 意义与局限性二、代码实现2.1 导包2.1 数据加载和处理2.3 网络构建2.4 训练和测试函数2.4.1 训练函数2.4.2 测试函数2.5 训练和保存模型2.6 模型加载和预测一、理论部分 LeNet是一…...
【2】数据结构的单链表章
目录标题 单链表的定义单链表的初始化单链表的建立头插法创建尾插法创建 查找操作按序号查找按内容查找 插入操作删除操作合并操作 单链表总代码与调试 单链表的定义 结点(Node)的定义:数据域(data)和指针域ÿ…...
Linux(十一)fork实例练习、文件操作示例及相关面试题目分享
一、fork实例练习 1、思考下面这段代码的打印结果是什么? #include<stdio.h> #include<unistd.h> #include<assert.h> #include<stdlib.h>int main(){int i0;for(;i<2;i){fork();printf("A\n");} exit(0); }所以一共打印6…...
android Fragment使用
在 Android Fragment 中,导入 id(findViewById)并给控件赋值的逻辑通常应该写在 onViewCreated() 方法中,而不是 onCreateView()。 Fragment 生命周期 & 适合的位置 方法作用适合的操作onCreateView()创建并返回 Fragment 的…...
open3d教程 (三)点云的显示
官方文档位置: Visualization - Open3D 0.19.0 documentationhttps://www.open3d.org/docs/release/tutorial/visualization/visualization.html核心方法: o3d.visualization.draw_geometries([几何对象列表]) import open3d as o3dprint("Load …...
根据模板将 Excel 明细数据生成 Txt 文档|邮件合并
在日常办公中,我们常常会遇到需要批量生成文档的任务。以往,若要将 Excel 中的每一条数据都转化为单独的文档,且文档部分内容依据 Excel 数据动态变化,手动操作不仅繁琐,还容易出错。现在,有一种便捷的方法…...
【学Rust写CAD】22 双圆径向渐变的结构体(two_circle_radial_gradient.rs)
源码 //two_circle_radial_gradient.rs //! 定义双圆径向渐变的结构体和相关功能/// 表示一个双圆径向渐变的源 /// /// 该结构体描述了两个圆之间的渐变,支持矩阵变换和颜色查找表优化 #[derive(Debug, Clone, PartialEq)] pub struct TwoCircleRadialGradientSou…...
LVGL Dropdown和Calendar详解
LVGL Dropdown和Calendar详解 一、Dropdown详解创建和初始化设置下拉框选项获取选项获取选中项文本:获取选中项索引:设置选中项: 事件处理其他功能和样式设置设置下拉按钮样式:设置下拉框方向:设置最大高度:…...
AISEO (GEO )中的知识图谱
一、知识图谱在AI SEO中的概念与结构 1. 知识图谱是什么? 定义:知识图谱(Knowledge Graph)是一种以图结构组织的语义网络,由实体(Entity)、**关系(Relation)和属性&…...
Vulnhub-zico2靶机打靶记录
本篇文章旨在为网络安全渗透测试靶机教学。通过阅读本文,读者将能够对渗透Vulnhub系列zico2靶机有一定的了解 一、信息收集阶段 靶机下载地址:https://download.vulnhub.com/zico/zico2.ova 因为靶机为本地部署虚拟机网段,查看dhcp地址池设…...
(041)05-01-自考数据结构(20331)树与二叉树大题总结
实际考试中,计算题约占40%,推理题约占30%,算法设计题约占30%。建议重点练习遍历序列相关的递归分治解法, 知识拓扑 知识点介绍 一、计算题类型与解法 1. 结点数量计算 题型示例: 已知一棵完全二叉树的第6层有8个叶子结点,求该二叉树最多有多少个结点? 解法步骤: 完…...
Python----机器学习(KNN:使用数学方法实现KNN)
一、原理 以下是K最近邻(K-Nearest Neighbors,简称KNN)算法的基本流程,用于对给定点进行分类预测。 1. 获得要预测的点 point_predict 。 2. 计算训练点集 point_set_train 中各点到要预测的点 表 l ist_L2_distance 。 3. 对 poi…...
网络攻防快速入门笔记pwn | 02 栈溢出题型 | 2.2 ret2libc
上一篇:网络攻防快速入门笔记pwn | 02 栈溢出题型 | 2.1 ret2text和ret2shellcode 下一篇:网络攻防快速入门笔记pwn | 02 栈溢出题型 | 2.3 ret2syscall 欢迎关注~ ret2libc 一、 什么是ret2libc(一)ret2lib的概念(…...
Edge浏览器快速开启IE模式
一些老旧的网站,仅支持Internet Explorer(IE)浏览器访问。 然而,出于安全性的考虑,可能会遇到限制IE浏览器使用的情况。 Microsoft Edge浏览器提供了兼容性配置,可以通过IE模式访问这些网站。 以下是两种…...
技术长期主义:用本分思维重构JavaScript逆向知识体系(一)Babel、AST、ES6+、ES5、浏览器环境、Node.js环境的关系和处理流程
基础不牢,地动山摇,逆向越久,越发现基础的重要性,本系列,回顾js逆向基础,让自己的知识体系更加系统化。 以下是 Babel、AST、ES6、ES5、浏览器环境、Node.js环境 的关系和流程的详细说明及图表:…...
Oracle 数据库系统全面详解
Oracle 数据库是全球领先的关系型数据库管理系统(RDBMS),由 Oracle 公司开发。它为企业级应用提供了高性能、高可用性、安全性和可扩展性的数据管理解决方案。 目录 一、Oracle 数据库体系结构 1. 物理存储结构 主要组件: 存储层次: 2. …...
LeetCode 解题思路 29(Hot 100)
解题思路: 映射关系建立:创建一个哈希表存储数字到字母的映射。递归参数: 给定字符串 digits、结果集 result、当前路径 path、当前位置 start。递归过程: 当当前位置 start 等于 digits 长度时,说明已经遍历完 digi…...
使用Python解析PPT文件并生成JSON结构详解
引言 PowerPoint(PPT)文件的自动化处理是办公自动化和数据提取的常见需求。本文将介绍如何通过Python的python-pptx库,将PPT文件的样式、结构、文本内容等信息解析为标准化的JSON格式,为后续的自动化处理、数据迁移或样式复用提供…...
LabVIEW永磁同步电机性能测试系统
开发了一种基于LabVIEW的永磁同步电机(PMSM)性能测试系统的设计及应用。该系统针对新能源汽车使用的电机进行稳态性能测试,解决了传统测试方法成本高、效率低的问题,实现了测试自动化,提高了数据的准确性和客观性。 …...
MTK Camera 照片切视频Systrace拆解分析
和你一起终身学习,这里是程序员Android 经典好文推荐,通过阅读本文,您将收获以下知识点: 一、Systrace 拆解概览二、Systrace 阶段拆解详解 一、Systrace 拆解概览 MTK Camera 照片切换视频trace 拆解(非切换摄像头类) 照片切换视频模块trace…...
某合约任意提取BNB漏洞
1背景描述 合约是一个在满足特定条件时在区块链上执行代码的程序,各方以数字签署合同的方式准许并维护它的其运行。这些代码可以是向朋友汇款、买卖 NFT 虚拟商品等一系列复杂的内容。 存在漏洞的目标合约是一个结合Meme文化病毒式传播与去中心化金融(D…...
Linux_3.2
今天继续学习shell语法 shell类似一个面向过程的语言,要区分好面向过程和面向对象的语言的区别。 循环语句 for循环 for i in a 2 cc doecho $i done #输出a 2 ccfor file in `ls` doecho $file done #输出ls命令的输出for i in $(seq 1 10) doecho $i done #输出1-10,seq…...
插件实现:分别通过winform和WPF界面输入操作CAD——CAD c#二次开发
效果如下图所示: 主程序 using Autodesk.AutoCAD.ApplicationServices; using Autodesk.AutoCAD.DatabaseServices; using Autodesk.AutoCAD.EditorInput; using Autodesk.AutoCAD.Geometry; using Autodesk.AutoCAD.Runtime; using System; using System.Windows…...
【学Rust写CAD】20 平铺模式结构体(spread.rs)
这个 Spread。rs文件定义了渐变超出定义区域时的扩展方式,通常用于处理渐变在边界之外的行为。 源码 //color/spread.rs #[derive(Debug, Clone, Copy)] pub struct Pad; // 空结构体,表示 Pad 模式#[derive(Debug, Clone, Copy)] pub struct Reflect…...
maya调整全局关节显示大小
请按以下步骤操作: 在 Maya 主菜单栏中,找到 Display (显示) 菜单。 在 Display 菜单下,找到 Animation (动画) 子菜单。 在 Animation 子菜单中,点击 Joint Size... (关节大小...)。 这时会弹出一个小窗口或者直接在界面上出现…...
白酒迈入3.0时代,珍酒李渡如何穿越周期高质增长?
当下,白酒行业仍处深度调整期,过往通过渠道拓展、硬广宣传等推动规模扩张、提升市场份额的模式,愈发难以为继。 行业迫切需要构建高质增长新模式,完成增长动能转换。中国酒业协会理事长宋书玉提出,白酒消费亟需进入品…...
HTTP代理:网页加速的隐形引擎
目录 引言:网页加载速度为何至关重要? 一、HTTP代理的核心加速原理 二、四大加速黑科技详解 三、实战场景性能对比 四、代理加速的隐藏代价 五、未来发展趋势 结语:智能代理的选型指南 引言:网页加载速度为何至关重要&#…...
人工智能-LangGraph+ChatUI+DeepSeek API搭建本地智能助手
人工智能-LangGraphChatUIDeepSeek API搭建本地智能助手 0 环境说明1 LangGraph2 Agent Chat UI 0 环境说明 环境项环境说明操作系统Windows11 专业版硬件信息联想拯救者Y9000PcondaAnancondaPython版本3.12NodeJs18.20.0 # 使用conda创建python环境 conda create -n langgra…...
3dmax批量转glb/gltf/fbx/osgb/stl/3ds/dae/obj/skp格式导出转换插件,无需一个个打开max,材质贴图在
3dmax批量转glb/gltf/fbx/osgb/stl/3ds/dae/obj/skp格式导出转换插件,无需一个个打开max,材质贴图在 3dmax批量转glb/gltf/fbx/osgb/stl/3ds/dae/obj/skp格式导出转换插件,无需一个个打开max,材质贴图在...
虚幻5入门
常用操作 运行时,调试相机,按~键,输入ToggleDebugCamera 。进入自由视角 常用节点 gate节点:用于控制该流程通不通,执不执行。Flip Flop节点:反转执行,一次A,一次B。Set Timer by…...
