当前位置：首页 > news >正文

【图像分类】理论篇（2）经典卷积神经网络 Lenet~Resenet

news 2026/5/16 12:56:47

1、卷积运算

2、经典卷积神经网络

2.1 Lenet

网络构架

代码实现

2.2 Alexnet

网络构架

代码实现

2.3 VGG

VGG16网络构架

代码实现

2.4 ResNet

ResNet50网络构架

代码实现

1、卷积运算

在二维卷积运算中，卷积窗口从输入张量的左上角开始，从左到右、从上到下滑动。当卷积窗口滑动到新一个位置时，包含在该窗口中的部分张量与卷积核张量进行按元素相乘，得到的张量再求和得到一个单一的标量值，由此我们得出了这一位置的输出张量值。在如上例子中，输出张量的四个元素由二维互相关运算得到，这个输出高度为2、宽度为2，如下所示：

import torch
from torch import nndef Conv2d(X, K):  """计算二维卷积运算"""h, w = K.shapeY = torch.zeros((X.shape[0] - h + 1, X.shape[1] - w + 1))for i in range(Y.shape[0]):for j in range(Y.shape[1]):Y[i, j] = (X[i:i + h, j:j + w] * K).sum()return Y

2、经典卷积神经网络

2.1 Lenet

网络构架：

代码实现：

import torch
import torch.nn as nnclass LeNet(nn.Module):def __init__(self, num_classes=10):super(LeNet, self).__init__()self.conv1 = nn.Conv2d(in_channels=1, out_channels=6, kernel_size=5)self.pool1 = nn.MaxPool2d(kernel_size=2)self.conv2 = nn.Conv2d(in_channels=6, out_channels=16, kernel_size=5)self.pool2 = nn.MaxPool2d(kernel_size=2)self.fc1 = nn.Linear(in_features=16*5*5, out_features=120)self.fc2 = nn.Linear(in_features=120, out_features=84)self.fc3 = nn.Linear(in_features=84, out_features=num_classes)def forward(self, x):x = self.pool1(torch.relu(self.conv1(x)))x = self.pool2(torch.relu(self.conv2(x)))x = x.view(-1, 16*5*5)x = torch.relu(self.fc1(x))x = torch.relu(self.fc2(x))x = self.fc3(x)return x# 创建LeNet模型
model = LeNet(num_classes=10)
print(model)

LeNet实现适用于MNIST数据集，其中输入图像大小为28x28，输出类别数为10（0-9的手写数字）。

2.2 Alexnet

网络构架：

代码实现：

import torch
import torch.nn as nnclass AlexNet(nn.Module):def __init__(self, num_classes=1000):super(AlexNet, self).__init__()self.features = nn.Sequential(nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=3, stride=2),nn.Conv2d(64, 192, kernel_size=5, padding=2),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=3, stride=2),nn.Conv2d(192, 384, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(384, 256, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(256, 256, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=3, stride=2),)self.avgpool = nn.AdaptiveAvgPool2d((6, 6))self.classifier = nn.Sequential(nn.Dropout(),nn.Linear(256 * 6 * 6, 4096),nn.ReLU(inplace=True),nn.Dropout(),nn.Linear(4096, 4096),nn.ReLU(inplace=True),nn.Linear(4096, num_classes),)def forward(self, x):x = self.features(x)x = self.avgpool(x)x = torch.flatten(x, 1)x = self.classifier(x)return x# 创建AlexNet模型
model = AlexNet(num_classes=1000)
print(model)

代码中的AlexNet实现适用于ImageNet数据集，其中输入图像大小为224x224，输出类别数为1000。

2.3 VGG

VGG16网络构架：

代码实现：

import torch
import torch.nn as nnclass VGG16(nn.Module):def __init__(self, num_classes=1000):super(VGG16, self).__init__()self.features = nn.Sequential(nn.Conv2d(3, 64, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(64, 64, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=2, stride=2),nn.Conv2d(64, 128, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(128, 128, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=2, stride=2),nn.Conv2d(128, 256, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(256, 256, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(256, 256, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=2, stride=2),nn.Conv2d(256, 512, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(512, 512, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(512, 512, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=2, stride=2),nn.Conv2d(512, 512, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(512, 512, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.Conv2d(512, 512, kernel_size=3, padding=1),nn.ReLU(inplace=True),nn.MaxPool2d(kernel_size=2, stride=2),)self.classifier = nn.Sequential(nn.Linear(512 * 7 * 7, 4096),nn.ReLU(inplace=True),nn.Dropout(),nn.Linear(4096, 4096),nn.ReLU(inplace=True),nn.Dropout(),nn.Linear(4096, num_classes),)def forward(self, x):x = self.features(x)x = x.view(x.size(0), -1)x = self.classifier(x)return x# 创建VGG16模型
model = VGG16(num_classes=1000)
print(model)

代码中的VGG16实现适用于ImageNet数据集，其中输入图像大小为224x224，输出类别数为1000。

2.4 ResNet

ResNet50网络构架：

代码实现：

import torch
import torch.nn as nn# 定义残差块
class ResidualBlock(nn.Module):def __init__(self, in_channels, out_channels, stride=1):super(ResidualBlock, self).__init__()self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=stride, padding=1, bias=False)self.bn1 = nn.BatchNorm2d(out_channels)self.relu = nn.ReLU(inplace=True)self.conv2 = nn.Conv2d(out_channels, out_channels, kernel_size=3, stride=1, padding=1, bias=False)self.bn2 = nn.BatchNorm2d(out_channels)if stride != 1 or in_channels != out_channels:self.downsample = nn.Sequential(nn.Conv2d(in_channels, out_channels, kernel_size=1, stride=stride, bias=False),nn.BatchNorm2d(out_channels))else:self.downsample = Nonedef forward(self, x):identity = xx = self.conv1(x)x = self.bn1(x)x = self.relu(x)x = self.conv2(x)x = self.bn2(x)if self.downsample is not None:identity = self.downsample(identity)x += identityx = self.relu(x)return x# 定义ResNet-50
class ResNet50(nn.Module):def __init__(self, num_classes=1000):super(ResNet50, self).__init__()self.in_channels = 64self.conv1 = nn.Conv2d(3, 64, kernel_size=7, stride=2, padding=3, bias=False)self.bn1 = nn.BatchNorm2d(64)self.relu = nn.ReLU(inplace=True)self.maxpool = nn.MaxPool2d(kernel_size=3, stride=2, padding=1)self.layer1 = self._make_layer(64, 3, stride=1)self.layer2 = self._make_layer(128, 4, stride=2)self.layer3 = self._make_layer(256, 6, stride=2)self.layer4 = self._make_layer(512, 3, stride=2)self.avgpool = nn.AdaptiveAvgPool2d((1, 1))self.fc = nn.Linear(512 * 4, num_classes)def _make_layer(self, out_channels, num_blocks, stride):layers = []layers.append(ResidualBlock(self.in_channels, out_channels, stride))self.in_channels = out_channelsfor _ in range(1, num_blocks):layers.append(ResidualBlock(out_channels, out_channels))return nn.Sequential(*layers)def forward(self, x):x = self.conv1(x)x = self.bn1(x)x = self.relu(x)x = self.maxpool(x)x = self.layer1(x)x = self.layer2(x)x = self.layer3(x)x = self.layer4(x)x = self.avgpool(x)x = x.view(x.size(0), -1)x = self.fc(x)return x# 创建ResNet-50模型
model = ResNet50(num_classes=1000)
print(model)

代码中的ResNet50实现适用于ImageNet数据集，其中输入图像大小为224x224，输出类别数为1000。

【图像分类】理论篇（1）图像分类的测评指标_TechMasterPlus的博客-CSDN博客

【图像分类】理论篇（3）交叉熵损失函数的理解与代码实现_TechMasterPlus的博客-CSDN博客

【图像分类】理论篇（4）图像增强opencv实现_TechMasterPlus的博客-CSDN博客

【图像分类】理论篇（2）经典卷积神经网络 Lenet~Resenet

目录 1、卷积运算 2、经典卷积神经网络 2.1 Lenet 网络构架代码实现 2.2 Alexnet 网络构架代码实现 2.3 VGG VGG16网络构架代码实现 2.4 ResNet ResNet50网络构架代码实现 1、卷积运算在二维卷积运算中，卷积窗口从输入张量的左上角开始&#xff…...

编程日记 2023/8/20 2:39:10

C++系列-内存模型

内存模型内存模型四个区代码区全局区栈区堆区内存开辟和释放在堆区开辟数组内存模型四个区不同区域存放的数据生命周期是不同的，更为灵活。代码区：存放函数体的二进制代码，操作系统管理。全局区：存放全局变量，常…...

编程日记 2023/8/20 2:38:05

[管理与领导-30]：IT基层管理者 - 人的管理 - 向上管理，管理好你的上司，职业发展事半功倍。什么样的上司不值得跟随？

目录前言： 一、什么是向上管理二、为什么要向上管理三、如何进行向上管理四、向上管理的注意事项五、向上管理的忌讳六、向上管理常犯的错七、如何帮助上司解决他关心的问题 7.1 如何帮助上司解决他关心的问题 7.2 如何帮助上司降低压力八、什么…...

编程日记 2023/8/20 2:37:04

Java进阶篇--迭代器模式

目录同步迭代器（Synchronous Iterator）： Iterator 接口常用方法： 注意： 扩展小知识: 异步迭代器（Asynchronous Iterator）： 常用的方法注意： 总结&#xff1a…...

编程日记 2023/8/20 2:36:03

【CAM】CAM(Class Activation Mapping)——可视化CNN的特征定位

文章目录一、CAM(Class Activation Mapping)二、CAM技术实现2.1 网络修改2.2 微调2.2 特征提取三、总结Reference 完整代码见Github ：https://github.com/capsule2077/CAM-Visualization ，如果有用可以点个Star，谢谢！ 一、CAM(C…...

编程日记 2023/8/20 2:35:02

Maven教程_编程入门自学教程_菜鸟教程-免费教程分享

教程简介 Maven 是一款基于 Java 平台的项目管理和整合工具，它将项目的开发和管理过程抽象成一个项目对象模型（POM）。开发人员只需要做一些简单的配置，Maven 就可以自动完成项目的编译、测试、打包、发布以及部署等工作。Maven 是…...

编程日记 2023/8/20 2:33:58

Gof23设计模式之模板方法模式

1.定义定义一个操作中的算法骨架，而将算法的一些步骤延迟到子类中，使得子类可以不改变该算法结构的情况下重定义该算法的某些特定步骤。 2.结构模板方法（Template Method）模式包含以下主要角色： 抽象类&#xff0…...

编程日记 2023/8/20 2:32:56

springBoot 配置文件 spring.resources.add-mappings 参数的作用

在Spring Boot应用中，spring.resources.add-mappings参数用于控制是否将特定路径的资源文件添加到URL路径映射中。默认情况下，该参数的值为true，即会自动将静态资源（例如CSS、JavaScript、图片等）的URL路径添加到Spr…...

编程日记 2023/8/20 2:31:55

《Java极简设计模式》第03章：工厂方法模式(FactoryMethod)

作者：冰河星球：http://m6z.cn/6aeFbs 博客：https://binghe.gitcode.host 文章汇总：https://binghe.gitcode.host/md/all/all.html 源码地址：https://github.com/binghe001/java-simple-design-patterns/tree/master/j…...

编程日记 2023/8/20 2:30:54

C++11并发与多线程笔记（11） std::atomic续谈、std::async深入谈

C11并发与多线程笔记（11） std::atomic续谈、std::async深入谈 1、std::atomic续谈2、std::async深入理解2.1 std::async参数详述2.2 std::async和std::thread()区别：2.3 async不确定性问题的解决 1、std::atomic续谈 #include <iostream&…...

编程日记 2023/8/20 2:29:53

React快速入门

最近需要学到react，这里进行一个快速的入门，参考react官网 1.创建和嵌套组件 react的组件封装是个思想，我这里快速演示代码，自己本身也不太熟悉。代码的路径是src底下的App.js function MyButton() {return (<button>I…...

编程日记 2023/8/20 2:28:51

windows权限维持—SSPHOOKDSRMSIDhistorySkeletonKey

windows权限维持—SSP&HOOK&DSRM&SIDhistory&SkeletonKey 1. 权限维持介绍1.1. 其他 2. 基于验证DLL加载—SPP2.1. 操作演示—临时生效2.1.1. 执行命令2.1.2. 切换用户 2.2. 操作演示—永久生效2.2.1. 上传文件2.2.2. 执行命令2.2.3. 重启生效 2.3. 总结 3. 基…...

编程日记 2023/8/20 2:27:49

CSS 两栏布局和三栏布局的实现

文章目录一、两栏布局的实现1. floatmargin2. flaotBFC3. 定位margin4. flex 布局5. grid布局二、三栏布局的实现1. float margin2. float BFC3. 定位 margin(或者定位BFC)4. flex布局5. 圣杯布局6. 双飞翼布局一、两栏布局的实现两栏布局其实就是左侧定宽，…...

编程日记 2023/8/20 2:26:46

消息中间件相关面试题

👏作者简介：大家好，我是爱发博客的嗯哼，爱好Java的小菜鸟 🔥如果感觉博主的文章还不错的话，请👍三连支持👍一下博主哦 📝社区论坛：希望大家能加入社区共同进步…...

编程日记 2023/8/20 2:25:44

成集云 | 电子签署集成腾讯云企业网盘 | 解决方案

源系统成集云目标系统方案介绍电子签署是通过电子方式完成合同、文件或其他文件的签署过程。相较于传统的纸质签署，电子签署具有更高效、更便捷、更安全的优势。在电子签署过程中，使用电子签名技术来验证签署者的身份并确保签署文件的完整性。电子…...

编程日记 2023/8/20 2:24:42

提升大数据技能，不再颓废！这6家学习网站是你的利器！

随着国家数字化转型，大数据领域对人才的需求越来越多。大数据主要研究计算机科学和大数据处理技术等相关的知识和技能，从大数据应用的三个主要层面（即数据管理、系统开发、海量数据分析与挖掘）出发，对实际问题进行分析…...

编程日记 2023/8/20 2:23:40

uniapp开发小程序-有分类和列表时，进入页面默认选中第一个分类

一、效果： 如下图所示，进入该页面后，默认选中第一个分类，以及第一个分类下的列表数据。二、代码实现： 关键代码： 进入页面时，默认调用分类的接口，在分类接口里做判断&#xff…...

编程日记 2023/8/20 2:22:39

小程序-uni-app：hbuildx uni-app 安装 uni-icons 及使用

一、官方文档找到uni-icons uni-app官网二、下载插件三、点击“打开HBuildX” 四、选择要安装的项目五、勾选要安装的插件六、安装后，项目插件目录根目录uni_modules目录下增加uni-icons、uni-scss 七、引入组件，使用组件 <uni-icons type&qu…...

编程日记 2023/8/20 2:21:36

PHP中in_array()函数用法详解

in_array() 函数是PHP中常用的数组函数之一，用于搜索数组中是否存在指定的值。语法 bool in_array ( mixed $needle , array $haystack [, bool $strict FALSE ] ) 参数描述needle必需。规定要在数组搜索的值。haystack必需。规定要搜索的数组。strict可选。如…...

编程日记 2023/8/20 2:20:34

热电联产在综合能源系统中的选址定容研究（matlab代码）

目录 1 主要内容目标函数程序模型 2 部分代码 3 程序结果 1 主要内容该程序参考《热电联产在区域综合能源系统中的定容选址研究》，主要针对电热综合能源系统进行优化，确定热电联产机组的位置和容量，程序以33节点电网和17节点热网为例…...

编程日记 2023/8/20 2:19:33

D2DX暗黑2宽屏补丁：3分钟让经典游戏焕发新生的终极优化方案

D2DX暗黑2宽屏补丁：3分钟让经典游戏焕发新生的终极优化方案【免费下载链接】d2dx D2DX is a complete solution to make Diablo II run well on modern PCs, with high fps and better resolutions. 项目地址: https://gitcode.com/gh_mirrors/d2/d2dx 还在…...

编程新知 2026/5/16 11:48:02

开源项目如何从“用爱发电”变成可持续收入？

一、为什么测试领域的开源项目更需要可持续收入？在测试领域，开源工具早已成为基础设施。从UI自动化的Selenium、移动端的Appium，到性能压测的JMeter、新一代端到端框架Playwright，几乎每个测试工程师的日常工作都构建在开源软件之…...

编程新知 2026/5/16 10:47:07

自建密码管理器：基于Web Crypto API与Flask的零知识安全架构实践

1. 项目概述：一个基于Web的密码管理器最近在GitHub上看到一个挺有意思的项目，叫clawvault。乍一看名字，可能会联想到“爪子”和“保险库”，其实它就是一个用Python写的、基于Web界面的密码管理器。这类工具大家应该不陌生&#xf…...

编程新知 2026/5/16 9:00:15

Checkmate：代码提交前的自动化质量检查工具实战指南

1. 项目概述：一个为开发者打造的代码质量守护者最近在梳理团队内部的代码审查流程，发现一个挺普遍的问题：很多初级开发者，甚至一些有经验的朋友，在提交代码前，对于“代码是否真的准备好了”这件事&#xff…...

编程新知 2026/5/16 8:49:41

Java后端开发德州扑克小酒馆小程序架构与源码解析

德州扑克小酒馆小程序的核心价值，在于依托休闲娱乐场景实现小酒馆线下引流，其Java后端的架构设计与源码实现，直接决定小程序的稳定性、可扩展性与合规性。一、架构设计核心原则（贴合场景，合规优先） 德州…...

编程新知 2026/5/16 8:36:13

ARM架构ID_ISAR4寄存器详解与应用

1. ARM架构中的ID_ISAR4寄存器概述在ARMv8架构体系中，系统寄存器扮演着处理器功能特性的关键角色。作为指令集属性寄存器家族的重要成员，ID_ISAR4（Instruction Set Attribute Register 4）专门用于描述处理器在AArch32执行状态下支…...

编程新知 2026/5/16 8:34:06

VMware macOS解锁神器：Unlocker 3.0终极完整指南

VMware macOS解锁神器：Unlocker 3.0终极完整指南【免费下载链接】unlocker VMware Workstation macOS 项目地址: https://gitcode.com/gh_mirrors/unloc/unlocker 想要在Windows或Linux电脑上体验macOS系统，却苦于VMware默认不支持苹果系统&…...

编程新知 2026/5/16 7:51:27

ncmdump终极指南：3步快速解锁网易云音乐NCM加密文件的完整免费解决方案

ncmdump终极指南：3步快速解锁网易云音乐NCM加密文件的完整免费解决方案【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump 还在为网易云音乐下载的歌曲只能在特定客户端播放而烦恼吗？ncmdump这款强大的NCM解密工…...

编程新知 2026/5/16 7:44:58

完美解决VS Code/Cursor远程连接报错：远程主机不满足运行 VS Code 服务器的先决条件（附AI编程最佳实践）

完美解决VS Code/Cursor远程连接报错：远程主机不满足运行 VS Code 服务器的先决条件（附AI编程最佳实践） 💡 背景与痛点最近在接手维护一个老项目，服务器是腾讯云的轻量应用服务器，装了宝塔面板。在经历了一…...

编程新知 2026/5/16 7:19:25

四旋翼无人机安全控制：CBF与双相对度系统实践

1. 四旋翼无人机安全控制的核心挑战四旋翼无人机在复杂环境中的自主飞行面临诸多安全挑战。当无人机在充满障碍物的空间执行任务时，传统控制方法往往难以同时满足轨迹跟踪精度和实时避障需求。我曾参与过一个物流仓库巡检项目，无人机在狭窄货架间穿行时&…...

编程新知 2026/5/16 6:33:14

1、卷积运算

2、经典卷积神经网络

2.1 Lenet

网络构架：

代码实现：

2.2 Alexnet

网络构架：

代码实现：

2.3 VGG

VGG16网络构架：

代码实现：

2.4 ResNet

ResNet50网络构架：

代码实现：

相关文章：