当前位置：首页 > news >正文

PyTorch入门之【AlexNet】

news 2026/2/10 7:56:41

参考文献：https://www.bilibili.com/video/BV1DP411C7Bw/?spm_id_from=333.999.0.0&vd_source=98d31d5c9db8c0021988f2c2c25a9620
AlexNet 是一个经典的卷积神经网络模型，用于图像分类任务。

大纲

在这里插入图片描述
各个文件的作用：

data就是数据集
dataloader.py就是数据集的加载以及实例初始化
model.py就是AlexNet模块的定义
train.py就是模型的训练
test.py就是模型的测试

dataloader

import torch
import torchvision
import torchvision.transforms as transformsimport matplotlib.pyplot as plt
import numpy as np# define the dataloader
transform = transforms.Compose([transforms.Resize(224),transforms.ToTensor(),transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])batch_size = 16trainset = torchvision.datasets.CIFAR10(root='./data', train=True,download=True, transform=transform)
train_loader = torch.utils.data.DataLoader(trainset, batch_size=batch_size,shuffle=True)testset = torchvision.datasets.CIFAR10(root='./data', train=False,download=True, transform=transform)
test_loader = torch.utils.data.DataLoader(testset, batch_size=batch_size,shuffle=False)classes = ('plane', 'car', 'bird', 'cat','deer', 'dog', 'frog', 'horse', 'ship', 'truck')if __name__ == '__main__':# get some random training imagesdataiter = iter(train_loader)images, labels = next(dataiter)# print labelsprint(' '.join('%5s' % classes[labels[j]] for j in range(batch_size)))# show imagesimg_grid = torchvision.utils.make_grid(images)img_grid = img_grid / 2 + 0.5npimg = img_grid.numpy()plt.imshow(np.transpose(npimg, (1, 2, 0)))plt.show()

model

import torch.nn as nn
import torchclass AlexNet(nn.Module):def __init__(self, num_classes=10):super(AlexNet, self).__init__()self.conv_1 = nn.Sequential(nn.Conv2d(3, 96, kernel_size=11, stride=4, padding=2),nn.BatchNorm2d(96),nn.ReLU(),nn.MaxPool2d(kernel_size = 3, stride = 2))self.conv_2 = nn.Sequential(nn.Conv2d(96, 256, kernel_size=5, stride=1, padding=2),nn.BatchNorm2d(256),nn.ReLU(),nn.MaxPool2d(kernel_size = 3, stride = 2))self.conv_3 = nn.Sequential(nn.Conv2d(256, 384, kernel_size=3, stride=1, padding=1),nn.BatchNorm2d(384),nn.ReLU())self.conv_4 = nn.Sequential(nn.Conv2d(384, 384, kernel_size=3, stride=1, padding=1),nn.BatchNorm2d(384),nn.ReLU())self.conv_5 = nn.Sequential(nn.Conv2d(384, 256, kernel_size=3, stride=1, padding=1),nn.BatchNorm2d(256),nn.ReLU(),nn.MaxPool2d(kernel_size = 3, stride = 2))self.fc_1 = nn.Sequential(nn.Dropout(0.5),nn.Linear(9216, 4096),nn.ReLU())self.fc_2 = nn.Sequential(nn.Dropout(0.5),nn.Linear(4096, 4096),nn.ReLU())self.fc_3= nn.Sequential(nn.Linear(4096, num_classes))def forward(self, x):out = self.conv_1(x)out = self.conv_2(out)out = self.conv_3(out)out = self.conv_4(out)out = self.conv_5(out)out = out.reshape(out.size(0), -1)out = self.fc_1(out)out = self.fc_2(out)out = self.fc_3(out)return outif __name__ == '__main__':model = AlexNet()print(model)x = torch.randn(1, 3, 224, 224)y = model(x)print(y.size())

train

import torch
import torch.nn as nnfrom dataloader import train_loader, test_loader
from model import AlexNet# define the hyperparameters
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
num_classes = 10
num_epochs = 20
learning_rate = 1e-3# load the model
model = AlexNet(num_classes).to(device)# loss and optimizer
criterion = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)  # train the model
total_len = len(train_loader)for epoch in range(num_epochs):for i, (images, labels) in enumerate(train_loader):# move tensors to the configured deviceimages = images.to(device)labels = labels.to(device)# forward passoutputs = model(images)loss = criterion(outputs, labels)# backward and optimizeoptimizer.zero_grad()loss.backward()optimizer.step()if (i+1) % 100 == 0:print('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'.format(epoch+1, num_epochs, i+1, total_len, loss.item()))# Validationwith torch.no_grad():model.eval()correct = 0total = 0for images, labels in test_loader:images = images.to(device)labels = labels.to(device)outputs = model(images)_, predicted = torch.max(outputs.data, 1)total += labels.size(0)correct += (predicted == labels).sum().item()model.train()print('Accuracy of the network on the {} validation images: {} %'.format(10000, 100 * correct / total))# save the model checkpoint
torch.save(model.state_dict(), 'alexnet.pth')

test

import torchfrom dataloader import test_loader, classes
from model import AlexNet# load the pretrained model
device = 'cuda' if torch.cuda.is_available() else 'cpu'
model = AlexNet().to(device)
model.load_state_dict(torch.load('alexnet.pth', map_location=device))# test the pretrained model on CIFAR-10 test data
with torch.no_grad():model.eval()correct = 0total = 0for images, labels in test_loader:images = images.to(device)labels = labels.to(device)outputs = model(images)_, predicted = torch.max(outputs.data, 1)total += labels.size(0)correct += (predicted == labels).sum().item()print('Accuracy of the network on the {} validation images: {} %'.format(10000, 100 * correct / total))

PyTorch入门之【AlexNet】

参考文献：https://www.bilibili.com/video/BV1DP411C7Bw/?spm_id_from333.999.0.0&vd_source98d31d5c9db8c0021988f2c2c25a9620 AlexNet 是一个经典的卷积神经网络模型，用于图像分类任务。目录大纲dataloadermodeltraintest 大纲各个文件的作用&…...

编程日记 2023/10/7 3:02:12

（六）正点原子STM32MP135移植——内核移植

目录一、概述二、编译官方代码三、移植四、编译一、概述前面已经移植好了TF-A、optee、u-boot，在u-boot能正常跑起来的情况下，现在来移植内核。二、编译官方代码进入kernel目录 2.1 解压源码、打补丁 /* 解压源码 */ tar xf linux-6.1.28.…...

编程日记 2023/10/7 3:01:12

自媒体工作内容管理助手

内容助手访问地址：editor.yunwow.cn 背景介绍最近在学习流量运营， 流量运营的第一站是内容创作， 我试过不少原创内容，都是跟生活相关的例如：录一段联琴的视频、录一段秋天的风景、写一段生活感悟、发一段小宠物的生…...

编程日记 2023/10/7 2:59:10

Echarts 教程一

Echarts 教程一可视化大屏幕适配方案可视化大屏幕布局方案Echart 图表通用配置部分解决方案1. titile2. tooltip3. xAxis / yAxis 常用配置4. legend5. grid6. series7.color Echarts API 使用全局echarts对象echarts实例对象可视化大屏幕适配方案 rem flexible.js 关于flex…...

编程日记 2023/10/7 2:57:05

【Kubernetes】Kubernetes 对象是什么？

什么是 Kubernetes 对象？常见的 Kubernetes 对象参考🔎感谢 💖 什么是 Kubernetes 对象？ Kubernetes 对象是持久化的实体，用于描述整个集群的状态和配置。它们是在 etcd 等持久化存储中存储的，因此它们的状…...

编程日记 2023/10/7 2:56:04

【C++设计模式之模板模式】分析及示例

C之模板模式描述实现原理示例步骤1步骤1 分析步骤2步骤2 分析调用输出结果结论描述模板模式（Template Pattern）是设计模式中的一种行为型模式。该模式定义一个操作中的算法骨架，而将具体的算法实现延迟到子类中。模板模式使得子类可以…...

编程日记 2023/10/7 2:54:03

1.运行图片 2.源码 using System; using System.Collections.Generic; using System.Linq; using System.Threading.Tasks; using System.Windows.Forms;namespace 捕捉全局异常 {internal static class Program{/// <summary>/// 应用程序的主入口点。/// </summary…...

编程日记 2023/10/7 2:52:01

java.text.ParseException: Unparseable date: “2023-09-06T09:08:18“

问题描述： java.text.ParseException: Unparseable date: “2023-09-06T09:08:18” 这是在String类型转Date类型出现的错误,主要是String类型时间中间有一个T在转换的过程出现问题. 解决方法： SimpleDateFormat simpleDateFormat new SimpleDateFormat…...

编程日记 2023/10/7 2:49:59

macOS 下如何优雅的使用 Burp Suite 汉化

转载 https://www.sqlsec.com/2019/11/macbp.html 主要内容是根据上面的来的下面总结个人出现错误的地方主要是优雅配置方面不要直接复制粘贴看清楚人家的内容下面的可以直接复制粘贴 --add-opensjava.desktop/javax.swingALL-UNNAMED --add-opensjava.base/java.lang…...

编程日记 2023/10/7 2:48:58

进程同步与进程互斥

1.进程同步知识点回顾: 进程具有异步性的特征。异步性是指，各并发执行的进程以各自独立的、不可预知的速度向前推进。如何解决这种异步问题，就是“进程同步”所讨论的内容。同步亦称直接制约关系，它是指为完成某种任务而建立的两个或多…...

编程日记 2023/10/7 2:46:56

公司安防工程简要介绍及系统需求分析

多年来从事安保监控领域的经验，在系统的功能要求、设备选型、施工控制、后期维护、人员配备等各方面反复论证，最终形成了本方案。在系统的硬件选择上，把系统的稳定性、安全性、可靠性放在第一位。根据招标文件的要求选用当今安防行业具…...

编程日记 2023/10/7 2:45:53

JMETER自适应高分辨率的显示器

系列文章目录历史文章每天15分钟JMeter入门篇（一）：Hello JMeter 每天15分钟JMeter入门篇（二）：使用JMeter实现并发测试每天15分钟JMeter入门篇（三）：认识JMeter的逻辑控…...

编程日记 2023/10/7 2:43:52

Linux工具（三）

继Linux工具（一）和Linux工具（二），下面我们就来讲解Linux最后的两个工具，分别是代码托管的版本控制器git和代码调试器gdb。目录 1.git-版本控制器从0到1的实现git代码托管检测并安装git 新建git仓库…...

编程日记 2023/10/7 2:40:49

基于SSM+Vue的鲜花销售系统设计与实现

末尾获取源码开发语言：Java Java开发工具：JDK1.8 后端框架：SSM 前端：采用Vue技术开发数据库：MySQL5.7和Navicat管理工具结合服务器：Tomcat8.5 开发软件：IDEA / Eclipse 是否Maven项目&#x…...

编程日记 2023/10/7 2:39:47

矢量图形编辑软件illustrator 2023 mac特点介绍

illustrator 2023 mac是一款矢量图形编辑软件，用于创建和编辑排版、图标、标志、插图和其他类型的矢量图形。 illustrator mac软件特点矢量图形：illustrator创建的图形是矢量图形，可以无限放大而不失真，这与像素图形编辑软件&am…...

编程日记 2023/10/7 2:38:45

【计算机网络面试题（62道）】

文章目录计算机网络面试题（62道）基础1.**说下计算机网络体系结构2.说一下每一层对应的网络协议有哪些？3.那么数据在各层之间是怎么传输的呢？ 网络综合4.**从浏览器地址栏输入 url 到显示主页的过程？5.说说 DNS 的解析…...

编程日记 2023/10/7 2:37:45

JVM-满老师

JVM 前言程序计数器，栈，虚拟机栈：本地方法栈：堆，方法区：堆内存溢出方法区运行时常量池垃圾回收垃圾回收算法分代回收前言 JVM 可以理解的代码就叫做字节码（即扩展名为 .class 的文件&#xff…...

编程日记 2023/10/7 2:36:43

加锁常见的问题

锁其是用来控制在某些场景下让代码串行的工具。我们为了充分利用计算机的硬件性能，发明了多线程，多线程有好处，但同时也有它复杂的一面，必须控制好多个线程的执行，才能驯服这个有能力也有脾气的烈马。一、加锁范围误区…...

编程日记 2023/10/7 2:35:43

【LeetCode力扣】LCR170 使用归并排序的思想解决逆序对问题（详细图解）

目录 1、题目介绍 2、解题思路 2.1、暴力破解法 2.2、归并排序思想 2.2.1、画图详细讲解 2.2.2、归并排序解决逆序对的代码实现 1、题目介绍首先阅读题目可以得出要点，即当前数大于后数时则当作一个【逆序对】，而题目是要求在一个数组中计算一共存…...

编程日记 2023/10/7 2:34:41

python经典百题之一个素数能被几个9整除

题目:判断一个素数能被几个9整除。首先，我们需要明确素数的定义：素数是大于1，且只能被1和自身整除的整数。下面将分别介绍三种实现方法，每种方法附上解题思路、实现代码、以及优缺点。最后，将对这三种方法进行总结…...

编程日记 2023/10/7 2:33:40

React Native 开发环境搭建（全平台详解）

React Native 开发环境搭建（全平台详解） 在开始使用 React Native 开发移动应用之前，正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南，涵盖 macOS 和 Windows 平台的配置步骤，如何在 Android 和 iOS…...

编程新知 2025/10/7 2:47:54

ESP32读取DHT11温湿度数据

芯片：ESP32 环境：Arduino 一、安装DHT11传感器库红框的库，别安装错了二、代码注意，DATA口要连接在D15上 #include "DHT.h" // 包含DHT库#define DHTPIN 15 // 定义DHT11数据引脚连接到ESP32的GPIO15 #define D…...

编程新知 2026/1/30 8:46:45

Pinocchio 库详解及其在足式机器人上的应用

Pinocchio 库详解及其在足式机器人上的应用 Pinocchio (Pinocchio is not only a nose) 是一个开源的 C 库，专门用于快速计算机器人模型的正向运动学、逆向运动学、雅可比矩阵、动力学和动力学导数。它主要关注效率和准确性，并提供了一个通用的框架&…...

编程新知 2025/11/28 5:32:31

打手机检测算法AI智能分析网关V4守护公共/工业/医疗等多场景安全应用

一、方案背景在现代生产与生活场景中，如工厂高危作业区、医院手术室、公共场景等，人员违规打手机的行为潜藏着巨大风险。传统依靠人工巡查的监管方式，存在效率低、覆盖面不足、判断主观性强等问题，难以满足对人员打手机行为精…...

编程新知 2026/2/7 21:37:35

永磁同步电机无速度算法--基于卡尔曼滤波器的滑模观测器

一、原理介绍传统滑模观测器采用如下结构： 传统SMO中LPF会带来相位延迟和幅值衰减，并且需要额外的相位补偿。采用扩展卡尔曼滤波器代替常用低通滤波器(LPF)，可以去除高次谐波，并且不用相位补偿就可以获得一个误差较小的转子位…...

编程新知 2026/2/10 6:48:11

【WebSocket】SpringBoot项目中使用WebSocket

1. 导入坐标如果springboot父工程没有加入websocket的起步依赖，添加它的坐标的时候需要带上版本号。 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-websocket</artifactId> </dep…...

编程新知 2025/9/20 3:28:39

CppCon 2015 学习:REFLECTION TECHNIQUES IN C++

关于 Reflection（反射） 这个概念，总结一下： Reflection（反射）是什么？ 反射是对类型的自我检查能力（Introspection） 可以查看类的成员变量、成员函数等信息。反射允许枚…...

编程新知 2025/12/1 1:27:24

Yii2项目自动向GitLab上报Bug

Yii2 项目自动上报Bug 原理 yii2在程序报错时, 会执行指定action, 通过重写ErrorAction, 实现Bug自动提交至GitLab的issue 步骤配置SiteController中的actions方法 public function actions(){return [error > [class > app\helpers\web\ErrorAction,],];}重写Error…...

编程新知 2025/12/17 3:27:17

Qt Quick Controls模块功能及架构

Qt Quick Controls是Qt Quick的一个附加模块，提供了一套用于构建完整用户界面的UI控件。在Qt 6.0中，这个模块经历了重大重构和改进。一、主要功能和特点 1. 架构重构完全重写了底层架构，与Qt Quick更紧密集成移除了对Qt Widgets的依赖&…...

编程新知 2026/1/9 11:24:56

【QT控件】显示类控件

目录一、Label 二、LCD Number 三、ProgressBar 四、Calendar Widget QT专栏：QT_uyeonashi的博客-CSDN博客一、Label QLabel 可以用来显示文本和图片. 核心属性如下代码示例: 显示不同格式的文本 1) 在界面上创建三个 QLabel 尺寸放大一些. objectName 分别…...

编程新知 2026/2/4 18:27:37

PyTorch入门之【AlexNet】

目录

大纲

dataloader

model

train

test

相关文章：

PyTorch入门之【AlexNet】

（六）正点原子STM32MP135移植——内核移植

自媒体工作内容管理助手

Echarts 教程一

【Kubernetes】Kubernetes 对象是什么？

【C++设计模式之模板模式】分析及示例

C#捕捉全局异常

java.text.ParseException: Unparseable date: “2023-09-06T09:08:18“

macOS 下如何优雅的使用 Burp Suite 汉化

进程同步与进程互斥

公司安防工程简要介绍及系统需求分析

JMETER自适应高分辨率的显示器

Linux工具（三）

基于SSM+Vue的鲜花销售系统设计与实现

矢量图形编辑软件illustrator 2023 mac特点介绍

【计算机网络面试题（62道）】

JVM-满老师

加锁常见的问题

【LeetCode力扣】LCR170 使用归并排序的思想解决逆序对问题（详细图解）

python经典百题之一个素数能被几个9整除

React Native 开发环境搭建（全平台详解）

ESP32读取DHT11温湿度数据

Pinocchio 库详解及其在足式机器人上的应用

打手机检测算法AI智能分析网关V4守护公共/工业/医疗等多场景安全应用

永磁同步电机无速度算法--基于卡尔曼滤波器的滑模观测器

【WebSocket】SpringBoot项目中使用WebSocket

CppCon 2015 学习:REFLECTION TECHNIQUES IN C++

Yii2项目自动向GitLab上报Bug

Qt Quick Controls模块功能及架构

【QT控件】显示类控件