当前位置：首页 > news >正文

PyTorch官网demo解读——第一个神经网络（1）

news 2026/2/11 3:27:09

神经网络如此神奇，feel the magic

今天分享一下学习PyTorch官网demo的心得，原来实现一个神经网络可以如此简单/简洁/高效，同时也感慨PyTorch如此强大。

这个demo的目的是训练一个识别手写数字的模型！

先上源码：

from pathlib import Path
import requests   # http请求库
import pickle
import gzipfrom matplotlib import pyplot   # 显示图像库import math
import numpy as np
import torch###########下载训练/验证数据######################################################
# 这里加载的是mnist数据集
DATA_PATH = Path("data")
PATH = DATA_PATH / "mnist"
PATH.mkdir(parents=True, exist_ok=True)URL = "https://github.com/pytorch/tutorials/raw/main/_static/"
FILENAME = "mnist.pkl.gz"if not (PATH / FILENAME).exists():content = requests.get(URL + FILENAME).content(PATH / FILENAME).open("wb").write(content)###########解压并加载训练数据######################################################
with gzip.open((PATH / FILENAME).as_posix(), "rb") as f:((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding="latin-1")# 通过pyplot显示数据集中的第一张图片
# 显示过程会中断运行，看到效果之后可以屏蔽掉，让调试更顺畅
#print("x_train[0]: ", x_train[0])
#pyplot.imshow(x_train[0].reshape((28, 28)), cmap="gray")
#pyplot.show()# 将加载的数据转成tensor
x_train, y_train, x_valid, y_valid = map(torch.tensor, (x_train, y_train, x_valid, y_valid)
)
n, c = x_train.shape   # n是函数，c是列数
print("x_train.shape: ", x_train.shape)
print("y_train.min: {0}, y_train.max: {1}".format(y_train.min(), y_train.max()))# 初始化权重和偏差值，权重是随机出来的784*10的矩阵，偏差初始化为0
weights = torch.randn(784, 10) / math.sqrt(784)
weights.requires_grad_()
bias = torch.zeros(10, requires_grad=True)# 激活函数
def log_softmax(x):return x - x.exp().sum(-1).log().unsqueeze(-1)# 定义模型：y = wx + b
# 实际上就是单层的Linear模型
def model(xb):return log_softmax(xb @ weights + bias)# 丢失函数 loss function
def nll(input, target):return -input[range(target.shape[0]), target].mean()
loss_func = nll# 计算精度函数
def accuracy(out, yb):preds = torch.argmax(out, dim=1)return (preds == yb).float().mean()###########开始训练##################################################################
bs = 64  # 每一批数据的大小
lr = 0.5  # 学习率
epochs = 2  # how many epochs to train forfor epoch in range(epochs):for i in range((n - 1) // bs + 1):start_i = i * bsend_i = start_i + bsxb = x_train[start_i:end_i]yb = y_train[start_i:end_i]pred = model(xb) # 通过模型预测loss = loss_func(pred, yb) # 通过与实际结果比对，计算丢失值loss.backward() # 反向传播with torch.no_grad():weights -= weights.grad * lr  # 调整权重值bias -= bias.grad * lr  # 调整偏差值weights.grad.zero_()bias.grad.zero_()##########对比一下预测结果############################################################
xb = x_train[0:bs]  # 加载一批数据，这里用的是训练的数据，在实际应用中最好使用没训练过的数据来验证
yb = y_train[0:bs]  # 训练数据对应的正确结果
preds = model(xb)  # 使用训练之后的模型进行预测
print("################## after training ###################")
print("accuracy: ", accuracy(preds, yb))   # 打印出训练之后的精度
# print(preds[0])
print("pred value: ", torch.argmax(preds, dim=1))   # 打印预测的数字
print("real value: ", yb)   # 实际正确的数据，可以直观地和上一行打印地数据进行对比

运行结果：

可以看到训练后模型地预测精度达到了0.9531，已经不错了，毕竟只使用了一个单层地Linear模型；从输出地对比数据中可以看出有三个地方预测错了（红框标记地数字）

ok，今天先到这里，下一篇再来解读代码中地细节

附：

PyTorch官方源码：https://github.com/pytorch/tutorials/blob/main/beginner_source/nn_tutorial.py

天地一逆旅，同悲万古愁！

PyTorch官网demo解读——第一个神经网络（1）

神经网络如此神奇，feel the magic 今天分享一下学习PyTorch官网demo的心得，原来实现一个神经网络可以如此简单/简洁/高效，同时也感慨PyTorch如此强大。这个demo的目的是训练一个识别手写数字的模型！ 先上源码： fr…...

编程日记 2023/12/17 6:17:01

升华 RabbitMQ：解锁一致性哈希交换机的奥秘【RabbitMQ 十】

欢迎来到我的博客，代码的世界里，每一行都是一个故事升华 RabbitMQ：解锁一致性哈希交换机的奥秘【RabbitMQ 十】前言第一：该插件需求为什么需要一种更智能的消息路由方式？一致性哈希的基本概念： 第二&…...

编程日记 2023/12/17 6:16:00

vue3 element-plus 日期选择器 el-date-picker 汉化

vue3 项目中，element-plus 的日期选择器 el-date-picker 默认是英文版的，如下： 页面引入： //引入汉化语言包 import locale from "element-plus/lib/locale/lang/zh-cn" import { ElDatePicker, ElButton, ElConfigP…...

编程日记 2023/12/17 6:14:59

剑指 Offer（第2版）面试题 35：复杂链表的复制

剑指 Offer（第2版）面试题 35：复杂链表的复制剑指 Offer（第2版）面试题 35：复杂链表的复制解法1：模拟剑指 Offer（第2版）面试题 35：复杂链表的复制题目来源&…...

编程日记 2023/12/17 6:11:57

编程日记 2023/12/17 6:10:55

预测性维护对制造企业设备管理的作用

制造企业设备管理和维护对于生产效率和成本控制至关重要。然而，传统的维护方法往往无法准确预测设备故障，导致生产中断和高额维修费用。为了应对这一挑战，越来越多的制造企业开始采用预测性维护技术。预测性维护是通过传感器数据、机器学习和…...

编程日记 2023/12/17 6:06:53

华为、新华三、锐捷常用命令总结

华为、新华三、锐捷常用命令总结一、华为交换机基础配置命令二、H3C交换机的基本配置三、锐捷交换机基础命令配置一、华为交换机基础配置命令 1、创建vlan： <Quidway> //用户视图，也就是在Quidway模式下运行命令。 <Quidway>system-view…...

编程日记 2023/12/17 6:04:51

链路追踪详解（四）：分布式链路追踪的事实标准 OpenTelemetry 概述

目录 OpenTelemetry 是什么？ OpenTelemetry 的起源和目标 OpenTelemetry 主要特点和功能 OpenTelemetry 的核心组件 OpenTelemetry 的工作原理 OpenTelemetry 的特点 OpenTelemetry 的应用场景小结 OpenTelemetry 是什么？ OpenTelemetry 是一个…...

编程日记 2023/12/17 6:03:50

Node.js 工作线程与子进程：应该使用哪一个

Node.js 工作线程与子进程：应该使用哪一个并行处理在计算密集型应用程序中起着至关重要的作用。例如，考虑一个确定给定数字是否为素数的应用程序。如果我们熟悉素数，我们就会知道必须从 1 遍历到该数的平方根才能确定它是否是素数&#xff…...

编程日记 2023/12/17 6:01:48

python matplotlib 三维图形添加文字且不随图形变动而变动

要在三维图形中添加文字并使其不随图形变动而变动，可以使用 annotate() 方法。这个方法可以在三维图形中添加文字，并且可以指定文字的位置、对齐方式和字体大小等属性。下面是一个示例代码，演示如何在三维图形中添加文字： impo…...

编程日记 2023/12/17 6:00:48

Ubuntu设置kubelet启动脚本关闭swap分区

查看swap分区 swapon -s打开swap分区 swapon -a查看/etc/fstab下所有固化的swap分区，注释 vi /etc/fstab修改kubelet.conf文件 vi /etc/systemd/system/kubelet.service.d/10-kubeadm.conf添加 ExecStartPre/sbin/swapoff -a生效 systemctl daemon-reload sys…...

编程日记 2023/12/17 5:59:46

MySQL数据库存储

MySQL数据库存储 MySQL数据库简介MySQL开发环境MySQL安装图形化界面工具Navicat使用表的操作表的概念3.2 创建表3.3 修改表数据的操作-增删改查4.1 增加数据4.2 删除数据4.3 修改数据4.4 查询数据4.4.1 基础查询4.4.2 分组查询和聚合函数4.4.4 having语句4.4.5 排序4.5 多表联…...

编程日记 2023/12/17 5:57:45

verilog语法进阶，时钟原语

概述： 内容 1. 时钟缓冲 2. 输入时钟缓冲 3. ODDR2作为输出时钟缓冲 1. 输入时钟缓冲 BUFGP verilog c代码，clk作为触发器的边沿触发，会自动将clk综合成时钟信号。 module primitive1(input clk,input a,output reg y); always (posed…...

编程日记 2023/12/17 5:56:44

案例069:基于微信小程序的计算机实验室排课与查询系统

文末获取源码开发语言：Java 框架：SSM JDK版本：JDK1.8 数据库：mysql 5.7 开发软件：eclipse/myeclipse/idea Maven包：Maven3.5.4 小程序框架：uniapp 小程序开发软件：HBuilder X 小程序…...

编程日记 2023/12/17 5:55:43

C语言：将三个数从大到小输出

#include<stdio.h> int main() {int a 0;int b 0;int c 0;printf("请输入abc的值：");scanf_s("%d%d%d", &a, &b, &c);if (b > a){int tmp a;a b;b tmp;}if (c > a){int tmp a;a c;c tmp;}if (b < c){int t…...

编程日记 2023/12/17 5:54:42

基于Hadoop的铁路货运大数据平台设计与应用

完整下载：基于Hadoop的铁路货运大数据平台设计与应用基于Hadoop的铁路货运大数据平台设计与应用 Design and Application of Railway Freight Big Data Platform based on Hadoop 目录目录 2 摘要 3 关键词 4 第一章绪论 4 1.1 研究背景 4 1.2 研究目的与意义 5 …...

编程日记 2023/12/17 5:52:41

Java基础题2：类和对象

1.下面代码的运行结果是（） public static void main(String[] args){String s;System.out.println("s"s);}A.代码编程成功，并输出”s” B.代码编译成功，并输出”snull” C.由于String s没有初始化，代码不能…...

编程日记 2023/12/17 5:51:40

冒泡排序学习

冒泡排序（Bubble Sort）是一种简单的排序算法，它通过重复地交换相邻的元素来排序。具体实现如下： 1. 从待排序的数组中的第一个元素开始，依次比较相邻的两个元素。 2. 如果前一个元素大于后一个元素，则交换…...

编程日记 2023/12/17 5:49:39

LeetCode（65）LRU 缓存【链表】【中等】

目录 1.题目2.答案3.提交结果截图链接： LRU 缓存 1.题目请你设计并实现一个满足 LRU (最近最少使用) 缓存约束的数据结构。实现 LRUCache 类： LRUCache(int capacity) 以正整数作为容量 capacity 初始化 LRU 缓存int get(int key) 如果关键字 k…...

编程日记 2023/12/17 5:48:38

网站提示“不安全”

当你在浏览网站时，有时可能会遇到浏览器提示网站不安全的情况。这通常是由于网站缺乏SSL证书所致。那么，从SSL证书的角度出发，我们应该如何解决这个问题呢？ 首先，让我们简单了解一下SSL证书。SSL证书是一种用于保护网站…...

编程日记 2023/12/17 5:47:37

linux之kylin系统nginx的安装

一、nginx的作用 1.可做高性能的web服务器直接处理静态资源（HTML/CSS/图片等），响应速度远超传统服务器类似apache支持高并发连接 2.反向代理服务器隐藏后端服务器IP地址，提高安全性 3.负载均衡服务器支持多种策略分发流量…...

编程新知 2026/2/8 20:42:56

css实现圆环展示百分比，根据值动态展示所占比例

代码如下 <view class""><view class"circle-chart"><view v-if"!!num" class"pie-item" :style"{background: conic-gradient(var(--one-color) 0%,#E9E6F1 ${num}%),}"></view><view v-else …...

编程新知 2026/2/5 4:28:28

K8S认证|CKS题库+答案| 11. AppArmor

目录 11. AppArmor 免费获取并激活 CKA_v1.31_模拟系统题目开始操作： 1）、切换集群 2）、切换节点 3）、切换到 apparmor 的目录 4）、执行 apparmor 策略模块 5）、修改 pod 文件 6）、…...

编程新知 2026/1/29 2:11:35

Qt Widget类解析与代码注释

#include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this); }Widget::~Widget() {delete ui; }//解释这串代码，写上注释当然可以！这段代码是 Qt …...

编程新知 2025/11/29 21:00:30

镜像里切换为普通用户

如果你登录远程虚拟机默认就是 root 用户，但你不希望用 root 权限运行 ns-3（这是对的，ns3 工具会拒绝 root），你可以按以下方法创建一个非 root 用户账号并切换到它运行 ns-3。一次性解决方案：创建非 roo…...

编程新知 2025/9/11 11:00:29

用docker来安装部署freeswitch记录

今天刚才测试一个callcenter的项目，所以尝试安装freeswitch 1、使用轩辕镜像 - 中国开发者首选的专业 Docker 镜像加速服务平台编辑下面/etc/docker/daemon.json文件为 {"registry-mirrors": ["https://docker.xuanyuan.me"] }同时可以进入轩…...

编程新知 2026/2/1 3:20:44

基于Java+MySQL实现（GUI）客户管理系统

客户资料管理系统的设计与实现第一章需求分析 1.1 需求总体介绍本项目为了方便维护客户信息为了方便维护客户信息，对客户进行统一管理，可以把所有客户信息录入系统，进行维护和统计功能。可通过文件的方式保存相关录入数据，对…...

编程新知 2026/2/11 2:57:31

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join 1、依赖1.1、依赖版本1.2、pom.xml 2、代码2.1、SqlSession 构造器2.2、MybatisPlus代码生成器2.3、获取 config.yml 配置2.3.1、config.yml2.3.2、项目配置类 2.4、ftl 模板2.4.1、…...

编程新知 2025/9/26 12:26:35

tomcat入门

1 tomcat 是什么 apache开发的web服务器可以为java web程序提供运行环境tomcat是一款高效，稳定，易于使用的web服务器tomcathttp服务器Servlet服务器 2 tomcat 目录介绍 -bin #存放tomcat的脚本 -conf #存放tomcat的配置文件 ---catalina.policy #to…...

编程新知 2025/7/7 19:44:31

深度剖析 DeepSeek 开源模型部署与应用：策略、权衡与未来走向

在人工智能技术呈指数级发展的当下，大模型已然成为推动各行业变革的核心驱动力。DeepSeek 开源模型以其卓越的性能和灵活的开源特性，吸引了众多企业与开发者的目光。如何高效且合理地部署与运用 DeepSeek 模型，成为释放其巨大潜力的关键所在&…...

编程新知 2025/12/27 19:12:07

PyTorch官网demo解读——第一个神经网络（1）

先上源码：

运行结果：

附：

相关文章：

PyTorch官网demo解读——第一个神经网络（1）

升华 RabbitMQ：解锁一致性哈希交换机的奥秘【RabbitMQ 十】

vue3 element-plus 日期选择器 el-date-picker 汉化

剑指 Offer（第2版）面试题 35：复杂链表的复制

自定义指令Custom Directives

预测性维护对制造企业设备管理的作用

华为、新华三、锐捷常用命令总结

链路追踪详解（四）：分布式链路追踪的事实标准 OpenTelemetry 概述

Node.js 工作线程与子进程：应该使用哪一个

python matplotlib 三维图形添加文字且不随图形变动而变动

Ubuntu设置kubelet启动脚本关闭swap分区

MySQL数据库存储

verilog语法进阶，时钟原语

案例069:基于微信小程序的计算机实验室排课与查询系统

C语言：将三个数从大到小输出

基于Hadoop的铁路货运大数据平台设计与应用

Java基础题2：类和对象

冒泡排序学习

LeetCode（65）LRU 缓存【链表】【中等】

网站提示“不安全”

linux之kylin系统nginx的安装

css实现圆环展示百分比，根据值动态展示所占比例

K8S认证|CKS题库+答案| 11. AppArmor

Qt Widget类解析与代码注释

镜像里切换为普通用户

用docker来安装部署freeswitch记录

基于Java+MySQL实现（GUI）客户管理系统

纯 Java 项目（非 SpringBoot）集成 Mybatis-Plus 和 Mybatis-Plus-Join

tomcat入门

深度剖析 DeepSeek 开源模型部署与应用：策略、权衡与未来走向