当前位置：首页 > news >正文

神经网络分类和回归任务实战

news 2025/12/14 18:21:16

学习方法：torch 边用边学，边查边学真正用查的过程才是学习的过程

直接上案例，先来跑，遇到什么解决什么

数据集Minist 数据集

做简单的任务 Minist 分类任务

总体代码（可以跑通）

from pathlib import Path
import requests
import pickle
import gzip
import torch
import torch.nn as nn
import torch.nn.functional as F
from torch.utils.data import TensorDataset
from torch.utils.data import DataLoader
from torch import optim
import numpy as np
bs=64
DATA_PATH = Path("data")
PATH = DATA_PATH / "mnist"PATH.mkdir(parents=True, exist_ok=True)URL = "http://deeplearning.net/data/mnist/"
FILENAME = "mnist.pkl.gz"
with gzip.open((PATH / FILENAME).as_posix(), "rb") as f:((x_train, y_train), (x_valid, y_valid), _) = pickle.load(f, encoding="latin-1")
from matplotlib import pyplot
import numpy as np
print(x_train.shape)# pyplot.imshow(x_train[0].reshape((28, 28)), cmap="gray")
#获取训练数据和测试数据
x_train, y_train, x_valid, y_valid = map(torch.tensor, (x_train, y_train, x_valid, y_valid)
)
#设置模型结构
class Mnist_NN(nn.Module):def __init__(self):super().__init__()self.hidden1 = nn.Linear(784, 128)self.hidden2 = nn.Linear(128, 256)self.out = nn.Linear(256, 10)def forward(self, x):x = F.relu(self.hidden1(x))x = F.relu(self.hidden2(x))x = self.out(x)return x
net = Mnist_NN()
# print(net)
# for name, parameter in net.named_parameters():
#     print(name, parameter,parameter.size())
#设置数据集和数据集加载器
train_ds = TensorDataset(x_train, y_train)
train_dl = DataLoader(train_ds, batch_size=64, shuffle=True)
valid_ds = TensorDataset(x_valid, y_valid)
valid_dl = DataLoader(valid_ds, batch_size=64 * 2)
def get_data(train_ds, valid_ds, bs):return (DataLoader(train_ds, batch_size=bs, shuffle=True),DataLoader(valid_ds, batch_size=bs * 2),)loss_func = F.cross_entropy
def loss_batch(model, loss_func, xb, yb, opt=None):loss = loss_func(model(xb), yb)if opt is not None:loss.backward()opt.step()opt.zero_grad()return loss.item(), len(xb)
#训练参数
def fit(steps, model, loss_func, opt, train_dl, valid_dl):for step in range(steps):model.train()for xb, yb in train_dl:loss_batch(model, loss_func, xb, yb, opt)model.eval()with torch.no_grad():losses, nums = zip(*[loss_batch(model, loss_func, xb, yb) for xb, yb in valid_dl])val_loss = np.sum(np.multiply(losses, nums)) / np.sum(nums)print('当前step:'+str(step), '验证集损失：'+str(val_loss))
def get_model():model = Mnist_NN()return model, optim.SGD(model.parameters(), lr=0.001)
train_dl, valid_dl = get_data(train_ds, valid_ds, bs)
model, opt = get_model()
fit(20, model, loss_func, opt, train_dl, valid_dl)
corret=0
total=0
for xb,yb in valid_dl:outputs=model(xb)_,predicted=torch.max(outputs.data,1)total+=yb.size(0)corret+=(predicted==yb).sum().item()
print('准确率是：%d %%'%(100*corret/total))

1.首先我们从最终实现的fit 函数开始看，

在fit h函数之前有一个get_model 函数得到model和优化器

model, opt = get_model()

得到模型的优化器以后

需要把训练轮数模型损失函数训练数据测试数据传入fit 训练函数

fit(20, model, loss_func, opt, train_dl, valid_dl)

fit 函数

def fit(steps, model, loss_func, opt, train_dl, valid_dl):for step in range(steps):model.train()for xb, yb in train_dl:loss_batch(model, loss_func, xb, yb, opt)model.eval()with torch.no_grad():losses, nums = zip(*[loss_batch(model, loss_func, xb, yb) for xb, yb in valid_dl])val_loss = np.sum(np.multiply(losses, nums)) / np.sum(nums)print('当前step:'+str(step), '验证集损失：'+str(val_loss))

xb是从dataloader 中取64个训练数据图片也就是64*784维度，784代表28*28的手写数字图片的展平成一维向量

yb是64个图片对应的数字值

loss_batch(model, loss_func, xb, yb, opt)

我们看一下loss_batch 函数

loss 反向传播——更新优化器——优化器梯度归0

loss 是一个带有梯度的tensor .item（）返回的是loss 的值 len（xb ）是为了求精度的时候算

输入是模型损失函数xb ,yb 和优化器

loss_func = F.cross_entropy 损失函数是交叉熵损失函数

将xb 经过model 得到输出后和xb 求损失函数 model 是定义的一个简单的模型有两个隐藏层一个输出层 784——128——256——10

再回到fit 函数的验证部分model.evl()

先来一个

with torch.no_grad()

不去计算梯度

zip(*的意思是解压缩 分别得到losses 和nums)

loss 和num 鲜橙求每64个batch 的总loss 再将datalosder的所有batch 相加除以总数得到训练损失

神经网络分类和回归任务实战

学习方法：torch 边用边学，边查边学真正用查的过程才是学习的过程直接上案例，先来跑，遇到什么解决什么数据集Minist 数据集做简单的任务 Minist 分类任务总体代码（可以跑通） from pathlib import …...

编程日记 2024/4/7 5:33:08

【数据结构】考研真题攻克与重点知识点剖析 - 第 4 篇：串

前言本文基础知识部分来自于b站：分享笔记的好人儿的思维导图与王道考研课程，感谢大佬的开源精神，习题来自老师划的重点以及考研真题。此前我尝试了完全使用Python或是结合大语言模型对考研真题进行数据清洗与可视化分析，本人技术…...

编程日记 2024/4/7 5:32:08

深入浅出 -- 系统架构之分布式多形态的存储型集群

一、多形态的存储型集群在上阶段，我们简单聊了下集群的基本知识，以及快速过了一下逻辑处理型集群的内容，下面重点来看看存储型集群，毕竟这块才是重头戏，集群的形态在其中有着多种多样的变化。逻辑处理型的应用&…...

编程日记 2024/4/7 5:31:07

STL —— list

博主首页： 有趣的中国人专栏首页： C专栏本篇文章主要讲解 list模拟实现的相关内容 １. list简介列表（list）是C标准模板库（STL）中的一个容器，它是一个双向链表数据结构&#xff0c…...

编程日记 2024/4/7 5:28:04

申请SSL证书

有很多方法可以确保您的网站安全。添加SSL证书可针对恶意攻击提供额外且关键的保护层。即使网站不接受交易，您仍然需要保护用户的登录详细信息、地址和其他个人信息。没有SSL证书的网站使用HTTP（一种基于文本的协议），这意味着…...

编程日记 2024/4/7 5:25:01

深入浅出 -- 系统架构之负载均衡Nginx环境搭建

引入负载均衡技术可带来的收益： 系统的高可用：当某个节点宕机后可以迅速将流量转移至其他节点。系统的高性能：多台服务器共同对外提供服务，为整个系统提供了更高规模的吞吐。系统的拓展性：当业务再次出现增长或萎靡时…...

编程日记 2024/4/7 5:24:00

解压路径 D:\Green\notepad_v8.0_x64_绿色版添加右键菜单.reg 新建nodepad添加右键菜单.reg文件 Windows Registry Editor Version 5.00[HKEY_CLASSES_ROOT\*\shell\NotePad] "Edit with &Notepad" "Icon""D:\\Green\\notepad_v8.0_x64_绿色版…...

编程日记 2024/4/7 5:22:59

7 个 iMessage 恢复应用程序/软件可轻松恢复文本

由于误操作、iOS 升级中断、越狱失败、设备损坏等原因，您可能会丢失 iPhone/iPad 上的 iMessages。意外删除很大程度上增加了这种可能性。更糟糕的是，这种情况经常发生在 iDevice 缺乏备份的情况下。 （iPhone消息消失还占用空间？&…...

编程日记 2024/4/7 5:21:58

DockerFile启动jar程序

1.创建Dockerfile 在项目的根目录下创建一个名为Dockerfile的文件，并使用文本编辑器打开它。Dockerfile的内容如下： # 基础镜像 FROM openjdk:8-jre # 创建目录 RUN mkdir -p /usr/app/ # 设置工作目录 WORKDIR /usr/app # 将JAR文件复制到容器中,注:…...

编程日记 2024/4/7 5:19:56

基于R、Python的Copula变量相关性分析及AI大模型应用

在工程、水文和金融等各学科的研究中，总是会遇到很多变量，研究这些相互纠缠的变量间的相关关系是各学科的研究的重点。虽然皮尔逊相关、秩相关等相关系数提供了变量间相关关系的粗略结果，但这些系数都存在着无法克服的困难。例如，…...

编程日记 2024/4/7 5:17:53

鸿蒙组件学习_Tabs组件

说明该组件从API Version 7 开始支持。子组件仅可包含子组件TabContent 参数 barPosition 设置Tabs的页签位置,默认值: BarPosition.StartStart vertical属性方法设置为true时,页签位于容器左侧;vertical属性方法设置为false时,页签位于容器顶部。End vertic…...

编程日记 2024/4/7 5:16:51

【LangChain学习之旅】—（19）BabyAGI：根据气候变化自动制定鲜花存储策略

【LangChain学习之旅】—（19）BabyAGI：根据气候变化自动制定鲜花存储策略 AutoGPTBaby AGIHuggingGPTLangChain 目前是将基于 CAMEL 框架的代理定义为 Simulation Agents（模拟代理）。这种代理在模拟环境中进行角色扮演，试图模拟特定场景或行为，而不是在真实世界中完成具体…...

编程日记 2024/4/7 5:15:50

thinkphp6入门（21）-- 如何删除图片、文件

假设文件的位置在 /*** 删除文件* $file_name avatar/20240208/d71d108bc1086b498df5191f9f925db3.jpg*/ function deleteFile($file_name) {// 要删除的文件路径$file app()->getRootPath() . public/uploads/ . $file_name; $result [];if (is_file($file)) {if (unlin…...

编程日记 2024/4/7 5:14:49

虚拟内存知识详解

虚拟内存单片机的 CPU 是直接操作内存的「物理地址」在这种情况下，要想在内存中同时运行两个程序是不可能的操作系统是如何解决这个问题呢？ 关键的问题是这两个程序都引用了绝对物理地址，而这正是我们最需要避免的。可以把进程所使用的…...

编程日记 2024/4/7 5:11:46

数据结构初阶：顺序表和链表

线性表线性表（ linear list ）是 n 个具有相同特性的数据元素的有限序列。线性表是一种在实际中广泛使用的数据结构，常见的线性表：顺序表、链表、栈、队列、字符串 ... 线性表在逻辑上是线性结构，也就说是连续的一条直线。但是在物理结构上并不一定是连续的，线性…...

编程日记 2024/4/7 5:09:44

在flutter中添加video_player【视频播放插件】

添加插件依赖 dependencies:video_player: ^2.8.3插件的用途在Flutter框架中，video_player 插件是一个专门用于播放视频的插件。它允许开发者在Flutter应用中嵌入视频播放器，并提供了一系列功能来控制和定制视频播放体验。这个插件对于需要在应用中展…...

编程日记 2024/4/7 5:08:43

golang微服务框架特性分析及选型

目录一、微服务框架特性（10个）包括：Istio、go-zero、go-kit、go-kratos、go-micro、rpcx、kitex、goa、jupiter、dubbo-go、tarsgo 1、特性及使用场景2、比较二、web框架特性（7个）包括：gin、fiber、beego…...

编程日记 2024/4/7 5:02:34

苹果cmsV10 MXProV4.5自适应PC手机影视站主题模板苹果cms模板mxone pro

演示站：http://a.88531.cn:8016 MXPro 模板主题(又名：mxonepro)是一款基于苹果 cms程序的一款全新的简洁好看 UI 的影视站模板类似于西瓜视频，不过同对比 MxoneV10 魔改模板来说功能没有那么多,也没有那么大气，但是比较且可视化功…...

编程日记 2024/4/7 5:01:33

GPU的了解

3D动画揭秘显卡的GPU是如何工作的_哔哩哔哩_bilibili 位于显卡中。与CPU区别： 100名小学生和1位数学博士做100道非常简单的算术题，小朋友一个人一道题，比博士快。做1道非常复杂的数学问题，只有博士可以做出来。 CPU主要用于快…...

编程日记 2024/4/7 5:00:32

鸿蒙实战开发-如何使用Stage模型卡片

介绍本示例展示了Stage模型卡片提供方的创建与使用。用到了卡片扩展模块接口，ohos.app.form.FormExtensionAbility 。卡片信息和状态等相关类型和枚举接口，ohos.app.form.formInfo 。卡片提供方相关接口的能力接口，ohos.app.form.for…...

编程日记 2024/4/7 4:59:31

Zustand 状态管理库：极简而强大的解决方案

Zustand 是一个轻量级、快速和可扩展的状态管理库，特别适合 React 应用。它以简洁的 API 和高效的性能解决了 Redux 等状态管理方案中的繁琐问题。核心优势对比基本使用指南 1. 创建 Store // store.js import create from zustandconst useStore create((set)…...

编程新知 2025/12/10 1:18:36

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

下面我将详细介绍如何使用HarmonyOS SDK在HarmonyOS 5中实现类似抖音的点赞功能，包括动画效果、数据同步和交互优化。 1. 基础点赞功能实现 1.1 创建数据模型 // VideoModel.ets export class VideoModel {id: string "";title: string ""…...

编程新知 2025/11/14 9:31:35

CMake基础：构建流程详解

目录 1.CMake构建过程的基本流程 2.CMake构建的具体步骤 2.1.创建构建目录 2.2.使用 CMake 生成构建文件 2.3.编译和构建 2.4.清理构建文件 2.5.重新配置和构建 3.跨平台构建示例 4.工具链与交叉编译 5.CMake构建后的项目结构解析 5.1.CMake构建后的目录结构 5.2.构…...

编程新知 2025/12/8 23:38:10

电脑插入多块移动硬盘后经常出现卡顿和蓝屏

当电脑在插入多块移动硬盘后频繁出现卡顿和蓝屏问题时，可能涉及硬件资源冲突、驱动兼容性、供电不足或系统设置等多方面原因。以下是逐步排查和解决方案： 1. 检查电源供电问题问题原因：多块移动硬盘同时运行可能导致USB接口供电不足&#x…...

编程新知 2025/10/28 15:02:57

成都鼎讯硬核科技！雷达目标与干扰模拟器，以卓越性能制胜电磁频谱战

在现代战争中，电磁频谱已成为继陆、海、空、天之后的 “第五维战场”，雷达作为电磁频谱领域的关键装备，其干扰与抗干扰能力的较量，直接影响着战争的胜负走向。由成都鼎讯科技匠心打造的雷达目标与干扰模拟器，凭借数字射…...

编程新知 2025/12/3 18:37:53

ArcGIS Pro制作水平横向图例+多级标注

今天介绍下载ArcGIS Pro中如何设置水平横向图例。之前我们介绍了ArcGIS的横向图例制作：ArcGIS横向、多列图例、顺序重排、符号居中、批量更改图例符号等等（ArcGIS出图图例8大技巧），那这次我们看看ArcGIS Pro如何更加快捷的操作。…...

编程新知 2025/12/8 16:40:25

Linux --进程控制

本文从以下五个方面来初步认识进程控制： 目录进程创建进程终止进程等待进程替换模拟实现一个微型shell 进程创建在Linux系统中我们可以在一个进程使用系统调用fork()来创建子进程，创建出来的进程就是子进程，原来的进程为父进程。…...

编程新知 2025/12/9 7:15:15

初学 pytest 记录

安装 pip install pytest用例可以是函数也可以是类中的方法 def test_func():print()class TestAdd: # def __init__(self): 在 pytest 中不可以使用__init__方法 # self.cc 12345 pytest.mark.api def test_str(self):res add(1, 2)assert res 12def test_int(self):r…...

编程新知 2025/12/9 21:24:31

IP如何挑？2025年海外专线IP如何购买？

你花了时间和预算买了IP，结果IP质量不佳，项目效率低下不说，还可能带来莫名的网络问题，是不是太闹心了？尤其是在面对海外专线IP时，到底怎么才能买到适合自己的呢？所以，挑IP绝对是个技…...

编程新知 2025/10/19 9:49:56

Go 语言并发编程基础：无缓冲与有缓冲通道

在上一章节中，我们了解了 Channel 的基本用法。本章将重点分析 Go 中通道的两种类型 —— 无缓冲通道与有缓冲通道，它们在并发编程中各具特点和应用场景。一、通道的基本分类类型定义形式特点无缓冲通道make(chan T)发送和接收都必须准备好&#xff0…...

编程新知 2025/9/13 17:45:05

神经网络分类和回归任务实战

相关文章：

神经网络分类和回归任务实战

【数据结构】考研真题攻克与重点知识点剖析 - 第 4 篇：串

深入浅出 -- 系统架构之分布式多形态的存储型集群

STL —— list

申请SSL证书

深入浅出 -- 系统架构之负载均衡Nginx环境搭建

notepad++绿色版添加右键菜单

7 个 iMessage 恢复应用程序/软件可轻松恢复文本

DockerFile启动jar程序

基于R、Python的Copula变量相关性分析及AI大模型应用

鸿蒙组件学习_Tabs组件

【LangChain学习之旅】—（19）BabyAGI：根据气候变化自动制定鲜花存储策略

thinkphp6入门（21）-- 如何删除图片、文件

虚拟内存知识详解

数据结构初阶：顺序表和链表

在flutter中添加video_player【视频播放插件】

golang微服务框架特性分析及选型

苹果cmsV10 MXProV4.5自适应PC手机影视站主题模板苹果cms模板mxone pro

GPU的了解

鸿蒙实战开发-如何使用Stage模型卡片

Zustand 状态管理库：极简而强大的解决方案

在鸿蒙HarmonyOS 5中实现抖音风格的点赞功能

CMake基础：构建流程详解

电脑插入多块移动硬盘后经常出现卡顿和蓝屏

成都鼎讯硬核科技！雷达目标与干扰模拟器，以卓越性能制胜电磁频谱战

ArcGIS Pro制作水平横向图例+多级标注

Linux --进程控制

初学 pytest 记录

IP如何挑？2025年海外专线IP如何购买？

Go 语言并发编程基础：无缓冲与有缓冲通道