当前位置：首页 > article >正文

Python6.1打卡（day33）

article 2026/2/7 22:37:37

DAY 33 MLP神经网络的训练

知识点回顾：

1.PyTorch和cuda的安装
2.查看显卡信息的命令行命令（cmd中使用）
3.cuda的检查
4.简单神经网络的流程
1.数据预处理（归一化、转换成张量）
        2.模型的定义
1.继承nn.Module类
                2.定义每一个层
                3.定义前向传播流程
        3.定义损失函数和优化器
        4.定义训练流程
        5.可视化loss过程

预处理补充：

注意事项：

1. 分类任务中，若标签是整数（如 0/1/2 类别），需转为long类型（对应 PyTorch 的torch.long），否则交叉熵损失函数会报错。

2. 回归任务中，标签需转为float类型（如torch.float32）。

作业：今日的代码，要做到能够手敲。这已经是最简单最基础的版本了。

# 仍然用4特征，3分类的鸢尾花数据集作为我们今天的数据集
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
import numpy as np# 加载鸢尾花数据集
iris = load_iris()
X = iris.data  # 特征数据
y = iris.target  # 标签数据
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 打印下尺寸
print(X_train.shape)
print(y_train.shape)
print(X_test.shape)
print(y_test.shape)# 归一化数据，神经网络对于输入数据的尺寸敏感，归一化是最常见的处理方式
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test) #确保训练集和测试集是相同的缩放# 将数据转换为 PyTorch 张量，因为 PyTorch 使用张量进行训练
# y_train和y_test是整数，所以需要转化为long类型，如果是float32，会输出1.0 0.0
X_train = torch.FloatTensor(X_train)
y_train = torch.LongTensor(y_train)
X_test = torch.FloatTensor(X_test)
y_test = torch.LongTensor(y_test)import torch
import torch.nn as nn
import torch.optim as optimlass MLP(nn.Module): # 定义一个多层感知机（MLP）模型，继承父类nn.Moduledef __init__(self): # 初始化函数super(MLP, self).__init__() # 调用父类的初始化函数# 前三行是八股文，后面的是自定义的self.fc1 = nn.Linear(4, 10)  # 输入层到隐藏层self.relu = nn.ReLU()self.fc2 = nn.Linear(10, 3)  # 隐藏层到输出层
# 输出层不需要激活函数，因为后面会用到交叉熵函数cross_entropy，交叉熵函数内部有softmax函数，会把输出转化为概率def forward(self, x):out = self.fc1(x)out = self.relu(out)out = self.fc2(out)return out# 实例化模型
model = MLP()# 分类问题使用交叉熵损失函数
criterion = nn.CrossEntropyLoss()# 使用随机梯度下降优化器
optimizer = optim.SGD(model.parameters(), lr=0.01)# # 使用自适应学习率的化器
# optimizer = optim.Adam(model.parameters(), lr=0.001)# 训练模型
num_epochs = 20000 # 训练的轮数# 用于存储每个 epoch 的损失值
losses = []for epoch in range(num_epochs): # range是从0开始，所以epoch是从0开始# 前向传播outputs = model.forward(X_train)   # 显式调用forward函数# outputs = model(X_train)  # 常见写法隐式调用forward函数，其实是用了model类的__call__方法loss = criterion(outputs, y_train) # output是模型预测值，y_train是真实标签# 反向传播和优化optimizer.zero_grad() #梯度清零，因为PyTorch会累积梯度，所以每次迭代需要清零，梯度累计是那种小的bitchsize模拟大的bitchsizeloss.backward() # 反向传播计算梯度optimizer.step() # 更新参数# 记录损失值losses.append(loss.item())# 打印训练信息if (epoch + 1) % 100 == 0: # range是从0开始，所以epoch+1是从当前epoch开始，每100个epoch打印一次print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')import matplotlib.pyplot as plt
# 可视化损失曲线
plt.plot(range(num_epochs), losses)
plt.xlabel('Epoch')
plt.ylabel('Loss')
plt.title('Training Loss over Epochs')
plt.show()

@浙大疏锦行

Python6.1打卡（day33）

DAY 33 MLP神经网络的训练知识点回顾： 1.PyTorch和cuda的安装 2.查看显卡信息的命令行命令（cmd中使用） 3.cuda的检查 4.简单神经网络的流程 1.数据预处理（归一化、转换成张量） 2.模型的定义 …...

编程日记 2026/2/7 22:37:37

金融全业务场景的系统分层与微服务域架构切分

构建一个支持金融全业务场景的会员账户体系，是一项复杂但极具战略价值的工程。为了支持跨国收付款、供应链金融、信用账户、票据、银行卡发卡等场景，需要采用清晰的分层架构和服务划分策略，确保系统具备可扩展性、合规性、安全性和高可用性。…...

编程日记 2025/9/3 20:27:09

POJO、DTO和VO：Java应用中的三种关键对象详解

在软件开发特别是Java开发中，常常会遇到POJO、DTO和VO这三类对象。它们在不同场景下扮演着重要角色，有助于优化代码结构、增强系统安全性和提升性能。本文将全面解析这三者的定义、区别及常见使用场景，帮助你更好地理解和应用。 1. POJO&…...

编程日记 2025/12/20 0:48:06

论文阅读笔记——Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset

I3D 论文 UCF-101（13000多个视频）和 HMDB-51（7000多个视频）数据集过小，提出了 Kinetics 数据集，并且在其之上预训练之后能够迁移到其他小的数据集。 2DLSTM：使用2D CNN的好处是可以直接从 Ima…...

编程日记 2026/2/5 5:00:52

IDEA，Spring Boot，类路径

在 IDEA 中开发 Spring Boot 项目时，类路径 (classpath) 的正确配置至关重要，它直接影响项目的编译、运行和依赖管理。以下是关于此问题的关键知识点： IDEA 与 Spring Boot 类路径核心概念类路径定义: 类路径是 JVM 用来搜索类文件 (.class…...

编程日记 2025/7/7 5:58:52

vscode编辑器怎么使用提高开发uVision 项目的效率，如何编译Keil MDK项目？

用vscode编译uVision 项目只需要安装一个Keil Assistant插件，即可用vscode开发“keil 项目”。极大提高开发速度！ 1.安装Keil Assistant插件安装插件成功之后，应该会让安装一个东西，点击安装即可 2.配置安装包路径 3.打开 uVi…...

编程日记 2026/2/5 5:32:02

Beta分布Dirichlet分布

目录 Beta分布Dirichlet分布Beta分布&Dirichlet分布从Dirichlet分布生成Beta样本Beta分布&Dirichlet分布应用 Beta分布 Beta分布是定义在区间 [ 0 , 1 ] [0, 1] [0,1]上的连续概率分布，通常用于模拟概率或比例的随机变量。Beta分布的概率密度函数&#xff…...

编程日记 2025/12/7 20:52:02

AR测量工具：精准测量，多功能集成

在日常生活中，我们常常会遇到需要测量物体长度、距离或角度的情况。无论是装修房屋、制作家具，还是进行户外活动，一个精准的测量工具都能大大提高我们的工作效率。AR测量工具就是这样一款集多种功能于一体的实用测量软件，它利用增…...

编程日记 2026/2/5 3:38:12

【Go-补充】Sync包

并发编程-Sync包 sync.WaitGroup 在代码中生硬的使用time.Sleep肯定是不合适的，Go语言中可以使用sync.WaitGroup来实现并发任务的同步。 sync.WaitGroup有以下几个方法： 方法名功能(wg * WaitGroup) Add(delta int)计数器delta(wg *WaitGroup) Done()…...

编程日记 2026/2/3 16:54:08

云服务器是什么，和服务器有什么区别？

云服务器 vs 传统服务器：通俗对比一句话总结： 云服务器是「租用」的虚拟服务器（像租房），传统服务器是「自购」的物理机器（像买房）。 1. 本质区别对比项云服务器传统服务器物理形态虚拟的&am…...

编程日记 2025/12/19 5:44:29

【HTML-14】HTML 列表：从基础到高级的完整指南

列表是HTML中用于组织和展示信息的重要元素。无论是导航菜单、产品特性还是步骤说明，列表都能帮助我们以结构化的方式呈现内容。本文将全面介绍HTML中的列表类型、语法、最佳实践以及一些高级技巧。 1. HTML列表的三种类型 HTML提供了三种主要的列表类型&#xff…...

编程日记 2025/11/14 3:25:13

设备驱动与文件系统：01 I/O与显示器

操作系统设备驱动学习之旅——以显示器驱动为例从这一节开始，我要学习操作系统的第四个部分，就是i o设备的驱动。今天要讲的是第26讲，内容围绕i o设备中的显示器展开，探究显示器是如何被驱动的，也就是操作系统怎样让…...

编程日记 2026/2/5 6:59:57

.NET 9正式发布，亮点是.NET Aspire和AI

.NET 9 正式发布：.NET Aspire 与 AI 引领新潮流一、.NET 9 发布概览 Microsoft 正式发布了 .NET 9，这一版本堪称迄今为止最高效、最现代、最安全、最智能且性能最高的 .NET 版本。它凝聚了全球数千名开发人员一年的心血，带来了数千项性能、…...

编程日记 2026/2/2 15:44:46

vue+mitt的简便使用

突然注意到 onMounted 在一个组件中可以多次调用，这不得发挥一下: 把绑定/解绑的逻辑封装到同一个模块中不就简化了吗，只需要在组件中注册一下子再传递一个回调就完事了。简单的组件中甚至不用引入onMounted和onUnmounted cnpm i mitt /src/utils/emi…...

编程日记 2026/2/7 0:01:34

Java正则表达式完全指南

Java正则表达式完全指南一、正则表达式基础概念1.1 什么是正则表达式1.2 Java中的正则表达式支持二、正则表达式基本语法2.1 普通字符2.2 元字符2.3 预定义字符类三、Java中正则表达式的基本用法3.1 编译正则表达式3.2 创建Matcher对象并执行匹配3.3 常用的Matcher方法四、…...

编程日记 2025/11/3 7:24:56

Windows搭建Swift语言编译环境?如何构建ObjC语言编译环境?Swift如何引入ObjC框架?Interface Builder的历史?

目录 Windows搭建Swift语言编译环境如何构建ObjC语言编译环境? Swift如何引入ObjC框架? Swift和ObjC中IBOutlet和IBAction代表什么? Interface Builder的历史 Xcode的“Use Storyboards"的作用? Xcode的Playground是什么? Windows搭建Swift语言编译环境 Windo…...

编程日记 2026/2/3 16:13:19

第七部分：第四节 - 在 NestJS 应用中集成 MySQL (使用 TypeORM)：结构化厨房的原材料管理系统

在 NestJS 这样一个结构化的框架中，我们更倾向于使用 ORM (Object-Relational Mapper) 来与关系型数据库交互。ORM 就像中央厨房里一套智能化的原材料管理系统，它将数据库中的表格和行映射到我们熟悉的对象和类的实例。我们可以使用面向对象的方式来操作…...

编程日记 2026/1/7 5:49:18

Bug 背后的隐藏剧情

Bug 背后的隐藏剧情 flyfish 1. 「bug」：70多年前那只被拍进史书的飞蛾故事原型：1947年哈佛实验室的「昆虫命案」 1947年的计算机长啥样？像一间教室那么大，塞满了几万根继电器（类似老式开关）&#xff…...

编程日记 2025/10/24 5:57:57

Golang | 搜索哨兵-对接分布式gRPC服务

哨兵（centennial）负责接待客人，直接与调用方对接。哨兵的核心组件包括service HUB和connection pool。service HUB用于与服务中心通信，获取可提供服务的节点信息。connection pool用于缓存与index worker的连接，避免每…...

编程日记 2025/12/18 10:08:05

智慧充电桩数字化管理平台：环境监测与动态数据可视化技术有哪些作用？

随着新能源汽车的普及，智慧充电桩作为基础设施的重要组成部分，正逐步向数字化、智能化方向发展。环境监测与动态数据可视化技术的应用，为充电桩的高效管理和运维提供了全新解决方案。通过实时采集环境参数与运行数据，并结合可视化…...

编程日记 2026/2/5 0:58:11

debian12.9或ubuntu,vagrant离线安装插件vagrant-libvirt

系统盘: https://mirror.lzu.edu.cn/debian-cd/12.9.0/amd64/iso-dvd/debian-12.9.0-amd64-DVD-1.iso 需要的依赖包,无需安装ruby( sudo apt install -y ruby-full ruby-dev rubygems ) : apt install -y iptables; apt install -y curl;rootdebian129:~# dpkg -l iptables …...

编程日记 2025/10/11 20:57:26

家政小程序开发，开启便捷生活新篇章

在快节奏的现代生活中，家务琐事常常让人分身乏术，如何高效解决家政服务需求成了众多家庭的难题。家政小程序开发，正是为解决这一痛点而生，它将为您带来前所未有的便捷生活体验。想象一下，您只需打开手机上的家政小程…...

编程日记 2026/2/4 16:30:08

C++ 重载(Overload)、重写(Override)、隐藏(Hiding) 的区别

C 重载(Overload)、重写(Override)、隐藏(Hiding) 的区别这三个概念是 C 面向对象的核心知识点，也是面试必问内容。下面我们从定义、发生条件、代码示例、底层原理全方位解析它们的区别。一、核心区别对比表（速记版） 特性重载(Overload)…...

编程日记 2026/1/7 7:29:15

李臻20242817_安全文件传输系统项目报告_第14周

安全文件传输系统项目报告（第 14 周） 1. 代码链接 Gitee 仓库地址：https://gitee.com/li-zhen1215/homework/tree/master/Secure-file 代码结构说明： SecureFileTransfer/ ├── client/ # 客户端主目…...

编程日记 2026/2/4 18:13:52

20250531MATLAB三维绘图

MATLAB三维绘图三维曲线：plot3功能介绍代码实现过程plot3实现效果三维曲面空间曲面作图命令：meshmeshgrid语法示例应用meshgrid实操训练 peakspeaks 的基本用法peaks数学表达式实操训练自定义网格大小使用自定义网格 meshMATLAB代码对齐快捷键Ctrli墨西…...

编程日记 2026/2/4 16:08:14

深入理解C#异步编程：原理、实践与最佳方案

在现代软件开发中，应用程序的性能和响应能力至关重要。特别是在处理I/O密集型操作（如网络请求、文件读写、数据库查询）时，传统的同步编程方式会导致线程阻塞，降低程序的吞吐量。C# 的异步编程模型（async/aw…...

编程日记 2026/2/4 16:04:21

基于千帆大模型的AI体检报告解读系统实战：使用OSS与PDFBox实现PDF内容识别

目录说明前言需求流程说明表结构说明整体流程百度智能云注册和实名认证创建应用费用说明大模型API说明集成大模型设计Prompt 上传体检报告读取PDF内容功能实现智能评测抽取大模型工具功能实现总结说明 AI体检报告解读、病例小结或者…...

编程日记 2026/2/4 17:47:33

Redis缓存落地总结

最近在优化电子签系统，涉及到缓存相关的也一并优化了，写个文档做个总结，防止以后开发时又考虑不全 1、避免大key 避免缓存大PDF文件： 💡 经验值：单个Redis Value不超过10KB，集合元素不超过500…...

编程日记 2025/12/15 2:08:28

Spring,SpringMVC,SpringBoot

1.Spring最核心包括aop和ioc概念 AOP 能够将将哪些于业务无关的，并且大量重复的业务逻辑进行封装起来，便于减少重复代码，降低模块之间的耦合度，给未来的系统更好的可用性和可维护性。 Spring中AOP是采用动态代理，JDK代…...

编程日记 2026/2/4 16:27:27

npm、pnpm、yarn使用以及区别

npm 使用安装包：在项目目录下，npm install <包名> 用于本地安装包到 node_modules 目录，并添加到 package.json 的 dependencies 中；npm install -g <包名> 用于全局安装，适用于命令行工具等。初始化项目…...

编程日记 2025/11/27 11:56:45

DAY 33 MLP神经网络的训练

相关文章：