当前位置：首页 > news >正文

Pytorch神经网络模型nn.Sequential与nn.Linear

news 2026/2/9 11:36:30

1、定义模型

对于标准深度学习模型，我们可以使用框架的预定义好的层。这使我们只需关注使用哪些层来构造模型，而不必关注层的实现细节。

我们首先定义一个模型变量net，它是一个Sequential类的实例。 Sequential类将多个层串联在一起。当给定输入数据时，Sequential实例将数据传入到第一层，然后将第一层的输出作为第二层的输入，以此类推。

在下面的例子中，我们的模型只包含一个层，因此实际上不需要Sequential。但是由于以后几乎所有的模型都是多层的，在这里使用Sequential会让你熟悉“标准的流水线”。

回顾图3.1.2中的单层网络架构，这一单层被称为全连接层（fully-connected layer），因为它的每一个输入都通过矩阵-向量乘法得到它的每个输出。

在PyTorch中，全连接层在Linear类中定义。 值得注意的是，我们将两个参数传递到nn.Linear中。第一个指定输入特征形状，即2，第二个指定输出特征形状，输出特征形状为单个标量，因此为1。

import torch# nn是神经网络的缩写
from torch import nnnet = nn.Sequential(nn.Linear(2, 1))

2、初始化模型参数

在使用net之前，我们需要初始化模型参数。 如权重和偏置。 深度学习框架通常有预定义的方法来初始化参数。在这里，我们指定每个权重参数应该从均值为0、标准差为0.01的正态分布中随机采样，偏置参数将初始化为零。

net[0].weight.data.normal_(0, 0.01)
net[0].bias.data.fill_(0)

3、定义损失函数

计算均方误差使用的是MSELoss类，也称为平方L2范数。默认情况下，它返回所有样本损失的平均值。

loss = nn.MSELoss()

4、定义优化算法

小批量随机梯度下降算法是一种优化神经网络的标准工具， PyTorch在optim模块中实现了该算法的许多变种。当我们实例化一个SGD实例时，我们要指定优化的参数（可通过net.parameters()从我们的模型中获得）以及优化算法所需的超参数字典。小批量随机梯度下降只需要设置lr值，这里设置为0.03。

trainer = torch.optim.SGD(net.parameters(), lr=0.03)

5、训练

通过深度学习框架的高级API来实现我们的模型只需要相对较少的代码。我们不必单独分配参数、不必定义我们的损失函数，也不必手动实现小批量随机梯度下降。

在每个迭代周期里，我们将完整遍历一次数据集（train_data），不停地从中获取一个小批量的输入和相应的标签。对于每一个小批量，我们会进行以下步骤:

通过调用net(X)生成预测并计算损失l（前向传播）。
通过进行反向传播来计算梯度。
通过调用优化器来更新模型参数。

为了更好的衡量训练效果，我们计算每个迭代周期后的损失，并打印它来监控训练过程。

num_epochs = 3
for epoch in range(num_epochs):for X, y in data_iter:l = loss(net(X) ,y)trainer.zero_grad()l.backward()trainer.step()l = loss(net(features), labels)print(f'epoch {epoch + 1}, loss {l:f}')# epoch 1, loss 0.000248
# epoch 2, loss 0.000103
# epoch 3, loss 0.000103

下面比较生成数据集的真实参数和通过有限数据训练获得的模型参数。要访问参数，我们首先从net访问所需的层，然后读取该层的权重和偏置。

w = net[0].weight.data
print('w的估计误差：', true_w - w.reshape(true_w.shape))
b = net[0].bias.data
print('b的估计误差：', true_b - b)# w的估计误差： tensor([-0.0010, -0.0003])
# b的估计误差： tensor([-0.0003])

batchsize的选择和学习率调整

batchsize的选择和学习率调整_batchsize和学习率-CSDN博客

Pytorch神经网络模型nn.Sequential与nn.Linear

1、定义模型

2、初始化模型参数

3、定义损失函数

4、定义优化算法

5、训练

batchsize的选择和学习率调整

相关文章：

Pytorch神经网络模型nn.Sequential与nn.Linear

C++-gdb调试常用功能

快速上手的AI工具-文心一言辅助学习

Boost 适用 filesystem 库，statx 函数无法找到引用问题的解决方案。

MyBatis中一级缓存是什么？SqlSession一级缓存失效的原因？如何理解一级缓存？

项目解决方案：多地医馆的高清视频监控接入汇聚联网

【前端基础--2】

【GitHub项目推荐--提取文字】【转载】

WebSocket与Shiro认证信息传递的实现与安全性探讨

QT 实现自动生成小学两位数加减法算式

小程序学习-20

面试题-【消息队列】

【江科大】STM32：I2C通信外设（硬件）

【机器学习300问】15、什么是逻辑回归模型？

C#调用C动态链接库

前端实现转盘抽奖 - 使用 lucky-canvas 插件

2024.1.23力扣每日一题——最长交替子数组

C语言王道练习题第七周两题

某马头条——day11+day12

springboot实现aop

手游刚开服就被攻击怎么办？如何防御DDoS？

css实现圆环展示百分比，根据值动态展示所占比例

linux 错误码总结

第一篇：Agent2Agent (A2A) 协议——协作式人工智能的黎明

ServerTrust 并非唯一

工业自动化时代的精准装配革新：迁移科技3D视觉系统如何重塑机器人定位装配

关于 WASM：1. WASM 基础原理

ios苹果系统，js 滑动屏幕、锚定无效

HarmonyOS运动开发：如何用mpchart绘制运动配速图表

Aspose.PDF 限制绕过方案：Java 字节码技术实战分享（仅供学习）