当前位置：首页 > news >正文

【PyTorch】手把手带你快速搭建PyTorch神经网络

news 2026/2/9 9:45:25

手把手带你快速搭建PyTorch神经网络

1. 定义一个Class
2. 使用上面定义的Class
3. 执行正向传播过程
4. 总结顺序
相关资料

话不多说，直接上代码

1. 定义一个Class

如果要做一个神经网络模型，首先要定义一个Class，继承nn.Module，也就是import torch.nn as nn，示例如下：

import torch.nn as nn
import torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super().__init__()self.conv1 = nn.Conv2d(1,6,5)self.conv2 = nn.Conv2d(6,16,5)def forward(self, x):x = F.max_pool2d(F.relu(self.conv1(x)), 2)x = F.max_pool2d(F.relu(self.conv2(x)), 2)return x

这里，我们把class的名字就叫成Net。Class里面主要写两个函数，一个是初始化的__init__函数，另一个是forward函数。

__init__里面就是定义卷积层，先super()一下，给父类nn.Module初始化一下。在这个__init__里边主要定义就是卷积层。比如第一层，我们叫它conv1，把它定义成输入1通道，输出6通道，卷积核5*5的的一个卷积层。conv2同理。
forward里边是真正执行数据的流动。比如上面的代码，输入的x先经过定义的conv1（这个名字是自己起的），再经过激活函数F.relu()（这里源自import torch.nn.functional as F，F.relu()是官方提供的函数）。当然如果在__init__里面把relu定义成了myrelu，那这里直接第一句话就成了x=F.max_pool2d(myrelu(self.conv1(x)),2)。下一步的F.max_pool2d池化也是一样的。在一系列流动以后，最后把x返回到外面去。

需要强调的是：

注意前后输出通道和输入通道的一致性。不能第一个卷积层输出4通道第二个输入6通道，这样就会报错。
它和我们常规的python的class还有一些不同

2. 使用上面定义的Class

先定义一个Net的实例，毕竟Net只是一个类不能直接传参数

net=Net()

然后，就可以往里边传入x了。假设已经有一个要往神经网络的输入的数据“input"（这个input应该定义成tensor类型），在传入的时候，

output=net(input)

注意：在常规python编程中，一般向class里面传入一个数据x，在class的定义里面，应该是把这个x作为形参传入__init__函数里的，而在上面的定义中，x作为形参是传入forward函数里面的。其实也不矛盾，因为在定义net的时候，是net=Net()，并没有往里面传入参数。如果想初始化的时候按需传入，则需要在__init__中增加需要传入的参数，然后把需要的传入进去即可。

3. 执行正向传播过程

在网络net定义好以后，就涉及到传入参数，计算误差，反向传播，更新权重等等，这些不太容易记住这些东西的格式和顺序。但是我们可以将这个过程理解为一次正向传播，需要把这一路上的输入x都计算出来。在计算的过程中要想让网络输出output与期望的ground truth差不多，就需要不断缩小二者的差距，这个差距就是目标函数（object function）或者称为损失函数。

如果损失函数loss趋近于0，那么自然就达到目的了。但是损失函数loss基本上没法达到0，但是仍然希望能让它达到最小值，那么这个做的方式是它能按照梯度进行下降。

那么神经网络怎么才能达到按照梯度下降呢？或者说是怎么调整自己使得loss函数趋近于0。它只能不断修改权重，比如y=wx+b，x是给定的，它只能改变w和b，让最后的输出y尽可能接近希望的y值，这样损失loss就越来越小。

如果loss对于输入x的偏导数接近0了，是不是就意味着到达了一个极值吗？而l在你的损失函数计算方式已经给定的情况下，loss对于输入x的偏导数的减小，其实只能通过更新参数卷积层参数W来实现。

所以，通过下述方式实现对W的更新：

先算loss对于输入x的偏导数。当然网络好几层，这个x指的是每一层的输入，而不是最开始的输入input
对第1步的结果再乘以一个步长，这样就相当于是得到一个对参数W的修改幅度
用W减掉这个修改幅度，完成一次对参数W的修改。

具体过程代码如下：

compute_loss=nn.MSELoss()  # 定义损失函数
loss=compute_loss(target,output)  # 把神经网络net的输出，和标准答案target传入进去
loss.backward()   # 算出loss，下一步就是反向传播

到这里，就把上面的第1步完成了，得到对参数W一步的更新量，算是一次反向传播。

当然搞深度学习不可能只用官方提供的loss函数，所以如果要想用自己的loss函数。必须也把loss定义成上面Net的样子，它也是继承nn.Module，把传入的参数放进forward里面，具体的loss在forward里面算，最后return loss。__init__()就空着，写个super().__init__就行了。

在反向传播之后，对于第2步和第3步的计算，就需要用到优化器来实现，让优化器来自动实现对网络权重W的更新：

from torch import optim
optimizer=optim.SGD(net.parameters(),lr=0.001,momentum=0.9)

同样地，优化器也是一个类，先定义一个实例optimizer，然后使用其中的一个优化器方法。注意在optimizer定义的时候，需要给SGD传入了net的参数parameters，这样优化器就掌握了对网络参数的控制权，就能够对它进行修改了。同时传入的时候把学习率lr也传进去。

注意，在每次迭代之前，先把optimizer里存的梯度清零一下，因为W已经更新过的“更新量”下一次就不需要用了。

optimizer.zero_grad()

在loss.backward()反向传播以后，更新参数：

optimizer.step()

4. 总结顺序

定义网络：写网络Net的Class，声明网络的实例net=Net();
定义优化器：optimizer=optim.xxx(net.parameters()，lr=xxx)；
定义损失函数：自己写class或者直接用官方的，例如compute_loss=nn.MSELoss()
开始循环过程：
1. 首先，清空优化器里的梯度信息：optimizer.zero_grad();
2. 再将input传入，output=net(input) ，开始正向传播
3. 计算损失，loss=compute_loss(target,output)
4. 误差反向传播，loss.backward()
5. 更新参数，optimizer.step()

综上，这样就实现了一个基本的神经网络。大部分神经网络的训练都可以简化为这个过程，无非是传入的内容复杂，网络定义复杂，损失函数复杂等等。

相关资料

梯度下降算法原理讲解——机器学习
深度学习数学基础之链式法则

【PyTorch】手把手带你快速搭建PyTorch神经网络

手把手带你快速搭建PyTorch神经网络

1. 定义一个Class

2. 使用上面定义的Class

3. 执行正向传播过程

4. 总结顺序

相关资料

相关文章：

【PyTorch】手把手带你快速搭建PyTorch神经网络

【完整代码】用HTML/CSS制作一个美观的个人简介网页

Java分布式事务（九）

基于深度学习的动物识别系统（YOLOv5清新界面版，Python代码）

K8S集群之-ETCD集群监控

一文弄懂熵、交叉熵和kl散度(相对熵)

10从零开始学Java之开发Java必备软件Intellij idea的安装配置与使用

04 - 进程参数编程

【python进阶】你真的懂元组吗？不仅是“不可变的列表”

《C++ Primer Plus》（第6版）第13章编程练习

【多线程】多线程案例

【IoT】嵌入式驱动开发：IIC子系统

DJ2-4 进程同步（第一节课）

AI独立开发者：一周涨粉8万赚2W美元；推特#HustleGPT GPT-4创业挑战；即刻#AIHackathon创业者在行动 | ShowMeAI周刊

不要迷信 QUIC

【28】Verilog进阶 - RAM的实现

【MySQL】聚合查询

初时STM32单片机

debian部署docker（傻瓜式）

JS判断是否为base64字符串如何转换为图片src格式

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

Auto-Coder使用GPT-4o完成：在用TabPFN这个模型构建一个预测未来3天涨跌的分类任务

AI编程--插件对比分析：CodeRider、GitHub Copilot及其他

Java面试专项一-准备篇

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台

LLMs 系列实操科普（1）

MacOS下Homebrew国内镜像加速指南（2025最新国内镜像加速）

从“安全密码”到测试体系：Gitee Test 赋能关键领域软件质量保障

Visual Studio Code 扩展

在RK3588上搭建ROS1环境：创建节点与数据可视化实战指南