当前位置：首页 > news >正文

PyTorch之nn.Module与nn.functional用法区别

news 2026/2/8 17:51:23

文章目录

1. nn.Module
2. nn.functional
- 2.1 基本用法
- 2.2 常用函数
3. nn.Module 与 nn.functional
- 3.1 主要区别
- 3.2 具体样例：nn.ReLU() 与 F.relu()
参考资料

1. nn.Module

在PyTorch中，nn.Module 类扮演着核心角色，它是构建任何自定义神经网络层、复杂模块或完整神经网络架构的基础构建块。通过继承 nn.Module 并在其子类中定义模型结构和前向传播逻辑（forward() 方法），开发者能够方便地搭建并训练深度学习模型。

关于 nn.Module 的更多介绍可以参考博客：PyTorch之nn.Module、nn.Sequential、nn.ModuleList使用详解

这里，我们基于nn.Module创建一个简单的神经网络模型，实现代码如下：

import torch
import torch.nn as nnclass MyModel(nn.Module):def __init__(self, input_size, hidden_size, output_size):super(MyModel, self).__init__()self.layer1 = nn.Linear(input_size, hidden_size)self.layer2 = nn.Linear(hidden_size, output_size)def forward(self, x):x = torch.relu(self.layer1(x))x = self.layer2(x)return x

2. nn.functional

nn.functional 是PyTorch中一个重要的模块，它包含了许多用于构建神经网络的函数。与 nn.Module 不同，nn.functional 中的函数不具有可学习的参数。这些函数通常用于执行各种非线性操作、损失函数、激活函数等。

2.1 基本用法

如何在神经网络中使用nn.functional？

在PyTorch中，你可以轻松地在神经网络中使用 nn.functional 函数。通常，你只需将输入数据传递给这些函数，并将它们作为网络的一部分。

以下是一个简单的示例，演示如何在一个全连接神经网络中使用ReLU激活函数：

import torch.nn as nn
import torch.nn.functional as Fclass MyModel(nn.Module):def __init__(self):super(MyModel, self).__init__()self.fc1 = nn.Linear(64, 128)self.fc2 = nn.Linear(128, 10)def forward(self, x):x = F.relu(self.fc1(x))x = self.fc2(x)return x

在上述示例中，我们首先导入nn.functional 模块，然后在网络的forward 方法中使用F.relu 函数作为激活函数。

nn.functional 的主要优势是它的计算效率和灵活性，因为它允许你以函数的方式直接调用这些操作，而不需要创建额外的层。

2.2 常用函数

（1）激活函数

激活函数是神经网络中的关键组件，它们引入非线性性，使网络能够拟合复杂的数据。以下是一些常见的激活函数：

ReLU（Rectified Linear Unit）
ReLU是一种简单而有效的激活函数，它将输入值小于零的部分设为零，大于零的部分保持不变。它的数学表达式如下：

output = F.relu(input)

Sigmoid
Sigmoid函数将输入值映射到0和1之间，常用于二分类问题的输出层。它的数学表达式如下：

output = F.sigmoid(input)

Tanh（双曲正切）
Tanh函数将输入值映射到-1和1之间，它具有零中心化的特性，通常在循环神经网络中使用。它的数学表达式如下：

output = F.tanh(input)

（2）损失函数

损失函数用于度量模型的预测与真实标签之间的差距。PyTorch的nn.functional 模块包含了各种常用的损失函数，例如：

交叉熵损失（Cross-Entropy Loss）
交叉熵损失通常用于多分类问题，计算模型的预测分布与真实分布之间的差异。它的数学表达式如下：

loss = F.cross_entropy(input, target)

均方误差损失（Mean Squared Error Loss）
均方误差损失通常用于回归问题，度量模型的预测值与真实值之间的平方差。它的数学表达式如下：

loss = F.mse_loss(input, target)

L1 损失
L1损失度量预测值与真实值之间的绝对差距，通常用于稀疏性正则化。它的数学表达式如下：

loss = F.l1_loss(input, target)

（3）非线性操作

nn.functional 模块还包含了许多非线性操作，如池化、归一化等。

最大池化（Max Pooling）
最大池化是一种用于减小特征图尺寸的操作，通常用于卷积神经网络中。它的数学表达式如下：

output = F.max_pool2d(input, kernel_size)

批量归一化（Batch Normalization）
批量归一化是一种用于提高训练稳定性和加速收敛的技术。它的数学表达式如下：

output = F.batch_norm(input, mean, std, weight, bias)

3. nn.Module 与 nn.functional

3.1 主要区别

nn.Module 与 nn.functional 的主要区别在于：

nn.Module实现的layers是一个特殊的类，都是由class Layer(nn.Module)定义，会自动提取可学习的参数；
nn.functional中的函数更像是纯函数，由def function(input)定义。

注意：

如果模型有可学习的参数时，最好使用nn.Module。
激活函数（ReLU、sigmoid、Tanh)、池化(MaxPool)等层没有可学习的参数,可以使用对应的functional函数。
卷积、全连接等有可学习参数的网络建议使用nn.Module。
dropout没有可学习参数，但建议使用nn.Dropout而不是nn.functional.dropout。

3.2 具体样例：nn.ReLU() 与 F.relu()

nn.ReLU() ：

import torch.nn as nn
'''
nn.ReLU()

F.relu()：

import torch.nn.functional as F
'''
out = F.relu(input)

其实这两种方法都是使用relu激活，只是使用的场景不一样，F.relu()是函数调用，一般使用在foreward函数里。而nn.ReLU()是模块调用，一般在定义网络层的时候使用。

当用print(net)输出时，nn.ReLU()会有对应的层，而F.ReLU()是没有输出的。

import torch.nn as nn
import torch.nn.functional as Fclass NET1(nn.Module):def __init__(self):super(NET1, self).__init__()self.conv = nn.Conv2d(3, 16, 3, 1, 1)self.bn = nn.BatchNorm2d(16)self.relu = nn.ReLU()  # 模块的激活函数def forward(self, x):out = self.conv(x)x = self.bn(x)out = self.relu()return outclass NET2(nn.Module):def __init__(self):super(NET2, self).__init__()self.conv = nn.Conv2d(3, 16, 3, 1, 1)self.bn = nn.BatchNorm2d(16)def forward(self, x):x = self.conv(x)x = self.bn(x)out = F.relu(x)  # 函数的激活函数return outnet1 = NET1()
net2 = NET2()
print(net1)
print(net2)

在这里插入图片描述

参考资料

PyTorch的nn.Module类的详细介绍
PyTorch nn.functional 模块详解：探索神经网络的魔法工具箱
pytorch：F.relu() 与 nn.ReLU() 的区别

PyTorch之nn.Module与nn.functional用法区别

文章目录 1. nn.Module2. nn.functional2.1 基本用法2.2 常用函数 3. nn.Module 与 nn.functional3.1 主要区别3.2 具体样例：nn.ReLU() 与 F.relu() 参考资料 1. nn.Module 在PyTorch中，nn.Module 类扮演着核心角色，它是构建任何自定义神经网…...

编程日记 2024/7/3 20:05:02

2024.06.24 校招实习内推面经

绿*泡*泡VX： neituijunsir 交流*裙 ，内推/实习/校招汇总表格 1、校招 | 昂瑞微2025届校园招聘正式启动校招 | 昂瑞微2025届校园招聘正式启动 2、实习 | 东风公司研发总院暑期实习生火爆招募中实习 | 东风公司研发总院暑期实习生火爆招募中 3、实习…...

编程日记 2024/7/3 20:04:00

【C++】using namespace std 到底什么意思

📢博客主页：https://blog.csdn.net/2301_779549673 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正！ 📢本文作为 JohnKi 的学习笔记，引用了部分大佬的案例 📢未来很长&a…...

编程日记 2024/7/3 20:01:58

基于ESP32 IDF的WebServer实现以及OTA固件升级实现记录（三）

经过前面两篇的前序铺垫，对webserver以及restful api架构有了大体了解后本篇描述下最终的ota实现的代码以及调试中遇到的诡异bug。 eps32的实际ota实现过程其实esp32官方都已经基本实现好了，我们要做到无非就是把要升级的固件搬运到对应ota flash分区里面…...

编程日记 2024/7/3 20:00:51

116-基于5VLX110T FPGA FMC接口功能验证6U CPCI平台

一、板卡概述本板卡是Xilinx公司芯片V5系列芯片设计信号处理板卡。由一片Xilinx公司的XC5VLX110T-1FF1136 / XC5VSX95T-1FF1136 / XC5VFX70T-1FF1136芯片组成。FPGA接1片DDR2内存条 2GB，32MB Nor flash存储器，用于存储程序。外扩 SATA、PCI、PCI expres…...

编程日记 2024/7/3 19:58:48

Android - Json/Gson

Json数据解析 json对象：花括号开头和结尾，中间是键值对形式————”属性”:属性值”” json数组：中括号里放置 json 数组，里面是多个json对象或者数字等 JSONObject 利用 JSONObject 解析 1.创建 JSONObject 对象，传…...

编程日记 2024/7/3 19:57:47

盲信号处理的发展现状

盲源分离技术最早在上个世纪中期提出，在1991年Herault和Jutten提出基于反馈神经网络的盲源分离方法，但该方法缺乏理论基础，后来Tong和Liu分析了盲源分离问题的可辨识性和不确定性，Cardoso于1993年提出了基于高阶统计的联合对角化盲…...

编程日记 2024/7/3 19:56:45

二轴机器人装箱机：重塑物流效率，精准灵活，引领未来装箱新潮流

在现代化物流领域，高效、精准与灵活性无疑是各大企业追求的核心目标。而在这个日益追求自动化的时代，二轴机器人装箱机凭借其较佳的性能和出色的表现，正逐渐成为装箱作业的得力助手，引领着未来装箱新潮流。一、高效：重…...

编程日记 2024/7/3 19:54:43

Python面向对象编程：派生

本套课在线学习视频（网盘地址，保存到网盘即可免费观看）： https://pan.quark.cn/s/69d1cc25d4ba 面向对象编程（OOP）是一种编程范式，它通过将数据和操作数据的方法封装在一起&#xff0…...

编程日记 2024/7/3 19:50:39

华为仓颉编程语言

目录一、引言二、仓颉编程语言概述三、技术特征四、应用场景五、社区支持六、结论与展望一、引言随着信息技术的快速发展，编程语言作为软件开发的核心工具，其重要性日益凸显。近年来，华为公司投入大量研发资源，成功…...

编程日记 2024/7/3 19:49:39

【微信小程序开发实战项目】——如何制作一个属于自己的花店微信小程序（2）

👨‍💻个人主页：开发者-曼亿点 👨‍💻 hallo 欢迎点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍💻 本文由曼亿点原创 👨‍💻 收录于专栏&#xff1a…...

编程日记 2024/7/3 19:48:37

解锁数据资产的无限潜能：深入探索创新的数据分析技术，挖掘其在实际应用场景中的广阔价值，助力企业发掘数据背后的深层信息，实现业务的持续增长与创新

目录一、引言二、创新数据分析技术的发展 1、大数据分析技术 2、人工智能与机器学习 3、可视化分析技术三、创新数据分析技术在实际应用场景中的价值 1、市场洞察与竞争分析 2、客户细分与个性化营销 3、业务流程优化与风险管理 4、产品创新与研发四、案例分析 …...

编程日记 2024/7/3 19:47:36

Bridging nonnull in Objective-C to Swift: Is It Safe?

Bridging nonnull in Objective-C to Swift: Is It Safe? In the world of iOS development, bridging between Objective-C and Swift is a common practice, especially for legacy codebases (遗留代码库) or when integrating (集成) third-party libraries. One importa…...

编程日记 2024/7/3 19:46:36