当前位置：首页 > news >正文

torch.nn.functional的用法

news 2026/2/11 0:44:41

文章目录

介绍
激活函数
- 示例
损失函数
- 示例
卷积操作
- 示例
池化
- 示例
归一化操作
- 示例
Dropout
- 示例
torch.nn.functional 与 torch.nn 的区别

介绍

torch.nn.functional 是 PyTorch 中的一个模块，提供了许多函数式的神经网络操作，包括激活函数、损失函数、卷积操作等。这些函数是无状态的（stateless），与 torch.nn 中的模块化层（如 nn.ReLU、nn.Conv2d 等）不同，torch.nn.functional 提供的是直接的函数调用方式。

激活函数

torch.nn.functional 提供了许多常用的激活函数，例如 ReLU、Sigmoid、Tanh 等。

import torch.nn.functional as F

在这里插入图片描述

示例

import torch  
import torch.nn.functional as F  x = torch.tensor([-1.0, 0.0, 1.0])  
relu_output = F.relu(x)  # ReLU 激活  
softmax_output = F.softmax(x, dim=0)  # Softmax 激活  
print(relu_output)  # tensor([0., 0., 1.])  
print(softmax_output)  # tensor([0.0900, 0.2447, 0.6652])

损失函数

torch.nn.functional 提供了许多损失函数，与 torch.nn 中的模块化损失函数（如 nn.CrossEntropyLoss）功能相同，但需要显式传入参数。
在这里插入图片描述

示例

input = torch.tensor([[0.5, 1.5], [2.0, 1.0]], requires_grad=True)  
target = torch.tensor([1, 0])  
loss = F.cross_entropy(input, target)  # 交叉熵损失  
print(loss)  # tensor(1.2412, grad_fn=<NllLossBackward>)

卷积操作

torch.nn.functional 提供了卷积操作的函数式实现，例如 F.conv1d、F.conv2d、F.conv3d。
在这里插入图片描述

示例

input = torch.randn(1, 1, 5)  # 输入：batch_size=1, channels=1, width=5  
weight = torch.randn(1, 1, 3)  # 卷积核：out_channels=1, in_channels=1, kernel_size=3  
output = F.conv1d(input, weight)  
print(output.shape)  # torch.Size([1, 1, 3])

池化

torch.nn.functional 提供了池化操作的函数式实现，例如最大池化和平均池化。
在这里插入图片描述

示例

input = torch.tensor([[[[1.0, 2.0], [3.0, 4.0]]]])  # 输入：batch_size=1, channels=1, height=2, width=2  
output = F.max_pool2d(input, kernel_size=2)  
print(output)  # tensor([[[[4.]]]])

归一化操作

torch.nn.functional 提供了归一化操作的函数式实现，例如 BatchNorm、LayerNorm 等。
在这里插入图片描述

示例

input = torch.randn(2, 3)  # 输入：batch_size=2, features=3  
output = F.layer_norm(input, normalized_shape=(3,))  
print(output)

Dropout

torch.nn.functional 提供了 Dropout 的函数式实现。
在这里插入图片描述

示例

input = torch.tensor([1.0, 2.0, 3.0])  
output = F.dropout(input, p=0.5, training=True)  # 50% 概率随机置零  
print(output)

torch.nn.functional 与 torch.nn 的区别

在这里插入图片描述

torch.nn.functional的用法

文章目录介绍激活函数示例损失函数示例卷积操作示例池化示例归一化操作示例 Dropout示例 torch.nn.functional 与 torch.nn 的区别介绍 torch.nn.functional 是 PyTorch 中的一个模块，提供了许多函数式的神经网络操作，包括激活函数、损失函数、卷…...

编程日记 2025/1/3 23:30:37

UE5材质节点Camera Vector/Reflection Vector

Camera Vector相机向量，输出像素到相机的方向，结果归一化会随着相机移动而改变 Reflection Vector 反射向量，物体表面法线反射到相机的方向，x和y和camera vector相反配合hdr使用...

编程日记 2025/1/3 23:26:29

NextCloud服务安装与配置教程

NextCloud服务安装与配置教程什么是 NextCloud: Nextcloud 是一款开源的私有云存储和协作平台，允许用户在自己的服务器上托管数据并管理团队协作。它可以作为一个功能丰富、安全可靠的替代方案，与商业云服务（如 Google Drive、Dropbox）相比提供更多控制和隐私保护。简单来…...

编程日记 2025/1/3 23:25:25

详解GPT-信息抽取任务 (GPT-3 FAMILY LARGE LANGUAGE MODELS)

GPT-3 FAMILY LARGE LANGUAGE MODELS Information Extraction 自然语言处理信息提取任务（NLP-IE）：从非结构化文本数据中提取结构化数据，例如提取实体、关系和事件 [164]。将非结构化文本数据转换为结构化数据可以实现高效的数据处…...

编程日记 2025/1/3 23:23:18

华为数通考试模拟真题（附带答案解析）题库领取

【多选题】管理员想要更新华为路由器的VRP版本，则正确的方法有? A管理员把路由器配置为FTP服务器，通过FTP来传输VRP软件 B:管理员把路由器置为FTP客户端，通过FTP来传输VRP软件 C:管理员把路由器配置为TFTP客户端，通过TFTP来传…...

编程日记 2025/1/3 23:22:17

微信小程序：正确输出＜小于，大于＞符号

错误写法 1、如果直接输入<符号会直接报错，>能正常使用，如图标红的是错误写法 2、输入html的<&gt的写法，会原样输入符号解决方法采用变量的方式输出 1、js写入变量 2、wxml直接写...

编程日记 2025/1/3 23:21:15

Flink源码解析之：如何根据算法生成StreamGraph过程

Flink源码解析之：如何根据算法生成StreamGraph过程在我们日常编写Flink应用的时候，会首先创建一个StreamExecutionEnvironment.getExecutionEnvironment()对象，在添加一些自定义处理算子后，会调用env.execute来执行定义好的Flin…...

编程日记 2025/1/3 23:16:10

问题： 顺时针打印二维方阵： 1 2 3 4 15 5 6 7 8 14 9 10 11 12 13 13 14 15 16 public class Test1 {public static void main(String[] args) {int[][] arr new int[][]{{1, 2, 3, 4,100},{5, 6, 7, 8,101},{9, 10, 11, 12,102},{13, 14, 15, 16,…...

编程日记 2025/1/3 23:14:06

Elasticsearch DSL版

文章目录 1.索引库操作创建索引库：删除索引库：查询索引库：修改索引库：总结 2.文档操作创建文档：查询文档：删除文档：全量修改文档：增量修改文档：总结 3.DSL查询语法&#…...

编程日记 2025/1/3 23:12:01

2024-12-29-sklearn学习（26）模型选择与评估-交叉验证：评估估算器的表现今夜偏知春气暖，虫声新透绿窗纱。

文章目录 sklearn学习(26) 模型选择与评估-交叉验证：评估估算器的表现26.1 计算交叉验证的指标26.1.1 cross_validate 函数和多度量评估26.1.2 通过交叉验证获取预测 26.2 交叉验证迭代器26.2.1 交叉验证迭代器–循环遍历数据26.2.1.1 K 折26.2.1.2 重复 K-折交叉验…...

编程日记 2025/1/3 23:10:55

STM32CUBEIDE FreeRTOS操作教程（十二）：std dynamic memory 标准动态内存

STM32CUBEIDE FreeRTOS操作教程（十二）：std dynamic memory 标准动态内存 STM32CUBE开发环境集成了STM32 HAL库进行FreeRTOS配置和开发的组件，不需要用户自己进行FreeRTOS的移植。这里介绍最简化的用户操作类应用教程。以STM32F40…...

编程日记 2025/1/3 23:09:52

异步爬虫之aiohttp的使用

在上一篇博客我们介绍了异步爬虫的基本原理和 asyncio 的基本用法，并且在最后简单提及了使用aiohttp 实现网页爬取的过程。本篇博客我们介绍一下 aiohttp 的常见用法。基本介绍前面介绍的 asyncio模块，其内部实现了对 TCP、UDP、SSL协议的异步操作&a…...

编程日记 2025/1/3 23:08:46

【Rust自学】9.1. 不可恢复的错误以及panic!

喜欢的话别忘了点赞、收藏加关注哦，对接下来的教程有兴趣的可以关注专栏。谢谢喵！(･ω･) 9.1.1. Rust错误处理概述 Rust拥有极高的可靠性，这也延伸到了错误处理的领域。比如说在大部分情况下，Rust会迫使你…...

编程日记 2025/1/3 23:05:38

【老张的程序人生】一天时间，我成软考高级系统分析师

今年下半年，我心血来潮报考了软考高级系统分析师。彼时的我，工作繁忙至极，一周十四节课，班主任的职责压身，还兼任教学管理事务，每日忙得晕头转向，那点可怜的闲暇时光，也都奉献给了游…...

编程日记 2025/1/3 23:02:33

vue使用el-select下拉框自定义复选框

在 Vue 开发中，高效且美观的组件能极大地提升用户体验和开发效率。在vue中使用elementplus 的 el-select下拉框实现了一个自定义的多选下拉框组件。一、代码功能概述这段代码创建了一个可多选的下拉框组件，通过el-select和el-checkbox-group结合的方…...

编程日记 2025/1/3 23:00:31

k8s基础(2)—Kubernetes-Namespace

一、Namespace概述名字空间在 Kubernetes 中，名字空间（Namespace） 提供一种机制，将同一集群中的资源划分为相互隔离的组。同一名字空间内的资源名称要唯一，但跨名字空间时没有这个要求。名字空间作用域仅针对带有…...

编程日记 2025/1/3 22:54:25

APM for Large Language Models

APM for Large Language Models 随着大语言模型（LLMs）在生产环境中的广泛应用，确保其可靠性和可观察性变得至关重要。应用性能监控（APM）在这一过程中发挥了关键作用，帮助开发者和运维人员深入了解LLM系统的…...

编程日记 2025/1/3 22:53:21

Spark Runtime Filter

Runtime Filter 参考链接： https://docs.google.com/document/d/16IEuyLeQlubQkH8YuVuXWKo2-grVIoDJqQpHZrE7q04/edit?tabt.0https://www.modb.pro/db/557718https://issues.apache.org/jira/browse/SPARK-32268https://github.com/apache/spark/pull/35789https…...

编程日记 2025/1/3 22:51:16

AI大模型系列之七：Transformer架构讲解

目录 Transformer网络是什么？ 输入模块结构： 编码器模块结构： 解码器模块: 输出模块结构： Transformer 具体是如何工作的？ Transformer核心思想是什么？ Transformer的代码架构自注意力机制是什么…...

编程日记 2025/1/3 22:49:13

网络六边形受到攻击

大家读完觉得有帮助记得关注和点赞！！！ 抽象现代智能交通系统 （ITS） 的一个关键要求是能够以安全、可靠和匿名的方式从互联车辆和移动设备收集地理参考数据。Nexagon 协议建立在 IETF 定位器/ID 分离协议 （…...

编程新知 2026/2/8 5:22:04

国防科技大学计算机基础课程笔记02信息编码

1.机内码和国标码国标码就是我们非常熟悉的这个GB2312,但是因为都是16进制，因此这个了16进制的数据既可以翻译成为这个机器码，也可以翻译成为这个国标码，所以这个时候很容易会出现这个歧义的情况； 因此，我们的这个国…...

编程新知 2026/2/8 4:37:15

C++实现分布式网络通信框架RPC(3)--rpc调用端

目录一、前言二、UserServiceRpc_Stub 三、 CallMethod方法的重写头文件实现四、rpc调用端的调用实现五、 google::protobuf::RpcController *controller 头文件实现六、总结一、前言在前边的文章中，我们已经大致实现了rpc服务端的各项功能代…...

编程新知 2026/2/8 20:42:58

C++_核心编程_多态案例二-制作饮品

#include <iostream> #include <string> using namespace std;/*制作饮品的大致流程为：煮水 - 冲泡 - 倒入杯中 - 加入辅料利用多态技术实现本案例，提供抽象制作饮品基类，提供子类制作咖啡和茶叶*//*基类*/ class AbstractDr…...

编程新知 2026/2/8 20:42:55

React Native 开发环境搭建（全平台详解）

React Native 开发环境搭建（全平台详解） 在开始使用 React Native 开发移动应用之前，正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南，涵盖 macOS 和 Windows 平台的配置步骤，如何在 Android 和 iOS…...

编程新知 2025/10/7 2:47:54

多模态商品数据接口：融合图像、语音与文字的下一代商品详情体验

一、多模态商品数据接口的技术架构 （一）多模态数据融合引擎跨模态语义对齐通过Transformer架构实现图像、语音、文字的语义关联。例如，当用户上传一张“蓝色连衣裙”的图片时，接口可自动提取图像中的颜色（RGB值&…...

编程新知 2025/7/23 3:55:49

spring：实例工厂方法获取bean

spring处理使用静态工厂方法获取bean实例，也可以通过实例工厂方法获取bean实例。实例工厂方法步骤如下： 定义实例工厂类（Java代码），定义实例工厂（xml），定义调用实例工厂&#xff…...

编程新知 2025/11/25 22:46:30

NFT模式：数字资产确权与链游经济系统构建

NFT模式：数字资产确权与链游经济系统构建 ——从技术架构到可持续生态的范式革命一、确权技术革新：构建可信数字资产基石 1. 区块链底层架构的进化跨链互操作协议：基于LayerZero协议实现以太坊、Solana等公链资产互通，通过零知…...

编程新知 2026/1/31 23:23:23

C# 求圆面积的程序（Program to find area of a circle）

给定半径r，求圆的面积。圆的面积应精确到小数点后5位。例子： 输入：r 5 输出：78.53982 解释：由于面积 PI * r * r 3.14159265358979323846 * 5 * 5 78.53982，因为我们只保留小数点后 5 位数字。输…...

编程新知 2026/2/8 9:34:11

苹果AI眼镜：从“工具”到“社交姿态”的范式革命——重新定义AI交互入口的未来机会

在2025年的AI硬件浪潮中，苹果AI眼镜（Apple Glasses）正在引发一场关于“人机交互形态”的深度思考。它并非简单地替代AirPods或Apple Watch，而是开辟了一个全新的、日常可接受的AI入口。其核心价值不在于功能的堆叠，而在于如何通过形态设计打破社交壁垒，成为用户“全天佩戴…...

编程新知 2025/12/22 12:09:15