当前位置：首页 > news >正文

【Pytorch】torch.nn.functional模块中的非线性激活函数

news 2026/2/9 4:52:31

在使用torch.nn.functional模块时，需要导入包：

from torch.nn import functional

以下是常见激活函数的介绍以及对应的代码示例：

tanh (双曲正切)

输出范围：(-1, 1)

特点：中心对称，适合处理归一化后的数据。
公式： $tanh(x) = (e^x - e^{-x}) / (e^x + e^{-x})$

import torch
x = torch.tensor([-2.0, -1.0, 0.0, 1.0, 2.0])
y = torch.nn.funcationl.tanh(x)
print(y)  # 输出：tensor([-0.9640, -0.7616,  0.0000,  0.7616,  0.9640])

sigmoid (S形函数)

输出范围：(0, 1)
特点：用于将输入映射到概率值，但可能会导致梯度消失问题。
公式： $sigmoid(x) = 1 / (1 + e^{-x})$

y = torch.nn.funcational.sigmoid(x)
print(y)  # 输出：tensor([0.1192, 0.2689, 0.5000, 0.7311, 0.8808])

SiLU (Sigmoid Linear Unit，也称Swish)

输出范围：(0, x)
特点：结合了线性和非线性特性，效果较好。
公式：silu(x) = x * sigmoid(x)

y = torch.nn.funcationl.silu(x)
print(y)  # 输出：tensor([-0.2384, -0.2689,  0.0000,  0.7311,  1.7616])

GELU (Gaussian Error Linear Unit)

输出范围：接近ReLU，但更加平滑。
特点：常用于Transformer模型。
公式：近似为：gelu(x) ≈ x * sigmoid(1.702 * x)

y = torch.nn.functional.gelu(x)
print(y)  # 输出：tensor([-0.0454, -0.1588,  0.0000,  0.8413,  1.9546])

ReLU (Rectified Linear Unit)

输出范围：[0, +∞)
特点：简单高效，是最常用的激活函数之一。
公式：relu(x) = max(0, x)

y = torch.nn.funcationl.relu(x)
print(y)  # 输出：tensor([0., 0., 0., 1., 2.])

ReLU_ (In-place ReLU)

输出范围：[0, +∞)
特点：修改原张量而不是生成新的张量，节省内存。

x.relu_()  # 注意：会改变x本身
print(x)  # x的值被修改为：tensor([0., 0., 0., 1., 2.])

Leaky ReLU

输出范围：(-∞, +∞)
特点：允许负值有较小的输出，避免死神经元问题。
公式：leaky_relu(x) = x if x > 0 else alpha * x

x = torch.tensor([-2.0, -1.0, 0.0, 1.0, 2.0])
y = torch.nn.functional.leaky_relu(x, negative_slope=0.01)
print(y)  # 输出：tensor([-0.0200, -0.0100,  0.0000,  1.0000,  2.0000])

Leaky ReLU_ (In-place Leaky ReLU)

特点：和ReLU_一样会修改原张量。

x.leaky_relu_(negative_slope=0.01)
print(x)  # x的值被修改

Softmax

输出范围：(0, 1)，且所有输出的和为1。
特点：常用于多分类任务的最后一层。
公式： $softmax(x)_i = exp(x_i) / sum(exp(x_j))$

x = torch.tensor([1.0, 2.0, 3.0])
y = torch.nn.functional.softmax(x, dim=0)
print(y)  # 输出：tensor([0.0900, 0.2447, 0.6652])

Threshold

输出范围：手动设置的范围。
特点：小于阈值的数被置为设定值，大于等于阈值的数保持不变。

x = torch.tensor([-1.0, 0.0, 1.0, 2.0])
y = torch.nn.functional.threshold(x, threshold=0.5, value=0.0)
print(y)  # 输出：tensor([0., 0., 0., 2.])

Normalize

功能：将张量的值标准化到指定范围。

公式：normalize(x) = x / max(||x||, eps)

x = torch.tensor([[1.0, 2.0, 3.0], [4.0, 5.0, 6.0]])
y = torch.nn.functional.normalize(x, p=2, dim=1)
print(y)  # 输出：标准化到单位向量

【Pytorch】torch.nn.functional模块中的非线性激活函数

在使用torch.nn.functional模块时，需要导入包： from torch.nn import functional 以下是常见激活函数的介绍以及对应的代码示例： tanh (双曲正切) 输出范围：(-1, 1) 特点：中心对称，适合处理归一化后的数据…...

编程日记 2024/11/19 14:46:06

reactflow 中 useNodesState 模块作用

1. 节点状态管理核心功能 useNodesState是一个关键的钩子函数，用于专门管理节点（Nodes）的状态。节点是流程图的核心元素，它们可以代表各种实体，如流程中的任务、系统中的组件或者数据结构中的元素。 useNodesState提…...

编程日记 2024/11/19 14:38:57

Go语言内存分配源码分析学习笔记

大家好，我是V 哥。GO GO GO，今天来说一说Go语言内存分配问题，Go语言内存分配的源码主要集中在runtime包中，它实现了Go语言的内存管理，包括初始化、分配、回收和释放等。下面来对这些过程详细分析一下，先赞后…...

编程日记 2024/11/19 14:36:55

【jvm】方法区常用参数有哪些

目录 1. -XX:PermSize2. -XX:MaxPermSize3. -XX:MetaspaceSize（Java 8及以后）4. -XX:MaxMetaspaceSize（Java 8及以后）5. -Xnoclassgc6. -XX:TraceClassLoading7.-XX:TraceClassUnLoading 1. -XX:PermSize 1.设置JVM初始分配的永久…...

编程日记 2024/11/19 14:34:54

JAVA环境的配置

首先找到JDK环境的官网。 Java Archive Downloads - Java SE 8u211 and laterhttps://www.oracle.com/java/technologies/javase/javase8u211-later-archive-downloads.html 我下载的最后一个x64.exe，下载后，直接双击运行，我这里默认安装到…...

编程日记 2024/11/19 14:33:52

LLM文档对话 —— pdf解析关键问题

一、为什么需要进行pdf解析？ 最近在探索ChatPDF和ChatDoc等方案的思路，也就是用LLM实现文档助手。在此记录一些难题和解决方案，首先讲解主要思想，其次以问题回答的形式展开。二、为什么需要对pdf进行解析？ 当利用L…...

编程日记 2024/11/19 14:32:49

本文针对 MySQL 单表查询时索引使用的几种场景情况进行分析。假设有一个表如下： CREATE TABLE single_table (id INT NOT NULL AUTO_INCREMENT,key1 VARCHAR(100),key2 INT,key3 VARCHAR(100),key_part1 VARCHAR(100),key_part2 VARCHAR(100),key_part3 VARCHAR(1…...

编程日记 2024/11/19 14:27:42

Qt邮箱程序改良版(信号和槽)

上一版代码可以正常使用,但是会报错上一篇文章错误信息 "QSocketNotifier: Socket notifiers cannot be enabled or disabled from another thread" 指出了一个问题，即在非主线程中尝试启用或禁用套接字通知器（QSocketNotifier）…...

编程日记 2024/11/19 14:26:40

入门到精通mysql数据（四）

5、运维篇 5.1、日志 5.1.1、错误日志错误日志是MySQL中最重要的日志之一，它记录了当mysqld启动和停止，以及服务器在运行过程中发生任何严重错误时的相关信息。当数据库出现任何故障导致无法正常使用时，建议首先查看此日志。该日志是默认开启的，默认存放目录/var/log…...

编程日记 2024/11/19 14:24:36

Java 设计模式详解

在Java开发中，设计模式是一种常见的、成熟的解决方案，用于应对特定的设计问题和复杂性管理。以下是一些常用的设计模式，它们可以分为三类：创建型模式、结构型模式和行为型模式。一、创建型模式创建型模式主要负责对象的创建&a…...

编程日记 2024/11/19 14:23:35

卡尔曼滤波学习资料汇总

卡尔曼滤波学习资料汇总其实，当初的目的，是为了写 MPU6050 的代码的，然后不知不觉学了那么多，也是因为好奇、感兴趣吧有些还没看完，之后笔记也会同步更新的学习原始材料【卡尔曼滤波器】1_递归算法_Recursive P…...

编程日记 2024/11/19 14:18:31

linux003.在ubuntu中安装cmake的方法

1.cmake安装程序下载 https://cmake.org/files/v3.30/ 2.解压并下载包解压cmake压缩包 tar -xvzf cmake.tar.gz进入解压目录 cd cmake-<version>编辑~/.bashrc nano ~/.bashrc在文件的末尾添加如下代码 export PATH/home/xwl/software/cmake/bin:$PATH然后运行以…...

编程日记 2024/11/19 14:15:27

EtherNet/IP转Profinet网关连接发那科机器人配置实例解析

本案例主要展示了如何通过Ethernet/IP转Profinet网关实现西门子1200PLC与发那科搬运机器人的连接。所需的设备有西门子1200PLC、开疆智能Ethernet/IP转Profinet网关以及Fanuc机器人。具体配置步骤：打开西门子博图配置软件，添加PLC。这是配置的第一步&am…...

编程日记 2024/11/19 14:13:24

自动化运维-检测Linux服务器CPU、内存、负载、IO读写、机房带宽和服务器类型等信息脚本

前言：以上脚本为今年8月1号发布的，当时是没有任何问题，但现在脚本里网络速度测试py文件获取不了了，测速这块功能目前无法实现，后面我会抽时间来研究，大家如果有建议也可以分享下。脚本内容： #…...

编程日记 2024/11/19 14:10:21

ubuntu24.04设置开机自启动Eureka

ubuntu24.04设置开机自启动Eureka 之前我们是在/root/.bashrc的文件中增加了一条命令 nohup java -jar /usr/software/eurekaServer-auth-prd-03.jar > /usr/software/log.log 2>&1 &但上面这条命令只有在登录root的用户时，才会执行，如果…...

编程日记 2024/11/19 14:08:18

从视频帧生成点云数据、使用PointNet++模型提取特征，并将特征保存下来的完整实现。

文件地址 https://github.com/yanx27/Pointnet_Pointnet2_pytorch?spm5176.28103460.0.0.21a95d27ollfze Pointnet_Pointnet2_pytorch\log\classification\pointnet2_ssg_wo_normals文件夹改名为Pointnet_Pointnet2_pytorch\log\classification\pointnet2_cls_ssg "E:…...

编程日记 2024/11/19 14:06:14

工化企业内部能源能耗过大落实能源管理

一、精准监测与数据分析实时准确的数据采集企业能耗管理系统能够对企业内各种能源（如电、水、气、热等）的使用情况进行实时监测。通过安装在能源供应线路和设备上的智能传感器，可以精确地采集能源消耗的各项数据，包括瞬时流量、…...

编程日记 2024/11/19 14:05:13

LSTM 和 LSTMCell

1. LSTM 和 LSTMCell 的简介 LSTM (Long Short-Term Memory): 一种特殊的 RNN（循环神经网络），用于解决普通 RNN 中梯度消失或梯度爆炸的问题。能够捕获长期依赖关系，适合处理序列数据（如自然语言、时间序列等&…...

编程日记 2024/11/19 14:03:09

python成长技能之正则表达式

文章目录一、认识正则表达式二、使用正则表达式匹配单一字符三、正则表达式之重复出现数量匹配四、使用正则表达式匹配字符集五、正则表达式之边界匹配六、正则表达式之组七、正则表达式之贪婪与非贪婪一、认识正则表达式什么是正则表达式正则表达式（英语&…...

编程日记 2024/11/19 14:02:07

解决docker报Error response from daemon Get httpsregistry-1.docker.iov2错误

解决docker报Error response from daemon: Get "https://registry-1.docker.io/v2/"错误报错详情首先先看一下问题报错效果,我想要拉去nacos-serve：1.1.4的镜像，报如下错误，从报错信息可以看到，用于网络的愿意&…...

编程日记 2024/11/19 14:00:04

Flask RESTful 示例

目录 1. 环境准备2. 安装依赖3. 修改main.py4. 运行应用5. API使用示例获取所有任务获取单个任务创建新任务更新任务删除任务中文乱码问题： 下面创建一个简单的Flask RESTful API示例。首先，我们需要创建环境，安装必要的依赖，然后…...

编程新知 2026/2/8 20:42:43

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning（提示调优）核心思想：固定预训练模型参数，仅学习额外的连续提示向量（通常是嵌入层的一部分）。实现方式：在输入文本前添加可训练的连续向量（软提示），模型只更新这些提示参数。优势：参数量少（仅提…...

编程新知 2026/2/9 1:17:40

k8s从入门到放弃之Ingress七层负载

k8s从入门到放弃之Ingress七层负载在Kubernetes（简称K8s）中，Ingress是一个API对象，它允许你定义如何从集群外部访问集群内部的服务。Ingress可以提供负载均衡、SSL终结和基于名称的虚拟主机等功能。通过Ingress，你可…...

编程新知 2025/9/7 0:12:53

Vue3 + Element Plus + TypeScript中el-transfer穿梭框组件使用详解及示例

使用详解 Element Plus 的 el-transfer 组件是一个强大的穿梭框组件，常用于在两个集合之间进行数据转移，如权限分配、数据选择等场景。下面我将详细介绍其用法并提供一个完整示例。核心特性与用法基本属性 v-model：绑定右侧列表的值&…...

编程新知 2026/2/4 4:25:40

STM32F4基本定时器使用和原理详解

STM32F4基本定时器使用和原理详解前言如何确定定时器挂载在哪条时钟线上配置及使用方法参数配置PrescalerCounter ModeCounter Periodauto-reload preloadTrigger Event Selection 中断配置生成的代码及使用方法初始化代码基本定时器触发DCA或者ADC的代码讲解中断代码定时启动…...

编程新知 2026/2/9 3:58:32