当前位置：首页 > news >正文

深度学习中常用的激活函数有sigmoid、tanh、ReLU、LeakyReLU、PReLU、GELU等。

news 2026/2/8 14:16:20

深度学习中常用的激活函数

1. Sigmoid函数
2. Tanh函数
3. ReLU函数
4. LeakyReLU函数
5. PReLU函数
6. ELU函数：
7. GELU函数：

深度学习中常用的激活函数有sigmoid、tanh、ReLU、LeakyReLU、PReLU等。

1. Sigmoid函数

Sigmoid函数公式为 $f(x)=\frac{1}{1+e^{-x}}$ ，它的输出值在[0,1]之间，可以用来解决二元分类问题。它的主要特点是它是可导的，并且输出值可以被解释为概率。但是，如果输入值过大或过小，会导致梯度消失问题，对于较深的神经网络来说不太适用。

PyTorch的代码示例：

import torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super(Net, self).__init__()self.fc1 = nn.Linear(10, 5)self.fc2 = nn.Linear(5, 1)def forward(self, x):x = F.sigmoid(self.fc1(x))x = F.sigmoid(self.fc2(x))return x

2. Tanh函数

Tanh函数公式为 $f(x)=\frac{e^x-e^{-x}}{e^x+e^{-x}}$ ，它的输出值在[-1,1]之间，可以用来解决回归问题。与sigmoid不同的是，它的输出是以0为中心的，因此幂次大的输入值仍然会导致梯度消失问题。

PyTorch的代码示例：

import torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super(Net, self).__init__()self.fc1 = nn.Linear(10, 5)self.fc2 = nn.Linear(5, 1)def forward(self, x):x = F.tanh(self.fc1(x))x = F.tanh(self.fc2(x))return x

3. ReLU函数

ReLU函数公式为 $f (x) = ma x (0, x)$ ，它的输出值在[0,无穷)之间，可以用来解决分类和回归问题。它有以下优点：1）解决了梯度消失问题；2）计算速度快。

PyTorch的代码示例：

import torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super(Net, self).__init__()self.fc1 = nn.Linear(10, 5)self.fc2 = nn.Linear(5, 1)def forward(self, x):x = F.relu(self.fc1(x))x = F.relu(self.fc2(x))return x

4. LeakyReLU函数

LeakyReLU函数公式为 $f (x) = ma x (0.01 x, x)$ ，它的输出值在(-无穷,无穷)之间，是ReLU的改进版。在输入值为负数时，它不是完全为0，而是有一个小的斜率，可以避免神经元死亡。

PyTorch的代码示例：

import torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super(Net, self).__init__()self.fc1 = nn.Linear(10, 5)self.fc2 = nn.Linear(5, 1)self.LeakyReLU = nn.LeakyReLU(0.01)def forward(self, x):x = self.LeakyReLU(self.fc1(x))x = self.LeakyReLU(self.fc2(x))return x

5. PReLU函数

PReLU函数公式为：

$\begin{cases} x, & \text{if $x > 0$}\\ \alpha x, & \text{otherwise} \end{cases}$

其中 $\alpha$ 是可学习的参数，它的输出值在(-无穷,无穷)之间，是LeakyReLU的改进版。与LeakyReLU不同的是， $\alpha$ 不是固定的，而是可以根据训练数据自适应调节。

PyTorch的代码示例：

import torch.nn.functional as Fclass Net(nn.Module):def __init__(self):super(Net, self).__init__()self.fc1 = nn.Linear(10, 5)self.fc2 = nn.Linear(5, 1)self.PReLU = nn.PReLU()def forward(self, x):x = self.PReLU(self.fc1(x))x = self.PReLU(self.fc2(x))return x

6. ELU函数：

ELU函数的数学公式为 $f(x)=\begin{cases}x, & x>0\\\alpha(e^x-1), & x\leq0\end{cases}$ ，它是另一种解决ReLU“死亡”现象的函数，通过引入一个指数函数来平滑负数区间。

以下是使用PyTorch实现ELU函数的代码示例：

import torch.nn.functional as Fx = torch.randn(2, 3)
y = F.elu(x, alpha=1.0)
print(y)

深度学习中常用的激活函数有sigmoid、ReLU、LeakyReLU、ELU、SeLU等，其中gelu是近年来提出的一种新的激活函数。

7. GELU函数：

GELU (Gaussian Error Linear Units)函数是一种近年来提出的新型激活函数，其原理是基于高斯误差函数的近似。其作用是在保持ReLU函数优点的同时，减少其缺点。将输入的值 $x$ 通过高斯分布的累积分布函数（CDF） $F (x)$ ，来获得激活函数的输出值。其数学表达式如下：

$\mathrm{gelu}(x)=x\cdot\Phi (x), \ \mathrm{其中}\Phi(x)=\frac{1}{2}[1+\mathrm{erf}(\frac{x}{\sqrt{2}})]$
其中， $\Phi(x)$ 为高斯分布的累积分布函数。

GELU函数具有以下特点：

可微性：GELU函数可导，可以使用反向传播算法训练神经网络。
非线性：与ReLU函数相似，GELU函数具有非线性特点，可以学习非线性函数。
平滑性：GELU函数在整个实数轴上都是连续可导的，可以减少梯度消失和爆炸问题。
计算效率高：由于GELU函数采用了近似求解，计算速度较ReLU函数更快。

由于高斯分布的概率密度函数（PDF）在均值处最大，因此gelu在接近0的地方具有很好的非线性特性，同时也有一定的平滑性，能够一定程度上减少梯度消失问题，提高模型的泛化能力。

PyTorch代码示例：

import torch.nn as nnclass MyModel(nn.Module):def __init__(self):super(MyModel, self).__init__()self.fc = nn.Linear(10, 20)self.act = nn.GELU()def forward(self, x):x = self.fc(x)x = self.act(x)return xmodel = MyModel()

import torch
import torch.nn.functional as Fclass Net(torch.nn.Module):def __init__(self):super(Net, self).__init__()self.fc1 = torch.nn.Linear(10, 20)self.fc2 = torch.nn.Linear(20, 2)def forward(self, x):x = F.gelu(self.fc1(x))x = F.gelu(self.fc2(x))return x

在上述示例代码中，我们使用了PyTorch中的F.gelu函数，实现了GELU激活函数对网络中的每个神经元进行激活。

深度学习中常用的激活函数有sigmoid、tanh、ReLU、LeakyReLU、PReLU、GELU等。

深度学习中常用的激活函数

1. Sigmoid函数

2. Tanh函数

3. ReLU函数

4. LeakyReLU函数

5. PReLU函数

6. ELU函数：

7. GELU函数：

相关文章：

深度学习中常用的激活函数有sigmoid、tanh、ReLU、LeakyReLU、PReLU、GELU等。

mysql同时使用order by排序和limit分页数据重复问题

英语——歌诀篇——歌诀记忆法

打破运维疆界：异构复杂网络环境的集中监控和管理

ubuntu安装debian包的命令dpkg和apt的详解

【暴力剪枝】CF1708D

代码格式化的使用

【Unity地编】地形系统搭建入门详解

文件的物理结构（连续分配，链接分配，索引分配）

vue2 解密图片地址(url)-使用blob文件-打开png格式图片

cuda PyTorch

vue视频直接播放rtsp流；vue视频延迟问题解决；webRTC占cpu太大卡死问题解决；解决webRTC播放卡花屏问题:

leetcode_2316 统计无向图中无法互相到达点对数

数据结构知识点总结

【经济研究】数字技术创新与中国企业高质量发展—来自企业数字专利的证据

Windows运维相关经验技巧

AYIT嵌入式实验室2023级C语言训练1-4章训练题

trino tpcds测试

SpringCloud学习笔记（上）：服务注册与发现：Eureka、Zookeeper、Consul+负载均衡服务调用：Ribbon

JavaPTA练习题 7-3 身体质量指数（BMI）测算

高频面试之3Zookeeper

【Go】3、Go语言进阶与依赖管理

CMake 从 GitHub 下载第三方库并使用

IT供电系统绝缘监测及故障定位解决方案

docker 部署发现spring.profiles.active 问题

Pinocchio 库详解及其在足式机器人上的应用

Unity UGUI Button事件流程

根目录0xa0属性对应的Ntfs!_SCB中的FileObject是什么时候被建立的----NTFS源代码分析--重要

Modbus RTU与Modbus TCP详解指南

云原生周刊：k0s 成为 CNCF 沙箱项目