当前位置：首页 > news >正文

神经网络常见激活函数 5-PReLU函数

news 2026/2/8 19:57:14

文章目录

- PReLU
- - 函数+导函数
  - 函数和导函数图像
  - 优缺点
  - pytorch中的PReLU函数
  - tensorflow 中的PReLU函数

PReLU

参数化修正线性单元:Parametric ReLU

函数+导函数

PReLU函数
$\rm PReLU = \left\{ \begin{array}{} x \quad & x>= 0 \\ \alpha x \quad & x<0 \end{array} \right. \quad (\alpha 是可训练参数)$
其中，α 是一个可学习的参数，它在训练过程中被优化。
PReLU函数导数
$\frac{d}{dx} \rm PReLU = \left\{ \begin{array}{} 1 \quad x \ge1 \\ \alpha \quad x < 0 \end{array} \right. \quad (\alpha 是可训练参数)$
它和 ReLU 函数的不同之处在于，当 x 小于零时，PReLU 函数的导数值是可学习的参数 α，而不是固定的常数。这使得 PReLU 函数在负值区域的斜率可以自适应地调整。

函数和导函数图像

画图

下面是的优化完成 $\alpha = 0.5$ 后的情况，请注意， LeakyReLU 中，p 是固定值，一般设置为较小值，而 PReLU 中， $\alpha$ 是可训练对象，在训练阶段是不断学习变化的。

import numpy as np
from matplotlib import pyplot as plt# 定义 PReLU 函数
def prelu(x, alpha=0.25):return np.where(x < 0, alpha * x, x)# 定义 PReLU 的导数
def prelu_derivative(x, alpha=0.25):d = np.where(x < 0, alpha, 1)return d# 生成数据
x = np.linspace(-2, 2, 1000)
alpha = 0.5  # 可以调整 alpha 的值
y = prelu(x, alpha)
y1 = prelu_derivative(x, alpha)# 绘制图形
plt.figure(figsize=(12, 8))
ax = plt.gca()
plt.plot(x, y, label='PReLU')
plt.plot(x, y1, label='Derivative')
plt.title(f'PReLU (alpha={alpha}) and Partial Derivative')# 设置上边和右边无边框
ax.spines['right'].set_color('none')
ax.spines['top'].set_color('none')# 设置 x 坐标刻度数字或名称的位置
ax.xaxis.set_ticks_position('bottom')# 设置边框位置
ax.spines['bottom'].set_position(('data', 0))
ax.yaxis.set_ticks_position('left')
ax.spines['left'].set_position(('data', 0))plt.legend(loc=2)
plt.show()

优缺点

PReLU函数相对于ReLU函数的改进
1. 在负值域，PReLU的斜率较小，这也可以避免Dead ReLU问题。与ELU相比，PReLU在负值域是线性运算。尽管斜率很小，但不会趋于 0 。
2. 公式与Leaky ReLu相似，但并不完全一样。 $\alpha$ 可以是常数，或自适应调整的参数。也就是说，如果让 $\alpha$ 自适应，那么PReLu会在反向传播时更新参数。
3. 参数通常为 0 到 1 之间的数字，并且通常相对较小。
  （1）如果 $\alpha$ = 0，则变为ReLU。
  （2）如果 $\alpha$ > 0，则变为leaky ReLU。
  （3）如果 $\alpha$ 是可学习的参数，则变为PReLU。

PReLU 的优点
1. 参数可训练：PReLU具有可训练的参数alpha，它可以随着训练的进行而自动调整，从而使得模型能够更好地适应不同的数据集。
2. 解决梯度消失问题：由于PReLU在输入小于0时梯度不为0，因此可以避免训练过程中的梯度消失问题。
3. 增强模型表达能力：与ReLU函数相比，PReLU函数能够更好地处理负数输入，提升了模型的表达能力和学习能力。
4. 提高模型的鲁棒性：PReLU函数的参数alpha能够根据数据自动调整，增强了模型对于噪声和异常值的鲁棒性。
5. 良好的拟合能力：PReLU函数在负数输入时具有非线性特点，能够更好地拟合非线性的数据模式和任务。
6. 平滑性：PReLU函数在整个定义域上都是光滑的，包括0点处。这种平滑性使得梯度计算更加稳定，有助于优化算法的训练过程。
PReLU 的缺点
1. 计算复杂度增加：由于PReLU需要额外的参数alpha，因此其计算复杂度比ReLU略高。
2. 参数选择敏感：alpha的值对模型的性能有很大影响，如果选择不当，可能会对模型的训练产生负面影响。
3. 增加模型复杂度：PReLU引入了可学习的参数alpha，这会增加模型的复杂度和训练时间。
4. 对异常值和噪声敏感：PReLU对异常值和噪声相对较为敏感，容易导致模型过拟合。

pytorch中的PReLU函数

代码

import torchf = torch.nn.PReLU(init=0.5) # 注意，alpha的初始值通过init设置，默认是0.25
x = torch.randn(2)prelu_x = f(x)print(f"x: \n{x}")
print(f"prelu_x:\n{prelu_x}")"""输出"""
x: 
tensor([-0.8802,  0.2288])
prelu_x:
tensor([-0.4401,  0.2288], grad_fn=<PreluKernelBackward0>)

注意，alpha的初始值通过init设置，默认是0.25,当前设置为0.5

tensorflow 中的PReLU函数

代码

python: 3.10.9

tensorflow: 2.18.0

import tensorflow as tf# 创建 PReLU 激活函数层
prelu = tf.keras.layers.PReLU(alpha_initializer=tf.initializers.constant(0.5))# 生成随机输入
x = tf.random.normal([2])# 应用 PReLU 激活函数
prelu_x = prelu(x)print(f"x: \n{x}")
print(f"prelu_x:\n{prelu_x}")"""输出"""
x: 
[-2.5138278  -0.34734365]
prelu_x:
[-1.2569139  -0.17367183]

注意，alpha的初始值通过alpha_initializer设置，不可直接传入数值，需要使用

tf.initializers.constant(0.5)

的这种方式,当前设置为0.5。

神经网络常见激活函数 5-PReLU函数

文章目录 PReLU函数导函数函数和导函数图像优缺点pytorch中的PReLU函数tensorflow 中的PReLU函数 PReLU 参数化修正线性单元:Parametric ReLU 函数导函数 PReLU函数 P R e L U { x x > 0 α x x < 0 ( α 是可训练参数 ) \rm PReLU \left\{ \begin{array}{} x \qua…...

编程日记 2025/2/10 12:03:39

2025我的第二次社招，写在春招之季

先说一个好消息，C那些事 4w star了！ 前面断更了一个月，本篇文章就可以看到原因，哈哈。大家好，我叫光城，腾讯实习转正做后端开发，后去小公司做数据库内核，经过这几年的成长与积累&am…...

编程日记 2025/2/10 12:00:36

Visual Studio Code中文出现黄色框子的解决办法

Visual Studio Code中文出现黄色框子的解决办法一、vsCode中文出现黄色框子-如图二、解决办法一、vsCode中文出现黄色框子-如图二、解决办法点击 “文件”点击 “首选项”点击 “设置” 搜索框直接搜索unicode选择“文本编辑器”，往下滑动，找到“Un…...

编程日记 2025/2/10 11:59:35

threejs开源代码之-旋转的彩色立方体

效果：旋转的彩色立方体效果描述： 一个立方体在场景中旋转。立方体的每个面有不同的颜色。使用自定义着色器为立方体添加动态的光影效果。代码实现 import * as THREE from three; import { OrbitControls } from three/examples/jsm/controls/OrbitC…...

编程日记 2025/2/10 11:58:32

visual studio 2008的试用版评估期已结束的解决办法

visual studio 2008试用期过了后，再次启动时提示：visual studio的试用版评估期已结束。需要的工具：补丁文件PatchVS2008.exe 解决办法： 1.在“控制面板”-“添加删除程序”中选择visual studio 2008，点击“更改/卸载”…...

编程日记 2025/2/10 11:54:27

解锁 DeepSeek 模型高效部署密码：蓝耘平台深度剖析与实战应用

💖亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也…...

编程日记 2025/2/10 11:53:26

Http和Socks的区别？

HTTP 和 SOCKS 的区别 HTTP 和 SOCKS 都是用于网络通信的协议，但它们在工作原理、应用场景和实现方式上有显著的区别。以下是详细的对比和说明。一、HTTP 协议 1. 定义 HTTP（HyperText Transfer Protocol）是用于传输超文本数据的应用层协…...

编程日记 2025/2/10 11:51:24

1、使用msi库 #include <mmsystem.h> #pragma comment(lib,"winmm.lib") .......//打开文件MCI_OPEN_PARMS mciOpen; mciOpen.lpstrDeviceType _T("mpegvideo"); mciOpen.lpstrElementName _T("c://1.mp3"); MCIERROR mciError mci…...

编程日记 2025/2/10 11:49:21

Docker 部署 verdaccio 搭建 npm 私服

一、镜像获取 # 获取 verdaccio 镜像 docker pull verdaccio/verdaccio 二、修改配置文件 cd /wwwroot/opt/docker/verdaccio/conf vim config.yaml config.yaml 配置文件如下，可以根据自己的需要进行修改 # # This is the default configuration file. It all…...

编程日记 2025/2/10 11:48:19

49-拓展（1）

49-拓展（1） 扩展概述扩展可以为在当前 package 可见的类型（除函数、元组、接口）添加新功能。当不能破坏被扩展类型的封装性，但希望添加额外的功能时，可以使用扩展。可以添加的功能包括： …...

编程日记 2025/2/10 11:47:18

国产编辑器EverEdit - 在文件中查找和替换

1 在文件中查找和替换 1.1 应用场景某些场景，用户需要在所有工程文件中进行查找和替换关键词，比如：查找工程中哪些文件使用了某个常量。 1.2 使用方法选择主菜单查找 -> 在文件中查找和替换，或使用快捷键Ctrl Shift F&a…...

编程日记 2025/2/10 11:42:11

安全行业大模型SecLLM技术白皮书

在ChatGPT 呈现全球现象级热度时，通用大语言模型（Large Language Model, LLM）技术成为了推动创新和变革的关键驱动力。但由于安全行业的特殊性和复杂性，LLM 并不能满足其应用需求。安全行业大模型(Security Large Language Model,…...

编程日记 2025/2/10 11:41:09

基础入门-HTTP数据包红蓝队研判自定义构造请求方法请求头修改状态码判断

知识点： 1、请求头&返回包-方法&头修改&状态码等 2、数据包分析-红队攻击工具&蓝队流量研判 3、数据包构造-Reqable自定义添加修改请求一、演示案例-请求头&返回包-方法&头修改&状态码等数据包客户端请求Request 请求方法 …...

编程日记 2025/2/10 11:36:03

2025年日祭

本文将同步发表于洛谷（暂无法访问）、CSDN 与 Github 个人博客（暂未发布） 本蒟自2025.2.8开始半停课。任务计划（站外题与专题） 数了一下，通过人数比较高的题，也就是我准备补的题&a…...

编程日记 2025/2/10 11:33:57

git命令行删除远程分支、删除远程提交日志

目录 1、从本地通过命令行删除远程git分支2、删除已 commit 并 push 的记录 1、从本地通过命令行删除远程git分支 git push origin --delete feature/feature_xxx 删除远程分支 feature/feature_xxx 2、删除已 commit 并 push 的记录 git reset --hard 7b5d01xxxxxxxxxx 恢复到…...

编程日记 2025/2/10 11:31:55

centOS8安装MySQL8设置开机自动启动失败

提供一个终极解决方案虽然systemctl 更符合管理预期但是不能用使用一下命令修改配置文件、修改mysql.service全是问题 systemctl start mysqld systemctl enable mysqld systemctl daemon-reload完全不生效各种报错提示配置文件内容有问题 Main process exited, codeexite…...

编程日记 2025/2/10 11:30:53

对接DeepSeek

其实，整个对接过程很简单，就四步，获取key，找到接口文档，接口测试，代码对接。获取 KEY https://platform.deepseek.com/transactions 直接付款就是了（现在官网暂停充值2025年2月7日&#xff0…...

编程日记 2025/2/10 11:29:52

SpringSecurity高级用法

SpringSecurity的高级用法，包括自定义loginUrl携带参数，自定义认证校验逻辑，自定义权限校验逻辑。示例项目 https://github.com/qihaiyan/springcamp/tree/master/spring-advanced-security 一、概述在项目实际开发过程中，Spr…...

编程日记 2025/2/10 11:23:44

NLP_[2]-认识文本预处理

文章目录 1 认识文本预处理1 文本预处理及其作用2. 文本预处理中包含的主要环节2.1 文本处理的基本方法2.2 文本张量表示方法2.3 文本语料的数据分析2.4 文本特征处理2.5数据增强方法2.6 重要说明 2 文本处理的基本方法1. 什么是分词2 什么是命名实体识别3 什么是词性标注 1 认…...

编程日记 2025/2/10 11:17:38

字符设备驱动开发

驱动就是获取外设、传感器数据和控制外设。数据会提交给应用程序。 Linux 驱动编译既要编写一个驱动，还要编写一个简单的测试应用程序。而单片机下驱动和应用都是放在一个文件里，也就是杂在一块。而 Linux 则是分开了。一、字符设备驱动开发流程 Lin…...

编程日记 2025/2/10 11:16:37

java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别

UnsatisfiedLinkError 在对接硬件设备中，我们会遇到使用 java 调用 dll文件的情况，此时大概率出现UnsatisfiedLinkError链接错误，原因可能有如下几种类名错误包名错误方法名参数错误使用 JNI 协议调用，结果 dll 未实现 JNI 协…...

编程新知 2025/10/6 16:38:04

django filter 统计数量按属性去重

在Django中，如果你想要根据某个属性对查询集进行去重并统计数量，你可以使用values()方法配合annotate()方法来实现。这里有两种常见的方法来完成这个需求： 方法1：使用annotate()和Count 假设你有一个模型Item，并且你想…...

编程新知 2026/1/11 2:37:51

vue3 字体颜色设置的多种方式

在Vue 3中设置字体颜色可以通过多种方式实现，这取决于你是想在组件内部直接设置，还是在CSS/SCSS/LESS等样式文件中定义。以下是几种常见的方法： 1. 内联样式你可以直接在模板中使用style绑定来设置字体颜色。 <template><div :s…...

编程新知 2026/2/4 20:47:44

Swagger和OpenApi的前世今生

Swagger与OpenAPI的关系演进是API标准化进程中的重要篇章，二者共同塑造了现代RESTful API的开发范式。本期就扒一扒其技术演进的关键节点与核心逻辑： 🔄 一、起源与初创期：Swagger的诞生（2010-2014） 核心…...

编程新知 2026/1/25 9:08:41

【7色560页】职场可视化逻辑图高级数据分析PPT模版

7种色调职场工作汇报PPT，橙蓝、黑红、红蓝、蓝橙灰、浅蓝、浅绿、深蓝七种色调模版【7色560页】职场可视化逻辑图高级数据分析PPT模版：职场可视化逻辑图分析PPT模版https://pan.quark.cn/s/78aeabbd92d1...

编程新知 2026/1/23 12:22:14

Qemu arm操作系统开发环境

使用qemu虚拟arm硬件比较合适。步骤如下： 安装qemu apt install qemu-system安装aarch64-none-elf-gcc 需要手动下载，下载地址：https://developer.arm.com/-/media/Files/downloads/gnu/13.2.rel1/binrel/arm-gnu-toolchain-13.2.rel1-x…...

编程新知 2026/1/31 9:18:40

掌握 HTTP 请求：理解 cURL GET 语法

cURL 是一个强大的命令行工具，用于发送 HTTP 请求和与 Web 服务器交互。在 Web 开发和测试中，cURL 经常用于发送 GET 请求来获取服务器资源。本文将详细介绍 cURL GET 请求的语法和使用方法。一、cURL 基本概念 cURL 是 "Client URL" 的缩写…...

编程新知 2025/7/9 20:52:19

windows系统MySQL安装文档

概览：本文讨论了MySQL的安装、使用过程中涉及的解压、配置、初始化、注册服务、启动、修改密码、登录、退出以及卸载等相关内容，为学习者提供全面的操作指导。关键要点包括： 解压 ：下载完成后解压压缩包，得到MySQL 8.…...

编程新知 2026/2/6 10:22:29

9-Oracle 23 ai Vector Search 特性知识准备

很多小伙伴是不是参加了免费认证课程（限时至2025/5/15） Oracle AI Vector Search 1Z0-184-25考试，都顺利拿到certified了没。各行各业的AI 大模型的到来，传统的数据库中的SQL还能不能打，结构化和非结构的话数据如何和…...

编程新知 2026/2/7 23:29:43

用 Rust 重写 Linux 内核模块实战：迈向安全内核的新篇章

用 Rust 重写 Linux 内核模块实战：迈向安全内核的新篇章摘要： 操作系统内核的安全性、稳定性至关重要。传统 Linux 内核模块开发长期依赖于 C 语言，受限于 C 语言本身的内存安全和并发安全问题，开发复杂模块极易引入难以…...

编程新知 2025/10/25 19:31:21

神经网络常见激活函数 5-PReLU函数

文章目录

PReLU

函数+导函数

函数和导函数图像

优缺点

pytorch中的PReLU函数

tensorflow 中的PReLU函数

相关文章：

神经网络常见激活函数 5-PReLU函数

2025我的第二次社招，写在春招之季

Visual Studio Code中文出现黄色框子的解决办法

threejs开源代码之-旋转的彩色立方体

visual studio 2008的试用版评估期已结束的解决办法

解锁 DeepSeek 模型高效部署密码：蓝耘平台深度剖析与实战应用

Http和Socks的区别？

VC播放mp3的方法

Docker 部署 verdaccio 搭建 npm 私服

49-拓展（1）

国产编辑器EverEdit - 在文件中查找和替换

安全行业大模型SecLLM技术白皮书

基础入门-HTTP数据包红蓝队研判自定义构造请求方法请求头修改状态码判断

2025年日祭

git命令行删除远程分支、删除远程提交日志

centOS8安装MySQL8设置开机自动启动失败

对接DeepSeek

SpringSecurity高级用法

NLP_[2]-认识文本预处理

字符设备驱动开发

java调用dll出现unsatisfiedLinkError以及JNA和JNI的区别

django filter 统计数量按属性去重

vue3 字体颜色设置的多种方式

Swagger和OpenApi的前世今生

【7色560页】职场可视化逻辑图高级数据分析PPT模版

Qemu arm操作系统开发环境

掌握 HTTP 请求：理解 cURL GET 语法

windows系统MySQL安装文档

9-Oracle 23 ai Vector Search 特性知识准备

用 Rust 重写 Linux 内核模块实战：迈向安全内核的新篇章