当前位置：首页 > news >正文

【NLP 37、激活函数 ③ relu激活函数】

news 2026/2/10 7:00:08

—— 25.2.23

ReLU广泛应用于卷积神经网络（CNN）和全连接网络，尤其在图像分类（如ImageNet）、语音识别等领域表现优异。其高效性和非线性特性使其成为深度学习默认激活函数的首选

一、定义与数学表达式

ReLU（Rectified Linear Unit，修正线性单元）是一种分段线性激活函数，

其数学表达式为：ReLU(x)=max(0,x)

即当输入 x 大于 0 时，输出为 x；当 x≤0 时，输出为 0。

二、核心特点

非线性特性：通过引入分段线性特性，ReLU为神经网络引入非线性，使其能拟合复杂函数。

计算高效：仅通过阈值判断（x>0）即可完成计算，避免了指数运算（如Sigmoid、Tanh），显著提升速度。

缓解梯度消失：在 x>0 时梯度恒为 1，反向传播时梯度不会饱和，加速收敛。

稀疏激活性：负输入时输出为 0，导致部分神经元“休眠”，减少参数依赖和过拟合风险。

三、优点

简单高效：实现和计算成本低，适合深度网络。

收敛速度快：相比Sigmoid/Tanh，ReLU在训练中梯度更稳定，收敛更快。

非零中心性：输出范围为 [0,+∞)，虽非严格零中心，但简化了优化过程

四、局限性

Dead ReLU问题：若神经元输入长期为负，梯度恒为 0，导致权重无法更新，神经元“死亡”。

非零中心性：输出偏向非负值，可能影响梯度下降效率。

对初始化敏感：若学习率过高，负输入区域可能使神经元永久失效。

五、变体

Leaky ReLU：允许负输入时输出 αx（α为小常数，如0.01）。

PReLU（Parametric ReLU）：将 α 设为可学习参数，动态调整负区斜率。

ELU（Exponential Linear Unit）：负输入时输出 α(ex−1)，使输出均值接近零。

Swish：自门控激活函数，结合ReLU和Sigmoid特性，平滑且无上界。

六、代码示例

1.通过 `nn.ReLU()` 作为网络层

nn.ReLU() ：PyTorch 中的修正线性单元（ReLU）激活函数模块，用于神经网络中引入非线性。其功能是将输入张量中所有负值置为 0，保留正值不变

参数名称	类型	是否必填	说明
inplace	bool	否	是否原地操作（直接修改输入张量）。
默认值为 `False`，此时会返回新张量。若设为 `True`，则直接在原张量上操作。

import torch
import torch.nn as nn
import torch.optim as optim# 定义一个简单的网络，包含两个线性层和 ReLU 激活
class Net(nn.Module):def __init__(self):super(Net, self).__init__()self.fc1 = nn.Linear(784, 256)  # 输入层：784 → 256self.relu = nn.ReLU()           # ReLU 激活层self.fc2 = nn.Linear(256, 10)   # 输出层：256 → 10（如分类任务）def forward(self, x):x = self.relu(self.fc1(x))  # 在第一层后应用 ReLUx = self.fc2(x)return x# 初始化网络、损失函数和优化器
model = Net()
criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(model.parameters(), lr=0.01)# 输入数据示例（如 MNIST 图像，形状为 [batch_size, 784]）
input_data = torch.randn(32, 784)# 前向传播
output = model(input_data)
print(output.shape)  # 输出形状: (32, 10)

2. 直接使用 `torch.relu()` 函数

torch.relu()： PyTorch 中实现修正线性单元（ReLU）激活函数的函数

其数学表达式为：ReLU(x)=max(0,x)

参数名称	类型	是否必填	说明
`inplace`	`bool`	否	是否原地修改输入张量。若为 `True`，则直接修改输入张量以节省内存；若为 `False`（默认），则返回新张量。

import torch# 示例输入
x = torch.tensor([-1.0, 0.0, 1.0])# 应用 ReLU 函数（非原地）
y = torch.relu(x)
print(y)  # 输出: tensor([0., 0., 1.])# 应用 ReLU 函数（原地）
torch.relu_(x)
print(x)  # 输出: tensor([0., 0., 1.])，原始张量被修改[1,7](@ref)。

【NLP 37、激活函数 ③ relu激活函数】

—— 25.2.23 ReLU广泛应用于卷积神经网络（CNN）和全连接网络，尤其在图像分类（如ImageNet）、语音识别等领域表现优异。其高效性和非线性特性使其成为深度学习默认激活函数的首选一、定义与数学表达式 ReLU&#xff0…...

编程日记 2025/2/25 21:46:00

量子计算的威胁，以及企业可以采取的措施

当谷歌、IBM、Honeywell和微软等科技巨头纷纷投身量子计算领域时，一场技术军备竞赛已然拉开帷幕。量子计算虽能为全球数字经济带来巨大价值，但也有可能对相互关联的系统、设备和数据造成损害。这一潜在影响在全球网络安全领域引起了强烈关注。也正因如…...

编程日记 2025/2/25 21:44:57

C#初级教程（5）——解锁 C# 变量的更多奥秘：从基础到进阶的深度指南

一、变量类型转换：隐式与显式的门道 （一）隐式转换：编译器的 “贴心小助手” 隐式转换是编译器自动进行的类型转换，无需开发者手动干预。这种转换通常发生在将取值范围小的数据类型赋值给取值范围大的数据类型时&#…...

编程日记 2025/2/25 21:43:54

Pytorch实现之GIEGAN（生成器信息增强GAN）训练自己的数据集

简介简介：在训练数据样本之前首先利用VAE来推断潜在空间中不同类的分布，用于后续的训练，并使用它来初始化GAN。与ACGAN和BAGAN不同的是，提出的GIEGAN有一个分类器结构，这个分类器主要判断生成的图像或者样本图像属于哪个类，而鉴别器仅判断图像是来自于生成器还是真实样…...

编程日记 2025/2/25 21:41:48

使用PHP接入纯真IP库：实现IP地址地理位置查询

引言在日常开发中，我们经常需要根据用户的IP地址获取其地理位置信息，例如国家、省份、城市等。纯真IP库（QQWry）是一个常用的IP地址数据库，提供了丰富的IP地址与地理位置的映射关系。本文将介绍如何使用PHP接入纯真IP库，并通过一个完整的案例演示如何实现IP地址的地理位…...

编程日记 2025/2/25 21:40:38

计算机毕业设计SpringBoot+Vue.jst0甘肃非物质文化网站(源码+LW文档+PPT+讲解)

温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 温馨提示：文末有 CSDN 平台官方提供的学长联系方式的名片！ 作者简介：Java领…...

编程日记 2025/2/25 21:39:34

无人机实战系列（三）本地摄像头+远程GPU转换深度图

这篇文章将结合之前写的两篇文章无人机实战系列（一）在局域网内传输数据和无人机实战系列（二）本地摄像头 Depth-Anything V2 实现了以下功能： 本地笔记本摄像头发布图像远程GPU实时处理（无回传&#…...

编程日记 2025/2/25 21:29:16

七.智慧城市数据治理平台架构

一、整体架构概览智慧城市数据治理平台架构描绘了一个全面的智慧城市数据治理平台，旨在实现城市数据的统一管理、共享和应用，为城市运行、管理和决策提供数据支撑。整体架构呈现出分层、模块化、集约化的特点，并强调数据安全和标准规范。智…...

编程日记 2025/2/25 21:28:10

UE5从入门到精通之多人游戏编程常用函数

文章目录前言一、权限与身份判断函数1. 服务器/客户端判断2. 网络角色判断二、网络同步与复制函数1. 变量同步2. RPC调用三、连接与会话管理函数1. 玩家连接控制2. 网络模式判断四、实用工具函数前言 UE5给我们提供了非常强大的多人网路系统，让我们可以很方便的开发多人游戏…...

编程日记 2025/2/25 21:26:05

RK3399 Android7 Ethernet Tether功能实现

在Android机顶盒产品，对于以太网与WiFi间的关系有如下： 1、以太网与WiFi STA均可连接路由器访问外网； 2、WiFi AP功能可以共享以太网访问外网。而本文档是对于2的变动，实现通过以太网共享WiFi STA访问外网，并在此基础上可以共享4G/5G网络（设备支持情况下），下面是相应…...

编程日记 2025/2/25 21:24:01

【论文学习】基于规模化Transformer模型的低比特率高质量语音编码

以下文章基于所提供的文档内容撰写，旨在对该论文“Scaling Transformers for Low-Bitrate High-Quality Speech Coding”进行较为系统和深入的分析与总结。论文地址：https://arxiv.org/pdf/2411.19842 一、研究背景与动机自20世纪70年代以来&#xff…...

编程日记 2025/2/25 21:21:47

Pretraining Language Models with Text-Attributed Heterogeneous Graphs

Pretraining Language Models with Text-Attributed Heterogeneous Graphs EMNLP 推荐指数：#paper/⭐⭐# 贡献： 我们研究了在更复杂的数据结构上预训练LM的问题，即，TAHG。与大多数只能从每个节点的文本描述中学习的PLM不同&…...

编程日记 2025/2/25 21:18:43

什么是将应用放在边缘服务器上创建？应用不是在用户手机上吗？边缘计算究竟如何优化？通过两个问题来辨析

元宇宙应用虽然可以在用户的手机等终端设备上运行，但大部分的计算和数据处理任务并不是完全在手机上完成的。元宇宙的运行需要庞大的计算资源和大量的数据交互，而这些是手机等终端设备难以独自承担的。因此，元宇宙应用需要借助边缘数据中心等…...

编程日记 2025/2/25 21:16:37

uni-app 系统学习，从入门到实战（二）—— 项目结构解析

全篇大概 2000 字（含代码），建议阅读时间 10min 一、UniApp 目录结构详解 UniApp 基于 Vue.js 开发，其目录结构遵循约定大于配置的原则，以下是一个标准项目的核心目录结构： pages # 页面目录（核…...

编程日记 2025/2/25 21:15:30

滴水逆向_引用_友元函数_运算符重载

作业： 运算符号重载实现。 struct Person { public:int x;int y; public:Person(){this->x 10;this->y 20;}Person(int x, int y){this->x x;this->y y;}//申明友元函数void Printf(const Person& p){printf("%d %d",p.x,p.y);}/…...

编程日记 2025/2/25 21:14:16

java医院多维度综合绩效考核源码，医院绩效管理系统，支持一键核算和批量操作，设有审核机制，允许数据修正

医院绩效考核管理系统，java医院绩效核算系统源码，采用多维度综合绩效考核的形式，针对院内实际情况分别对工作量、KPI指标、科研、教学、管理等进行全面考核。医院可结合实际需求，对考核方案中各维度进行灵活配置，对各维…...

编程日记 2025/2/25 21:13:06

科普：HTTP端口80和HTTPS端口443

你会发现，有的网址不带端口号，怎么回事？ HTTP协议默认端口：HTTP协议的默认端口是80。当用户在浏览器中输入一个没有指定端口的以http://开头的网址时，浏览器会自动使用80端口与服务器建立连接，进行超文本数…...

编程日记 2025/2/25 21:12:00

uniapp打包生产证书上架IOS全流程

第一步：生成生产证书上传CSR文件，windows系统电脑无法上传csr文件可以参考这个： windows下创建ios打包证书的详细流程_香蕉云编下载生产证书下载下来的cer生产证书在香蕉云编cer文件上传栏上传，然后生成p12文件生成p12文件…...

编程日记 2025/2/25 21:08:43

山东大学软件学院nosql实验一环境配置

环境：前端vue后端springboot 软件环境： MongoDB MongoDBCompass 实验步骤与内容： 在官网下载安装包（最新版） 配置环境环境变量在“高级系统设置-环境变量”中，可以将MongoDB添加到环境变量Path中(D:\…...

编程日记 2025/2/25 21:04:38

【2024 CSDN博客之星】大学四年，我如何在CSDN实现学业与事业的“双逆袭”？

前言： Hello大家好，我是Dream。不知不觉2024年已经过去，自己也马上迈入23岁，感慨时间飞快，从19岁刚入大学加入CSDN，到现在大学毕业已经整整四年了。CSDN陪伴我走过了最青涩的四年大学时光，在这里…...

编程日记 2025/2/25 21:01:28

变量 varablie 声明- Rust 变量 let mut 声明与 C/C++ 变量声明对比分析

一、变量声明设计：let 与 mut 的哲学解析 Rust 采用 let 声明变量并通过 mut 显式标记可变性，这种设计体现了语言的核心哲学。以下是深度解析： 1.1 设计理念剖析安全优先原则：默认不可变强制开发者明确声明意图 let x 5; …...

编程新知 2025/9/28 20:12:12

3.3.1_1 检错编码（奇偶校验码）

从这节课开始，我们会探讨数据链路层的差错控制功能，差错控制功能的主要目标是要发现并且解决一个帧内部的位错误，我们需要使用特殊的编码技术去发现帧内部的位错误，当我们发现位错误之后，通常来说有两种解决方案。第一…...

编程新知 2026/1/30 3:28:14

剑指offer20_链表中环的入口节点

链表中环的入口节点给定一个链表，若其中包含环，则输出环的入口节点。若其中不包含环，则输出null。数据范围节点 val 值取值范围 [ 1 , 1000 ] [1,1000] [1,1000]。节点 val 值各不相同。链表长度 [ 0 , 500 ] [0,500] [0,500]。 …...

编程新知 2026/1/31 6:09:22

【论文笔记】若干矿井粉尘检测算法概述

总的来说，传统机器学习、传统机器学习与深度学习的结合、LSTM等算法所需要的数据集来源于矿井传感器测量的粉尘浓度，通过建立回归模型来预测未来矿井的粉尘浓度。传统机器学习算法性能易受数据中极端值的影响。YOLO等计算机视觉算法所需要的数据集来源于…...

编程新知 2025/10/14 10:52:24

Keil 中设置 STM32 Flash 和 RAM 地址详解

文章目录 Keil 中设置 STM32 Flash 和 RAM 地址详解一、Flash 和 RAM 配置界面（Target 选项卡）1. IROM1（用于配置 Flash）2. IRAM1（用于配置 RAM）二、链接器设置界面（Linker 选项卡）1. 勾选“Use Memory Layout from Target Dialog”2. 查看链接器参数（如果没有勾选上面…...

编程新知 2026/2/7 0:28:16

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个生活电费的缴纳和查询小程序

一、项目初始化与配置 1. 创建项目 ohpm init harmony/utility-payment-app 2. 配置权限 // module.json5 {"requestPermissions": [{"name": "ohos.permission.INTERNET"},{"name": "ohos.permission.GET_NETWORK_INFO"…...

编程新知 2025/11/26 13:15:57