激活函数解析:神经网络背后的“驱动力”
神经网络中的激活函数(Activation Function)是其运作的核心组件之一,它们决定了神经元如何根据输入信号进行“激活”,进而影响整个模型的表现。理解激活函数的工作原理对于设计和优化神经网络至关重要。本篇博客将深入浅出地介绍各种常见激活函数,帮助大家掌握这一基础概念。
目录
什么是激活函数?
激活函数的作用:
常见的激活函数
1. Sigmoid 函数(S型函数)
编辑2. Tanh 函数(双曲正切函数)
编辑
3. ReLU(Rectified Linear Unit)函数
4. Leaky ReLU 函数
5. Softmax 函数
总结
什么是激活函数?
在神经网络中,每个神经元都会接收来自前一层神经元的输入信号,这些输入信号经过加权和求和后,需要通过激活函数进行处理。激活函数的作用是决定神经元是否应该被激活,从而影响输出值。简单来说,激活函数决定了一个神经元对其输入信号的反应程度。
激活函数的作用:
- 非线性化:神经网络中的激活函数通常是非线性的,这使得网络能够学习和表示复杂的关系。没有非线性的激活函数,无论网络有多少层,其等价于一个简单的线性模型。
- 引入阈值:激活函数决定了神经元的输出值是否激活,类似于生物神经元的工作方式。
- 限制输出范围:激活函数可以对输出进行一定的限制,使得模型更加稳定。
常见的激活函数
接下来,我们将介绍几种常见的激活函数,并分析它们的优缺点。
1. Sigmoid 函数(S型函数)
Sigmoid 函数是最经典的激活函数之一,其数学表达式为:
特点:
- 输出范围:0 到 1,适用于二分类问题,输出可以被看作概率。
- 平滑和连续:Sigmoid 函数是平滑的,且具有单调性。
缺点:
- 梯度消失:当输入值过大或过小时,梯度几乎为 0,导致训练时梯度消失,难以进行有效学习。
- 输出不对称:Sigmoid 的输出范围是 [0, 1],导致其在正负输入时表现不对称,可能影响模型表现。
图片示例如下:
2. Tanh 函数(双曲正切函数)
Tanh 函数是 Sigmoid 函数的改进版,其数学表达式为:
特点:
- 输出范围:-1 到 1,具有更强的对称性。
- 平滑和连续:Tanh 函数与 Sigmoid 函数类似,具有平滑的曲线。
优点:
- 对称性:Tanh 函数的输出范围是对称的,负数输出可以更好地表示负向激活。
缺点:
- 梯度消失:和 Sigmoid 类似,当输入值过大或过小时,梯度接近于零,训练时容易出现梯度消失问题。
3. ReLU(Rectified Linear Unit)函数
ReLU 是目前最常用的激活函数之一,其数学表达式为:
特点:
- 输出范围:当输入大于 0 时,输出等于输入;否则输出为 0。
- 计算简单:ReLU 函数计算非常简单,仅需要比较输入值和 0,极大提高了训练效率。
优点:
- 避免梯度消失:由于其线性特性,当输入为正时,ReLU 的梯度为常数,避免了梯度消失问题。
- 收敛速度快:ReLU 可以加速神经网络的收敛速度,是深度学习中最常用的激活函数。
缺点:
- 死亡神经元问题:如果输入总是负数,神经元将“死亡”,导致其输出始终为 0,无法参与学习。

4. Leaky ReLU 函数
Leaky ReLU 是对标准 ReLU 的改进版本。其数学表达式为:
其中, 是一个小的常数,通常为 0.01。
特点:
- 输出范围:负输入不会被完全抑制,而是乘以一个小的系数 α\alphaα。
- 避免神经元死亡:即使输入值为负,Leaky ReLU 也能提供一个很小的梯度,避免神经元“死亡”。
优点:
- 避免死亡神经元问题:通过给负数输入提供一个小的斜率,Leaky ReLU 避免了 ReLU 中的死亡神经元问题。
- 收敛速度快:类似于 ReLU,Leaky ReLU 也能加速训练过程。

5. Softmax 函数
Softmax 函数常用于多分类问题,其数学表达式为:
特点:
- 输出范围:Softmax 函数将输出转换为概率分布,每个输出值的范围是 (0, 1),且所有输出值之和为 1。
- 多分类应用:常用于多分类任务的最后一层,将原始输出值转换为类别概率。
优点:
- 概率输出:Softmax 输出的每个值可以解释为某个类别的概率,非常适合多分类问题。
总结
激活函数是神经网络中不可或缺的组成部分,它们让网络能够学习复杂的非线性关系。不同的激活函数具有不同的特点,适用于不同的任务和数据集。在实际应用中,ReLU 和其变种(如 Leaky ReLU)因其简单高效而成为深度学习中最常用的激活函数。而在多分类问题中,Softmax 函数是经典的选择。
在选择激活函数时,需要根据问题的特性以及网络结构来进行选择。希望通过本篇博客,大家能对激活函数有更清晰的认识,并在实际应用中作出更合适的选择。
相关文章:
激活函数解析:神经网络背后的“驱动力”
神经网络中的激活函数(Activation Function)是其运作的核心组件之一,它们决定了神经元如何根据输入信号进行“激活”,进而影响整个模型的表现。理解激活函数的工作原理对于设计和优化神经网络至关重要。本篇博客将深入浅出地介绍各…...
【开源免费】基于SpringBoot+Vue.JS水果购物网站(JAVA毕业设计)
博主说明:本文项目编号 T 065 ,文末自助获取源码 \color{red}{T065,文末自助获取源码} T065,文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析…...
推荐一款多物理场模拟仿真软件:STAR-CCM+
Siemens STAR-CCM是一款功能强大的计算流体力学(CFD)软件,由西门子公司推出。它集成了现代软件工程技术、先进的连续介质力学数值技术和卓越的设计,为工程师提供了一个全面的多物理场仿真平台。主要特点与优势:多物理场仿真、自动化与高效、高…...
React Hooks在现代前端开发中的应用
💓 博客主页:瑕疵的CSDN主页 📝 Gitee主页:瑕疵的gitee主页 ⏩ 文章专栏:《热点资讯》 React Hooks在现代前端开发中的应用 React Hooks在现代前端开发中的应用 React Hooks在现代前端开发中的应用 引言 React Hooks …...
重学SpringBoot3-整合Quartz定时任务
更多SpringBoot3内容请关注我的专栏:《SpringBoot3》 期待您的点赞👍收藏⭐评论✍ Quartz 是一个开源的任务调度框架,用于在应用程序中创建、管理和调度定时任务。将 Quartz 和 Spring Boot 3 结合,可以轻松实现定时任务的灵活管理…...
STM32单片机WIFI语音识别智能衣柜除湿消毒照明
实践制作DIY- GC0196-WIFI语音识别智能衣柜 一、功能说明: 基于STM32单片机设计-WIFI语音识别智能衣柜 二、功能介绍: STM32F103C系列最小系统板LCD1602显示器ULN2003控制的步进电机(柜门开关)5V加热片直流风扇紫外消毒灯DHT11…...
spring中entity的作用
在Spring框架中,特别是结合Spring Data JPA(Java Persistence API)时,Entity类用于表示数据库中的表。这些类通常用于ORM(对象关系映射),即将对象模型与关系型数据库中的表进行映射。以下是Enti…...
2019年下半年试题二:论软件系统架构评估及其应用
论文库链接:系统架构设计师论文 论文题目 对于软件系统,尤其是大规模复杂软件系统而言,软件系统架构对于确保最终系统的质量具有十分重要的意义。在系统架构设计结束后,为保证架构设计的合理性、完整性和针对性,保证系…...
网络自动化04:python实现ACL匹配信息(主机与主机信息)
目录 背景分析代码代码解读代码总体结构1. load_pattern_from_excel 函数2. match_and_append_pattern 函数3. main 函数总结 最终的效果: 今天不分享netmiko,今天分享一个用python提升工作效率的小案例:acl梳理时的信息匹配。 背景 最近同事…...
字典树介绍以及C++实现
字典树的概念 字典树(Trie),又称为前缀树或单词查找树,是一种树形数据结构,主要用于存储具有相同前缀的字符串集合。它特别适合用于词典中的单词查找、自动补全、拼写检查等应用。 字典树算法的核心思想就是每层存入…...
【C++】用红黑树封装set和map
在C标准库中,set容器和map容器的底层都是红黑树,它们的各种接口都是基于红黑树来实现的,我们在这篇文章中已经模拟实现了红黑树 ->【C】红黑树,接下来我们在此红黑树的基础上来看看如何封装set和map。 一、共用一颗红黑树 我…...
【大数据测试HDFS + Flask详细教程与实例】
大数据测试HDFS Flask 1. 环境准备安装工具安装Hadoop(以单机模式为例)安装Flask和HDFS Python客户端 2. HDFS Flask基本架构基本文件结构 3. 创建Flask应用与与HDFS交互步骤1:配置HDFS连接步骤2:构建Flask应用 4. 创建前端界面…...
高级java每日一道面试题-2024年10月31日-RabbitMQ篇-RabbitMQ中vhost的作用是什么?
如果有遗漏,评论区告诉我进行补充 面试官: RabbitMQ中vhost的作用是什么? 我回答: 在Java高级面试中,关于RabbitMQ中vhost(虚拟主机)的作用是一个重要且常见的考点。以下是对vhost的详细解释: 一、vhost的基本概念 vhost&am…...
【日常记录-Java】代码配置Logback
1. 简介 在Logback中,推荐使用配置文件(如logback.xml或logback-spring.xml)来设置日志记录的行为。但在实际应用中,会有动态配置logback的需求。此时可通过编程的方式直接操作LoggerContext以及相关的Logger、Appender、Encoder等…...
HTTP常见的请求头有哪些?都有什么作用?在 Web 应用中使用这些请求头?
HTTP 请求头(Request Headers)用于在 HTTP 请求中携带额外的信息,帮助服务器更好地处理请求。以下是一些常见的 HTTP 请求头及其作用: 常见请求头及其作用 1. Accept 作用:告知服务器客户端可以接受的内容类型。示例…...
电信数据清洗案例:利用MapReduce实现高效数据预处理
电信数据清洗案例:利用MapReduce实现高效数据预处理 在大数据时代,电信行业积累了大量的用户通话、短信、上网等行为数据。在数据分析和机器学习模型训练前,对这些数据进行清洗是至关重要的一步。MapReduce 是一种高效的数据处理模型&#x…...
react 中 FC 模块作用
React.FC 是一个泛型类型,用于定义函数组件的类型 一、类型定义和代码可读性 1. 明确组件类型 使用React.FC定义一个组件时,使得组件的输入(props)和输出(返回的 React 元素)都有明确的类型定义。 impo…...
多模态大模型(1)--CLIP
CLIP(Contrastive Language-Image Pre-training)模型是一种多模态预训练神经网络,由OpenAI在2021年发布。它通过对比学习的方式,将图像和文本映射到同一个向量空间中,从而实现跨模态的检索和分类。下面介绍其基础功能&…...
opencv入门学习总结
opencv学习总结 不多bb,直接上代码!!! 案例一: import cv2 # 返回当前安装的 OpenCV 库的版本信息 并且是字符串格式 print(cv2.getVersionString()) """ 作用:它可以读取不同格式的图像文…...
C/C++内存管理 | new的机制 | 重载自己的operator new
一、C/C内存分布 1. 内存分区 栈又叫堆栈–非静态局部变量/函数参数/返回值等等,栈是向下增长的。内存映射段是高效的I/O映射方式,用于装载一个共享的动态内存库。用户可使用系统接口创建共享共享内存,做进程间通信 .堆用于程序运行时动态内…...
模型参数、模型存储精度、参数与显存
模型参数量衡量单位 M:百万(Million) B:十亿(Billion) 1 B 1000 M 1B 1000M 1B1000M 参数存储精度 模型参数是固定的,但是一个参数所表示多少字节不一定,需要看这个参数以什么…...
.Net框架,除了EF还有很多很多......
文章目录 1. 引言2. Dapper2.1 概述与设计原理2.2 核心功能与代码示例基本查询多映射查询存储过程调用 2.3 性能优化原理2.4 适用场景 3. NHibernate3.1 概述与架构设计3.2 映射配置示例Fluent映射XML映射 3.3 查询示例HQL查询Criteria APILINQ提供程序 3.4 高级特性3.5 适用场…...
Unit 1 深度强化学习简介
Deep RL Course ——Unit 1 Introduction 从理论和实践层面深入学习深度强化学习。学会使用知名的深度强化学习库,例如 Stable Baselines3、RL Baselines3 Zoo、Sample Factory 和 CleanRL。在独特的环境中训练智能体,比如 SnowballFight、Huggy the Do…...
Aspose.PDF 限制绕过方案:Java 字节码技术实战分享(仅供学习)
Aspose.PDF 限制绕过方案:Java 字节码技术实战分享(仅供学习) 一、Aspose.PDF 简介二、说明(⚠️仅供学习与研究使用)三、技术流程总览四、准备工作1. 下载 Jar 包2. Maven 项目依赖配置 五、字节码修改实现代码&#…...
Java + Spring Boot + Mybatis 实现批量插入
在 Java 中使用 Spring Boot 和 MyBatis 实现批量插入可以通过以下步骤完成。这里提供两种常用方法:使用 MyBatis 的 <foreach> 标签和批处理模式(ExecutorType.BATCH)。 方法一:使用 XML 的 <foreach> 标签ÿ…...
[ACTF2020 新生赛]Include 1(php://filter伪协议)
题目 做法 启动靶机,点进去 点进去 查看URL,有 ?fileflag.php说明存在文件包含,原理是php://filter 协议 当它与包含函数结合时,php://filter流会被当作php文件执行。 用php://filter加编码,能让PHP把文件内容…...
学习一下用鸿蒙DevEco Studio HarmonyOS5实现百度地图
在鸿蒙(HarmonyOS5)中集成百度地图,可以通过以下步骤和技术方案实现。结合鸿蒙的分布式能力和百度地图的API,可以构建跨设备的定位、导航和地图展示功能。 1. 鸿蒙环境准备 开发工具:下载安装 De…...
从物理机到云原生:全面解析计算虚拟化技术的演进与应用
前言:我的虚拟化技术探索之旅 我最早接触"虚拟机"的概念是从Java开始的——JVM(Java Virtual Machine)让"一次编写,到处运行"成为可能。这个软件层面的虚拟化让我着迷,但直到后来接触VMware和Doc…...
TJCTF 2025
还以为是天津的。这个比较容易,虽然绕了点弯,可还是把CP AK了,不过我会的别人也会,还是没啥名次。记录一下吧。 Crypto bacon-bits with open(flag.txt) as f: flag f.read().strip() with open(text.txt) as t: text t.read…...
聚六亚甲基单胍盐酸盐市场深度解析:现状、挑战与机遇
根据 QYResearch 发布的市场报告显示,全球市场规模预计在 2031 年达到 9848 万美元,2025 - 2031 年期间年复合增长率(CAGR)为 3.7%。在竞争格局上,市场集中度较高,2024 年全球前十强厂商占据约 74.0% 的市场…...

