当前位置：首页 > news >正文

深度学习5 神经网络

news 2026/2/10 19:13:22

生物神经网络是指人的大脑，这是人工神经网络的技术原型。根据生物神经网络的原理，人们用计算机复现了简化的神经网络。当然，人工神经网络是机器学习的一大分支。

1.基本组成

1.1神经元

神经元是神经网络的基本组成。激活函数又称作激励函数、传输函数。

1.2 层

层其实就是由多个上面的神经元模型构建起来的模型。一层可以有多个神经元，多个层就构成一个神经网络。

这是一个含有3个神经元的单层网络,每一个输入都跟每一个神经元有连接，每一个连接的权重都不一样；输入的数量和神经元的数量不用相等；每一个神经元都可以使用不同的传输函数，每一个的输出都是不同的。也可以把激活函数和偏置理解成神经元的内部属性，毕竟每一个神经元只有一个激活函数和一个偏置。

2.反向传播（BP）

BP 算法是神经网络的核心所在,模型有权重和偏置，通过反向，输入通过权重和偏置得到最终的输出，但是输出的结果肯定与想要的结果有偏差。通过 BP 算法来更新模型的权重和偏置，以使得改变后的模型的输出值与想要的结果更为相近。

向模型中传入数据，数据经过每一层的偏置和层与层之间的权重矩阵，最后会得到一个预测值。这个预测值与真实值之间存在损失函数(Cost Function)。

3.反向传播神经网络

广义的BP 神经网络，是指一种反向传播的思想，这个思想贯穿整个深度学习当中，不管是卷积神经网络(Convolutional Neural Networks,CNN)还是循环神经网络 (Recurrent Neural Network,RNN),都继承了这样的思想。至于狭义的 BP 神经网络，其实就是全连接网络，每一层都是FC(Full-Connected)层，从输入层到隐含层再到输出层。至于全连接层，就是之前讲的“层”概念。使用反向传播不断更新参数，就是训练神经网络的本质。经常听到的多层感知机(Multi Layer Perceptron,MLP)其实就是狭义的BP 神经网络，也就是全连接网络。

4.卷积运算

卷积只是一个为了方便计算而定义的概念，是一个符号，是一个像加减乘除的运算。原图像的数字被卷积核挡住了。被卷积核盖住的原图的那一部分就称为卷积核的视野域。当卷积核的尺寸越大，那么卷积核的视野域也就越大。

5.卷积层

此处引入相关定义：步长(Stride) 、填充(Padding)、通道(Channel) 和特征图(Feature Map)。

一个5×5的图片被3×3卷积核卷积之后就是3×3的图像，如果想让卷积前后的图像具有相同尺寸，就要用到Padding,如图所示。

填充的输入并不都是0,有很多不同的模填充式，例如“根据原图边缘进行填充”等。把经过卷积层卷积的图片称为特征图。

6.池化层

池化层(Pool)比较简单，一般夹在卷积层中间，用于压缩数据和参数的量，也可减少过拟合现象。有时，也把池化层称为下采样层。池化层也有卷积核，但是这个卷积核只是取视野域内的最大值或者平均值，所以分为最大池化层和平均池化层。因为并没有参数需要调整，所以池化层不参与反向传播。池化层具有特征不变性(Invariance)。通俗地讲，就是假设有一个100×100的“狗”图片，假设池化之后变成50×50的图片，依然看得出来这是一只狗。池化层保留了图片中最重要的特征，去掉的是无关紧要的信息。但是这个过程使图片的尺寸改变了，所以可以认为：留下来的特征具有“尺度不变性”,是最能表达图像特征的特征图。

7.循环神经网络

前面讲解了全连接网络，也讲解了CNN, 现在又出现了RNN 。 CNN 已经可以处理图像分类、图像检测、图像生成的问题了，为何还要RNN 呢?

RNN 的特点就是具有一定的记忆。卷积网络可以识别一个图片的内容，但是对于一个每一帧之间都具有某种联系的视频呢，卷积网络就不能很好地处理其间的时间关系。而RNN可以考虑前一个时刻的影响，还可以对这个时刻之前的所有时刻都具有一定的记忆性。总之，RNN 是基于“人的认知是基于过往经验和记忆”的观点提出的。

RNN用途

卷积网络可以当作一个图像的特征提取器，通过提取图像的特征对图像进行分类。RNN 可以对“之前的信息”进行记忆并用于当前的计算中，所以RNN 的应用领域是非常广阔的：

(1)自然语言处理(Nature Language Process,NLP)基本是与RNN 绑定最为紧密的一个应用领域。其目的是实现有效自然语言通信的计算机系统，简单说就是计算机可以像人一样跟人进行沟通交流。包括文本生成、语言模型、机器翻译、文本相似度等内容；

(2)视频处理、语音识别、图像描述生成等；

(3)音乐推荐、商品推荐等推荐系统。

从一句话中提取信息来填空的查询方式，被称为槽填充(Slot Filling)。RNN的反向传播 — —BPTT(Back Propagation Through Time)。

总结：

(1)神经网络的基本组成：神经元与层。

(2)神经网络的反向传播算法的铺垫与推导，这里给出四个最重要的概念：

首先定义神经元的损失：

其次计算所有层的神经元的损失：

通过神经元的损失，计算偏置的梯度：

以及权重的梯度：

(3)卷积网络的基本概念。后续的实战对卷积的了解有质的飞跃。

(4)循环神经网络的基本概念。

深度学习5 神经网络

相关文章：

深度学习5 神经网络

js中! 、!!、?.、??、??=的用法及使用场景

嵌入式面试高频八股文面试题及参考答案

前端练习小项目——方向感应名片

【Vim】为什么程序员喜欢用 Vim

stm32h743 NetXduo 实现http server CubeIDE+CubeMX

ubuntu服务器部署vue springboot前后端分离项目

【python】pandas报错：UnicodeDecodeError详细分析，解决方案以及如何避免

FlinkModule加载HiveModule异常

计算机硬件---如何更新自己电脑的BLOS

AI算法17-贝叶斯岭回归算法Bayesian Ridge Regression | BRR

唯众物联网综合实训台物联网实验室建设方案

深入浅出 Vue.js：从基础到进阶的全面总结

路网双线合并单线——ArcGISpro 解决方法

邮箱验证码功能开发

2024-07-15 Unity插件 Odin Inspector3 —— Button Attributes

根据脚手架archetype快速构建spring boot/cloud项目

安灯系统在电力设备制造业中的应用效果

代码随想录打卡第二十五天

openharmony上传图片，并获取返回路径

利用ngx_stream_return_module构建简易 TCP/UDP 响应网关

Spring Boot 实现流式响应（兼容 2.7.x）

STM32F4基本定时器使用和原理详解

Golang dig框架与GraphQL的完美结合

ESP32 I2S音频总线学习笔记（四）： INMP441采集音频并实时播放

C++中string流知识详解和示例

RNN避坑指南：从数学推导到LSTM/GRU工业级部署实战流程

AGain DB和倍数增益的关系

推荐 github 项目:GeminiImageApp(图片生成方向，可以做一定的素材)

Java毕业设计：WML信息查询与后端信息发布系统开发