当前位置: 首页 > article >正文

深度学习算法清单

目录

1. 神经网络必备基础知识点

2. 神经网络前向传播与反向传播

3. 网络模型整体架构分析实例

4. 神经网络建模效果分析

5. 激活函数与过拟合问题解决

6. 卷积神经网络核心知识点

7. 卷积建模流程与各参数作用分析

8. 池化层的作用与效果

9. 经典卷积神经网络架构分析

10. 感受野的作用与效果解读

11. 递归神经网络模型原理分析

12. RNN系列网络结构优缺点分析

13. 词向量模型与LSTM应用实例

总结


1. 神经网络必备基础知识点

  • 神经元模型

    • 模拟生物神经元,输入信号加权求和后通过激活函数输出。

    • 数学表达:$z = \sum w_i x_i + b$$a = f(z)$(如Sigmoid、ReLU)。

  • 网络结构

    • 输入层:接收原始数据(如像素值、文本向量)。

    • 隐藏层:负责特征提取和变换(层数越多,非线性能力越强)。

    • 输出层:生成最终结果(分类概率、回归值等)。

  • 权重与偏置

    • 权重$(w)$决定特征重要性,偏置$(b)$调整输出阈值。

  • 损失函数

    • 衡量预测值与真实值的差距(如交叉熵损失、均方误差)。


2. 神经网络前向传播与反向传播

  • 前向传播

    • 输入数据逐层计算至输出:$a^{(l)} = f(W^{(l)}a^{(l-1)} + b^{(l)})$

  • 反向传播

    • 链式法则:从输出层到输入层逐层计算梯度。

    • 梯度计算:通过损失函数对权重求导$\frac{\partial L}{\partial w} = \frac{\partial L}{\partial a} \cdot \frac{\partial a}{\partial z} \cdot \frac{\partial z}{\partial w}$

    • 参数更新:使用优化器(如SGD、Adam)调整权重:$w \leftarrow w - \eta \cdot \frac{\partial L}{\partial w}$


3. 网络模型整体架构分析实例

  • 以LeNet-5为例

    • 输入层:32×32灰度图像。

    • 卷积层:提取边缘、纹理等低级特征。

    • 池化层:降低空间维度(如最大池化)。

    • 全连接层:整合全局信息进行分类。

    • 输出层:Softmax生成类别概率。

  • 设计原则

    • 特征抽象层级递进(低级→高级)。

    • 参数量与计算效率的平衡。


4. 神经网络建模效果分析

  • 评价指标

    • 分类任务:准确率、精确率、召回率、F1值。

    • 回归任务:均方误差(MSE)、平均绝对误差(MAE)。

  • 训练状态诊断

    • 欠拟合:训练集和测试集表现均差(模型简单或训练不足)。

    • 过拟合:训练集准确率高,测试集差(模型复杂或数据噪声多)。

  • 解决方案

    • 欠拟合:增加网络深度、使用更复杂模型。

    • 过拟合:正则化(L1/L2)、数据增强、早停法。


5. 激活函数与过拟合问题解决

  • 激活函数

    • Sigmoid:输出0~1,易导致梯度消失。

    • ReLU:缓解梯度消失,计算高效($f(x)=max(0,x)$)。

    • Softmax:多分类输出归一化概率。

  • 过拟合解决策略

    • Dropout:随机屏蔽神经元,强制网络学习冗余特征。

    • 正则化:L1(稀疏权重)、L2(限制权重幅度)。

    • 数据增强:旋转、裁剪图像,添加噪声等。


6. 卷积神经网络核心知识点

  • 卷积层

    • 滤波器(Kernel):滑动窗口提取局部特征(如边缘检测)。

    • 参数共享:同一滤波器在不同位置复用,减少参数量。

    • 输出尺寸计算Output Size=\frac{N-K+2P}{S} + 1(N输入尺寸,K滤波器尺寸,P填充,S步长)。

  • 通道(Channel)

    • 输入通道数(如RGB图像的3通道)。

    • 输出通道数对应不同滤波器的数量。


7. 卷积建模流程与各参数作用分析

  • 建模流程

    1. 输入数据预处理(归一化、标准化)。

    2. 交替堆叠卷积层和池化层。

    3. 全连接层整合特征,输出结果。

  • 参数作用

    • 滤波器尺寸:3×3(常用)、5×5(捕捉更大区域)。

    • 步长(Stride):控制滑动步幅(步长越大,输出越小)。

    • 填充(Padding):保持输出尺寸不变(如Same Padding)。


8. 池化层的作用与效果

  • 核心作用

    • 降维减少计算量。

    • 增强平移不变性(轻微位置变化不影响输出)。

  • 池化类型

    • 最大池化:保留局部最显著特征。

    • 平均池化:平滑特征响应(适用于背景区域)。

  • 输出尺寸:与步长和池化窗口大小相关(如2×2窗口+步长2,尺寸减半)。


9. 经典卷积神经网络架构分析

  • AlexNet

    • 首个深度CNN,使用ReLU和Dropout。

    • 多GPU并行训练,局部响应归一化(LRN)。

  • VGGNet

    • 小尺寸滤波器(3×3)堆叠,加深网络。

  • ResNet

    • 残差连接(Skip Connection)解决梯度消失,允许千层网络训练。


10. 感受野的作用与效果解读

  • 定义:输出特征图上每个点能“看到”输入图像的区域大小。

  • 计算方式

    • 逐层累加:$RFl = RFl_{l-1} + (Kl - 1) \times \prod_{i=1}^{l-1} Si$

  • 作用

    • 深层网络感受野扩大,可捕捉全局语义信息(如物体整体形状)。


11. 递归神经网络模型原理分析

  • 核心思想

    • 处理序列数据(如时间序列、文本),引入时间维度上的状态传递。

  • 数学表达

    • 隐藏状态更新:$h_t = f(W \cdot [h_{t-1}, x_t] + b)$

  • 局限

    • 长序列依赖问题(梯度消失/爆炸)。


12. RNN系列网络结构优缺点分析

  • 标准RNN

    • 优点:简单,适合短序列建模。

    • 缺点:无法处理长程依赖。

  • LSTM

    • 门控机制(输入门、遗忘门、输出门)控制信息流。

    • 解决梯度消失,适合长序列(如文本生成)。

  • GRU

    • 简化版LSTM(合并遗忘门和输入门),计算效率更高。


13. 词向量模型与LSTM应用实例

  • 词向量模型(Word2Vec)

    • Skip-Gram:通过中心词预测上下文。

    • CBOW:通过上下文预测中心词。

  • LSTM应用实例(文本分类)

    1. 输入层:词向量序列(如300维)。

    2. LSTM层:捕捉上下文依赖。

    3. 全连接层:输出类别概率。

    4. 优化:使用交叉熵损失和Adam优化器。


总结

  • 神经网络基础:神经元、前向/反向传播、损失函数。

  • CNN核心:卷积、池化、经典架构(ResNet等)。

  • RNN系列:LSTM解决长序列依赖,词向量建模文本语义。

  • 实践技巧:激活函数选择、过拟合解决方法、参数调优。

相关文章:

深度学习算法清单

目录 1. 神经网络必备基础知识点 2. 神经网络前向传播与反向传播 3. 网络模型整体架构分析实例 4. 神经网络建模效果分析 5. 激活函数与过拟合问题解决 6. 卷积神经网络核心知识点 7. 卷积建模流程与各参数作用分析 8. 池化层的作用与效果 9. 经典卷积神经网络架构分析…...

docker ssh远程连接

目录 操作命令: 确保 SSH 配置允许 root 登录: docker提交: 操作命令: # 进入容器 docker exec -ti lbg04 /bin/bash# 更新包管理并安装 SSH 服务(Ubuntu/Debian 示例) apt-get update apt-get install…...

leetcode 20.有效括号

20. 有效的括号 - 力扣(LeetCode) class Solution:def isValid(self, s: str) -> bool:stack []for i in s :if i in ((,{,[ ):stack.append(i)elif i in () ):# 这种情况是 栈弹出元素为空时候 ,右半部分的括号多出来一些 比如&#x…...

【杂记三】Cython加速模块cython_nms未编译

一、问题 from cython_nms import nms as cnms ModuleNotFoundError: No module named cython_nms Github download 需要生成如下的 二、安装编译编译安装 cython_nms 1. 确保已经安装了 Cython conda activate your-env pip install cython2. 编译编译 cython_nms 进入编译…...

LeetCode(977):有序数组的平方

有序数组的平方 题目链接 题目&#xff1a;给你一个按非递减顺序排序的整数数组 nums&#xff0c;返回每个数字的平方组成的新数组&#xff0c;要求也按非递减顺序排序。 //暴力 #include<stdio.h> void sort(int *nums,int n){for(int i0;i<n;i)for(int ji1;j<…...

订票系统|基于Java+vue的火车票订票系统(源码+数据库+文档)

订票系统目录 基于Springbootvue的火车票订票系统 一、前言 二、系统设计 三、系统功能设计 1会员信息管理 2 车次信息管理 3订票订单管理 4留言板管理 四、数据库设计 五、核心代码 六、论文参考 七、最新计算机毕设选题推荐 八、源码获取&#xff1a; 博主介绍…...

「Unity3D」使用C#获取Android虚拟键盘的高度

原理是&#xff1a;利用getWindowVisibleDisplayFrame方法&#xff0c;获取Android窗口可见区域的Rect&#xff0c;这个Rect剔除了状态栏与导航栏&#xff0c;并且在有虚拟键盘遮挡的时候&#xff0c;会剔除这个遮挡区域。 接着&#xff0c;Unity的safeArea也剔除了状态栏与导…...

近场通信(NFC)在电动车启动系统中的技术实现路径

电动车NFC一键启动系统基于13.56MHz频段实现非接触控制&#xff0c;技术方案要点如下&#xff1a; ‌系统架构‌ ‌硬件核心‌ NFC芯片&#xff08;如N32G45x&#xff09;处理通信协议&#xff0c;支持手机/卡片识别STM32主控解析指令&#xff0c;AES-128加密模块保障双向认证…...

斜线、短横、空格,三种分隔日期的优雅解析(Python | DeepSeek)

标准日期解析操作&#xff0c;str.replace链式如灵蛇蜿蜒&#xff0c;三元表达式像空灵仙家妙法。 笔记模板由python脚本于2025-03-25 22:32:24创建&#xff0c;本篇笔记适合三元表达式、字符串操作修习的coder翻阅。 【学习的细节是欢悦的历程】 博客的核心价值&#xff1a;在…...

自动化逆向框架使用(Objection+Radare2)

1. 工具链架构与核心优势 1.1 动静结合逆向体系 graph LR A[动态分析] -->|Objection实时Hook| B[关键点定位] B --> C[行为数据捕获] D[静态分析] -->|Radare2深度解析| E[控制流重建] E --> F[漏洞模式识别] B --> F C --> F 组合优势对比&…...

inline 配置全局参数变量

在 C 中&#xff0c;对于头文件中定义的全局变量&#xff0c;使用 inline 比 static 更优&#xff0c;主要原因如下&#xff1a; 1. 避免重复定义的多个副本 static 的问题 每个包含该头文件的 .cpp 都会生成一个独立的变量副本&#xff0c;导致&#xff1a; 内存浪费&#xf…...

(C语言)静态通讯录(正式版)(C语言小项目)

1.首先是头文件&#xff1a; //头文件 //contact.h//防止头文件被重复包含 #pragma once //定义符号常亮&#xff0c;方便维护和修改 //联系人基本信息容量 #define NAME_MAX 20 #define AGE_MAX 5 #define SEX_MAX 5 #define TELE_MAX 15 #define ADDR_MAX 30 //联系人最大容量…...

Windows 计划任务服务(Task Scheduler)

svchost.exe -k netsvcs -p -s Schedule 是 Windows 计划任务服务&#xff08;Task Scheduler&#xff09; 的标准启动命令&#xff0c;通常用于管理系统定时任务。以下是详细解析&#xff1a; 命令拆解 svchost.exe Windows 核心进程&#xff0c;用于托管系统服务&#xff08;…...

[特殊字符] 2025蓝桥杯备赛Day13——P10984 [蓝桥杯 2023 国 Python A] 残缺的数字

&#x1f50d; 2025蓝桥杯备赛Day13——P10984 [蓝桥杯 2023 国 Python A] 残缺的数字 &#x1f680; 题目速览 题目难度&#xff1a;⭐⭐⭐&#xff08;需掌握位运算与组合数学&#xff09; 考察重点&#xff1a;二进制状态处理、位运算、乘法原理、枚举 P10984 [蓝桥杯 2…...

线程控制与线程库

目录 解析tid 线程的地址空间布局 线程栈 我们来学习线程控制与线程库 解析tid #include<iostream> #include<string> #include<cstdio> #include<cstring> #include<unistd.h> #include<thread> using namespace std;int shared_val…...

P1182 数列分段 Section II

P1182 数列分段 Section II - 洛谷 题目描述 对于给定的一个长度为 N 的正整数数列 A1​∼AN​&#xff0c;现要将其分成 M&#xff08;M≤N&#xff09;段&#xff0c;并要求每段连续&#xff0c;且每段和的最大值最小。 关于最大值最小&#xff1a; 例如一数列 4 2 4 5 1…...

比手动备份快 Iperius全自动加密备份,NAS/云盘/磁带机全兼容

IperiusBackupFull是一款专为服务器和工作站设计的备份解决方案&#xff0c;它同时也是一款针对Windows 7/8/10/11/Server系统的简洁且可靠的备份软件。该软件支持增量备份、数据同步以及驱动器镜像&#xff0c;确保能够实现完全的系统恢复。在备份存储方面&#xff0c;Iperius…...

从概率到梯度:理解分类问题中交叉熵的优越性

分类问题一般使用交叉熵&#xff08;Cross-Entropy&#xff09;而不是平方损失&#xff08;Square Loss&#xff09;函数1. **概率解释**2. **梯度性质**3. **对错误的惩罚**4. **计算复杂度**5. **总结** 分类问题一般使用交叉熵&#xff08;Cross-Entropy&#xff09;而不是平…...

2025最新版Ubuntu Server版本Ubuntu 24.04.2 LTS下载与安装-详细教程,细致到每一步都有说明

官网 https://ubuntu.com/ 下载 点击菜单 Prodercts> Ubuntu OS>Ubuntu Server 点击下载 下载后会有个弹窗 安装 选择第一个 install Ubuntu Server 直接默认&#xff0c;选择English 【默认】 选择键盘布局【默认】 选择安装配置【默认】 配置网络 我这里选择…...

更新测试环境构建命令以解决构建失败问题

本段代码解决 更新测试环境构建命令以解决构建失败问题 //本项目是reactumi3antdesign 搭建的后台管理系统 "build:test": "cross-env UMI_ENVtest NODE_OPTIONS--openssl-legacy-provider umi build"**原因&#xff1a;**Node.js v17 的 OpenSSL 3.0 与旧…...

C 语言中, scanf 函数在哪些情况下会结束输入读取:

在 C 语言中&#xff0c; scanf 函数在以下几种情况下会结束输入读取&#xff1a; &#xff1a; 1. 遇到指定格式匹配失败&#xff1a; scanf 按照格式字符串要求读取输入。当输入数据格式与格式字符串不匹配时&#xff0c;就会结束读取。例如 scanf(“%d”, &num) 要求输…...

树莓派5-GPIO和40针引脚

1.树莓派5引脚图 2.GPIO 引脚作用 (1) 电压 板上有两个 5V 引脚和两个 3.3V 引脚&#xff0c;以及一些不可配置的接地引脚 (0V)。其余引脚均为通用 3.3V 引 脚&#xff0c;这意味着输出设置为 3.3V&#xff0c;输入可接 3.3V。 (2) 输出 指定为输出引脚的 GPIO 引脚可设置为…...

【数据库】sql错题详解

1. 执行子查询 SELECT 供应商号 FROM 订购单 WHERE 职工号 IN (E1, E3) GROUP BY 供应商号 HAVING COUNT(DISTINCT 职工号) 2筛选职工号为 E1 或 E3 的记录&#xff1a; 依据 WHERE 职工号 IN (E1, E3) 这个条件&#xff0c;从 订购单 表中把职工号为 E1 或者 E3 的记录筛选出…...

搭建主从DNS、nfs、nginx

任务需求&#xff1a; 客户端通过访问 www.nihao.com 后&#xff0c;能够通过 dns 域名解析&#xff0c;访问到 nginx 服务中由 nfs 共享的首页文件&#xff0c;内容为&#xff1a;Very good, you have successfully set up the system. 各个主机能够实现时间同步&#xff0c;…...

C#重写treeView控件

1.先准备两张图片downdrop.png、downdrop_open.png放在项目Resources里 2.新建用户控件BaseTreeView控件 3.重写控件继承TreeView&#xff0c;记得删除AutoScaleMode这一行&#xff0c;否则会报错 public partial class BaseTreeView : TreeView {//这个属性貌似不起作用&…...

JS自动装箱(Auto-boxing)机制深度解析

&#x1f4e6; JS自动装箱(Auto-boxing)机制深度解析 自动装箱&#xff08;Autoboxing&#xff09; 是 JavaScript 的一项特性 &#x1f31f; 核心概念速览 自动装箱 原始值临时变身对象 当对原始值调用方法或访问属性时&#xff0c;JS 引擎会自动将其转换为对应的包装对象&…...

ArcGIS 10.8.1之后发布栅格数据的MapServer 动态工作空间 替换数据源渲染问题

背景 经过测试&#xff0c;Server 10.8.1、11.0、11.1发布相关服务设置动态空间之后&#xff0c;前端都无法自动读取同名的clr色彩映射表文件进行渲染&#xff0c;服务都是由ArcGIS Pro进行发布。 原因 基于ArcMap发布的服务才支持&#xff0c;但是10.8.1之后不支持ArcMap发…...

Java集合框架深度剖析:从数据结构到实战应用

引言 Java集合框架是Java开发中的核心组件之一&#xff0c;其设计目标是提供高性能、高复用性的数据容器。无论是数据处理、缓存设计还是高并发场景&#xff0c;集合框架都扮演着关键角色。本文将从List、Map、Set三大核心接口出发&#xff0c;深入剖析其主流实现类&#xff0…...

【MySQL】监控MySQL

目录 使用状态变量监控MySQL 使用性能模式&#xff08;Performance Schema&#xff09;监控MySQL 1.性能模式 2.性能模式设置表 3.sys模式 使用状态变量监控MySQL 使用 show status 语句评估系统运行状况。 可以添加范围修饰符global或session来显示全局或本地状态信息。…...

涅槃上岸,入陕进军,复试全程流程开启!

复试决胜局&#xff0c;整装待发&#xff0c;上岸西电&#xff01; 线下复试注意事项、全流程、录取后西安旅游提前告知&#xff01; 过两天考研复试笔试、机试&#xff08;如果有&#xff09;、面试就要开始了&#xff0c;我们需要准备很多东西&#xff0c;学长从以下几个方面…...