当前位置：首页 > news >正文

通俗讲解-动量梯度下降法原理与代码实例

news 2026/2/10 11:14:58

本站原创文章，转载请说明来自《老饼讲解-BP神经网络》bp.bbbdata.com

一.动量梯度下降法介绍

1.1 动量梯度下降法简介与思想

1.2 动量梯度下降法的算法流程

二.动量梯度下降法代码实例

2.1 动量梯度下降法实例代码

一.动量梯度下降法介绍

本节介绍动量梯度下降法的思想以及算法流程

1.1 动量梯度下降法简介与思想

动量梯度下降法是对梯度下降法的一种改进，
这主要是因为梯度下降法在遇到局部最优时，毫无办法

为了解决跳出局部最优，动量梯度下降法为此模仿物体从高处滚到低处的原理，
由于物体具有动量，遇到小坑时会由于原有动量而跃出小坑,因此，动量梯度下降法在迭代的过程中引入动量的概念，它的迭代量改为"速度",而当前的负梯度只作为速度的修改量，

动量梯度下降法迭代公式如下：
$v_t=mc*v_{t-1}+(1-mc)*(-\text{lr}*g)$
$x_t = x_{t-1} +v_{t}$
其中，mc是动量系数，一般设为0.9，g是梯度
这样做的好处是，在遇到“小坑”的时候，会因为原有的速度方向，冲出小坑

1.2 动量梯度下降法的算法流程

动量梯度下降法的具体算法流程如下
一、设置参数与初始化相关变量
1. 设置学习率lr
lr一般设为0.1
2. 设置动量系数mc
mc一般设为0.9
3. 初始化速度v
v一般初始化为0
4. 初始化初始解x
x随机初始化,或者具体问题具体设定
二、循环迭代
按如下步骤进行迭代
1.计算当前的梯度g
2.计算当前的梯度对v带来的修改量dx
   $\text{dx = lr*(-}g)$
3.计算当前的速度
   $\text{v = mc*v+(1-mc)*dx}$
4.更新x
$\text{x = x + v}$
5.检查迭代终止条件

如果满足终止条件，就退出迭代程序

  终止条件可设如下：

(1)是否达到最大迭代次数

  (2)目标函数值是否满足要求

(3) x是否多次变化极小

三、输出结果
输出最终的求解结果x

二.动量梯度下降法代码实例

本节展示动量梯度下降法求解函数最小值的一个代码实例

2.1 动量梯度下降法实例代码

现求解 $\small \text{y} = 0.4*x^2+3*\textbf{exp}\left (-(x+2)^2\right)$ 的极小值
它的函数图像如下：

其中，梯度公式为 $\dfrac{\partial \text{y}}{\partial x}=0.8*x-6*\textbf{exp}(-(x+2)^2)*(x+2)$
按以上算法流程，编写程序如下(matlab)：

% 本代码用动量梯度下降法求解函数y = 0.4*x^2+3*exp(-(x+2)^2) 的极小值
% 代码主旨用于教学,供大家学习理解动量梯度下降法的原理
%  转载请说明来自 《老饼讲解神经网络》 bp.bbbdata.com
clc;clear all ;
line_x = -5:0.1:5;                            % 目标函数曲线x
line_y = 0.4*line_x.^2+3*exp(-(line_x+2).^2); % 目标函数曲线y
lr = 0.1;                                     % 学习率
mc = 0.9;                                     % 动量系数
x  = -4;                                      % x的初始值
v  = 0;                                       % 初始速度
for i = 1:100gx = -(0.8*x-6*exp(-(x+2).^2)*(x+2));      % 计算负梯度v  = mc*v+(1-mc)*lr*gx;                    % 将负梯度叠加到上一次速度中，作为本次的速度x  = x+v;                                  % 更新xy  = 0.4*x.^2+3*exp(-(x+2).^2);            % 计算当前的目标函数值fprintf('第%d轮x的迭代值x=%f\n',i,x)plot(line_x,line_y,x,y,'or')               % 画出曲线与当前迭代点drawnow;                                   % 展示图象
end

运行结果如下
第0轮x的迭代值x=-3.970198
第1轮x的迭代值x=-3.914051
第2轮x的迭代值x=-3.835152
第3轮x的迭代值x=-3.737256
第4轮x的迭代值x=-3.624348
....
第95轮x的迭代值x=0.033763
第96轮x的迭代值x=0.037061
第97轮x的迭代值x=0.041660
第98轮x的迭代值x=0.047361
第99轮x的迭代值x=0.053971
经过100步迭代，求得最后y在x=0.053971处取得极小值

相关文章
1-LVQ的学习目录：老饼|BP神经网络-竞争神经网络
2-SVM的学习目录：老饼|BP神经网络-感知机与SVM
3-BP的学习目录：老饼|BP神经网络-BP入门

通俗讲解-动量梯度下降法原理与代码实例

本站原创文章，转载请说明来自《老饼讲解-BP神经网络》bp.bbbdata.com 目录一.动量梯度下降法介绍 1.1 动量梯度下降法简介与思想 1.2 动量梯度下降法的算法流程二.动量梯度下降法代码实例 2.1 动量梯度下降法实例代码一.动量梯度下降法介绍…...

编程日记 2023/8/16 14:47:12

【【STM32-USART串口协议】】

STM32-USART串口协议 USART串口协议 •通信的目的：将一个设备的数据传送到另一个设备，扩展硬件系统 •通信协议：制定通信的规则，通信双方按照协议规则进行数据收发就是我们并不能在芯片上设计完全部的一下子完成所有的设计&…...

编程日记 2023/8/16 14:46:11

1、props 没有加TS限制类型的时候 1. 数组写法 defineProps([count, changCount]) 2. 对象写法 defineProps({count: Number,changCount: Function }) 3. 配置对象 defineProps({count: {type: Number,default: 2},changCount: {type: Function,required: true} })注意: defi…...

编程日记 2023/8/16 14:45:10

费曼学习法

费曼学习法费曼学习法（Feynman Technique）是一种学习和理解复杂概念的方法，以理查德费曼（Richard Feynman）这位著名的理论物理学家命名。该方法的核心思想是通过将学习内容简化并用自己的话解释给别人，来…...

编程日记 2023/8/16 14:44:09

Kubernetes介绍和部署,使用

1.k8s kubernetes来自希腊语舵手,google, 8是ubernete 1.管理docker容器 go写的(并发) 2.用于微服务 3.cncf云原生基金会 2.mater(管理节点)和nodes(微服务节点) 3.部署 1.minikube kind官网在线测试语句 2.kubeadm(官方)(安装比较方便添加) 3.github下载二进制包 4.yum(老) …...

编程日记 2023/8/16 14:43:08

视频汇聚平台EasyCVR视频监控播放平台WebRTC流地址无法播放的问题解决方案

开源EasyDarwin视频监控TSINGSEE青犀视频平台EasyCVR能在复杂的网络环境中，将分散的各类视频资源进行统一汇聚、整合、集中管理，在视频监控播放上，TSINGSEE青犀视频安防监控汇聚平台可支持1、4、9、16个画面窗口播放，可同时播放多…...

编程日记 2023/8/16 14:42:06

node.js 基础高并发案例

什么是高并发高并发是指系统在同一时间段内需要处理大量的并发请求或同时进行大量的操作。在计算机领域中，高并发通常指的是在短时间内有大量的用户或客户端同时访问系统或进行操作，对系统的并发处理能力提出了较高的要求。高并发的特点包括大量的…...

编程日记 2023/8/16 14:41:05

OpenCV实例（八）车牌字符识别技术（二）字符识别

车牌字符识别技术（二）字符识别 1.字符识别原理及其发展阶段2.字符识别方法3.英文、数字识别4.车牌定位实例 1.字符识别原理及其发展阶段匹配判别是字符识别的基本思想，与其他模式识别的应用非常类似。字符识别的基本原理就是对字符图像进行…...

编程日记 2023/8/16 14:40:04

svn文章五：问题排查与修复 - 出了问题怎么办？SVN故障排除与修复指南

文章五：问题排查与修复 - “出了问题怎么办？SVN故障排除与修复指南” 概述：在使用SVN时，难免会遇到一些问题和错误。在这篇文章中，我们将教您如何进行故障排查和修复，保护您的SVN仓库和数据安全。 1. 引言…...

编程日记 2023/8/16 14:39:03

国产开源ambari之DataSophon部署

介绍 DataSophon致力于快速实现部署、管理、监控以及自动化运维大数据云原生平台，帮助您快速构建起稳定、高效、可弹性伸缩的大数据云原生平台。主要特性有: 快速部署,可快速完成300个节点的大数据集群部署兼容复杂环境,极少的依赖使其很容易适配各种复杂环境监控指标全面丰…...

编程日记 2023/8/16 14:38:02

面试之快速学习STL- vector

1. vector底层实现机制刨析： 简述：使用三个迭代器表示的：  这也就解释了，为什么 vector 容器在进行扩容后，与其相关的指针、引用以及迭代器可能会失效的原因。 insert 整体向后移 erase 整体向前移…...

编程日记 2023/8/16 14:36:58

LeetCode_03Java_1572. 矩阵对角线元素的和

给你一个正方形矩阵 mat，请你返回矩阵对角线元素的和。请你返回在矩阵主对角线上的元素和副对角线上且不在主对角线上元素的和。输入：mat [[1,2,3],[4,5,6],[7,8,9]] 输出：25 解释：对角线的和为：1 5 9 3 7 2…...

编程日记 2023/8/16 14:35:57

系统架构设计师---职责及与其他角色的关系区别

一. 系统架构设计师的职责如下：系统架构设计师是系统或产品线的设计责任人，是一个负责理解和管理并最终确认和评估非功能性系统需求（比如软件的可维护性、性能、复用性、可靠性、有效性和可测试性等），给出开发规范，搭建系统实现的核心构架，对整个软件架构、关键构件、…...

编程日记 2023/8/16 14:34:55

【Visual Studio Code】--- Win11 C盘爆满修改 Code 插件数据和缓存的保存路径

Win11 C盘爆满修改 Code 插件数据和缓存的保存路径一、概述二、修改 Code 插件数据和缓存的保存路径一、概述一个好的文章能够帮助开发者完成更便捷、更快速的开发。书山有路勤为径，学海无涯苦作舟。我是秋知叶i、期望每一个阅读了我的文章的开发者都能够有所成…...

编程日记 2023/8/16 14:33:53

mapbox-gl中mvt、pbf 矢量切片 feature id bug

1.版本：mapbox-gl.js 2.13.0，pbf采用 postgis生成 2.调用矢量切片时，采用如下方法查询矢量切片要素，报错 map.on(mousemove, function(e) { var bbox = [ [e.point.x - 5, e.point.y - 5], [e.point…...

编程日记 2023/8/16 14:32:52

206、仿真-51单片机锂电池蓄电池电压电流加按键控制开关状态Proteus仿真设计(程序+Proteus仿真+配套资料等)

毕设帮助、开题指导、技术解答(有偿)见文未目录一、硬件设计二、设计功能三、Proteus仿真图四、程序源码资料包括： 需要完整的资料可以点击下面的名片加下我，找我要资源压缩包的百度网盘下载地址及提取码。方案选择单片机的选择方案一&a…...

编程日记 2023/8/16 14:31:51

【Realtek sdk-3.4.14b】RTL8197F+RTL8812F欧洲屏蔽5G天气雷达信道DFS信道120、124、128方法

需求描述对于欧洲国家来说，默认支持DFS信道，但是有三个信道比较特殊，是天气雷达信道，如下图所示120、124、128，天气雷达信道有个特点就是在信号可以发射之前需要检测静默15min,如果信道自动选择到了天气雷达信道，就会有15min的时间无法连接到WiFi热点，严重影响用户体验…...

编程日记 2023/8/16 14:30:50

【嵌入式学习笔记】嵌入式入门7——IIC总线协议

1.IIC简介 IIC即Inter Integrated Circuit，集成电路总线，是一种同步，串行，半双工通信总线。 IIC总线协议——总线就是传输数据通道，协议就是传输数据的规则，有以下特点： 由时钟线SCL和数据线S…...

编程日记 2023/8/16 14:29:49

你永远想象不到有多折磨的 Android 开发 react-native gradle*！￥%#

很难过，拿到项目运行不起来，错误报告研究几天没研究明白，改代码，装gradle，忙和好久还是一个样，也不知道是码的问题还是什么，一开始后面装完gradle，不报错了，但是也跑不起…...

编程日记 2023/8/16 14:28:47

关于STM32 hal printf重定向 “FILE“ is undefined

> 关于STM32 hal printf重定向，及报错。“FILE” is undefined 增加以下内容： #include "string.h" #include "stdio.h" #pragma import(__use_no_semihosting) 标准库需要的支持函数 struct __…...

编程日记 2023/8/16 14:27:45

KubeSphere 容器平台高可用：环境搭建与可视化操作指南

Linux_k8s篇欢迎来到Linux的世界，看笔记好好学多敲多打，每个人都是大神！ 题目：KubeSphere 容器平台高可用：环境搭建与可视化操作指南版本号: 1.0,0 作者: 老王要学习日期: 2025.06.05 适用环境: Ubuntu22 文档说…...

编程新知 2026/2/9 18:19:34

盘古信息PCB行业解决方案：以全域场景重构，激活智造新未来

一、破局：PCB行业的时代之问在数字经济蓬勃发展的浪潮中，PCB（印制电路板）作为 “电子产品之母”，其重要性愈发凸显。随着 5G、人工智能等新兴技术的加速渗透，PCB行业面临着前所未有的挑战与机遇。产品迭代…...

编程新知 2026/2/7 17:29:24

Java多线程实现之Callable接口深度解析

Java多线程实现之Callable接口深度解析一、Callable接口概述1.1 接口定义1.2 与Runnable接口的对比1.3 Future接口与FutureTask类二、Callable接口的基本使用方法2.1 传统方式实现Callable接口2.2 使用Lambda表达式简化Callable实现2.3 使用FutureTask类执行Callable任务三、…...

编程新知 2026/1/25 6:36:06

Matlab | matlab常用命令总结

常用命令一、基础操作与环境二、矩阵与数组操作（核心）三、绘图与可视化四、编程与控制流五、符号计算 (Symbolic Math Toolbox)六、文件与数据 I/O七、常用函数类别重要提示这是一份 MATLAB 常用命令和功能的总结，涵盖了基础操作、矩阵运算、绘图、编程和文件处理等…...

编程新知 2025/8/11 1:05:59

IT供电系统绝缘监测及故障定位解决方案

随着新能源的快速发展，光伏电站、储能系统及充电设备已广泛应用于现代能源网络。在光伏领域，IT供电系统凭借其持续供电性好、安全性高等优势成为光伏首选，但在长期运行中，例如老化、潮湿、隐裂、机械损伤等问题会影响光伏板绝缘层…...

编程新知 2026/2/1 6:36:36

实现弹窗随键盘上移居中

实现弹窗随键盘上移的核心思路在Android中，可以通过监听键盘的显示和隐藏事件，动态调整弹窗的位置。关键点在于获取键盘高度，并计算剩余屏幕空间以重新定位弹窗。 // 在Activity或Fragment中设置键盘监听 val rootView findViewById<V…...

编程新知 2025/10/6 18:46:56

【学习笔记】深入理解Java虚拟机学习笔记——第4章虚拟机性能监控，故障处理工具

第2章虚拟机性能监控，故障处理工具 4.1 概述略 4.2 基础故障处理工具 4.2.1 jps:虚拟机进程状况工具命令：jps [options] [hostid] 功能：本地虚拟机进程显示进程ID（与ps相同），可同时显示主类&#x…...

编程新知 2026/1/15 1:34:10

是否存在路径（FIFOBB算法）

题目描述一个具有 n 个顶点e条边的无向图，该图顶点的编号依次为0到n-1且不存在顶点与自身相连的边。请使用FIFOBB算法编写程序，确定是否存在从顶点 source到顶点 destination的路径。输入第一行两个整数，分别表示n 和 e 的值（1…...

编程新知 2025/10/1 6:09:21

return this；返回的是谁

一个审批系统的示例来演示责任链模式的实现。假设公司需要处理不同金额的采购申请，不同级别的经理有不同的审批权限： // 抽象处理者：审批者 abstract class Approver {protected Approver successor; // 下一个处理者// 设置下一个处理者pub…...

编程新知 2026/1/28 21:45:43

Linux 中如何提取压缩文件？

Linux 是一种流行的开源操作系统，它提供了许多工具来管理、压缩和解压缩文件。压缩文件有助于节省存储空间，使数据传输更快。本指南将向您展示如何在 Linux 中提取不同类型的压缩文件。 1. Unpacking ZIP Files ZIP 文件是非常常见的，要在 …...

编程新知 2026/2/1 5:38:25

通俗讲解-动量梯度下降法原理与代码实例

一.动量梯度下降法介绍

1.1 动量梯度下降法简介与思想

1.2 动量梯度下降法的算法流程

二.动量梯度下降法代码实例

2.1 动量梯度下降法实例代码

相关文章：

通俗讲解-动量梯度下降法原理与代码实例

【【STM32-USART串口协议】】

vue3.0组件通信

费曼学习法

Kubernetes介绍和部署,使用

视频汇聚平台EasyCVR视频监控播放平台WebRTC流地址无法播放的问题解决方案

node.js 基础高并发案例

OpenCV实例（八）车牌字符识别技术（二）字符识别

svn文章五：问题排查与修复 - 出了问题怎么办？SVN故障排除与修复指南

国产开源ambari之DataSophon部署

面试之快速学习STL- vector

LeetCode_03Java_1572. 矩阵对角线元素的和

系统架构设计师---职责及与其他角色的关系区别

【Visual Studio Code】--- Win11 C盘爆满修改 Code 插件数据和缓存的保存路径

mapbox-gl中mvt、pbf 矢量切片 feature id bug

206、仿真-51单片机锂电池蓄电池电压电流加按键控制开关状态Proteus仿真设计(程序+Proteus仿真+配套资料等)

【Realtek sdk-3.4.14b】RTL8197F+RTL8812F欧洲屏蔽5G天气雷达信道DFS信道120、124、128方法

【嵌入式学习笔记】嵌入式入门7——IIC总线协议

你永远想象不到有多折磨的 Android 开发 react-native gradle*！￥%#

关于STM32 hal printf重定向 “FILE“ is undefined

KubeSphere 容器平台高可用：环境搭建与可视化操作指南

盘古信息PCB行业解决方案：以全域场景重构，激活智造新未来

Java多线程实现之Callable接口深度解析

Matlab | matlab常用命令总结

IT供电系统绝缘监测及故障定位解决方案

实现弹窗随键盘上移居中

【学习笔记】深入理解Java虚拟机学习笔记——第4章虚拟机性能监控，故障处理工具

是否存在路径（FIFOBB算法）

return this；返回的是谁

Linux 中如何提取压缩文件？