当前位置：首页 > news >正文

机器学习入门教学——梯度下降、梯度上升

news 2026/2/10 0:48:27

1、简介

梯度表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（梯度的方向）变化最快，变化率（梯度的模）最大，可理解为导数。
梯度上升和梯度下降是优化算法中常用的两种方法，主要目的是通过迭代找到目标函数的最大值和最小值。
例如：
- 想象我们在一座很高的山上，怎么才能以最快的速度下山？我们可以先选择坡度最倾斜的方向走一段距离，然后再重新选择坡度最倾斜的方向，再走一段距离。以此类推，我们就可以以最快的速度到达山底。（梯度的方向，就是我们要选择的方向）

2、梯度下降

梯度下降：梯度下降是一种迭代算法，用于寻找函数的局部最小值或全局最小值。它的核心思想是沿着函数梯度的负方向进行迭代更新，以逐步接近最小值点。在每一次迭代中，根据当前位置的梯度方向来更新参数或变量值，使目标函数值减小。梯度下降算法广泛应用于求解机器学习中的优化问题，如线性回归、逻辑回归、神经网络等。
这里我将模拟整个机器学习的流程来解释什么是梯度下降。

2.1、预测函数

假设，我们需要建立一个模型用来预测房价。我们拥有一些样本点，现在需要对这些样本点进行拟合。
拟合方法：我们可以先随机选一条过原点的直线，然后计算所有样本点和它的偏离程度(误差)，再根据误差大小来调整直线的斜率w。其中，为预测函数。

2.2、代价函数

在调整预测函数斜率前，我们需要量化数据的偏离程度，即量化误差。最常见的方法是均方误差，即误差平方和的平均值。
假设，样本点p1(x1,y1)对应的误差为e1。
，展开为
同理，
均方误差为：，合并同类项得：
用字母代替不同项的系数。
其中，即为代价函数。
代价函数是用来衡量机器学习模型在给定训练集上的表现的函数，它反映了模型对训练集的拟合程度，可以衡量模型的预测输出与真实输出之间的差异。
我们可以看出该代价函数是一个二元函数，图像为抛物线。这样的话，我们就可以把预测函数的拟合过程，转换为代价函数寻找最小值的过程。（代价越小，拟合程度越高）
我们要做的就是不断地更新参数w，找到一个w让预测函数值最小。

2.3、计算梯度

机器学习的目标是拟合出最接近训练数据分布的直线，也就是找到使得误差代价最小的参数w，对应在代价函数图像上就是它的最低点。寻找最低点的过程就会使用到梯度下降。
假设起始点如图所示，我们只要选择向陡峭程度最大的方向走，就能更快地到达最低点。
陡峭程度就是梯度，是代价函数的导数，也是抛物线的曲线斜率。
- 【注】因为这里的代价函数只是二维平面，所以抛物线的斜率即为梯度。而实际应用中，代价函数的图形可能是三维四维的，这时的梯度就是沿着某个方向取得最大值的导数了。
所以，计算梯度就是计算代价函数在某个方向取得最大值的导数。

2.4、按学习率前进

确定方向以后就需要前进了，这时我们需要确定步长，即更新参数w时的大小和速度。
步长太大或太小对梯度下降算法的效果都是不好的。步长太大，函数无法收敛到最小值；步长太小，收敛速度较慢。所以需要找到合适的步长，使其在收敛速度和稳定性之间达到平衡。
我们尝试使用斜率（梯度）来作为步长。好处是，斜率较大时，步长稍大些，可以快速收敛；斜率较小时，步长稍小些，收敛的越精准。但在实际过程中，w左右反复横跳，依然无法收敛到最小值，原因是开始时的步长太大。如下图所示。
我们让斜率乘以一个非常小的值，即缩小斜率后再当作步长，如0.1，结果就非常顺滑了。这个非常小的值就是学习率。
- 【注】斜率是有正负的，当起始点在最低点左侧时，斜率为负，w逐渐增大；当起始点在最低点右侧时，斜率为正，w逐渐减小。

2.5、循环迭代

每次迭代即计算一次梯度，按照梯度的方向前进一段步长。循环迭代就是重复计算梯度和按学习率前进的步骤，直到找到最低点。

3、梯度上升

梯度上升：梯度上升是一种迭代算法，用于寻找函数的局部最大值或全局最大值。它的核心思想是沿着函数梯度的正方向进行迭代更新，以逐步接近最大值点。在每一次迭代中，根据当前位置的梯度方向来更新参数或变量值，使目标函数值增大。梯度上升算法适用于求解优化问题中的约束最优化、最大似然估计等。
梯度上升和梯度下降类似，只不过方向不同，结合下面公式理解。

机器学习入门教学——梯度下降、梯度上升

1、简介梯度表示某一函数在该点处的方向导数沿着该方向取得最大值，即函数在该点处沿着该方向（梯度的方向）变化最快，变化率（梯度的模）最大，可理解为导数。梯度上升和梯度下降是优化算法中常用的…...

编程日记 2023/9/12 5:47:10

BUUCTF Reverse/[羊城杯 2020]login(python程序)

查看信息,python文件动调了一下，该程序创建了一个线程来读入数据，而这个线程的代码应该是放在内存中直接执行的，本地看不到代码，很蛋疼查了下可以用PyInstaller Extractor工具来解包，可以参考这个Python解包及反编译…...

编程日记 2023/9/12 5:46:09

indexDB localForage

一、前言前端本地化存储算是一个老生常谈的话题了，我们对于 cookies、Web Storage（sessionStorage、localStorage）的使用已经非常熟悉，在面试与实际操作之中也会经常遇到相关的问题，但这些本地化存储的方式还存在一些…...

编程日记 2023/9/12 5:45:08

Spring Boot开发时Java对象和Json对象互转

🙈作者简介：练习时长两年半的Java up主 🙉个人主页：程序员老茶 🙊 ps:点赞👍是免费的，却可以让写博客的作者开兴好久好久😎 📚系列专栏：Java全栈，…...

编程日记 2023/9/12 5:44:07

C++ 多态

引例： #include<iostream> using namespace std; class Animal { public:void speak(){cout<<"动物在说话"<<endl;} }; class Cat:public Animal { public:void speak(){cout<<"小猫在说话"<<endl;} }; void Do…...

编程日记 2023/9/12 5:43:06

LeetCode 之二分查找

网址： LeetCode 704.二分查找算法模拟： Algorithm Visualizer 在线工具： C 在线工具如果习惯性使用Visual Studio Code进行编译运行，需要C11特性的支持，可参考博客： VisualStudio Code 支持C11插件配…...

编程日记 2023/9/12 5:42:04

【性能测试】中间件优化

1、Tomcat 优化连接数、线程池打开tomcat安装目录\conf\server.xml文件，在server.xml中有以下配置： tomcat HTTP/1.1 <Connector port"8080" protocol"HTTP/1.1" maxThreads"1000" acceptCount"1500" c…...

编程日记 2023/9/12 5:41:03

【算法】查找类——二分查找算法

二分查找算法算法总结算法描述该算法属于查找算法。当需要从有序数组中查找某一元素时，可以使用该算法进行查找。（本文章假设数组是升序排列的数组） 算法思想每次进行对半查找，获取中间元素值，然后与目标值进行…...

编程日记 2023/9/12 5:40:02

Ansible FIle模块，使用Ansible File模块进行文件管理

当使用 Ansible 进行自动化配置和管理时，file 模块是一个强大的工具，用于在目标主机上创建、修改和删除文件和目录。它提供了一种简单而灵活的方式来处理文件系统操作。在本文中，我们将详细介绍如何使用 Ansible 的 file 模块。 1. 创建文件 …...

编程日记 2023/9/12 5:39:01

索尼mp4变成rsv修复案例(ILME-FX3)

索尼mp4的修复案例讲过很多，这次是索尼的ILME-FX3也算是一个畅销的机型，一般索尼没有封装的文件是RSV文件，但是极少遇到有多个RSV文件的，下边我们来讲下这个特殊案例。故障文件:4个RSV文件，大小在1.78G~28G多故障现…...

编程日记 2023/9/12 5:37:59

抓拍摄像机开关量控制4K高清手机远程看图建筑生长定时缩时相机

作为物联网数据采集解决方案专业提供商,数采物联网小编daq-iot 在这里做以下内容介绍,并诚挚的欢迎大家讨论和交流。项目案例参考视频： https://www.bilibili.com/video/BV1Kp4y1T7wQ/?spm_id_from333.999.0.0 4K高清太阳能供电定时拍照相机，通过光…...

编程日记 2023/9/12 5:36:59

创建drogon框架 drogon_ctl create project test_ctrl添加一个控制器进入controllers目录下 drogon_ctl create controller -h check_ctrl编写主函数 #include <drogon/drogon.h> int main() {//Set HTTP listener address and port//drogon::app().addListener("…...

编程日记 2023/9/12 5:35:58

幼儿棒球运动宣传介绍·野球6号位

幼儿棒球运动宣传介绍 1. 棒球对幼儿成长的重要性棒球运动对幼儿协调能力和团队协作的培养棒球运动对幼儿协调能力和团队协作的培养非常重要。通过棒球运动，孩子们可以学习如何与队友合作，如何在压力下保持冷静，以及如何快速做出决策。这…...

编程日记 2023/9/12 5:34:56

grpc多语言通信之GO和DART

都是一个吗生的,找下例子上一篇文章说到go实现的grpc方法已经实现了一个grpc的server端, 注意: 这两个项目的.proto文件应当是完全一致的,只是方法用各自的语言实现罢了报错了: Caught error: gRPC Error (code: 12, codeName: UNIMPLEMENTED, message: grpc: Decompresso…...

编程日记 2023/9/12 5:33:54

基于FPGA的RGB图像转Ycbcr实现,包括tb测试文件以及MATLAB辅助验证

目录 1.算法运行效果图预览 2.算法运行软件版本 3.部分核心程序 4.算法理论概述 5.算法完整程序工程 1.算法运行效果图预览将FPGA的数据导入到matlab进行显示 2.算法运行软件版本 Vivado2019.2 matlab2022a 3.部分核心程序 timescale 1ns / 1ps // // Company: // E…...

编程日记 2023/9/12 5:32:52

centos 编译安装的php多版本切换

centos 编译安装的php多版本切换 wheris php php: /usr/bin/php /usr/lib64/php /etc/php.ini /etc/php.d /usr/local/php /usr/local/php7.4 /usr/share/php /usr/share/man/man1/php.1.gz/usr/bin/php: php可执行脚本，任何版本的php 通过软连接到这可以实现全局…...

编程日记 2023/9/12 5:31:51

Unity 性能优化之Shader分析处理函数ShaderUtil.HasProceduralInstancing: 深入解析与实用案例

Unity 性能优化之Shader分析处理函数ShaderUtil.HasProceduralInstancing: 深入解析与实用案例点击封面跳转到Unity国际版下载页面简介在Unity中，性能优化是游戏开发过程中非常重要的一环。其中，Shader的优化对于游戏的性能提升起着至关重要的作用。…...

编程日记 2023/9/12 5:30:50

2023数学建模国赛E题黄河水沙监测数据分析完整代码分析+处理结果+思路文档

已经写出国赛E题黄河水沙监测数据分析完整代码分析处理结果思路分析（30页），包括数据预处理、数据可视化（分组数据分布图可视化、相关系数热力图可视化、散点图可视化）、回归模型（决策树回归模型、随机森林回…...

编程日记 2023/9/12 5:29:50

玩转Mysql系列 - 第19篇：游标详解

这是Mysql系列第19篇。环境：mysql5.7.25，cmd命令中进行演示。代码中被[]包含的表示可选，|符号分开的表示可选其一。需求背景当我们需要对一个select的查询结果进行遍历处理的时候，如何实现呢？ 此时我们需要使…...

编程日记 2023/9/12 5:28:49

【量化分析】Python 布林线（ Bollinger）概念

一、说明布林线(BOLL)，Bollinger Bands，利用统计原理，求出股价的标准差及其信赖区间，从而确定股价的波动范围及未来走势，利用波带显示股价的安全高低价位，因而也被称为布林带。二、布林带基本概念布林线…...

编程日记 2023/9/12 5:27:48

现代密码学 | 椭圆曲线密码学—附py代码

Elliptic Curve Cryptography 椭圆曲线密码学（ECC）是一种基于有限域上椭圆曲线数学特性的公钥加密技术。其核心原理涉及椭圆曲线的代数性质、离散对数问题以及有限域上的运算。椭圆曲线密码学是多种数字签名算法的基础，例如椭圆曲线数字签…...

编程新知 2026/2/6 7:30:33

自然语言处理——Transformer

自然语言处理——Transformer 自注意力机制多头注意力机制Transformer 虽然循环神经网络可以对具有序列特性的数据非常有效，它能挖掘数据中的时序信息以及语义信息，但是它有一个很大的缺陷——很难并行化。我们可以考虑用CNN来替代RNN，但是…...

编程新知 2026/2/1 7:05:07

浅谈不同二分算法的查找情况

二分算法原理比较简单，但是实际的算法模板却有很多，这一切都源于二分查找问题中的复杂情况和二分算法的边界处理，以下是博主对一些二分算法查找的情况分析。需要说明的是，以下二分算法都是基于有序序列为升序有序的情况&#xf…...

编程新知 2025/9/14 7:37:32

pikachu靶场通关笔记22-1 SQL注入05-1-insert注入(报错法)

目录一、SQL注入二、insert注入三、报错型注入四、updatexml函数五、源码审计六、insert渗透实战 1、渗透准备 2、获取数据库名database 3、获取表名table 4、获取列名column 5、获取字段本系列为通过《pikachu靶场通关笔记》的SQL注入关卡(共10关&#xff0…...

编程新知 2026/2/5 2:28:27

Spring AI与Spring Modulith核心技术解析

Spring AI核心架构解析 Spring AI（https://spring.io/projects/spring-ai）作为Spring生态中的AI集成框架，其核心设计理念是通过模块化架构降低AI应用的开发复杂度。与Python生态中的LangChain/LlamaIndex等工具类似，但特别为多语…...

编程新知 2025/12/14 17:38:21