优化算法(五)—梯度下降算法(附MATLAB程序)
梯度下降算法(Gradient Descent)是一种常用的优化算法,用于寻找函数的局部最小值。它通过沿着函数梯度的反方向迭代地调整变量,以逐步找到最优解。梯度下降广泛应用于机器学习和深度学习中,特别是在训练模型时优化损失函数。
一、基本原理
梯度下降算法是一种优化算法,用于最小化目标函数。其基本原理如下:
-
目标函数:设定一个需要最小化的函数(例如,损失函数)。
-
初始化:随机选择一个初始点(参数值)。
-
计算梯度:在当前点计算目标函数的梯度(即偏导数),表示函数在该点的上升方向。
-
更新参数:根据梯度调整参数,更新规则为:
![]()
其中,θ是参数,α是学习率,∇J是目标函数的梯度。
5.迭代:重复步骤3和4,直到达到停止条件(如梯度足够小或达到最大迭代次数)。
梯度下降算法的关键在于选择合适的学习率和确保收敛到局部最优解。根据更新的方式,可以分为不同类型,如批量梯度下降、随机梯度下降和小批量梯度下降。
二、公式推导
梯度下降算法的推导主要围绕目标函数的最优化过程。我们以最小化目标函数 J(θ) 为例,下面是详细的推导过程。
1. 定义目标函数
假设我们要最小化的目标函数为 J(θ),其中 θ 是我们需要优化的参数。
2. 计算梯度
梯度是目标函数对参数的偏导数,表示在当前点上,函数最陡的上升方向。梯度的数学表示为:

这里,∇J(θ) 是一个向量,包含了目标函数在各个参数方向的导数。
3. 更新参数
我们希望通过沿着梯度的反方向更新参数,以减小目标函数的值。更新公式如下:
![]()
是当前的参数值。
是更新后的参数值。
是学习率,控制更新的步长。
4. 迭代过程
通过反复应用更新公式,可以不断调整参数,逐步逼近目标函数的最小值。迭代过程可以表示为:
![]()
其中 t表示迭代次数。
5. 收敛条件
迭代过程持续进行,直到满足某个停止条件,例如:
- 梯度的范数小于某个阈值:

- 参数的变化小于某个阈值:

- 达到最大迭代次数。
6. 误差分析
选择合适的学习率α 是关键。过大的学习率可能导致发散,过小的学习率则可能使收敛速度缓慢。因此,有时会使用动态调整学习率的方法。
三、MATLAB仿真
下面是一个简单的MATLAB仿真程序,用于实现梯度下降算法以最小化一个二次目标函数
% 梯度下降算法示例
% 最小化目标函数 J(θ) = θ^2% 初始化参数
theta = 10; % 初始参数值
alpha = 0.1; % 学习率
num_iterations = 100; % 迭代次数% 存储每次迭代的目标函数值
J_history = zeros(num_iterations, 1);% 梯度下降算法
for iter = 1:num_iterations% 计算目标函数 J(θ)J = theta^2; % 目标函数J_history(iter) = J; % 存储目标函数值% 计算梯度gradient = 2 * theta; % J(θ) 的导数% 更新参数theta = theta - alpha * gradient; % 更新公式% 输出当前迭代的信息fprintf('Iteration %d: theta = %.4f, J(θ) = %.4f\n', iter, theta, J);
end% 绘制目标函数值随迭代次数变化的曲线
figure;
plot(1:num_iterations, J_history, 'b-', 'LineWidth', 2);
xlabel('Iteration');
ylabel('J(θ)');
title('Objective Function Value vs. Iteration');
grid on;
代码说明
-
初始化参数:
theta是优化的初始值。alpha是学习率。num_iterations是迭代次数。
-
循环进行梯度下降:
- 计算当前参数的目标函数值 JJJ。
- 计算梯度(对于 J(θ)=,梯度是 2θ2\theta2θ)。
- 更新参数
theta。
-
输出和绘图:
- 在每次迭代中输出当前的参数值和目标函数值。
- 最后绘制目标函数值随迭代次数变化的图。
如何运行
将以上代码复制到MATLAB的脚本文件中(例如 gradient_descent.m),然后运行即可查看梯度下降的过程及目标函数的收敛情况。
四、总结
梯度下降算法是优化问题中一种强大且有效的工具,通过简单的迭代过程,能够在多种应用中找到合适的解。在实际使用中,选择合适的学习率和优化策略是确保其有效性的关键。
优化算法以往链接:
优化算法(一)—遗传算法(Genetic Algorithm)附MATLAB程序-CSDN博客
优化算法(二)—粒子群优化算法(附MATLAB程序)-CSDN博客
优化算法(三)—模拟退火算法(附MATLAB程序)_模拟退火算法csdn-CSDN博客
优化算法(四)—蚁群算法(附MATLAB程序)-CSDN博客
相关文章:
优化算法(五)—梯度下降算法(附MATLAB程序)
梯度下降算法(Gradient Descent)是一种常用的优化算法,用于寻找函数的局部最小值。它通过沿着函数梯度的反方向迭代地调整变量,以逐步找到最优解。梯度下降广泛应用于机器学习和深度学习中,特别是在训练模型时优化损失…...
TypeScript 设计模式之【单例模式】
文章目录 **单例模式**: 独一无二的特工我们为什么需要这样的特工?单例模式的秘密:如何培养这样的特工?特工的利与害代码实现单例模式的主要优点单例模式的主要缺点单例模式的适用场景总结 单例模式: 独一无二的特工 单例模式就像是一个秘密组织里的特殊特工。这…...
UDP与TCP那个传输更快
UDP(用户数据报协议)和 TCP(传输控制协议)是互联网协议栈中常用的两种传输层协议。它们在设计和应用上存在一些显著的差异,导致在传输速度和可靠性等方面表现不同。以下是它们之间的比较,特别是关于传输速度…...
如何把PDF样本册转换为网址链接
随着互联网的普及,将纸质或PDF格式的样本册转化为网址链接,以便于在线浏览和分享,变得越来越重要。本文将为您详细讲解如何将PDF样本册转换为网址链接,让您轻松实现线上展示和分享。 一、了解PDF样本册与网址链接 1. PDF样本册…...
centos7 semanage 离线安装 SELinux
centos7 semanage 离线安装 还是参考一下 换成阿里云的源 之后 ,在线更新不,不要用离线安装 centos7 更新 yum源 为 阿里云 LTS https://blog.csdn.net/wowocpp/article/details/142517908 CentOS7安装时使用"基础服务器"选项安装, 后发现没…...
磨具生产制造9人共用一台工作站
随着技术的不断进步与工业自动化的深入发展,如何优化生产流程、提高设备利用率成为了众多企业面临的重大课题。那么在磨具生产制造中实现9人共用一台工作站呢? 一、背景与挑战 在磨具制造行业,高精度、高效率的生产要求与复杂多变的工艺流程…...
Qt clicked()、clicked(bool)、toggled(bool)信号的区别和联系
clicked() 信号 所属控件:clicked()信号是QAbstractButton类(及其子类,如QPushButton、QRadioButton、QCheckBox等)的一个信号。clicked信号可以说是许多控件(特别是按钮类控件,如QPushButton)…...
nginx实现负载均衡的分发策略
文章目录 分发策略 分发策略 轮询策略 轮询策略是最简单的负载均衡策略之一。Nginx 默认采用轮询方式将请求分发到不同的后端服务器。它将请求按照顺序轮流分配给每个后端服务器,不论服务器当前的负载情况如何。这种策略适合后端服务器性能相近且无太大差异的场景。…...
【Python】用代码片段掌握Python核心功能
探索各种用户输入值 Python 是一种多才多艺的编程语言,广泛应用于从 Web 开发到数据分析的各种场景。这篇文章将通过实际的代码片段带你了解 Python 中的几个基本概念和操作。无论你是初学者还是想重温一下知识点,这些例子都会给你带来宝贵的见解。 输…...
JVM 内存模型
JVM 内存模型 对于 Java 程序员来说,在虚拟机自动内存管理机制下,不再需要像 C/C程序开发程序员这样为每一个 new 操作去写对应的 delete/free 操作,不容易出现内存泄漏和内存溢出问题。正是因为 Java程序把内存控制权利交给 JVM 虚拟机。一旦出现内存泄漏和溢出方面的问题,如果…...
Linux2.6* 内核默认支持的文件系统
Linux2.6* 内核默认支持的文件系统 Btrfs是一种具有先进特性的写时复制文件系统。支持多种高级功能,如快照、透明压缩、数据校验和自我修复等,适用于大规模存储系统和数据可靠性要求较高的场景。JFSJournaled File System日志文件系统,具有高…...
PMP--二模--解题--111-120
文章目录 7.成本管理111、 [单选] 你向项目出资人提供了项目的成本估算,他对估算不满意,因为他认为价格太高了。他要你削减项目估算的15%,你该怎么做? 8.质量管理112、 [单选] 在新建水处理厂的建设过程中,政府对处理厂…...
idea 创建多模块项目
一、新建项目,创建父工程 新建项目,选择 spring initializr 填写相关信息后提交 删除不相关的目录,如下 修改打包方式为 pom,在 pom.xml 文件中新增一行,如下 二、创建子模块 新增子模块 三、修改 pom 文件 修…...
redis Redis-Cluster常用命令与Redis性能监控
起因:随着项目的进一步推广,数据量的增大,直接访问mysql数据库获取数据所使用的时间越来越长,为解决当前主要矛盾,决定引入redis非关系型数据库作为缓存层,使得数据并不能直接命中数据库,减少访…...
《C++中的随机数生成器:探索随机之美》
在 C编程的世界里,随机数生成器是一个非常重要的工具,它在众多领域都有着广泛的应用,从游戏开发中的随机事件触发,到模拟实验中的随机数据生成,再到密码学中的安全随机数需求,随机数生成器都扮演着关键的角…...
为什么推荐使用英文版LabVIEW
在LabVIEW开发中,中文版和英文版主要在界面语言、功能习惯以及社区支持等方面存在差异。以下是两者的特点以及推荐使用英文版的原因: 中文版特点: 界面和帮助文档为中文:对于中文母语开发者来说,中文版LabVIEW的界面和…...
【Moveit2】move_group_interface_tutorial中文注释
move_group_interface_tutorial #include <moveit/move_group_interface/move_group_interface.h> // 包含MoveIt的移动组接口 #include <moveit/planning_scene_interface/planning_scene_interface.h> // 包含规划场景接口#include <moveit_msgs/msg/display…...
JavaScript window的open和close用法
在JavaScript中,window.open() 和 window.close() 方法分别用于打开和关闭浏览器窗口或标签页。以下是这两个方法的基本用法: window.open() window.open() 方法可以接受四个参数: URL:要打开的网页的地址。如果省略这个参…...
经典sql题(十四)炸裂函数的恢复
下面是一个关于 SELECT 语句的例子,该示例展示了如何使用 CONCAT_WS 和 COLLECT_LIST 函数来处理炸裂之后学生成绩的数据。假设我们有一个名为 test 的表,结构如下: 表结构 test student_idstudent_nameclassscore1AliceClass1901AliceClas…...
【vue2】组件写法
组件基本骨架 <template><div class"my-component"><!-- 组件的 HTML 结构 --><h1>{{ title }}</h1><!-- 事件绑定 --><button click"handleClick">点击我</button><!-- 输入框与双向数据绑定 -->…...
微信H5支付v3版Java实战:从零构建移动端支付解决方案
1. 微信H5支付的应用场景与优势 移动端支付已经成为现代商业不可或缺的一部分。微信H5支付作为微信支付生态中的重要一环,特别适合那些需要在非微信客户端浏览器中实现支付功能的场景。想象一下这样的画面:用户在手机浏览器中浏览你的电商网站ÿ…...
通义千问1.5-1.8B-Chat-GPTQ-Int4场景应用:网络安全威胁情报的智能分析与报告生成
通义千问1.5-1.8B-Chat-GPTQ-Int4场景应用:网络安全威胁情报的智能分析与报告生成 1. 引言:当安全分析师遇上信息洪流 想象一下,你是一名网络安全分析师。凌晨三点,刺耳的告警声把你从睡梦中惊醒。屏幕上,来自防火墙…...
FastAPI 2.0流式AI接口上线前必须做的4项压力测试:QPS突破1200+的实测阈值与熔断配置清单
第一章:FastAPI 2.0流式AI接口压力测试全景认知FastAPI 2.0 引入了对异步流式响应(如 StreamingResponse)的深度优化,使大语言模型(LLM)类接口可原生支持 Server-Sent Events(SSE)、…...
Marp CLI元数据管理:如何优化SEO和社交媒体分享
Marp CLI元数据管理:如何优化SEO和社交媒体分享 【免费下载链接】marp-cli A CLI interface for Marp and Marpit based converters 项目地址: https://gitcode.com/gh_mirrors/ma/marp-cli Marp CLI是一款强大的命令行工具,让你仅用纯Markdown就…...
11.0592MHz晶振在51单片机串口通信中的优势解析
1. 为什么11.0592MHz晶振成为单片机工程师的首选在嵌入式系统设计中,晶振的选择往往决定了整个系统的稳定性和精度。作为一名从事单片机开发多年的工程师,我发现11.0592MHz的晶振在51单片机项目中出现的频率异常高。这绝非偶然,而是由一系列精…...
5个认知重构,收割你的补偿性Offer
春招反杀指南当别人还在为秋招失利懊悔时,聪明人已经完成了思维系统的彻底升级秋招的硝烟尚未散尽,春招的号角已经吹响。这不是简单的“第二轮机会”,而是认知层面的降维打击战。那些在秋招中凭借简历光环轻松通关的路径已然失效,…...
高压柔性输电系统中的6脉冲与12脉冲晶闸管控制HVDC仿真模型说明文档
高压柔性输电系统6脉冲,12脉冲晶闸管控制HVDC的仿真模型,说明文档江湖上流传着这么一句话:"搞HVDC不玩晶闸管,就像吃火锅不放辣"。今天咱们就扒一扒那些藏在MATLAB/Simulink里的6脉冲和12脉冲换流器秘密。先说个冷知识&…...
终极指南:如何用buger/jsonparser实现10倍性能的Go JSON解析
终极指南:如何用buger/jsonparser实现10倍性能的Go JSON解析 【免费下载链接】jsonparser One of the fastest alternative JSON parser for Go that does not require schema 项目地址: https://gitcode.com/gh_mirrors/js/jsonparser buger/jsonparser是Go…...
Beyond Compare 5 永久激活完全指南:从入门到精通
Beyond Compare 5 永久激活完全指南:从入门到精通 【免费下载链接】BCompare_Keygen Keygen for BCompare 5 项目地址: https://gitcode.com/gh_mirrors/bc/BCompare_Keygen 一、问题诊断:Beyond Compare 5授权痛点解析 1.1 评估期结束的功能限制…...
VSCode + WSL-Ubuntu 20.04 开发环境配置:从零搭建C++开发环境(含Clangd智能补全)
VSCode WSL-Ubuntu 20.04 开发环境配置:从零搭建C开发环境(含Clangd智能补全) 在跨平台开发日益普及的今天,微软推出的WSL(Windows Subsystem for Linux)为Windows开发者提供了无缝的Linux开发体验。结合…...
