优化算法(五)—梯度下降算法(附MATLAB程序)
梯度下降算法(Gradient Descent)是一种常用的优化算法,用于寻找函数的局部最小值。它通过沿着函数梯度的反方向迭代地调整变量,以逐步找到最优解。梯度下降广泛应用于机器学习和深度学习中,特别是在训练模型时优化损失函数。
一、基本原理
梯度下降算法是一种优化算法,用于最小化目标函数。其基本原理如下:
-
目标函数:设定一个需要最小化的函数(例如,损失函数)。
-
初始化:随机选择一个初始点(参数值)。
-
计算梯度:在当前点计算目标函数的梯度(即偏导数),表示函数在该点的上升方向。
-
更新参数:根据梯度调整参数,更新规则为:
其中,θ是参数,α是学习率,∇J是目标函数的梯度。
5.迭代:重复步骤3和4,直到达到停止条件(如梯度足够小或达到最大迭代次数)。
梯度下降算法的关键在于选择合适的学习率和确保收敛到局部最优解。根据更新的方式,可以分为不同类型,如批量梯度下降、随机梯度下降和小批量梯度下降。
二、公式推导
梯度下降算法的推导主要围绕目标函数的最优化过程。我们以最小化目标函数 J(θ) 为例,下面是详细的推导过程。
1. 定义目标函数
假设我们要最小化的目标函数为 J(θ),其中 θ 是我们需要优化的参数。
2. 计算梯度
梯度是目标函数对参数的偏导数,表示在当前点上,函数最陡的上升方向。梯度的数学表示为:
这里,∇J(θ) 是一个向量,包含了目标函数在各个参数方向的导数。
3. 更新参数
我们希望通过沿着梯度的反方向更新参数,以减小目标函数的值。更新公式如下:
是当前的参数值。
是更新后的参数值。
是学习率,控制更新的步长。
4. 迭代过程
通过反复应用更新公式,可以不断调整参数,逐步逼近目标函数的最小值。迭代过程可以表示为:
其中 t表示迭代次数。
5. 收敛条件
迭代过程持续进行,直到满足某个停止条件,例如:
- 梯度的范数小于某个阈值:
- 参数的变化小于某个阈值:
- 达到最大迭代次数。
6. 误差分析
选择合适的学习率α 是关键。过大的学习率可能导致发散,过小的学习率则可能使收敛速度缓慢。因此,有时会使用动态调整学习率的方法。
三、MATLAB仿真
下面是一个简单的MATLAB仿真程序,用于实现梯度下降算法以最小化一个二次目标函数
% 梯度下降算法示例
% 最小化目标函数 J(θ) = θ^2% 初始化参数
theta = 10; % 初始参数值
alpha = 0.1; % 学习率
num_iterations = 100; % 迭代次数% 存储每次迭代的目标函数值
J_history = zeros(num_iterations, 1);% 梯度下降算法
for iter = 1:num_iterations% 计算目标函数 J(θ)J = theta^2; % 目标函数J_history(iter) = J; % 存储目标函数值% 计算梯度gradient = 2 * theta; % J(θ) 的导数% 更新参数theta = theta - alpha * gradient; % 更新公式% 输出当前迭代的信息fprintf('Iteration %d: theta = %.4f, J(θ) = %.4f\n', iter, theta, J);
end% 绘制目标函数值随迭代次数变化的曲线
figure;
plot(1:num_iterations, J_history, 'b-', 'LineWidth', 2);
xlabel('Iteration');
ylabel('J(θ)');
title('Objective Function Value vs. Iteration');
grid on;
代码说明
-
初始化参数:
theta
是优化的初始值。alpha
是学习率。num_iterations
是迭代次数。
-
循环进行梯度下降:
- 计算当前参数的目标函数值 JJJ。
- 计算梯度(对于 J(θ)=,梯度是 2θ2\theta2θ)。
- 更新参数
theta
。
-
输出和绘图:
- 在每次迭代中输出当前的参数值和目标函数值。
- 最后绘制目标函数值随迭代次数变化的图。
如何运行
将以上代码复制到MATLAB的脚本文件中(例如 gradient_descent.m
),然后运行即可查看梯度下降的过程及目标函数的收敛情况。
四、总结
梯度下降算法是优化问题中一种强大且有效的工具,通过简单的迭代过程,能够在多种应用中找到合适的解。在实际使用中,选择合适的学习率和优化策略是确保其有效性的关键。
优化算法以往链接:
优化算法(一)—遗传算法(Genetic Algorithm)附MATLAB程序-CSDN博客
优化算法(二)—粒子群优化算法(附MATLAB程序)-CSDN博客
优化算法(三)—模拟退火算法(附MATLAB程序)_模拟退火算法csdn-CSDN博客
优化算法(四)—蚁群算法(附MATLAB程序)-CSDN博客
相关文章:
优化算法(五)—梯度下降算法(附MATLAB程序)
梯度下降算法(Gradient Descent)是一种常用的优化算法,用于寻找函数的局部最小值。它通过沿着函数梯度的反方向迭代地调整变量,以逐步找到最优解。梯度下降广泛应用于机器学习和深度学习中,特别是在训练模型时优化损失…...

TypeScript 设计模式之【单例模式】
文章目录 **单例模式**: 独一无二的特工我们为什么需要这样的特工?单例模式的秘密:如何培养这样的特工?特工的利与害代码实现单例模式的主要优点单例模式的主要缺点单例模式的适用场景总结 单例模式: 独一无二的特工 单例模式就像是一个秘密组织里的特殊特工。这…...
UDP与TCP那个传输更快
UDP(用户数据报协议)和 TCP(传输控制协议)是互联网协议栈中常用的两种传输层协议。它们在设计和应用上存在一些显著的差异,导致在传输速度和可靠性等方面表现不同。以下是它们之间的比较,特别是关于传输速度…...

如何把PDF样本册转换为网址链接
随着互联网的普及,将纸质或PDF格式的样本册转化为网址链接,以便于在线浏览和分享,变得越来越重要。本文将为您详细讲解如何将PDF样本册转换为网址链接,让您轻松实现线上展示和分享。 一、了解PDF样本册与网址链接 1. PDF样本册…...
centos7 semanage 离线安装 SELinux
centos7 semanage 离线安装 还是参考一下 换成阿里云的源 之后 ,在线更新不,不要用离线安装 centos7 更新 yum源 为 阿里云 LTS https://blog.csdn.net/wowocpp/article/details/142517908 CentOS7安装时使用"基础服务器"选项安装, 后发现没…...

磨具生产制造9人共用一台工作站
随着技术的不断进步与工业自动化的深入发展,如何优化生产流程、提高设备利用率成为了众多企业面临的重大课题。那么在磨具生产制造中实现9人共用一台工作站呢? 一、背景与挑战 在磨具制造行业,高精度、高效率的生产要求与复杂多变的工艺流程…...

Qt clicked()、clicked(bool)、toggled(bool)信号的区别和联系
clicked() 信号 所属控件:clicked()信号是QAbstractButton类(及其子类,如QPushButton、QRadioButton、QCheckBox等)的一个信号。clicked信号可以说是许多控件(特别是按钮类控件,如QPushButton)…...
nginx实现负载均衡的分发策略
文章目录 分发策略 分发策略 轮询策略 轮询策略是最简单的负载均衡策略之一。Nginx 默认采用轮询方式将请求分发到不同的后端服务器。它将请求按照顺序轮流分配给每个后端服务器,不论服务器当前的负载情况如何。这种策略适合后端服务器性能相近且无太大差异的场景。…...
【Python】用代码片段掌握Python核心功能
探索各种用户输入值 Python 是一种多才多艺的编程语言,广泛应用于从 Web 开发到数据分析的各种场景。这篇文章将通过实际的代码片段带你了解 Python 中的几个基本概念和操作。无论你是初学者还是想重温一下知识点,这些例子都会给你带来宝贵的见解。 输…...

JVM 内存模型
JVM 内存模型 对于 Java 程序员来说,在虚拟机自动内存管理机制下,不再需要像 C/C程序开发程序员这样为每一个 new 操作去写对应的 delete/free 操作,不容易出现内存泄漏和内存溢出问题。正是因为 Java程序把内存控制权利交给 JVM 虚拟机。一旦出现内存泄漏和溢出方面的问题,如果…...
Linux2.6* 内核默认支持的文件系统
Linux2.6* 内核默认支持的文件系统 Btrfs是一种具有先进特性的写时复制文件系统。支持多种高级功能,如快照、透明压缩、数据校验和自我修复等,适用于大规模存储系统和数据可靠性要求较高的场景。JFSJournaled File System日志文件系统,具有高…...

PMP--二模--解题--111-120
文章目录 7.成本管理111、 [单选] 你向项目出资人提供了项目的成本估算,他对估算不满意,因为他认为价格太高了。他要你削减项目估算的15%,你该怎么做? 8.质量管理112、 [单选] 在新建水处理厂的建设过程中,政府对处理厂…...

idea 创建多模块项目
一、新建项目,创建父工程 新建项目,选择 spring initializr 填写相关信息后提交 删除不相关的目录,如下 修改打包方式为 pom,在 pom.xml 文件中新增一行,如下 二、创建子模块 新增子模块 三、修改 pom 文件 修…...

redis Redis-Cluster常用命令与Redis性能监控
起因:随着项目的进一步推广,数据量的增大,直接访问mysql数据库获取数据所使用的时间越来越长,为解决当前主要矛盾,决定引入redis非关系型数据库作为缓存层,使得数据并不能直接命中数据库,减少访…...
《C++中的随机数生成器:探索随机之美》
在 C编程的世界里,随机数生成器是一个非常重要的工具,它在众多领域都有着广泛的应用,从游戏开发中的随机事件触发,到模拟实验中的随机数据生成,再到密码学中的安全随机数需求,随机数生成器都扮演着关键的角…...

为什么推荐使用英文版LabVIEW
在LabVIEW开发中,中文版和英文版主要在界面语言、功能习惯以及社区支持等方面存在差异。以下是两者的特点以及推荐使用英文版的原因: 中文版特点: 界面和帮助文档为中文:对于中文母语开发者来说,中文版LabVIEW的界面和…...
【Moveit2】move_group_interface_tutorial中文注释
move_group_interface_tutorial #include <moveit/move_group_interface/move_group_interface.h> // 包含MoveIt的移动组接口 #include <moveit/planning_scene_interface/planning_scene_interface.h> // 包含规划场景接口#include <moveit_msgs/msg/display…...
JavaScript window的open和close用法
在JavaScript中,window.open() 和 window.close() 方法分别用于打开和关闭浏览器窗口或标签页。以下是这两个方法的基本用法: window.open() window.open() 方法可以接受四个参数: URL:要打开的网页的地址。如果省略这个参…...
经典sql题(十四)炸裂函数的恢复
下面是一个关于 SELECT 语句的例子,该示例展示了如何使用 CONCAT_WS 和 COLLECT_LIST 函数来处理炸裂之后学生成绩的数据。假设我们有一个名为 test 的表,结构如下: 表结构 test student_idstudent_nameclassscore1AliceClass1901AliceClas…...
【vue2】组件写法
组件基本骨架 <template><div class"my-component"><!-- 组件的 HTML 结构 --><h1>{{ title }}</h1><!-- 事件绑定 --><button click"handleClick">点击我</button><!-- 输入框与双向数据绑定 -->…...
浏览器访问 AWS ECS 上部署的 Docker 容器(监听 80 端口)
✅ 一、ECS 服务配置 Dockerfile 确保监听 80 端口 EXPOSE 80 CMD ["nginx", "-g", "daemon off;"]或 EXPOSE 80 CMD ["python3", "-m", "http.server", "80"]任务定义(Task Definition&…...
Objective-C常用命名规范总结
【OC】常用命名规范总结 文章目录 【OC】常用命名规范总结1.类名(Class Name)2.协议名(Protocol Name)3.方法名(Method Name)4.属性名(Property Name)5.局部变量/实例变量(Local / Instance Variables&…...

Java-41 深入浅出 Spring - 声明式事务的支持 事务配置 XML模式 XML+注解模式
点一下关注吧!!!非常感谢!!持续更新!!! 🚀 AI篇持续更新中!(长期更新) 目前2025年06月05日更新到: AI炼丹日志-28 - Aud…...

视频字幕质量评估的大规模细粒度基准
大家读完觉得有帮助记得关注和点赞!!! 摘要 视频字幕在文本到视频生成任务中起着至关重要的作用,因为它们的质量直接影响所生成视频的语义连贯性和视觉保真度。尽管大型视觉-语言模型(VLMs)在字幕生成方面…...

全志A40i android7.1 调试信息打印串口由uart0改为uart3
一,概述 1. 目的 将调试信息打印串口由uart0改为uart3。 2. 版本信息 Uboot版本:2014.07; Kernel版本:Linux-3.10; 二,Uboot 1. sys_config.fex改动 使能uart3(TX:PH00 RX:PH01),并让boo…...
JAVA后端开发——多租户
数据隔离是多租户系统中的核心概念,确保一个租户(在这个系统中可能是一个公司或一个独立的客户)的数据对其他租户是不可见的。在 RuoYi 框架(您当前项目所使用的基础框架)中,这通常是通过在数据表中增加一个…...
Java编程之桥接模式
定义 桥接模式(Bridge Pattern)属于结构型设计模式,它的核心意图是将抽象部分与实现部分分离,使它们可以独立地变化。这种模式通过组合关系来替代继承关系,从而降低了抽象和实现这两个可变维度之间的耦合度。 用例子…...

LabVIEW双光子成像系统技术
双光子成像技术的核心特性 双光子成像通过双低能量光子协同激发机制,展现出显著的技术优势: 深层组织穿透能力:适用于活体组织深度成像 高分辨率观测性能:满足微观结构的精细研究需求 低光毒性特点:减少对样本的损伤…...

(一)单例模式
一、前言 单例模式属于六大创建型模式,即在软件设计过程中,主要关注创建对象的结果,并不关心创建对象的过程及细节。创建型设计模式将类对象的实例化过程进行抽象化接口设计,从而隐藏了类对象的实例是如何被创建的,封装了软件系统使用的具体对象类型。 六大创建型模式包括…...

手机平板能效生态设计指令EU 2023/1670标准解读
手机平板能效生态设计指令EU 2023/1670标准解读 以下是针对欧盟《手机和平板电脑生态设计法规》(EU) 2023/1670 的核心解读,综合法规核心要求、最新修正及企业合规要点: 一、法规背景与目标 生效与强制时间 发布于2023年8月31日(OJ公报&…...