当前位置：首页 > news >正文

模型优化学习笔记—Adam算法

news 2026/2/8 20:33:33

首先复习一下：

动量梯度下降：

1、算出dw、db

2、计算指数加权（移动）平均

vdw = k *vdw + (1-k)*dw

vdb = k *vdb + (1-k)*db

3、梯度下降

w = w - r*vdw
b = b - r*vdb

RMSprop：

1、算出dw和db

2、算指数平均值（dw的平方是元素平方）

Sdw = k*Sdw + (1-k)dw^2

Sdb = k * Sdb + (1-k)dw^2

3、梯度下降（其中sqrt表示开平方，u取10^(-8) ）

w = w -r * ( dw / sqrt(Sdw+u) )

b = b - r * ( db / sqrt(Sdb+u) )

Adam算法：

假设动量梯度下降，可以在30个epoch能找到最小值，那么RMSprop能在20个epoch中找到，而Adam更厉害，因为它是动量梯度下降和RMSprop的结合体。运算步骤：

1、算出dw、db

2、Vdw = k1 * Vdw + (1-k1) * dw , Vdb = K1 * Vdb + (1-k1) * db，算出指数加权移动平均，即动量梯度下降

3、Sdw = k2 * Sdw + (1-K2) *dw^2, Sdb = k2 * Sdb + (1-k2)*db^2，算出RMSprop

4、Vdw修 = Vdw / (1-k1^t)，Vdb修 = Vdb / (1-k1^t)，修正动量梯度下降的值

5、Sdw修 = Sdw/ (1-k2^t)，Sdb修 = Sdb / (1-k2^t)，修正RMSprop

6、w = w -r * (Vdw修) / sqrt(Sdw修 + u) ，b = b - r * (Vdb修) / sqrt(Sdb修+u)

超参数：r、k1、k2，一般k1和k2取0.9和0.999且很少改变。调参主要调整学习率。t表示梯度下降的次数，u用来防止除0

这里Adam的理解可以为自适应改变学习率：虽然表面r没变，但是w=w-rdw，当dw变大，w变小，相当于r变大的效果。起到了与调整r的同样的作用：改变了梯度下降在某个方向的学习速度。


def initialize_adam(parameters):L = len(parameters) // 2v = {}s = {}for l in range(1, L + 1):v[f"dW{l}"] = np.zeros_like(parameters[f"W{l}"])v[f"db{l}"] = np.zeros_like(parameters[f"b{l}"])s[f"dW{l}"] = np.zeros_like(parameters[f"W{l}"])s[f"db{l}"] = np.zeros_like(parameters[f"b{l}"])return v, sdef update_parameters_with_adam(parameters, grads, v, s, t, learning_rate=0.01, beta1=0.9, beta2=0.999, epsilon=1e-8):L = len(parameters) // 2v_corrected = {}s_corrected = {}  # 修正后值for l in range(1, L + 1):# 算出v值，等式左边的为本次计算的新Vdw，等式右边为上次调用update_parameters_with_adam留下的Vdw值，注意不是for循环的上个值哦！for循环里的是多个dW1、dW2...等，别搞混了v[f"dW{l}"] = beta1 * v[f"dW{l}"] + (1 - beta1) * grads[f"dW{l}"]v[f"db{l}"] = beta1 * v[f"db{l}"] + (1 - beta1) * grads[f"db{l}"]v_corrected[f"dW{l}"] = v[f"dW{l}"] / (1 - np.power(beta1, t))v_corrected[f"db{l}"] = v[f"db{l}"] / (1 - np.power(beta1, t))# 算出s值s[f"dW{l}"] = beta2 * s[f"dW{l}"] + (1 - beta2) * np.power(grads[f"dW{l}"], 2)s[f"db{l}"] = beta2 * s[f"db{l}"] + (1 - beta2) * np.power(grads[f"db{l}"], 2)s_corrected[f"dW{l}"] = s[f"dW{l}"] / (1 - np.power(beta2, t))s_corrected[f"db{l}"] = s[f"db{l}"] / (1 - np.power(beta2, t)) # t为梯度下降次数，也就是调用该update_parameters_with_adam()方法的累计次数。parameters[f"W{l}"] = parameters[f"W{l}"] - learning_rate * v_corrected[f"dW{l}"] / np.sqrt(s_corrected[f"dW{l}"] + epsilon)parameters[f"b{l}"] = parameters[f"b{l}"] - learning_rate * v_corrected[f"db{l}"] / np.sqrt(s_corrected[f"db{l}"] + epsilon)return parameters, v, s

模型优化学习笔记—Adam算法

首先复习一下： 动量梯度下降： 1、算出dw、db 2、计算指数加权（移动）平均 vdw k *vdw (1-k)*dw vdb k *vdb (1-k)*db 3、梯度下降 w w - r*vdw b b - r*vdb RMSprop： 1、算出dw和db 2、算指数平均值&am…...

编程日记 2024/8/5 18:49:55

车辆出险报告(h5)-车辆出险记录接口-车辆相关接口

接口简介：通过vin及行驶证查询车辆出险、理赔、事故记录接口。查询成功率99%,返回URL地址的查询报告。不能对返回的报告进行任何的修改，否则由用户自行承担相应的责任报告结果只保留30天，如需永久保存，请您查询后自行保存接口地…...

编程日记 2024/8/5 18:48:54

C基础项目（学生成绩管理系统）

目录一、项目要求二、完整代码实例三、分文件编写代码实例一、项目要求 1.系统运行，打开如下界面。列出系统帮助菜单（即命令菜单），提示输入命令 2.开始时还没有录入成绩，所以输入命令 L 也无法列出成绩。应提…...

编程日记 2024/8/5 18:45:49

C# 设计模式之原型模式

总目录前言在软件系统中，当创建一个类的实例的过程很昂贵或很复杂，并且我们需要创建多个这样类的实例时，如果我们用new操作符去创建这样的类实例，这未免会增加创建类的复杂度和耗费更多的内存空间，因为这样在内存中…...

编程日记 2024/8/5 18:44:48

美林数据Tempo Talents | 两大资源中心，打造开放、成长型数智人才能力平台

在数字化时代的大潮中，高校作为知识与人才培养的重要阵地，独立分散的课程资源管理方式已无法满足现代教育的需求，而数据资源的分散和碎片化也阻碍了科研和教学工作的深入进行。那么，高校如何打造一个集中、高效的课程与数据资源中…...

编程日记 2024/8/5 18:42:46

IDC权威认可！工业领域最佳实践案例！

近日，IDC发布了《工业领域中数据管理分析服务最佳实践案例》报告，总结行业用户在应用过程中面临的主要挑战和实践路径，并评选最佳实践案例，为行业用户提供了相关的指导建议，供市场参考。星环科技中航电梯数据中台项目入…...

编程日记 2024/8/5 18:41:45

未授权访问漏洞系列详解①！

Redis未授权访问漏洞 Redis 默认情况下，会绑定在 0.0.0.0:6379 ，如果没有进行采用相关的策略，比如添加防火墙规则避免其他非信任来源 ip 访问等，这样将会将 Redis 服务暴露到公网上，如果在没有设置密码认证(一般为空)的…...

编程日记 2024/8/5 18:40:44

第1天：Python基础语法（五）

正文： 在之前的文章中，我们已经学习了Python的基本语法集合和集合的一些常用操作。在本篇文章中，我们将继续学习其他类型字符串格式化使用操作符%s来实现 ➢ 几个%s就几个变量 ➢ 超过一个变量时，需要用元组%（…...

编程日记 2024/8/5 18:38:43

【c++】用C++制作一个简易windows系统

源码： #include <iostream> #include <cstdlib> // 为了使用system #include<limits> void clearScreen() {system("cls"); }void displayMenu() {clearScreen();std::cout << "1.我的文件" << std::endl;std::…...

编程日记 2024/8/5 18:37:42

常见锁策略

目录 1.乐观锁/悲观锁 2.重量级锁/轻量级锁（轻量重量是站在加锁开销的角度） 3.挂起等待锁/自旋锁 4.公平锁/非公平锁 5.可重入锁与不可重入锁 6.读写锁 synchronized 面试题：是什么偏向锁？ 锁的升级： 锁消除&…...

编程日记 2024/8/5 18:36:41

【机器学习】人工神经网络优化方法及正则化技术

🌈个人主页: 鑫宝Code 🔥热门专栏: 闲话杂谈｜ 炫酷HTML | JavaScript基础 💫个人格言: "如无必要，勿增实体" 文章目录人工神经网络优化方法及正则化技术1. 引言2. 神经网络优化的基础2.1 损失函数2.…...

编程日记 2024/8/5 18:35:40

Django异步请求和后台管理实战

项目概述项目实现Ajax异步请求局部刷新使用XAdmin后台模板提供图片上传接口在明细页应用了富文本编辑器在加载图书信息的时候使用LazyLoad（图片懒加载） # 环境 asgiref3.7.2 crispy-bootstrap32024.1 defusedxml0.7.1 diff-match-patch20230430 Djang…...

编程日记 2024/8/5 18:34:39

大奖放送｜ AI编程达人秀视频文章征集大赛来啦！

AI Coding，可以有多少种打开玩法？腾讯云AI代码助手是一款辅助编码工具，基于混元大模型，提供技术对话、代码补全、代码诊断和优化等能力，为你生成优质代码，帮你解决技术难题，提升编码效率。我…...

编程日记 2024/8/5 18:33:38

a bag of bones

以下是根据你提供的内容制作的5道选择题，包括答案和解析： 1. 短语 "a bag of bones" 通常用来描述什么？ - A. 一个恐怖片中的角色 - B. 一个非常瘦弱的人 - C. 一个懒惰的人 - D. 一个穿着比基尼的人答案：B 解析&#…...

编程日记 2024/8/5 18:28:32

XLT高速线缆自动化测试系统

高速线缆自动化测试系统随着高速通信的快速发展，对于高速数据通信线缆性能要求日益增高，在其硏发、生产阶段，需要多次测试射频性能。传统人工手动测试存在测试环境搭建复杂、测试效率低、耗时长，特别是多次测试中因为人工测试带…...

编程日记 2024/8/5 18:26:30

微软AI业务最新营收数据情况（2024年7月）

Azure AI 年度经常性收入 (ARR)：达到50亿美元客户数量：60,000家平均客户价值 (ACV) 中位数：83,000美元同比增长率：达到了惊人的900% GitHub Copilot 年度经常性收入 (ARR)：达到3亿美元客户数量：77,000家…...

编程日记 2024/8/5 18:24:27

canvas绘制表格

canvas绘制表格最近在为公司产品做技术预研，经理让用canvas做一个表格，于是就有了这篇博客。我们的数据是后端通过MQTT推送过来的我在代码中也直接使用了具体MQTT的实现代码，可见博客在vue使用MQTT 在这里为了方便实用我直接封装成组件…...

编程日记 2024/8/5 18:23:23

避免溃坝的关键：渗压计在防洪管理中的作用

防洪管理对于保障人民生命财产安全具有重要意义，而溃坝作为防洪管理中的重大风险之一，其防范工作尤为关键。在防洪管理体系中，渗压计作为一种重要的监测工具，发挥着不可替代的作用。本文将深入探讨渗压计在防洪管理中的作用。实时…...

编程日记 2024/8/5 18:22:22

品牌建设如何助力中小企业突破生存瓶颈？

品牌，不仅仅是一个标志或商标，更是企业的形象、声誉和信誉的体现。品牌的存在是为了使企业区别于其他竞争对手，树立独特的形象，赢得消费者的认可和信任。品牌的本质是品牌拥有者的产品、服务或其它优于竞争对手的优势能为目标受…...

编程日记 2024/8/5 18:21:21

Vim 调用外部命令学习笔记

Vim 外部命令集成完全指南文章目录 Vim 外部命令集成完全指南核心概念理解命令语法解析语法对比常用外部命令详解文本排序与去重文本筛选与搜索高级 grep 搜索技巧文本替换与编辑字符处理高级文本处理编程语言处理其他实用命令范围操作示例指定行范围处理复合命令示例实用技…...

编程新知 2025/11/16 8:24:16

DockerHub与私有镜像仓库在容器化中的应用与管理

哈喽，大家好，我是左手python！ Docker Hub的应用与管理 Docker Hub的基本概念与使用方法 Docker Hub是Docker官方提供的一个公共镜像仓库，用户可以在其中找到各种操作系统、软件和应用的镜像。开发者可以通过Docker Hub轻松获取所…...

编程新知 2025/10/8 10:56:25

剑指offer20_链表中环的入口节点

链表中环的入口节点给定一个链表，若其中包含环，则输出环的入口节点。若其中不包含环，则输出null。数据范围节点 val 值取值范围 [ 1 , 1000 ] [1,1000] [1,1000]。节点 val 值各不相同。链表长度 [ 0 , 500 ] [0,500] [0,500]。 …...

编程新知 2026/1/31 6:09:22

【Go】3、Go语言进阶与依赖管理

前言本系列文章参考自稀土掘金上的【字节内部课】公开课，做自我学习总结整理。 Go语言并发编程 Go语言原生支持并发编程，它的核心机制是 Goroutine 协程、Channel 通道，并基于CSP（Communicating Sequential Processes&#xff0…...

编程新知 2025/10/7 0:32:40

Unit 1 深度强化学习简介

Deep RL Course ——Unit 1 Introduction 从理论和实践层面深入学习深度强化学习。学会使用知名的深度强化学习库，例如 Stable Baselines3、RL Baselines3 Zoo、Sample Factory 和 CleanRL。在独特的环境中训练智能体，比如 SnowballFight、Huggy the Do…...

编程新知 2026/2/8 12:54:53

Android15默认授权浮窗权限

我们经常有那种需求，客户需要定制的apk集成在ROM中，并且默认授予其【显示在其他应用的上层】权限，也就是我们常说的浮窗权限，那么我们就可以通过以下方法在wms、ams等系统服务的systemReady()方法中调用即可实现预置应用默认授权浮…...

编程新知 2026/2/1 4:13:59

Python基于历史模拟方法实现投资组合风险管理的VaR与ES模型项目实战

说明：这是一个机器学习实战项目（附带数据代码文档），如需数据代码文档可以直接到文章最后关注获取。 1.项目背景在金融市场日益复杂和波动加剧的背景下，风险管理成为金融机构和个人投资者关注的核心议题之一。VaR&…...

编程新知 2026/1/25 4:19:49

LangChain知识库管理后端接口：数据库操作详解—— 构建本地知识库系统的基础《二》

这段 Python 代码是一个完整的知识库数据库操作模块，用于对本地知识库系统中的知识库进行增删改查（CRUD）操作。它基于 SQLAlchemy ORM 框架和一个自定义的装饰器 with_session 实现数据库会话管理。 📘 一、整体功能概述该模块…...

编程新知 2025/11/26 18:23:29

在Mathematica中实现Newton-Raphson迭代的收敛时间算法（一般三次多项式）

考察一般的三次多项式，以r为参数： p[z_, r_] : z^3 (r - 1) z - r; roots[r_] : z /. Solve[p[z, r] 0, z]； 此多项式的根为： 尽管看起来这个多项式是特殊的，其实一般的三次多项式都是可以通过线性变换化为这个形式…...

编程新知 2026/1/30 3:24:00

基于Java+VUE+MariaDB实现（Web）仿小米商城

仿小米商城环境安装 nodejs maven JDK11 运行 mvn clean install -DskipTestscd adminmvn spring-boot:runcd ../webmvn spring-boot:runcd ../xiaomi-store-admin-vuenpm installnpm run servecd ../xiaomi-store-vuenpm installnpm run serve 注意：运行前…...

编程新知 2026/1/31 4:37:40

模型优化学习笔记—Adam算法

首先复习一下：

Adam算法：

相关文章：

模型优化学习笔记—Adam算法

车辆出险报告(h5)-车辆出险记录接口-车辆相关接口

C基础项目（学生成绩管理系统）

C# 设计模式之原型模式

美林数据Tempo Talents | 两大资源中心，打造开放、成长型数智人才能力平台

IDC权威认可！工业领域最佳实践案例！

未授权访问漏洞系列详解①！

第1天：Python基础语法（五）

【c++】用C++制作一个简易windows系统

常见锁策略

【机器学习】人工神经网络优化方法及正则化技术

Django异步请求和后台管理实战

大奖放送｜ AI编程达人秀视频文章征集大赛来啦！

最新小猫咪PHP加密系统源码V1.4_本地API接口_带后台

a bag of bones

XLT高速线缆自动化测试系统

微软AI业务最新营收数据情况（2024年7月）

canvas绘制表格

避免溃坝的关键：渗压计在防洪管理中的作用

品牌建设如何助力中小企业突破生存瓶颈？

Vim 调用外部命令学习笔记

DockerHub与私有镜像仓库在容器化中的应用与管理

剑指offer20_链表中环的入口节点

【Go】3、Go语言进阶与依赖管理

Unit 1 深度强化学习简介

Android15默认授权浮窗权限

Python基于历史模拟方法实现投资组合风险管理的VaR与ES模型项目实战

LangChain知识库管理后端接口：数据库操作详解—— 构建本地知识库系统的基础《二》

在Mathematica中实现Newton-Raphson迭代的收敛时间算法（一般三次多项式）

基于Java+VUE+MariaDB实现（Web）仿小米商城