当前位置：首页 > news >正文

神经网络基础-神经网络补充概念-23-神经网络的梯度下降法

news 2025/8/23 13:29:46

概念

神经网络的梯度下降法是训练神经网络的核心优化算法之一。它通过调整神经网络的权重和偏差，以最小化损失函数，从而使神经网络能够逐渐逼近目标函数的最优值。

步骤

1损失函数（Loss Function）：
首先，我们定义一个损失函数，用来衡量神经网络预测值与真实标签之间的差距。常见的损失函数包括均方误差（Mean Squared Error）和交叉熵（Cross-Entropy）等。

2初始化参数：
在训练之前，需要随机初始化神经网络的权重和偏差。

4前向传播：
通过前向传播计算神经网络的输出，根据输入数据、权重和偏差计算每一层的激活值和预测值。

5计算损失：
使用损失函数计算预测值与真实标签之间的差距。

6反向传播：
反向传播是梯度下降法的关键步骤。它从输出层开始，计算每一层的误差梯度，然后根据链式法则将梯度传递回每一层。这样，可以得到关于权重和偏差的梯度信息，指导参数的更新。

7更新参数：
使用梯度信息，按照一定的学习率（learning rate）更新神经网络的权重和偏差。通常采用如下更新规则：新权重 = 旧权重 - 学习率 × 梯度。

8重复迭代：
重复执行前向传播、计算损失、反向传播和参数更新步骤，直到损失函数收敛或达到预定的迭代次数。

9评估模型：
在训练过程中，可以周期性地评估模型在验证集上的性能，以防止过拟合并选择合适的模型。

python实现

import numpy as np# 定义 sigmoid 激活函数及其导数
def sigmoid(x):return 1 / (1 + np.exp(-x))def sigmoid_derivative(x):return x * (1 - x)# 设置随机种子以保证可重复性
np.random.seed(42)# 生成模拟数据
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([[0], [1], [1], [0]])# 初始化权重和偏差
input_size = 2
output_size = 1
hidden_size = 4weights_input_hidden = np.random.uniform(-1, 1, (input_size, hidden_size))
bias_hidden = np.zeros((1, hidden_size))weights_hidden_output = np.random.uniform(-1, 1, (hidden_size, output_size))
bias_output = np.zeros((1, output_size))# 设置学习率和迭代次数
learning_rate = 0.1
epochs = 10000# 训练神经网络
for epoch in range(epochs):# 前向传播hidden_input = np.dot(X, weights_input_hidden) + bias_hiddenhidden_output = sigmoid(hidden_input)final_input = np.dot(hidden_output, weights_hidden_output) + bias_outputfinal_output = sigmoid(final_input)# 计算损失loss = np.mean(0.5 * (y - final_output) ** 2)# 反向传播d_output = (y - final_output) * sigmoid_derivative(final_output)d_hidden = d_output.dot(weights_hidden_output.T) * sigmoid_derivative(hidden_output)# 更新权重和偏差weights_hidden_output += hidden_output.T.dot(d_output) * learning_ratebias_output += np.sum(d_output, axis=0, keepdims=True) * learning_rateweights_input_hidden += X.T.dot(d_hidden) * learning_ratebias_hidden += np.sum(d_hidden, axis=0, keepdims=True) * learning_rateif epoch % 1000 == 0:print(f'Epoch {epoch}, Loss: {loss}')# 打印训练后的权重和偏差
print('Final weights_input_hidden:', weights_input_hidden)
print('Final bias_hidden:', bias_hidden)
print('Final weights_hidden_output:', weights_hidden_output)
print('Final bias_output:', bias_output)

神经网络基础-神经网络补充概念-23-神经网络的梯度下降法

概念神经网络的梯度下降法是训练神经网络的核心优化算法之一。它通过调整神经网络的权重和偏差，以最小化损失函数，从而使神经网络能够逐渐逼近目标函数的最优值。步骤 1损失函数（Loss Function）： 首先&#xff0c…...

编程日记 2023/8/18 4:11:51

鸿蒙3.1 设备管理DeviceManager

介绍 DeviceManager组件在OpenHarmony上提供账号无关的分布式设备的认证组网能力，并为开发者提供了一套用于分布式设备间监听、发现和认证的接口。其组成及依赖如下所示：总结设备管理模块其实就是软总线的包皮服务。目前权限都是控制系统uid，但是根据官方介绍，后续可…...

编程日记 2023/8/18 4:10:51

Git 目录详解

一、Git目录详解在使用Git时，有几个目录和文件在Git项目中扮演着重要的角色，下面详细介绍一下这些目录和文件的作用 1、.git目录 .git目录是Git项目的核心，包含了Git的版本库和元数据等重要信息。在该目录中，有一些重要的子目录和…...

编程日记 2023/8/18 4:09:50

基于springboot+vue的武汉旅游网(前后端分离)

博主主页：猫头鹰源码博主简介：Java领域优质创作者、CSDN博客专家、公司架构师、全网粉丝5万、专注Java技术领域和毕业设计项目实战主要内容：毕业设计(Javaweb项目|小程序等)、简历模板、学习资料、面试题库、技术咨询文末联系获取项目介绍…...

编程日记 2023/8/18 4:08:48

目录扩展学习资料高阶组件 /src/components/hoc/withTooltip.js /src/components/hoc/itemA.jsx /src/components/hoc/itemB.jsx /src/App.js 函数作为子组件【Render pprops】函数作为子组件 /src/components/rp/itemC.jsx【父组件】 /src/components/rp/withToo…...

编程日记 2023/8/18 4:07:46

Java 单例模式简单介绍

何为单例模式所谓类的单例设计模式，就是采取一定的方法保证在整个的软件系统中，对某个类只能存在一个对象实例，并且该类只提供一个取得其对象实例的方法。实现思路如果我们要让类在一个虚拟机中只能产生一个对象，我们首先必…...

编程日记 2023/8/18 4:06:45

根据源码，模拟实现 RabbitMQ - 从需求分析到实现核心类(1)

目录一、需求分析 1.1、对 Message Queue 的认识 1.2、消息队列核心概念 1.3、Broker Server 内部关键概念 1.4、Broker Server 核心 API （重点实现） 1.5、交换机类型 Direct 直接交换机 Fanout 扇出交换机 Topic 主题交换机 1.6、持久化 1.7…...

编程日记 2023/8/18 4:05:43

企业服务器数据库遭到malox勒索病毒攻击后如何解决，勒索病毒解密

网络技术的发展不仅为企业带来了更高的效率，还为企业带来信息安全威胁，其中较为常见的就是勒索病毒攻击。近期，我们公司收到很多企业的求助，企业的服务器数据库遭到了malox勒索病毒攻击，导致系统内部的许多重要数据被加…...

编程日记 2023/8/18 4:04:41

udp与can通信的选择与比较

UDP（用户数据报协议）和CAN（控制器局域网）是两种不同的通信协议，它们在实时传递性上有一些区别。 UDP是一种无连接的传输协议，它提供了简单的、不可靠的数据传输。UDP不提供可靠性保证、流控制或重传机制。…...

编程日记 2023/8/18 4:03:34

HoudiniVex笔记_P24_ForceBasics力基础

原视频：https://www.youtube.com/playlist?listPLzRzqTjuGIDhiXsP0hN3qBxAZ6lkVfGDI Bili：Houdini最强VEX算法教程 - VEX for Algorithmic Design_哔哩哔哩_bilibili Houdini版本：19.5 1、什么是Force 本章主要讲重力、弹力、速度与质量、…...

编程日记 2023/8/18 4:02:33

半导体退火那些事（1）

1.半导体退火的原理半导体材料在晶体生长和制造过程中，由于各种原因会出现缺陷、杂质、位错等结构性缺陷，导致晶格不完整，施加电场后的电导率较低。通过退火处理，可以使材料得到修复，结晶体内部重新排列，…...

编程日记 2023/8/18 4:01:32

MapReduce介绍

目录一、什么是MapReduce 二、MapReduce 的设计思想 2.1 分而治之 2.2 构建抽象模型：Map和Reduce 2.3 隐藏系统层细节三、MapReduce 的框架原理 3.1 MRv1工作原理 3.1.1 MRv1架构工作原理图 3.1.1.1 流程说明 3.1.1.1.1 作业的提交 3.1.1.1.2 作业的初始化 3…...

编程日记 2023/8/18 4:00:30

Redis支持的主要数据结构操作命令有哪些？

Redis支持多种数据结构操作命令，包括以下主要命令： 字符串（Strings）： SET：设置字符串键的值。GET：获取指定键的值。INCR/DECR：对存储整数的字符串执行加一或减一操作。APPEND&#x…...

编程日记 2023/8/18 3:59:29

环境与能源创新专题：地级市绿色创新、碳排放与环境规制数据

数据简介：推动绿色发展，促进人与自然和谐共生是重大战略举措。绿色发展强调“绿水青山就是金山银山”，人与自然和谐共生重在正确处理生态环境保护与经济发展的关系。在着力于实现绿色发展的过程中，绿色创新是绿色发展的重要驱动因…...

编程日记 2023/8/18 3:58:27

设计模式之门面模式（Facade）的C++实现

1、门面模式提出在组件的开发过程中，某些接口之间的依赖是比较紧密的，如果某个接口发生变化，其他的接口也会跟着发生变化，这样的代码违背了代码的设计原则。门面设计模式是在外部客户程序和系统程序之间添加了一层中间接口&…...

编程日记 2023/8/18 3:57:25

【数理知识】向量与基的内积，Matlab 代码验证

序号内容1【数理知识】向量的坐标基表示法，Matlab 代码验证2【数理知识】向量与基的内积，Matlab 代码验证文章目录 1. 向量与基的内积2. 二维平面向量举例3. 代码验证Ref 1. 向量与基的内积假设存在一个二维平面内的向量 a ⃗ \vec{a} a &#xff0c…...

编程日记 2023/8/18 3:56:24

黑客入侵：福特汽车Sync3车机存在漏洞，黑客入侵可抹除系统数据

据福特汽车公告，他们发现部分2021年至2022年车型的Sync3车机存在Wi-Fi漏洞，该漏洞可能被黑客利用来入侵并抹除车机内的系统数据。这一漏洞源于福特车系中采用的WL18xx MCP驱动程序的内存缓冲区溢位漏洞，其漏洞编号为CVE-2023-29468。这一发现…...

编程日记 2023/8/18 3:55:23

面试热题（单词搜索）

给定一个 m x n 二维字符网格 board 和一个字符串单词 word 。如果 word 存在于网格中，返回 true ；否则，返回 false 。单词必须按照字母顺序，通过相邻的单元格内的字母构成，其中“相邻”单元格是那些水平相邻或垂直相…...

编程日记 2023/8/18 3:54:21

自定义表格组件：实现表格中有固定列的功能逻辑

目录 1，效果图2，实现思路3，实现方式 1，效果图可以拖动纵向滑块，最左边一列固定住。以同样的道理，可以在右面固定一列 2，实现思路作为一个table组件，要接受父组件中的对table的…...

编程日记 2023/8/18 3:53:20

uni-app弹窗列表滚动, 弹框下面的内容也跟随滚动解决方案

滑动弹窗里的列表，弹框下面的内容也会跟着滑动，导致弹窗中的列表不能正常滚动 1.弹窗组件代码，需要在最外层的view中加入touchmove.stop.prevent"moveHandle"，且弹窗中需要滚动的列表要使用scroll-view标签包裹起来&…...

编程日记 2023/8/18 3:52:18

C++_核心编程_多态案例二-制作饮品

#include <iostream> #include <string> using namespace std;/*制作饮品的大致流程为：煮水 - 冲泡 - 倒入杯中 - 加入辅料利用多态技术实现本案例，提供抽象制作饮品基类，提供子类制作咖啡和茶叶*//*基类*/ class AbstractDr…...

编程新知 2025/8/11 10:05:03

反向工程与模型迁移：打造未来商品详情API的可持续创新体系

在电商行业蓬勃发展的当下，商品详情API作为连接电商平台与开发者、商家及用户的关键纽带，其重要性日益凸显。传统商品详情API主要聚焦于商品基本信息（如名称、价格、库存等）的获取与展示，已难以满足市场对个性化、智能…...

编程新知 2025/6/15 17:37:51

React Native 开发环境搭建（全平台详解）

React Native 开发环境搭建（全平台详解） 在开始使用 React Native 开发移动应用之前，正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南，涵盖 macOS 和 Windows 平台的配置步骤，如何在 Android 和 iOS…...

编程新知 2025/7/14 21:22:23

工程地质软件市场：发展现状、趋势与策略建议

一、引言在工程建设领域，准确把握地质条件是确保项目顺利推进和安全运营的关键。工程地质软件作为处理、分析、模拟和展示工程地质数据的重要工具，正发挥着日益重要的作用。它凭借强大的数据处理能力、三维建模功能、空间分析工具和可视化展示手段&…...

编程新知 2025/6/17 23:10:20

LLM基础1_语言模型如何处理文本

基于GitHub项目：https://github.com/datawhalechina/llms-from-scratch-cn 工具介绍 tiktoken：OpenAI开发的专业"分词器" torch：Facebook开发的强力计算引擎，相当于超级计算器理解词嵌入：给词语画"…...

编程新知 2025/7/21 10:28:02

AI编程--插件对比分析：CodeRider、GitHub Copilot及其他

AI编程插件对比分析：CodeRider、GitHub Copilot及其他随着人工智能技术的快速发展，AI编程插件已成为提升开发者生产力的重要工具。CodeRider和GitHub Copilot作为市场上的领先者，分别以其独特的特性和生态系统吸引了大量开发者。本文将从功…...

编程新知 2025/7/6 18:33:10

JDK 17 新特性

#JDK 17 新特性 /**************** 文本块 *****************/ python/scala中早就支持，不稀奇 String json “”" { “name”: “Java”, “version”: 17 } “”"; /**************** Switch 语句 -> 表达式 *****************/ 挺好的&#xff…...

编程新知 2025/8/17 10:25:39

什么？连接服务器也能可视化显示界面？：基于X11 Forwarding + CentOS + MobaXterm实战指南

文章目录什么是X11？环境准备实战步骤1️⃣ 服务器端配置（CentOS）2️⃣ 客户端配置（MobaXterm）3️⃣ 验证X11 Forwarding4️⃣ 运行自定义GUI程序(Python示例)5️⃣ 成功效果![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/55aefaea8a9f477e86d065227851fe3d.pn…...

编程新知 2025/7/24 7:13:48

USB Over IP专用硬件的5个特点

USB over IP技术通过将USB协议数据封装在标准TCP/IP网络数据包中，从根本上改变了USB连接。这允许客户端通过局域网或广域网远程访问和控制物理连接到服务器的USB设备（如专用硬件设备），从而消除了直接物理连接的需要。USB over IP的…...

编程新知 2025/8/22 3:59:13

10-Oracle 23 ai Vector Search 概述和参数

一、Oracle AI Vector Search 概述企业和个人都在尝试各种AI，使用客户端或是内部自己搭建集成大模型的终端，加速与大型语言模型（LLM）的结合，同时使用检索增强生成（Retrieval Augmented Generation &#…...

编程新知 2025/8/22 3:59:36

神经网络基础-神经网络补充概念-23-神经网络的梯度下降法

概念

步骤

python实现

相关文章：

神经网络基础-神经网络补充概念-23-神经网络的梯度下降法

鸿蒙3.1 设备管理DeviceManager

Git 目录详解

基于springboot+vue的武汉旅游网(前后端分离)

步入React正殿 - React组件设计模式

Java 单例模式简单介绍

根据源码，模拟实现 RabbitMQ - 从需求分析到实现核心类(1)

企业服务器数据库遭到malox勒索病毒攻击后如何解决，勒索病毒解密

udp与can通信的选择与比较

HoudiniVex笔记_P24_ForceBasics力基础

半导体退火那些事（1）

MapReduce介绍

Redis支持的主要数据结构操作命令有哪些？

环境与能源创新专题：地级市绿色创新、碳排放与环境规制数据

设计模式之门面模式（Facade）的C++实现

【数理知识】向量与基的内积，Matlab 代码验证

黑客入侵：福特汽车Sync3车机存在漏洞，黑客入侵可抹除系统数据

面试热题（单词搜索）

自定义表格组件：实现表格中有固定列的功能逻辑

uni-app弹窗列表滚动, 弹框下面的内容也跟随滚动解决方案

C++_核心编程_多态案例二-制作饮品

反向工程与模型迁移：打造未来商品详情API的可持续创新体系

React Native 开发环境搭建（全平台详解）

工程地质软件市场：发展现状、趋势与策略建议

LLM基础1_语言模型如何处理文本

AI编程--插件对比分析：CodeRider、GitHub Copilot及其他

JDK 17 新特性

什么？连接服务器也能可视化显示界面？：基于X11 Forwarding + CentOS + MobaXterm实战指南

USB Over IP专用硬件的5个特点

10-Oracle 23 ai Vector Search 概述和参数