当前位置：首页 > news >正文

LLM - 神经网络的训练过程

news 2026/2/9 8:12:38

1. 对于回归问题，用损失函数来计算预测值和真实值的差异，一种常用的公式是如下图所示(Mean Square Error)，如果损失函数的值越小说明神经网络学习越准确，所以神经网络训练目标是减小损失函数的值，

2. 对于分类问题，损失函数和上面不一样，这里使用交叉熵作为损失函数，神经网络训练目标是最小化交叉熵。

3. 最小化损失函数的方法（梯度下降法），即将优化步骤拆分成若干个步骤，每次对损失函数的值做小幅缩小，具体过程是对损失函数求该模型参数的梯度，每次迭代对向着梯度变化最快的方向前进一步（这样就可以计算出模型参数，并在此轮迭代后更新模型参数），这样就可以使损失函数值降低一点，每次前进一步的步长称为学习率。

4. 回归问题的梯度求解过程：输出是标量F(x), 输入是[x1,x2,...xn], 对输入求偏导，得到的向量是梯度。

5. 分类问题的梯度求解过程：输出是向量F(X)，有多个输出，让每个输出对输入变量X[x1,x2,..xn]求微分，得到的jacobian矩阵是梯度

6. 求微分时的链式法则：

7.求微分实例：

8.在实际深度学习场景中，对每个参数梯度计算是通过反向传播算法实现的。

9.单个节点梯度的计算过程: downstream_gradient = upstream_gradient * local_gradient 这个公式在实际写算子时会用到。

相关文章：

LLM - 神经网络的训练过程

1. 对于回归问题，用损失函数来计算预测值和真实值的差异，一种常用的公式是如下图所示(Mean Square Error)，如果损失函数的值越小说明神经网络学习越准确，所以神经网络训练目标是减小损失函数的值， 2. 对于分类问题&…...

编程日记 2024/7/6 4:29:03

【全网最全ABC三题完整版】2024年APMCM第十四届亚太地区大学生数学建模竞赛（中文赛项）完整思路解析+代码+论文

我是Tina表姐，毕业于中国人民大学，对数学建模的热爱让我在这一领域深耕多年。我的建模思路已经帮助了百余位学习者和参赛者在数学建模的道路上取得了显著的进步和成就。现在，我将这份宝贵的经验和知识凝练成一份全面的解题思路与代码论文集合…...

编程日记 2024/7/6 4:27:58

Python | Leetcode Python题解之第213题打家劫舍II

题目： 题解： class Solution:def rob(self, nums: List[int]) -> int:def robRange(start: int, end: int) -> int:first nums[start]second max(nums[start], nums[start 1])for i in range(start 2, end 1):first, second second, max(fi…...

编程日记 2024/7/6 4:26:47

揭秘数据之美：【Seaborn】在现代【数学建模】中的革命性应用

目录已知数据集 tips 生成数据集并保存为CSV文件数据预览： 导入和预览数据步骤1：绘制散点图（Scatter Plot） 步骤2：添加回归线（Regression Analysis） 步骤3：分类变量分析&…...

编程日记 2024/7/6 4:25:42

【宠粉赠书】UML 2.5基础、建模与设计实践

为了回馈粉丝们的厚爱，今天小智给大家送上一套系统建模学习的必备书籍——《UML 2.5基础、建模与设计实践》。下面我会详细给大家介绍这本书，文末留有领取方式。图书介绍《UML 2.5基础、建模与设计实践》以实战为主旨，结合draw.io免费软件…...

编程日记 2024/7/6 4:22:36

Python中几个重要的集合

Python中几个重要的集合（Collection）类型，包括列表（List）、元组（Tuple）、集合（Set）和字典（Dictionary） 1. 列表（List） 说…...

编程日记 2024/7/6 4:20:33

【JS】纯web端使用ffmpeg实现的视频编辑器-视频合并

纯前端实现的视频合并接上篇ffmpeg文章【JS】纯web端使用ffmpeg实现的视频编辑器这次主要添加了一个函数，实现了视频合并的操作。 static mergeArgs(timelineList) {const cmd []console.log(时间轴数据,timelineList)console.log("文件1",this.readD…...

编程日记 2024/7/6 4:19:32

解决Python用xpath爬取不到数据的一个思路

前言最近在学习Python爬虫的知识，既然眼睛会了难免忍不住要实践一把。不废话直接上主题代码不复杂，简单的例子奉上： import requests from lxml import etreecookie 浏览器F12网络请求标头里有 user_agent 浏览器F12网络请求标头里有…...

编程日记 2024/7/6 4:18:31

C#面：如何把一个array复制到arrayist里

要将一个数组复制到ArrayList中，可以使用ArrayList的AddRange方法。以下是一个示例代码： int[] array { 1, 2, 3, 4, 5 }; ArrayList arrayList new ArrayList(); arrayList.AddRange(array); 在上面的代码中，我们首先创建了一个整数类型…...

编程日记 2024/7/6 4:15:28

解决前后端同一个端口跨域问题

前端起了一个代理如果url是api开头的自动代理访问8080端口（解决前后端端口不一致要么是前端代理，要么是后端加过滤器） proxy:{/api:{target:http://localhost:8080,changeOrigin : true,// 替换去掉路径上的api// rewrite:(path)>path.r…...

编程日记 2024/7/6 4:14:27

《C语言》认识数据类型和理解变量

🌹个人主页🌹：喜欢草莓熊的bear 🌹专栏🌹：C语言基础目录前言一、数据类型的介绍 1.1 字符型 1.2 整形 1.3 浮点型 1.4 布尔类型 1.5 各种数据类型的长度 1.5.1 sizeof操作符 1.5.2 数据类型长度…...

编程日记 2024/7/6 4:11:24

【ARM 常见汇编指令学习 7.1 -- LDRH 半字读取指令】

请阅读【嵌入式开发学习必备专栏】文章目录 LDRH 使用介绍LDRH（Load Register Half-word）总结 LDRH 使用介绍在ARMv9架构中，汇编指令LDRH用于从内存中载入数据到寄存器的指令，下面将分别对它进行详细介绍： LDRH&am…...

编程日记 2024/7/6 4:10:23

C++期末整理

课堂笔记构造与析构 #include <iosteam> #include <cstring> using namespace std;struct Date {int y, m, d;void setDate(int, int, int);Date(int yy, int mm, int dd) {y yy, m mm, d dd;} };class Student { private:char* name;Date birthday; public:…...

编程日记 2024/7/6 4:09:22

技术派Spring事件监听机制及原理

Spring事件监听机制是Spring框架中的一种重要技术，允许组件之间进行松耦合通信。通过使用事件监听机制，应用程序的各个组件可以在其他组件不直接引用的情况下，相互发送和接受消息。需求在技术派中有这样一个需求，当发布文章或…...

编程日记 2024/7/6 4:08:21

秋招突击——设计模式补充——简单工厂模式和策略模式

文章目录引言正文简单工厂模式策略模式策略模式和工厂模式的结合策略模式解析总结引言一个一个来吧，面试腾讯的时候，问了我单例模式相关的东西，自己这方面的东西，还没有看过。这里需要需要补充一下。但是设计模式有很多&…...

编程日记 2024/7/6 4:07:20

SwiftUI中List的liststyle样式及使用详解添加、移动、删除、自定义滑动

SwiftUI中的List可是个好东西，它用于显示可滚动列表的视图容器，类似于UITableView。在List中可以显示静态或动态的数据，并支持垂直滚动。List是一个数据驱动的视图，当数据发生变化时，列表会自动更新。针对List&#xf…...

编程日记 2024/7/6 4:06:19

PostgreSQL的系统视图pg_stats

PostgreSQL的系统视图pg_stats pg_stats 是 PostgreSQL 提供的一种系统视图，用于展示当前数据库中的统计信息。这些统计信息由数据库内部的自动统计过程通过 ANALYZE 命令收集，它们帮助查询规划器做出更好的执行决策，从而优化查询性能。 pg…...

编程日记 2024/7/6 4:03:16

UML2.0-系统架构师（二十四）

1、（重点）系统（）在规定时间内和规定条件下能有效实现规定功能的能力。它不仅取决于规定的使用条件等因素，还与设计技术有关。 A可靠性 B可用性 C可测试性 D可理解性解析： 可靠性：规定时间…...

编程日记 2024/7/6 3:58:10

leetcode 152. 乘积最大子数组「贪心」「动态规划」

152. 乘积最大子数组题目描述： 给你一个整数数组nums，请你找出数组中乘积最大的非空连续子数组，并返回该子数组所对应的乘积思路1：贪心由于 n u m s [ i ] nums[i] nums[i]都是整数，所以多乘一些数肯定不会让绝…...

编程日记 2024/7/6 3:56:08

Android项目目录结构

Android项目目录结构 1. 顶层目录2. 重要的顶层文件和目录3. app模块目录结构4. 重要的**app**模块文件和目录5. 典型的 **build.gradle** 文件内容典型的Android项目结构的详细介绍。 1. 顶层目录 MyAndroidApp/ ├── .gradle/ ├── .idea/ ├── app/ ├── build/ ├…...

编程日记 2024/7/6 3:55:07

Chapter03-Authentication vulnerabilities

文章目录 1. 身份验证简介1.1 What is authentication1.2 difference between authentication and authorization1.3 身份验证机制失效的原因1.4 身份验证机制失效的影响 2. 基于登录功能的漏洞2.1 密码爆破2.2 用户名枚举2.3 有缺陷的暴力破解防护2.3.1 如果用户登录尝试失败次…...

编程新知 2026/2/7 4:57:53

iOS 26 携众系统重磅更新，但“苹果智能”仍与国行无缘

美国西海岸的夏天，再次被苹果点燃。一年一度的全球开发者大会 WWDC25 如期而至，这不仅是开发者的盛宴，更是全球数亿苹果用户翘首以盼的科技春晚。今年，苹果依旧为我们带来了全家桶式的系统更新，包括 iOS 26、iPadOS 26…...

编程新知 2026/2/8 20:41:56

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning（提示调优）核心思想：固定预训练模型参数，仅学习额外的连续提示向量（通常是嵌入层的一部分）。实现方式：在输入文本前添加可训练的连续向量（软提示），模型只更新这些提示参数。优势：参数量少（仅提…...

编程新知 2026/2/9 1:17:40

智慧工地云平台源码，基于微服务架构+Java+Spring Cloud +UniApp +MySql

智慧工地管理云平台系统，智慧工地全套源码，java版智慧工地源码，支持PC端、大屏端、移动端。智慧工地聚焦建筑行业的市场需求，提供“平台网络终端”的整体解决方案，提供劳务管理、视频管理、智能监测、绿色施工、安全管…...

编程新知 2026/1/30 15:16:32

UDP(Echoserver)

网络命令 Ping 命令检测网络是否连通使用方法: ping -c 次数网址ping -c 3 www.baidu.comnetstat 命令 netstat 是一个用来查看网络状态的重要工具. 语法：netstat [选项] 功能：查看网络状态常用选项： n 拒绝显示别名&#…...

编程新知 2026/1/24 7:56:15

智能在线客服平台：数字化时代企业连接用户的 AI 中枢

随着互联网技术的飞速发展，消费者期望能够随时随地与企业进行交流。在线客服平台作为连接企业与客户的重要桥梁，不仅优化了客户体验，还提升了企业的服务效率和市场竞争力。本文将探讨在线客服平台的重要性、技术进展、实际应用，并…...

编程新知 2026/2/4 17:51:19

【SQL学习笔记1】增删改查+多表连接全解析（内附SQL免费在线练习工具）

可以使用Sqliteviz这个网站免费编写sql语句，它能够让用户直接在浏览器内练习SQL的语法，不需要安装任何软件。链接如下： sqliteviz 注意： 在转写SQL语法时，关键字之间有一个特定的顺序，这个顺序会影响到…...

编程新知 2026/2/5 4:36:53

ElasticSearch搜索引擎之倒排索引及其底层算法

文章目录一、搜索引擎1、什么是搜索引擎？2、搜索引擎的分类3、常用的搜索引擎4、搜索引擎的特点二、倒排索引1、简介2、为什么倒排索引不用B+树1.创建时间长，文件大。2.其次，树深，IO次数可怕。3.索引可能会失效。4.精准度差。三. 倒排索引四、算法1、Term Index的算法2、 …...

编程新知 2026/1/30 17:10:19

WordPress插件：AI多语言写作与智能配图、免费AI模型、SEO文章生成

厌倦手动写WordPress文章？AI自动生成，效率提升10倍！ 支持多语言、自动配图、定时发布，让内容创作更轻松！ AI内容生成 → 不想每天写文章？AI一键生成高质量内容！多语言支持 → 跨境电商必备&am…...

编程新知 2026/1/30 17:24:20

【分享】推荐一些办公小工具

1、PDF 在线转换 https://smallpdf.com/cn/pdf-tools 推荐理由：大部分的转换软件需要收费，要么功能不齐全，而开会员又用不了几次浪费钱，借用别人的又不安全。这个网站它不需要登录或下载安装。而且提供的免费功能就能满足日常…...

编程新知 2026/1/25 14:40:59