当前位置：首页 > news >正文

8. 损失函数与反向传播

news 2025/7/10 7:42:09

8.1 损失函数

① Loss损失函数一方面计算实际输出和目标之间的差距。

② Loss损失函数另一方面为我们更新输出提供一定的依据。

8.2 L1loss损失函数

① L1loss数学公式如下图所示，例子如下下图所示。

import torch
from torch.nn import L1Loss
inputs = torch.tensor([1,2,3],dtype=torch.float32)
targets = torch.tensor([1,2,5],dtype=torch.float32)
inputs = torch.reshape(inputs,(1,1,1,3))
targets = torch.reshape(targets,(1,1,1,3))
loss = L1Loss()  # 默认为 maen
result = loss(inputs,targets)
print(result)

结果：

tensor(0.6667)

import torch
from torch.nn import L1Loss
inputs = torch.tensor([1,2,3],dtype=torch.float32)
targets = torch.tensor([1,2,5],dtype=torch.float32)
inputs = torch.reshape(inputs,(1,1,1,3))
targets = torch.reshape(targets,(1,1,1,3))
loss = L1Loss(reduction='sum') # 修改为sum，三个值的差值，然后取和
result = loss(inputs,targets)
print(result)

结果：

tensor(2.)

8.3 MSE损失函数

① MSE损失函数数学公式如下图所示。

import torch
from torch.nn import L1Loss
from torch import nn
inputs = torch.tensor([1,2,3],dtype=torch.float32)
targets = torch.tensor([1,2,5],dtype=torch.float32)
inputs = torch.reshape(inputs,(1,1,1,3))
targets = torch.reshape(targets,(1,1,1,3))
loss_mse = nn.MSELoss()
result_mse = loss_mse(inputs,targets)
print(result_mse)

结果：

tensor(1.3333)

8.4 交叉熵损失函数

① 交叉熵损失函数数学公式如下图所示。

import torch
from torch.nn import L1Loss
from torch import nnx = torch.tensor([0.1,0.2,0.3])
y = torch.tensor([1])
x = torch.reshape(x,(1,3)) # 1的 batch_size，有三类
loss_cross = nn.CrossEntropyLoss()
result_cross = loss_cross(x,y)
print(result_cross)

结果：

tensor(1.1019)

8.5 搭建神经网络

import torch
import torchvision
from torch import nn 
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriterdataset = torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)       
dataloader = DataLoader(dataset, batch_size=1,drop_last=True)class Tudui(nn.Module):def __init__(self):super(Tudui, self).__init__()        self.model1 = Sequential(Conv2d(3,32,5,padding=2),MaxPool2d(2),Conv2d(32,32,5,padding=2),MaxPool2d(2),Conv2d(32,64,5,padding=2),MaxPool2d(2),Flatten(),Linear(1024,64),Linear(64,10))def forward(self, x):x = self.model1(x)return xtudui = Tudui()
for data in dataloader:imgs, targets = dataoutputs = tudui(imgs)print(outputs)print(targets)

结果：

8.6 数据集计算损失函数

import torch
import torchvision
from torch import nn 
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriterdataset = torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)       
dataloader = DataLoader(dataset, batch_size=64,drop_last=True)class Tudui(nn.Module):def __init__(self):super(Tudui, self).__init__()        self.model1 = Sequential(Conv2d(3,32,5,padding=2),MaxPool2d(2),Conv2d(32,32,5,padding=2),MaxPool2d(2),Conv2d(32,64,5,padding=2),MaxPool2d(2),Flatten(),Linear(1024,64),Linear(64,10))def forward(self, x):x = self.model1(x)return xloss = nn.CrossEntropyLoss() # 交叉熵    
tudui = Tudui()
for data in dataloader:imgs, targets = dataoutputs = tudui(imgs)result_loss = loss(outputs, targets) # 计算实际输出与目标输出的差距print(result_loss)

结果：

8.7 损失函数反向传播

① 反向传播通过梯度来更新参数，使得loss损失最小，如下图所示。

import torch
import torchvision
from torch import nn 
from torch.nn import Conv2d, MaxPool2d, Flatten, Linear, Sequential
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriterdataset = torchvision.datasets.CIFAR10("./dataset",train=False,transform=torchvision.transforms.ToTensor(),download=True)       
dataloader = DataLoader(dataset, batch_size=64,drop_last=True)class Tudui(nn.Module):def __init__(self):super(Tudui, self).__init__()        self.model1 = Sequential(Conv2d(3,32,5,padding=2),MaxPool2d(2),Conv2d(32,32,5,padding=2),MaxPool2d(2),Conv2d(32,64,5,padding=2),MaxPool2d(2),Flatten(),Linear(1024,64),Linear(64,10))def forward(self, x):x = self.model1(x)return xloss = nn.CrossEntropyLoss() # 交叉熵    
tudui = Tudui()
for data in dataloader:imgs, targets = dataoutputs = tudui(imgs)result_loss = loss(outputs, targets) # 计算实际输出与目标输出的差距result_loss.backward()  # 计算出来的 loss 值有 backward 方法属性，反向传播来计算每个节点的更新的参数。这里查看网络的属性 grad 梯度属性刚开始没有，反向传播计算出来后才有，后面优化器会利用梯度优化网络参数。      print("ok")

8. 损失函数与反向传播

8.1 损失函数 ① Loss损失函数一方面计算实际输出和目标之间的差距。 ② Loss损失函数另一方面为我们更新输出提供一定的依据。 8.2 L1loss损失函数 ① L1loss数学公式如下图所示，例子如下下图所示。 import torch from torch.nn import L1Loss inputs torch.tens…...

编程日记 2023/9/1 15:54:11

Angular安全专辑之四 —— 避免服务端可能的资源耗尽(NodeJS)

express-rate-limit是一个简单实用的npm包,用于在Express应用程序中实现速率限制。它可以帮助防止DDoS攻击和暴力破解,同时还允许对API端点进行流控。 express-rate-limit及其主要功能 express-rate-limit是Express框架的一个流行中间件,它允许根据IP地址或其他标准轻松地对请求…...

编程日记 2023/9/1 15:53:07

Servlet学习总结（Request请求与转发，Response响应，Servlet生命周期、体系结构、执行流程等...）

Override 是Java中的注解（Annotation），它用于告诉编译器该方法是覆盖（重写）父类中的方法。当我们使用Override注解时，编译器会检查当前方法是否正确地覆盖了父类中的方法，如果没有覆盖成功&…...

编程日记 2023/9/1 15:52:05

目录饥饿网一百句翻译 Using government funds for pollution cleanup work can create a comfortable environment. "Allocating government funds to pollution cleanup work can contribute to the creation of a comfortable environment." Some advertise…...

编程日记 2023/9/1 15:51:04

Element Plus 日期选择器的使用和属性

element plus 日期选择器如果如果没有进行处理他会返回原有的属性值data格式如果想要获取选中的日期时间就需要通过以下的代码来实现选中的值 format"YYYY/MM/DD" value-format"YYYY-MM-DD" <el-date-pickerv-model"formInline.date" type&…...

编程日记 2023/9/1 15:50:04

中国五百强企业用泛微为合同加速，提升数字化办公水平

华谊集团借力泛微，融合企业微信、SAP、WPS、电子签章等多种系统，构建了业务集成、场景驱动的全程数字化合同管理平台。上海华谊（集团）公司是由上海市政府国有资产监督管理委员会授权，通过资产重组建立的大型化工企业…...

编程日记 2023/9/1 15:49:02

Vue3 QRCode生成

一. 依赖安装 npm install vue-qr --save 二. 引用与使用引用 <script> // import vueqr from vue-qr vue2的引入 import vueqr from vue-qr/src/packages/vue-qr.vue // vue3的引入 export default {components: {vueqr} } </script> 使用 <template>&…...

编程日记 2023/9/1 15:48:01

2023年8月随笔之有顾忌了

1. 回头看日更坚持了243天。读《发布！设计与部署稳定的分布式系统》终于更新完成选读《SQL经典实例》也更新完成读《高性能MySQL（第4版）》开更，但目前暂缓读《SQL学习指南（第3版）》开更并持续更新…...

编程日记 2023/9/1 15:47:01

正中优配：红筹股是啥意思？

随着我国经济的高速开展，越来越多的人开始参加到股票出资中。其中，红筹股作为一种特别类型的股票，备受一些出资者的关注，但对于一般出资者来说，红筹股详细含义还不是特别清楚。本文将从多个角度探讨红筹股的含义、特征…...

编程日记 2023/9/1 15:45:59

《Linux从练气到飞升》No.19 进程等待

🕺作者： 主页我的专栏C语言从0到1探秘C数据结构从0到1探秘Linux菜鸟刷题集 😘欢迎关注：👍点赞🙌收藏✍️留言 🏇码字不易，你的👍点赞🙌收藏❤️关注对我真的…...

编程日记 2023/9/1 15:44:58

OpenCV

文章目录 OpenCV学习报告读取图片和网络摄像头1.1 图片读取1.2 视频读取1.1.1 读取视频文件1.1.2读取网络摄像头 OpenCV基础功能调整、裁剪图像3.1 调整图像大小3.2 裁剪图像图像上绘制形状和文本4.1 图像上绘制形状4.2图像上写文字透视变换图像拼接颜色检测轮廓检测人脸检测…...

编程日记 2023/9/1 15:43:57

hadoop解决数据倾斜的方法

分析&回答 1，如果预聚合不影响最终结果，可以使用conbine，提前对数据聚合，减少数据量。使用combinner合并,combinner是在map阶段,reduce之前的一个中间阶段,在这个阶段可以选择性的把大量的相同key数据先进行一个合并,可以看做…...

编程日记 2023/9/1 15:42:56

打造坚不可摧的代码堡垒 - 搭建GitLab私有仓库完全指南

在现代软件开发中，版本控制是一个不可或缺的环节。GitLab是一个流行的版本控制平台，允许开发团队协同工作并管理他们的代码。在某些情况下，您可能希望将您的代码托管在一个私有仓库中，以确保代码的安全性和机密性。在本文中&#…...

编程日记 2023/9/1 15:41:55

linux把文件压缩/解压成.tar.gz/tar/tgz等格式的命令大全

linux把文件压缩/解压成.tar.gz/tar/tgz等格式的命令大全 linux压缩命令常用的有：tar，tgz，gzip，zip，rar 一，tar（一） tar压缩命令#说明：#举例： （二…...

编程日记 2023/9/1 15:40:54

用户角色权限demo后续出现问题和解决

将demo账号给到理解和蒋老师，测试的时候将登录人账号改了，结果登录不了了，后续还需要分配权限无法更改他人的账号和密码将用户和权限重新分配（数据库更改，不要学我） 试着登录还是报一样的错，但…...

编程日记 2023/9/1 15:39:53

SpringBoot在IDEA里实现热部署

使用步骤 1.引入依赖  <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-devtools</artifactId><optional>true</optional><scope>true</scope><versi…...

编程日记 2023/9/1 15:38:50

浅谈Linux中的mkdir -p

mkdir 是一个用于创建目录（目录树）的 Unix 和 Linux 命令。-p 选项允许创建一个目录和它不存在的父目录。换句话说，-p 选项确保了指定的整个目录路径都会被创建。基础用法如果你只是运行 mkdir new_directory，这个命令会尝试在…...

编程日记 2023/9/1 15:37:48

设计模式—职责链模式（Chain of Responsibility）

目录思维导图什么是职责链模式？ 有什么优点呢？ 有什么缺点呢？ 什么场景使用呢？ 代码展示 ①、职责链模式 ②、加薪代码重构思维导图什么是职责链模式？ 使多个对象都有机会处理请求，从而避免请…...

编程日记 2023/9/1 15:36:46

vue小测试之拖拽、自定义事件

在开始之前我去复习了一下，clientX、clientY、pageX、pageY的区别，对于不熟悉offsetLeft和offsetTop的也可以在这里去复习一下。 vue拖拽指令之offsetX、clientX、pageX、screenX_wade3po的博客-CSDN博客_vue offset 客户区坐标位置（clientX&…...

编程日记 2023/9/1 15:35:44

时序预测 | MATLAB实现DBN-SVM深度置信网络结合支持向量机时间序列预测(多指标评价)

时序预测 | MATLAB实现DBN-SVM深度置信网络结合支持向量机时间序列预测(多指标评价) 目录时序预测 | MATLAB实现DBN-SVM深度置信网络结合支持向量机时间序列预测(多指标评价)效果一览基本描述程序设计参考资料效果一览基本描述 MATLAB实现DBN-SVM深度置信网络结合支持向量机…...

编程日记 2023/9/1 15:34:43

UE5 学习系列（二）用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇，在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下： 【Note】：如果你已经完成安装等操作，可以只执行第一篇博客中 2. 新建一个空白游戏项目章节操作，重…...

编程新知 2025/7/9 11:13:42

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码思路进入页面发现是一个登录框，很难让人不联想到SQL注入，但提示都说了不是SQL注入，所以就不往这方面想了先查看一下网页源码，发现一段JavaScript代码，有一个关键类ctfs…...

编程新知 2025/7/9 19:31:15

无法与IP建立连接，未能下载VSCode服务器

如题，在远程连接服务器的时候突然遇到了这个提示。查阅了一圈，发现是VSCode版本自动更新惹的祸！！！ 在VSCode的帮助->关于这里发现前几天VSCode自动更新了，我的版本号变成了1.100.3 才导致了远程连接出…...

编程新知 2025/7/9 16:52:14

django filter 统计数量按属性去重

在Django中，如果你想要根据某个属性对查询集进行去重并统计数量，你可以使用values()方法配合annotate()方法来实现。这里有两种常见的方法来完成这个需求： 方法1：使用annotate()和Count 假设你有一个模型Item，并且你想…...

编程新知 2025/6/24 3:45:54

江苏艾立泰跨国资源接力：废料变黄金的绿色供应链革命

在华东塑料包装行业面临限塑令深度调整的背景下，江苏艾立泰以一场跨国资源接力的创新实践，重新定义了绿色供应链的边界。跨国回收网络：废料变黄金的全球棋局艾立泰在欧洲、东南亚建立再生塑料回收点，将海外废弃包装箱通过标准…...

编程新知 2025/7/6 1:19:36

spring：实例工厂方法获取bean

spring处理使用静态工厂方法获取bean实例，也可以通过实例工厂方法获取bean实例。实例工厂方法步骤如下： 定义实例工厂类（Java代码），定义实例工厂（xml），定义调用实例工厂&#xff…...

编程新知 2025/7/7 20:02:31

学习STC51单片机31（芯片为STC89C52RCRC）OLED显示屏1

每日一言生活的美好，总是藏在那些你咬牙坚持的日子里。硬件：OLED 以后要用到OLED的时候找到这个文件 OLED的设备地址 SSD1306"SSD" 是品牌缩写，"1306" 是产品编号。驱动 OLED 屏幕的 IIC 总线数据传输格式示意图 …...

编程新知 2025/7/8 12:26:58

2025 后端自学UNIAPP【项目实战：旅游项目】6、我的收藏页面

代码框架视图 1、先添加一个获取收藏景点的列表请求【在文件my_api.js文件中添加】 // 引入公共的请求封装 import http from ./my_http.js// 登录接口（适配服务端返回 Token） export const login async (code, avatar) > {const res await http…...

编程新知 2025/7/8 9:37:00

C/C++ 中附加包含目录、附加库目录与附加依赖项详解

在 C/C 编程的编译和链接过程中，附加包含目录、附加库目录和附加依赖项是三个至关重要的设置，它们相互配合，确保程序能够正确引用外部资源并顺利构建。虽然在学习过程中，这些概念容易让人混淆，但深入理解它们的作用和联…...

编程新知 2025/7/8 12:50:06

xmind转换为markdown

文章目录解锁思维导图新姿势：将XMind转为结构化Markdown 一、认识Xmind结构二、核心转换流程详解1.解压XMind文件（ZIP处理）2.解析JSON数据结构3：递归转换树形结构4：Markdown层级生成逻辑三、完整代码解锁思维导图新…...

编程新知 2025/7/6 19:40:32

8. 损失函数与反向传播

8.1 损失函数

8.2 L1loss损失函数

8.3 MSE损失函数

8.4 交叉熵损失函数

8.5 搭建神经网络

8.6 数据集计算损失函数

8.7 损失函数反向传播

相关文章：

8. 损失函数与反向传播

Angular安全专辑之四 —— 避免服务端可能的资源耗尽(NodeJS)

Servlet学习总结（Request请求与转发，Response响应，Servlet生命周期、体系结构、执行流程等...）

雅思写作三小时浓缩学习顾家北笔记总结（二）

Element Plus 日期选择器的使用和属性

中国五百强企业用泛微为合同加速，提升数字化办公水平

Vue3 QRCode生成

2023年8月随笔之有顾忌了

正中优配：红筹股是啥意思？

《Linux从练气到飞升》No.19 进程等待

OpenCV

hadoop解决数据倾斜的方法

打造坚不可摧的代码堡垒 - 搭建GitLab私有仓库完全指南

linux把文件压缩/解压成.tar.gz/tar/tgz等格式的命令大全

用户角色权限demo后续出现问题和解决

SpringBoot在IDEA里实现热部署

浅谈Linux中的mkdir -p

设计模式—职责链模式（Chain of Responsibility）

vue小测试之拖拽、自定义事件

时序预测 | MATLAB实现DBN-SVM深度置信网络结合支持向量机时间序列预测(多指标评价)

UE5 学习系列（二）用户操作界面及介绍

CTF show Web 红包题第六弹

无法与IP建立连接，未能下载VSCode服务器

django filter 统计数量按属性去重

江苏艾立泰跨国资源接力：废料变黄金的绿色供应链革命

spring：实例工厂方法获取bean

学习STC51单片机31（芯片为STC89C52RCRC）OLED显示屏1

2025 后端自学UNIAPP【项目实战：旅游项目】6、我的收藏页面

C/C++ 中附加包含目录、附加库目录与附加依赖项详解

xmind转换为markdown