当前位置：首页 > news >正文

PyTorch常用的损失函数(ChatGPT)

news 2026/2/8 23:39:13

L1Loss

nn.L1Loss 也称为平均绝对误差（Mean Absolute Error，MAE）。它计算预测值与真实值之间的差异（即误差），然后取绝对值并求和，最后除以样本数量得到平均误差。具体来说，对于一批大小为 $N$ 的样本，nn.L1Loss 的计算公式如下：

在这里插入图片描述

其中， $x$ 为模型的预测输出， $y$ 为样本的真实标签。

nn.L1Loss 通常用于回归问题中，例如预测房价、预测人的年龄等。它的优点是可以对异常值不敏感，即单个异常值不会对整体误差产生过大的影响。因此，它经常被用作回归问题的基准指标。

在 PyTorch 中，可以通过调用 nn.L1Loss() 函数来创建一个 L1 损失函数的实例。同时，它也可以作为一个组件被添加到神经网络模型中，用于反向传播计算梯度。

MSELoss

nn.MSELoss 也称为均方误差（Mean Squared Error，MSE）。它计算预测值与真实值之间的差异（即误差），然后取平方并求和，最后除以样本数量得到平均误差。具体来说，对于一批大小为 $N$ 的样本，nn.MSELoss 的计算公式如下：

在这里插入图片描述

其中， $x$ 为模型的预测输出， $y$ 为样本的真实标签。

nn.MSELoss 也通常用于回归问题中，例如预测房价、预测人的年龄等。它的优点是对误差的大值敏感，因此可以使模型更加关注样本中误差较大的部分，从而提高模型的准确性。

在 PyTorch 中，可以通过调用 nn.MSELoss() 函数来创建一个 MSE 损失函数的实例。同时，它也可以作为一个组件被添加到神经网络模型中，用于反向传播计算梯度。

CrossEntropyLoss

nn.CrossEntropyLoss 用于多分类问题中。它的计算方式是将 Softmax 函数的输出和真实标签作为输入，然后计算它们的交叉熵损失（Cross-entropy Loss）。具体来说，对于一批大小为 $N$ 的样本，nn.CrossEntropyLoss 的计算公式如下：

在这里插入图片描述

其中， $x$ 为模型的预测输出， $y$ 为样本的真实标签。

nn.CrossEntropyLoss 在内部自动进行 Softmax 计算，因此输入的 $x$ 不需要经过 Softmax 函数处理。在计算过程中，交叉熵损失越小，表示模型预测的结果和真实结果越接近，模型的性能也越好。

在 PyTorch 中，可以通过调用 nn.CrossEntropyLoss() 函数来创建一个交叉熵损失函数的实例。同时，它也可以作为一个组件被添加到神经网络模型中，用于反向传播计算梯度。

BCELoss

nn.BCELoss 也称为二元交叉熵损失（Binary Cross-Entropy Loss）。它的计算方式是将模型的预测输出和真实标签作为输入，然后计算它们之间的二元交叉熵损失。具体来说，对于一批大小为 $N$ 的样本，nn.BCELoss 的计算公式如下：

在这里插入图片描述

其中， $x$ 为模型的预测输出， $y$ 为样本的真实标签。该损失函数适用于二分类问题，其中每个样本只有两种可能的类别标签。对于多分类问题，通常使用 nn.CrossEntropyLoss。

nn.BCELoss 在内部自动进行 Sigmoid 计算，因此输入的 $x$ 不需要经过 Sigmoid 函数处理。在计算过程中，二元交叉熵损失越小，表示模型预测的结果和真实结果越接近，模型的性能也越好。

在 PyTorch 中，可以通过调用 nn.BCELoss() 函数来创建一个二元交叉熵损失函数的实例。同时，它也可以作为一个组件被添加到神经网络模型中，用于反向传播计算梯度。

参考

https://chat.openai.com/chat/

PyTorch常用的损失函数(ChatGPT)

L1Loss

MSELoss

CrossEntropyLoss

BCELoss

参考

相关文章：

PyTorch常用的损失函数(ChatGPT)

LeetCode——1237. 找出给定方程的正整数解

系统编程中的进程的概念No.3【进程状态】

推荐 3 款 Golang 语义化版本库

Windows平台使用gdb连接qemu虚拟机上的系统

【博客624】MAC地址表、ARP表、路由表(RIB表)、转发表(FIB表)

【蓝桥日记⑤】2014第五届省赛（软件类）JavaA组❆答案解析

Leetcode.1139 最大的以 1 为边界的正方形

Bing+ChatGPT 对传统搜索引擎的降维打击

【JS】数组常用方法总结-功能、参数、返回值

pytest 单元测试前后置处理

汽车安全硬件扩展 AUTOSAR SHE SecureHardwareExtensions

2023年美国大学生数学建模C题:预测Wordle结果建模详解+模型代码

5、HAL库驱动W25Qxx

git rebase 洐合（变基）

Kubernetes 1.18学习笔记

AJAX技术

华为OD机试 - 最大排列（JS）

Prometheus Docker安装及监控自身

点云处理PCL常用函数与工具

盘古信息PCB行业解决方案：以全域场景重构，激活智造新未来

高频面试之3Zookeeper

微信小程序 - 手机震动

Qt Http Server模块功能及架构

Android Bitmap治理全解析：从加载优化到泄漏防控的全生命周期管理

sipsak：SIP瑞士军刀！全参数详细教程！Kali Linux教程！

视觉slam十四讲实践部分记录——ch2、ch3

MFC 抛体运动模拟：常见问题解决与界面美化

Selenium常用函数介绍

Unity UGUI Button事件流程