当前位置：首页 > article >正文

深度学习 —— 损失函数

article 2026/4/22 5:19:34

目录损失函数一、多分类交叉熵函数 —— nn.CrossEntropyLoss()二、二分类交叉熵函数 —— nn.BCELoss()三、回归任务1. MAE 损失函数2. MSE损失函数3. Smooth L1 Loss 也称为 Huber Loss4. 如何选择回归任务的损失函数5. 代码损失函数是什么评估模型的预测值和真实值差距的函数从而评估模型的好坏损失值越小越好。损失函数、代价函数、目标函数、误差函数同一个意思。一、多分类交叉熵函数 —— nn.CrossEntropyLoss()自带了SoftMax模型的输出输出层不需要再softmax例如带入公式正确类别的预测概率曲线总结其中y_logits是模型的原始输出/预测分数softmax(y_logits)是模型输出的概率分布也就是每个类别的预测概率最大概率对应预测类别注意多分类交叉熵CrossEntropLoss里面有softmax运算所以模型的输出层不需要softmax。但是如果要获取预测概率则需要在模型输出的原始预测分数后面经过softmax应用多分类问题如10个类别预测图片属于哪一类API:nn.CrossEntropyLoss()代码import torch import torch.nn as nn# 1.创建样本的真实值假设是一个三分类任务, 真实类别为[1,0,2,0]. 4个样本 y_true torch.tensor([1,0,2,0], dtypetorch.long) # 2.创建模型的预测分数y_logits y_logits torch.tensor([ [0.1,2.0,1.0], [0.2,0.5,0.3], [0.3,0.2,0.5], [0.5,0.2,0.3] ]) # 3.创建多分类交叉熵损失函数对象 loss_fn nn.CrossEntropyLoss() # 4.计算损失 # y_logits: 2D(batch_size, 3), y_true: 1D(batch_size) # 为什么是 3 ---- 三分类 loss loss_fn(y_logits,y_true) print(f多分类交叉熵损失函数: {loss})二、二分类交叉熵函数 —— nn.BCELoss()二分类中使用总结二分类交叉熵损失公式BCELoss -y*log(y_hat)-(1-y)*log(1-y_hat)其中y_hat是模型的预测值也就是经过sigmoid之后的预测概率对应正类y 是真实值0或1负类标签编码0one-hot编码[1,0],正类标签编码1one-hot[0,1]注意二分类交叉熵损失BCELoss里面没有sigmoid所以模型输出层最后需要添加sigmoidAPI:nn.BCELoss()代码# 1.创建样本的真实值假设是一个二分类任务, 真实类别为[0,1,0,1] y_true torch.tensor([0,1,0,1], dtypetorch.float) # 2. 创建预测分数 1D (batch_size,) y_logits torch.tensor([10, -10, -50, 2.5], dtypetorch.float) # 预测类别 [1,0,0,1] # 经过sigmoid转换为概率这里才是模型输出的预测值 y_preds torch.sigmoid(y_logits) # 3. 创建二分类交叉熵损失函数 loss_fn nn.BCELoss() # 4. 计算损失 # y_pred: 1D (4,). y_true:1D(4,) loss loss_fn(y_preds,y_true) print(f二分类交叉熵损失: {loss})二分类任务可以用多分类交叉熵损失。三、回归任务1. MAE 损失函数公式特点① 损失 - 误差呈线性关系② MAE损失函数本身不具有稀梳性不会让权重衰减为0③ 最大问题是梯度在零点不平滑会跳过极小值④ 适用于回归问题中存在异常值或噪声数据时可以减少对离群点的敏感性2. MSE损失函数Mean Squared Loss / Quadratic Loss (MSE loss) 也被称为L2 loss或欧氏距离。计算误差平方的平均值. 均差平方之和 / 样本总数公式特点① 损失-误差呈二次曲线关系② 处处可导、梯度平滑是最常用的回归损失函数③ 误差大时候容易梯度过大无法有效训练模型④ 适用于大多数标准回归问题如房价、温度预测等3. Smooth L1 Loss 也称为 Huber Loss简单来说就是MAE 和 MSE的结合尤其是在面对异常值时它能平滑过渡避免大误差的影响公式可以转换看做 1是 MSE. ≥ 1 是MAE解决L1MAE在0点不平滑、以及L2MSE的梯度爆炸问题4. 如何选择回归任务的损失函数MSE Smooth L1 MAEAPI:nn.L1Loss()nn.MSELoss()nn.SoothL1Loss()5. 代码# 1.创建样本的真实值 # 4个样本 y_true torch.tensor([20.0,21.0,22.0,23.0],dtypetorch.float32) # 2.创建模型的预测值 y_pred torch.tensor([21.0,22.0,23.0,24.0],dtypetorch.float32,requires_gradTrue) # 3.定义损失函数对象 loss_fn1 nn.L1Loss() loss_fn2 nn.MSELoss() loss_fn3 nn.SmoothL1Loss() # 4.计算损失值 loss1 loss_fn1(y_pred,y_true) loss2 loss_fn2(y_pred,y_true) loss3 loss_fn3(y_pred,y_true) # 5.打印损失值 print(f损失值 MAE{loss1}) # 1 print(f损失值 MSE{loss2}) # 2 print(f损失值 Smooth{loss3}) # 3

深度学习 —— 损失函数

相关文章：

深度学习 —— 损失函数

Qianfan-OCR入门实战：Python requests调用OCR API并解析JSON响应

【从零开始学Java | 第四十一篇】深入多线程

避坑指南：用STM32CubeMX生成的工程，为什么在QEMU上跑不起来？

FPGA上实现96.58%精度：三阶流水线CNN加速器Verilog设计避坑指南

容器启动慢？磁盘爆满？Docker 27存储驱动调优全解析，深度解读inode泄漏、layer膨胀与GC失效三大隐性故障

薄元近似(TEA)与傅里叶模态法(FMM)的光栅建模

倾斜光栅的参数优化及公差分析

告别串口不够用！手把手教你用WK2124芯片在Firefly-RK3399上扩展4个串口（SPI转UART实战）

保姆级教程：用ESP32的gpio_hold_en函数，搞定智能家居传感器的超长待机

华为eNSP模拟企业网：三层交换机DHCP配置保姆级教程（含VLAN规划与排错）

保姆级教程：在Deepin/UOS上手动打包最新版QQ的deb安装包（附字体修复方案）

从‘删库到跑路’梗说起：聊聊rm -rf的设计哲学与Windows命令的替代方案

Docker 27车载部署必须关闭的5个默认守护进程，否则QNX/Hypervisor共存环境下将触发TSN时间同步漂移

Swarm模式已过时？Docker 27原生调度引擎升级指南，3天完成零停机迁移

Docker 27原生多平台构建全解析：从buildx配置到QEMU加速，手把手落地生产级镜像交付

Dify + C# 14 AOT = 下一代AI边缘客户端？2026 Q2起Windows/Linux/ARM64三平台统一交付方案（附签名证书自动化签发脚本）

Dify车载问答准确率骤降47%？揭秘车规级NPU算力分配冲突与动态Prompt裁剪策略

用Verilog在FPGA上实现一个带万年历的数字钟：从分频模块到整点报时的完整设计流程

嵌入式产品量产必看：用LittleFS实现掉电安全的设备启动次数记录

git clone https://github.com/RedisBloom/RedisBloom.git的生命周期的庖丁解牛

redis_version:6.2.21默认自带布隆过滤器吗？

2026 AI数字员工合规运营指南：等保2.0、关基保护与数据安全法的落地实践

如何避免在 Map 中使用大对象作为键而导致内存积压

“再一次被数学打动”，这是一套被读者追更求动画化的科普书！

别再只会apt-get了！手把手教你源码编译ROS Melodic的Navigation包（与Cartographer共存）

告别手动格式化！用VSCode settings.json + ESLint/Prettier打造你的专属自动保存工作流

在 HarmonyOS6 中实现 Material Design 3 导航栏

关键指标自动提取（使用千问）

如何用3步实现效率突破：开源智能工具重构网盘资源获取体验