当前位置：首页 > article >正文

一文读懂深度学习中的损失函数quantifying loss —— 作用、分类和示例代码

article 2026/3/24 6:08:57

在深度学习中，quantifying loss（量化损失）是指通过数学方法计算模型预测值与真实值之间的差异，以衡量模型的性能。损失函数（Loss Function）是量化损失的核心工具，它定义了模型预测值与真实值之间的误差大小。损失值越小，表示模型的预测越接近真实值。

一、损失函数的作用

衡量模型性能：损失函数提供了一个具体的数值，用于评估模型在当前参数下的表现。
指导模型优化：通过最小化损失函数，模型可以逐步调整参数，使预测结果更接近真实值。
帮助模型收敛：损失函数是优化算法（如梯度下降）的核心，它决定了模型参数更新的方向和幅度。

二、常见的损失函数

根据任务类型（如回归、分类等），常用的损失函数有所不同：

1. 回归任务（Regression）

• 均方误差（Mean Squared Error, MSE）：
计算预测值与真实值之间平方差的平均值。适用于回归问题。
$\text{MSE} = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2$
其中， $y_i$ 是真实值， $\hat{y}_i$ 是预测值， $n$ 是样本数量。

• 平均绝对误差（Mean Absolute Error, MAE）：
计算预测值与真实值之间绝对差的平均值。对异常值不敏感。
$\text{MAE} = \frac{1}{n} \sum_{i=1}^n |y_i - \hat{y}_i|$

2. 分类任务（Classification）

• 交叉熵损失（Cross-Entropy Loss）：
衡量预测概率分布与真实概率分布之间的差异。适用于分类问题。
◦ 二分类（Binary Cross-Entropy）：
$\text{BCE} = -\frac{1}{n} \sum_{i=1}^n \left( y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right)$
◦ 多分类（Categorical Cross-Entropy）：
$\text{CCE} = -\frac{1}{n} \sum_{i=1}^n \sum_{j=1}^m y_{ij} \log(\hat{y}_{ij})$
其中， $m$ 是类别数量， $y_{ij}$ 是真实标签（one-hot 编码）， $\hat{y}_{ij}$ 是预测概率。

• 稀疏分类交叉熵（Sparse Categorical Cross-Entropy）：
适用于标签是整数（非 one-hot 编码）的分类任务。
$\text{Sparse CCE} = -\frac{1}{n} \sum_{i=1}^n \log(\hat{y}_{i, y_i})$

3. 其他任务

• Hinge Loss：
用于支持向量机（SVM）和二分类问题。
$\text{Hinge Loss} = \max(0, 1 - y_i \cdot \hat{y}_i)$
• Kullback-Leibler Divergence (KL Divergence)：
衡量两个概率分布之间的差异，常用于生成模型（如变分自编码器）。

三、如何量化损失

在训练模型时，损失函数的计算过程如下：

前向传播：模型根据输入数据计算预测值。
计算损失：使用损失函数计算预测值与真实值之间的误差。
反向传播：根据损失值计算梯度，更新模型参数。

在 Keras 中，可以通过 model.compile() 指定损失函数，并通过 model.fit() 训练模型。

四、示例代码

以下是一个使用均方误差（MSE）作为损失函数的回归任务示例：

import tensorflow as tf
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense# 构建模型
model = Sequential([Dense(64, input_shape=(10,), activation='relu'),  # 输入维度为 10Dense(32, activation='relu'),Dense(1)  # 输出层，用于回归任务
])# 编译模型，指定损失函数为 MSE
model.compile(optimizer='adam', loss='mean_squared_error')# 生成随机数据
import numpy as np
x_train = np.random.rand(1000, 10)
y_train = np.random.rand(1000, 1)# 训练模型
model.fit(x_train, y_train, epochs=10, batch_size=32)

五、总结

Quantifying loss 是通过损失函数计算模型预测值与真实值之间的差异，以衡量模型性能并指导优化。不同的任务需要使用不同的损失函数，例如均方误差（MSE）用于回归任务，交叉熵损失用于分类任务。理解损失函数的作用和选择适当的损失函数是构建高效深度学习模型的关键。

一文读懂深度学习中的损失函数quantifying loss —— 作用、分类和示例代码

一、损失函数的作用

二、常见的损失函数

1. 回归任务（Regression）

2. 分类任务（Classification）

3. 其他任务

三、如何量化损失

四、示例代码

五、总结

相关文章：

一文读懂深度学习中的损失函数quantifying loss —— 作用、分类和示例代码

Vue 3 整合 WangEditor 富文本编辑器：从基础到高级实践

筑牢网络安全防线：守护您的数据安全

基于Asp.net的农产品销售管理系统

android11使用gpio口控制led状态灯

解决最长无重复子串问题

ASP .NET Core 学习（.NET9）Serilog日志整合

基于python+flask+mysql的川渝地区天气数据分析系统

一个结合创意与技术的Python数据可视化案例，展示动态3D粒子轨迹图与热力图的融合效果，代码包含注释与关键技术点解析

【Linux———信号精讲】

scBaseCamp：一个AI代理的可持续扩充的单细胞数据存储库

GPTs+RPA赋能智慧校园：构建下一代教育智能体的技术实践

Linux 系统不同分类的操作命令区别

集成的背景与LLM集成学习

【AIGC】通义万相 2.1 与蓝耘智算：共绘 AIGC 未来绚丽蓝图

【AIGC实战】蓝耘元生代部署通义万相2.1文生图，结尾附上提示词合集

Gartner：数据安全平台DSP提升数据流转及使用安全

数据结构与算法：双指针

Leetcode 57: 插入区间

NLP如何训练AI模型以理解知识

android13为账号密码做文件存储功能

Excel的行高、列宽单位不统一？还是LaTeX靠谱

【JavaSE-5】程序逻辑控制相关练习题

MyBatis-Plus 条件构造器的使用（左匹配查询）

深入理解设计模式中的单例模式（Singleton Pattern）

CES Asia 2025增设未来办公教育板块，科技变革再掀高潮

汽车零部件厂如何选择最适合的安灯系统解决方案

sqlite3 c++ client选择； c++环境搭建 : abseil-cpp | fnc12/sqlite_orm

Pytorch中的主要函数

景联文科技：以专业标注赋能AI未来，驱动智能时代的精准跃迁