一文读懂深度学习中的损失函数quantifying loss —— 作用、分类和示例代码
在深度学习中,quantifying loss(量化损失)是指通过数学方法计算模型预测值与真实值之间的差异,以衡量模型的性能。损失函数(Loss Function)是量化损失的核心工具,它定义了模型预测值与真实值之间的误差大小。损失值越小,表示模型的预测越接近真实值。
一、损失函数的作用
- 衡量模型性能:损失函数提供了一个具体的数值,用于评估模型在当前参数下的表现。
- 指导模型优化:通过最小化损失函数,模型可以逐步调整参数,使预测结果更接近真实值。
- 帮助模型收敛:损失函数是优化算法(如梯度下降)的核心,它决定了模型参数更新的方向和幅度。
二、常见的损失函数
根据任务类型(如回归、分类等),常用的损失函数有所不同:
1. 回归任务(Regression)
• 均方误差(Mean Squared Error, MSE):
计算预测值与真实值之间平方差的平均值。适用于回归问题。
MSE = 1 n ∑ i = 1 n ( y i − y ^ i ) 2 \text{MSE} = \frac{1}{n} \sum_{i=1}^n (y_i - \hat{y}_i)^2 MSE=n1∑i=1n(yi−y^i)2
其中, y i y_i yi 是真实值, y ^ i \hat{y}_i y^i 是预测值, n n n 是样本数量。
• 平均绝对误差(Mean Absolute Error, MAE):
计算预测值与真实值之间绝对差的平均值。对异常值不敏感。
MAE = 1 n ∑ i = 1 n ∣ y i − y ^ i ∣ \text{MAE} = \frac{1}{n} \sum_{i=1}^n |y_i - \hat{y}_i| MAE=n1∑i=1n∣yi−y^i∣
2. 分类任务(Classification)
• 交叉熵损失(Cross-Entropy Loss):
衡量预测概率分布与真实概率分布之间的差异。适用于分类问题。
◦ 二分类(Binary Cross-Entropy):
BCE = − 1 n ∑ i = 1 n ( y i log ( y ^ i ) + ( 1 − y i ) log ( 1 − y ^ i ) ) \text{BCE} = -\frac{1}{n} \sum_{i=1}^n \left( y_i \log(\hat{y}_i) + (1 - y_i) \log(1 - \hat{y}_i) \right) BCE=−n1∑i=1n(yilog(y^i)+(1−yi)log(1−y^i))
◦ 多分类(Categorical Cross-Entropy):
CCE = − 1 n ∑ i = 1 n ∑ j = 1 m y i j log ( y ^ i j ) \text{CCE} = -\frac{1}{n} \sum_{i=1}^n \sum_{j=1}^m y_{ij} \log(\hat{y}_{ij}) CCE=−n1∑i=1n∑j=1myijlog(y^ij)
其中, m m m是类别数量, y i j y_{ij} yij 是真实标签(one-hot 编码), y ^ i j \hat{y}_{ij} y^ij 是预测概率。
• 稀疏分类交叉熵(Sparse Categorical Cross-Entropy):
适用于标签是整数(非 one-hot 编码)的分类任务。
Sparse CCE = − 1 n ∑ i = 1 n log ( y ^ i , y i ) \text{Sparse CCE} = -\frac{1}{n} \sum_{i=1}^n \log(\hat{y}_{i, y_i}) Sparse CCE=−n1∑i=1nlog(y^i,yi)
3. 其他任务
• Hinge Loss:
用于支持向量机(SVM)和二分类问题。
Hinge Loss = max ( 0 , 1 − y i ⋅ y ^ i ) \text{Hinge Loss} = \max(0, 1 - y_i \cdot \hat{y}_i) Hinge Loss=max(0,1−yi⋅y^i)
• Kullback-Leibler Divergence (KL Divergence):
衡量两个概率分布之间的差异,常用于生成模型(如变分自编码器)。
三、如何量化损失
在训练模型时,损失函数的计算过程如下:
- 前向传播:模型根据输入数据计算预测值。
- 计算损失:使用损失函数计算预测值与真实值之间的误差。
- 反向传播:根据损失值计算梯度,更新模型参数。
在 Keras 中,可以通过 model.compile() 指定损失函数,并通过 model.fit() 训练模型。
四、示例代码
以下是一个使用均方误差(MSE)作为损失函数的回归任务示例:
import tensorflow as tf
from tensorflow.keras import Sequential
from tensorflow.keras.layers import Dense# 构建模型
model = Sequential([Dense(64, input_shape=(10,), activation='relu'), # 输入维度为 10Dense(32, activation='relu'),Dense(1) # 输出层,用于回归任务
])# 编译模型,指定损失函数为 MSE
model.compile(optimizer='adam', loss='mean_squared_error')# 生成随机数据
import numpy as np
x_train = np.random.rand(1000, 10)
y_train = np.random.rand(1000, 1)# 训练模型
model.fit(x_train, y_train, epochs=10, batch_size=32)
五、总结
Quantifying loss 是通过损失函数计算模型预测值与真实值之间的差异,以衡量模型性能并指导优化。不同的任务需要使用不同的损失函数,例如均方误差(MSE)用于回归任务,交叉熵损失用于分类任务。理解损失函数的作用和选择适当的损失函数是构建高效深度学习模型的关键。
相关文章:
一文读懂深度学习中的损失函数quantifying loss —— 作用、分类和示例代码
在深度学习中,quantifying loss(量化损失)是指通过数学方法计算模型预测值与真实值之间的差异,以衡量模型的性能。损失函数(Loss Function)是量化损失的核心工具,它定义了模型预测值与真实值之间…...
Vue 3 整合 WangEditor 富文本编辑器:从基础到高级实践
本文将详细介绍如何在 Vue 3 项目中集成 WangEditor 富文本编辑器,实现图文混排、自定义扩展等高阶功能。 一、为什么选择 WangEditor? 作为国内流行的开源富文本编辑器,WangEditor 具有以下优势: 轻量高效:压缩后仅…...
筑牢网络安全防线:守护您的数据安全
在数字化时代,数据安全已成为企业和个人不容忽视的重要议题。近日印尼国家数据中心遭黑客袭击的事件,不仅扰乱了机场的移民检查,还影响了众多机构的服务运行。黑客利用恶意软件对数据中心进行攻击,索要巨额赎金,给印尼…...
基于Asp.net的农产品销售管理系统
作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…...
android11使用gpio口控制led状态灯
目录 一、简介 二、解决方法 A、底层驱动 B、上层调用 C、验证 一、简介 1、需求:这里是用2个gpio口来控制LED灯,开机时默认亮蓝灯,按开机键,休眠亮红灯,唤醒亮蓝灯。 原理图: 这里由于主板上电阻R63…...
解决最长无重复子串问题
在编程面试中,字符串处理常常是考察算法能力的重要部分。今天,我们将探讨一个经典问题——最长无重复子串问题,并给出 Python 代码实现。 问题描述 给定一个字符串 s,你需要找到其中最长的无重复字符的子串,并返回它…...
ASP .NET Core 学习(.NET9)Serilog日志整合
Serilog 是一个功能强大的 .NET 日志库,以其简洁的配置和灵活的输出方式而受到开发者喜爱。支持多种日志输出目标(如控制台、文件、数据库等),并且可以通过结构化日志的方式记录丰富的上下文信息,便于后续的日志分析和…...
基于python+flask+mysql的川渝地区天气数据分析系统
系统首页 天气数据分析 历史天气数据查询 python爬虫代码展示 import requests import re import time as delay from bs4 import BeautifulSoup import pandas as pd import pymysql import json# 定义一个函数,用于获取网页的源代码 def get_page(url, headers)…...
一个结合创意与技术的Python数据可视化案例,展示动态3D粒子轨迹图与热力图的融合效果,代码包含注释与关键技术点解析
以下是一个结合创意与技术的Python数据可视化案例,展示动态3D粒子轨迹图与热力图的融合效果,代码包含注释与关键技术点解析: import numpy as np import pandas as pd import matplotlib.pyplot as plt from matplotlib.animation import Fu…...
【Linux———信号精讲】
你是怎么做到的,给了她想要的爱............................................................................................ 文章目录 前言 一、【信号入门】 1.1、【生活角度的信号】 1.2、【ctrl c与z】 1.3、【信号的发送与记录】 1.4、【信号处理常见方式…...
scBaseCamp:一个AI代理的可持续扩充的单细胞数据存储库
scBaseCamp是Tahoe-100M:最大规模的单细胞扰动数据集的后续 构建虚拟细胞是人工智能与生物学交叉领域的新兴前沿方向,单细胞RNA测序数据的快速增长为这一领域提供了助力。通过整合数百项研究中数百万个细胞的基因表达谱,单细胞图谱为训练由 …...
GPTs+RPA赋能智慧校园:构建下一代教育智能体的技术实践
文章目录 一、核心应用场景与技术融合1. 教务流程自动化(RPAGPTs双引擎驱动)2. 智能问答中枢(NLP流程自动化) 二、关键技术实现方案1. 多模态数据处理架构2. 智能文档处理流水线 三、典型系统架构设计智慧校园AI中台架构ÿ…...
Linux 系统不同分类的操作命令区别
Linux 系统有多种发行版,每种发行版都有其独特的操作命令和工具。以下是一些常见的分类及其操作命令的区别: 1. 基于 Red Hat 的发行版 (RHEL, CentOS, Fedora) 1.1 包管理 安装软件包: bash复制 sudo yum install <package> 更新软件包: bash复制 sudo yum update…...
集成的背景与LLM集成学习
文章目录 集成的背景与LLM集成学习LLVM集成指南Azure OpenAl集成Hugging Face Hub集成集成的背景与LLM集成学习 任何新的技术框架或工具,往往需要对其背后的原理和历史背景有所了解,这样可以更好地掌握它的应用方式和最佳实践。在探讨为什么学习LangChain的集成项目之前,先看…...
【AIGC】通义万相 2.1 与蓝耘智算:共绘 AIGC 未来绚丽蓝图
一、引言 在人工智能技术迅猛发展的今天,AIGC(生成式人工智能内容生成)领域正以惊人的速度改变着我们的生活和工作方式。从艺术创作到影视制作,从广告设计到智能客服,AIGC 技术的应用越来越广泛。通义万相 2.1 作为一…...
【AIGC实战】蓝耘元生代部署通义万相2.1文生图,结尾附上提示词合集
文章目录 👏什么是文生图?👏通义万相2.1文生图👏蓝耘元生代部署通义万相2.1👏平台注册👏部署通义万相2.1👏使用通义万相2.1文生图 👏提示词合集👏总结 随着人工智能生成内…...
Gartner:数据安全平台DSP提升数据流转及使用安全
2025 年 1 月 7 日,Gartner 发布“China Context:Market Guide for Data Security Platforms”(《数据安全平台市场指南——中国篇》,以下简称指南),报告主要聚焦中国数据安全平台(Data Securit…...
数据结构与算法:双指针
前言 双指针其实和滑动窗口差不多,但能使用的场景比滑动窗口更广功能更强。滑动窗口的内容在我上一篇文章数据结构与算法:滑动窗口。 一、原理 双指针的关键还是分析题目单调性,从而保证指针可以单方向滑动。 二、题目 1.按奇偶排序数组…...
Leetcode 57: 插入区间
Leetcode 57: 插入区间 问题描述: 给定一个非重叠的区间集合 intervals(按开始时间升序排列)和一个新的区间 newInterval,将新的区间插入到区间集合中并合并重叠的部分,最后返回结果区间集合。 适合面试的解法&#x…...
NLP如何训练AI模型以理解知识
一、自然语言处理(NLP)的定义与核心目标 1. 什么是自然语言处理? NLP是计算机科学与人工智能的交叉领域,旨在让机器具备以下能力: • 理解:解析人类语言(文本或语音)的语法、语义和…...
android13为账号密码做文件存储功能
注册获取外存权限 <uses-permission android:name"android.permission.WRITE_EXTERNAL_STORAGE" /><uses-permission android:name"android.permission.READ_EXTERNAL_STORAGE" />申请文件存入外存权限 // Activity中 // 1. 申请PackageManag…...
Excel的行高、列宽单位不统一?还是LaTeX靠谱
想要生成田字格、米字格、带拼音标准,方便小学生书法和练字。Word,Excel之类所见即所得是最容易相当的方式。但它们处理带田字格之类背景时,如果没有专用模板、奇奇怪怪的插件,使用起来会碰到各种问题。比如,Word里面用…...
【JavaSE-5】程序逻辑控制相关练习题
1、判断一个数字是否是素数(质数) //方法1: import java.util.Scanner; public static void main(String[] args) {//判断一个数字是否是素数:除了1和它本身外没有其他数可以整除Scanner scan new Scanner(System.in);int num scan.nextInt();boolean flag tru…...
MyBatis-Plus 条件构造器的使用(左匹配查询)
在上一篇文章中,我们已经介绍了 MyBatis-Plus 条件构造器,包括 QueryWrapper 和 UpdateWrapper 的基本使用方法、常见查询条件(如等于、不等于、大于、小于)以及如何使用 Lambda 表达式来构建动态查询和更新条件。 在本文中&…...
深入理解设计模式中的单例模式(Singleton Pattern)
各类资料学习下载合集 https://pan.quark.cn/s/8c91ccb5a474 单例模式是一种创建型设计模式,确保一个类只有一个实例,并提供全局访问点。这种模式在许多应用场景中都很有用,特别是当我们希望控制对共享资源的访问时,比…...
CES Asia 2025增设未来办公教育板块,科技变革再掀高潮
作为亚洲消费电子领域一年一度的行业盛会,CES Asia 2025(第七届亚洲消费电子技术贸易展)即将盛大启幕。今年展会规模再度升级,预计将吸引超过500家全球展商参展,专业观众人数有望突破10万。除了聚焦人工智能、物联网、…...
汽车零部件厂如何选择最适合的安灯系统解决方案
在现代制造业中,安灯系统作为一种重要的生产管理工具,能够有效提升生产线的异常处理效率,确保生产过程的顺畅进行。对于汽车零部件厂来说,选择一套适合自身生产需求的安灯系统解决方案尤为重要。 一、安灯系统的核心功能 安灯系统…...
sqlite3 c++ client选择; c++环境搭建 : abseil-cpp | fnc12/sqlite_orm
sqlite3 c client选择 今日20250305 2.4K星: 7月前最后提交核心: SRombauts/SQLiteCpp.git : 薄封装、命令式sql、非orm、支持事务2.4K星: 1月前最后提交核心: fnc12/sqlite_orm.git : 厚封装、非侵入、真orm、真泛型、类型复杂、支持事务 因真泛型导致DbInstance必须放在x.h…...
Pytorch中的主要函数
目录 一、torch.manual_seed(seed)二、torch.cuda.manual_seed(seed)三、torch.rand(*size, outNone, dtypeNone, layouttorch.strided, deviceNone, requires_gradFalse)四、给大家写一个常用的自动选择电脑cuda 或者cpu 的小技巧五、torch.version.cuda;torch.bac…...
景联文科技:以专业标注赋能AI未来,驱动智能时代的精准跃迁
在人工智能技术重塑全球产业格局的今天,高质量训练数据已成为驱动算法进化的核心燃料。作为数据智能服务领域的领军者,景联文科技深耕数据标注行业多年,以全栈式数据解决方案为核心,构建起覆盖数据采集、清洗、标注、质检及算法调…...
