当前位置：首页 > news >正文

TensorFlow入门(二十、损失函数)

news 2026/2/9 16:46:14

损失函数

损失函数用真实值与预测值的距离指导模型的收敛方向,是网络学习质量的关键。不管是什么样的网络结构,如果使用的损失函数不正确,最终训练出的模型一定是不正确的。常见的两类损失函数为:①均值平方差②交叉熵

均值平方差

均值平方差(Mean Squared Error,MSE),也称"均方误差",在神经网络中主要用于表达预测值与真实值之间的差异,针对的是回归问题。其数学计算公式如下:

可以看出,均值平方差是对每一个真实值与预测值相减后的差的平方取平均值。在具体模型中,它的值越小,表明模型越好。除此之外,类似的损失算法还有均方根误差RMSE(即将MSE开平方)、平均绝对值误差MAD(对一个真实值与预测值相减的绝对值取平均值)等。

注意 : 在神经网络计算时,预测值要和真实值控制在同样的数据分布内,例如将预测值经过Sigmoid激活函数得到的值控制在0~1之间,那么真实值也需要归一化在0~1之间。这样,进行loss计算时才会有较好的效果。

在TensorFlow中,没有提供单独的MSE函数。由于公式简单,可以自己组合,例如:

MSE = tf.reduce_mean(tf.pow(tf.sub(logits,outputs),2.0))

其中,logits代表标签值,即真实值,outputs代表预测值。

同理,均方根误差RMSE和平均绝对值误差MAD也可以手动组合,例如:

RMSE = tf.sqrt(tf.reduce_mean(tf.pow(tf.sub(logits,outputs),2.0)))
MAD = tf.reduce_mean(tf.complex_abs(tf.sub(logits,outputs)))

交叉熵

交叉熵(crossentropy),一般针对的是分类问题,主要用于预测输入样本属于某一类的概率。其数学计算公式如下:

其中y代表真实值分类(0或1),a代表预测值。

注意 : 用于计算的a也是通过分布统一化处理的(或者是经过Sigmoid函数激活的),取值范围在0~1之间。如果真实值和预测值都是1,前面一项y*ln(a)就是1*ln(1)等于0,后一项(1-y)*ln(1-a)也就是0*ln(0)等于0,loss为0,反之loss函数为其他数。

在TensorFlow中常见的交叉熵函数有:

①Sigmoid交叉熵

Sigmoid交叉熵,即tf.nn.sigmoid_cross_entropy_with_logits(_sentinel = None,labels = None,logits = None,name = None),该函数对logits计算sigmoid的交叉熵。logits是神经网络模型中的w*x矩阵,也是神经网络最后一层的输出,还没有经过sigmoid激活函数计算,而labels是实际的标签值,它的shape和logits相同。

具体计算公式如下:

②softmax交叉熵

softmax交叉熵,即tf.nn.softmax_cross_entropy_with_logits(logits,labels,name = None),该函数的参数logits和labels,与Sigmoid交叉熵函数的一样。函数的计算过程一共分为两步:

①将logits通过softmax计算转换成概率,公式如下:

②计算交叉熵损失,把softmax的输出向量[y1,y2,y3...]和样本的实际标签做一个交叉熵,公式如下:

其中,y'i指代实际的标签中第i个的值,yi是上一步softmax的输出向量[y1,y2,y3...]中,第i个元素的值。非常明显,预测越准确,计算得出的值越小,最后再通过求平均值,得到最终的loss。注意:该函数的返回值是一个向量,不是一个数。

③sparse交叉熵

sparse交叉熵,即tf.nn.sparse_softmax_cross_entropy_with_logits(logits,labels,name = None),该函数用于计算logits和labels之间的稀疏softmax交叉熵。计算流程和softmax交叉熵一样,区别在于sparse交叉熵的样本真实值与预测结果不需要one-hot编码,但是要求分类的个数一定要从0开始。比如,如果分两类,标签的预测值只有0和1两个数。如果是五类,预测值有0,1,2,3,4共五个数。

④加权Sigmoid交叉熵

加权Sigmoid交叉熵,即tf.nn.weighted_cross_entropy_with_logits(targets,logits,pos_weight,name = None),该函数用于计算加权交叉熵。计算方式与Sigmoid交叉熵基本一样,只是加上了权重的功能,是计算具有权重的Sigmoid交叉熵函数。

计算公式如下:

使用时,直接调用对应的API即可。

小结

在实际的模型训练过程中,损失函数的选取取决于输入标签数据的类型:如果输入的是实数、无界的值,损失函数使用平方差;如果输入标签是位矢量(分类标志),使用交叉熵会更合适。

TensorFlow入门(二十、损失函数)

损失函数损失函数用真实值与预测值的距离指导模型的收敛方向,是网络学习质量的关键。不管是什么样的网络结构,如果使用的损失函数不正确,最终训练出的模型一定是不正确的。常见的两类损失函数为:①均值平方差②交叉熵均值平方差均值平方差(Mean Squared Error,MSE),也称&qu…...

编程日记 2023/10/15 23:04:48

MySQL中死锁

数据库的死锁是指不同的事务在获取资源时相互等待，导致无法继续执行的一种情况。当发生死锁时，数据库会自动中断其中一个事务，以解除死锁。在数据库中，事务可以分为读事务和写事务。读事务只需要获取读锁，而写事务需要…...

编程日记 2023/10/15 23:03:46

【LeetCode刷题（数据结构）】：给定一个链表每个节点包含一个额外增加的随机指针该指针可以指向链表中的任何节点或空节点要求返回这个链表的深度拷贝

给你一个长度为 n 的链表，每个节点包含一个额外增加的随机指针 random ，该指针可以指向链表中的任何节点或空节点构造这个链表的深拷贝。深拷贝应该正好由 n 个全新节点组成，其中每个新节点的值都设为其对应的原节点的值。新节点的 next…...

编程日记 2023/10/15 23:01:44

uniapp封装loading 的动画动态加载

实现效果 html代码 <view class"loadBox" v-if"loading"><img :src"logo" class"logo"> </view> css代码 .loadBox {width: 180rpx;min-height: 180rpx;border-radius: 50%;display: flex;align-items: center;j…...

编程日记 2023/10/15 23:00:43

Kopler.gl笔记：可视化功能总览

1 添加数据 2 添加图层打开“数据层”菜单，开始可视化。层（Layers）简单来说就是可以相互叠加的数据可视化。 3 添加过滤器在地图上添加过滤器以限制显示的数据。过滤器必须基于数据集中的列。要创建新的过滤器，打开“过滤器…...

编程日记 2023/10/15 22:59:40

rust学习Cell、RefCell、OnceCell

背景 Rust 内存安全基于以下规则：给定一个对象 T，它只能具有以下之一：对对象有多个不可变引用 (&T)（也称为别名 aliasing）对对象有一个可变引用 (&mut T)（也称为可变性 mutability）这是由 Rust 编译器强制执行的。然而，在某些情况下，该规则不够灵活（this r…...

编程日记 2023/10/15 22:58:39

基于SSM的摄影约拍系统

基于SSM的摄影约拍系统的设计与实现开发语言：Java数据库：MySQL技术：SpringSpringMVCMyBatisJSP工具：IDEA/Ecilpse、Navicat、Maven 【主要功能】前台系统：首页拍摄作品展示、摄影师展示、模特展示、文章信息、交流论…...

编程日记 2023/10/15 22:56:37

分析智能平台VMware Greenplum 7 正式发布！

📢📢📢📣📣📣 哈喽！大家好，我是【IT邦德】，江湖人称jeames007，10余年DBA及大数据工作经验一位上进心十足的【大数据领域博主】！😜&am…...

编程日记 2023/10/15 22:55:35

动态规划算法（3）--0-1背包、石子合并、数字三角形

目录一、0-1背包 1、概述 2、暴力枚举法 3、动态规划二、石子合并问题 1、概述 2、动态规划 3、环形石子怎么办？ 三、数字三角形问题 1、概述 2、递归 3、线性规划四、租用游艇问题一、0-1背包 1、概述 0-1背包：给定多种物品和一个固定…...

编程日记 2023/10/15 22:54:33

Linux C/C++ 嗅探数据包并显示流量统计信息

嗅探数据包并显示流量统计信息是网络分析中的一种重要技术，常用于网络故障诊断、网络安全监控等方面。具体来说，嗅探器是一种可以捕获网络上传输的数据包，并将其展示给分析人员的软件工具。在嗅探器中，使用pcap库是一种常见的方法…...

编程日记 2023/10/15 22:53:31

Vitis导入自制IP导致无法构建Platform

怎么还有这种问题（ 解决Vitis导入自制IP导致无法构建Platform – TaterLi 个人博客 Vitis报错：fatal error: xxx.h: No such file or directory._ly2lj的博客-CSDN博客在指定位置黏入以上代码即可： INCLUDEFILES$(wildcard *.h) LIBSOUR…...

编程日记 2023/10/15 22:52:30

SQLAlchemy 使用封装实例

类封装 database.py #! /usr/bin/env python # -*- coding: utf-8 -*-import sys import json import logging from datetime import datetimefrom core.utils import classlock, parse_bool from core.config import (MYSQL_HOST,MYSQL_PORT,MYSQL_USER,MYSQL_PASS,MYSQL_DA…...

编程日记 2023/10/15 22:51:28

Android Framework通信：Binder

文章目录前言一、Linux传统跨进程通信原理二、Android Binder跨进程通信原理1、动态内核可加载模块2、内存映射3、Binder IPC 实现原理三、Android Binder IPC 通信模型1、Client/Server/ServiceManager/驱动Binder与路由器之间的角色关系 2、Binder通信过程3、Binder通信中的…...

编程日记 2023/10/15 22:50:27

如何用精准测试来搞垮团队？

测试行业每年会冒出来一些新鲜词：混沌工程、精准测试、AI测试…… 这些新概念、新技术让我们感到很焦虑，逼着自己去学习和了解这些新玩意，担心哪一天被淘汰掉。以至于给我这样的错觉，当「回归测试」、「精准测试」这两个词摆在一…...

编程日记 2023/10/15 22:49:25

暴力递归转动态规划（十）

题目给定一个二维数组matrix[][]，一个人必须从左上角出发，最终到达右下角，沿途只可以向下或者向右走，沿途的数字都累加就是距离累加和。返回最小距离累加和。这道题中会采用压缩数组的算法来进行优化暴力递归暴力递归方法的整…...

编程日记 2023/10/15 22:48:23

深度学习-房价预测案例

1. 实现几个函数方便下载数据 import hashlib import os import tarfile import zipfile import requests#save DATA_HUB dict() DATA_URL http://d2l-data.s3-accelerate.amazonaws.com/def download(name, cache_diros.path.join(.., data)): #save"""下载…...

编程日记 2023/10/15 22:46:21

【26】c++设计模式——＞命令模式

c命令模式 C的命令模式是一种行为模式，通过将请求封装成对象，以实现请求发送者和接受者的解耦。在命令模式中，命令被封装成一个包含特定操作的对象，这个对象包含的执行该操作的方法，以及一些必要的参数。命令对象可以…...

编程日记 2023/10/15 22:45:20

ElasticSearch容器化从0到1实践（一）

背景通过kubernetes集群聚合多个Elasticsearch集群碎片资源，提高运维效率。介绍 Kubernetes Operator 是一种特定的应用控制器，通过 CRD（Custom Resource Definitions，自定义资源定义）扩展 Kubernetes API 的功能…...

编程日记 2023/10/15 22:44:18

【Vue面试题二十四】、Vue项目中有封装过axios吗？主要是封装哪方面的？

文章底部有个人公众号：热爱技术的小郑。主要分享开发知识、学习资料、毕业设计指导等。有兴趣的可以关注一下。为何分享？ 踩过的坑没必要让别人在再踩，自己复盘也能加深记忆。利己利人、所谓双赢。面试官：Vue项目中有封装过axios…...

编程日记 2023/10/15 22:43:17

旅游票务商城小程序的作用是什么

随着环境放开，旅游行业恢复了以往的规模，本地游、外地游成为众多用户选择，而在旅游时，不少人会报名旅行团前往各风景热点游玩，对旅游票务经营者而言，市场高需求的同时也面临一些难题。对旅游票务经营商家…...

编程日记 2023/10/15 22:42:15

CTF show Web 红包题第六弹

提示 1.不是SQL注入 2.需要找关键源码思路进入页面发现是一个登录框，很难让人不联想到SQL注入，但提示都说了不是SQL注入，所以就不往这方面想了先查看一下网页源码，发现一段JavaScript代码，有一个关键类ctfs…...

编程新知 2026/2/5 4:33:58

day52 ResNet18 CBAM

在深度学习的旅程中，我们不断探索如何提升模型的性能。今天，我将分享我在 ResNet18 模型中插入 CBAM（Convolutional Block Attention Module）模块，并采用分阶段微调策略的实践过程。通过这个过程，我不仅提升…...

编程新知 2025/11/9 1:27:18

循环冗余码校验CRC码算法步骤+详细实例计算

通信过程：（白话解释） 我们将原始待发送的消息称为 M M M，依据发送接收消息双方约定的生成多项式 G ( x ) G(x) G(x)（意思就是 G （ x ) G（x) G（x) 是已知的）&#xff0…...

编程新知 2026/2/8 8:16:14

渗透实战PortSwigger靶场-XSS Lab 14：大多数标签和属性被阻止

编程新知 2026/1/24 13:05:24

CentOS下的分布式内存计算Spark环境部署

一、Spark 核心架构与应用场景 1.1 分布式计算引擎的核心优势 Spark 是基于内存的分布式计算框架，相比 MapReduce 具有以下核心优势： 内存计算：数据可常驻内存，迭代计算性能提升 10-100 倍（文档段落：3-79…...

编程新知 2026/2/5 1:30:05

剑指offer20_链表中环的入口节点

链表中环的入口节点给定一个链表，若其中包含环，则输出环的入口节点。若其中不包含环，则输出null。数据范围节点 val 值取值范围 [ 1 , 1000 ] [1,1000] [1,1000]。节点 val 值各不相同。链表长度 [ 0 , 500 ] [0,500] [0,500]。 …...

编程新知 2026/1/31 6:09:22

【JavaSE】绘图与事件入门学习笔记

-Java绘图坐标体系坐标体系-介绍坐标原点位于左上角，以像素为单位。在Java坐标系中,第一个是x坐标,表示当前位置为水平方向，距离坐标原点x个像素;第二个是y坐标，表示当前位置为垂直方向，距离坐标原点y个像素。坐标体系-像素 …...

编程新知 2025/12/19 20:46:15

Spring Cloud Gateway 中自定义验证码接口返回 404 的排查与解决

Spring Cloud Gateway 中自定义验证码接口返回 404 的排查与解决问题背景在一个基于 Spring Cloud Gateway WebFlux 构建的微服务项目中，新增了一个本地验证码接口 /code，使用函数式路由（RouterFunction）和 Hutool 的 Circle…...

编程新知 2026/2/9 4:25:05

C++使用 new 来创建动态数组

问题： 不能使用变量定义数组大小原因： 这是因为数组在内存中是连续存储的，编译器需要在编译阶段就确定数组的大小，以便正确地分配内存空间。如果允许使用变量来定义数组的大小，那么编译器就无法在编译时确定数组的大…...

编程新知 2026/2/2 18:33:19

初探Service服务发现机制

1.Service简介 Service是将运行在一组Pod上的应用程序发布为网络服务的抽象方法。主要功能：服务发现和负载均衡。 Service类型的包括ClusterIP类型、NodePort类型、LoadBalancer类型、ExternalName类型 2.Endpoints简介 Endpoints是一种Kubernetes资源&#xf…...

编程新知 2026/2/6 15:01:23

相关文章：