当前位置：首页 > news >正文

损失函数-二分类和多分类

news 2026/2/11 1:40:54

二分类和多分类的损失函数

二分类

损失函数
$L(y,\hat{y}) = -(ylog(\hat{y})) + (1-y)log(1-\hat{y})$
其中真实标签表示为y（取值为 0 或 1），预测概率表示为 $\hat{y}$ （取值在 0 到 1 之间）
代码

import torch
import torch.nn as nncriterion = nn.BCELoss()  # 或者使用 nn.BCEWithLogitsLoss()  BCEWithLogitsLoss可以直接接收logit输出
# 假设模型的输出 logits
logits = torch.tensor([0.2, 0.8, 0.5, 0.1]) #shape: (4, 1) 
predicted_probabilities = torch.sigmoid(logits) #shape: (4, 1) 
# 真实标签
labels = torch.tensor([0.0, 1.0, 1.0, 0.0]) #shape: (4, 1) 
# 计算损失
loss = criterion(predicted_probabilities, labels)
print("Loss:", loss.item())

可视化损失值
对于输出的loss值，我们往往不能理解这个loss是好还是坏，我们重看损失函数，发现对于单个正样本来说：
$-log(\hat{y})$
对于单个负样本来说：
$-log(1-\hat{y})$
从这个公式我们可以反推模型对正样本预测的概率为：
$hit_{pos} = e^{-loss}$
对负样本预测的概率为：
$hit_{neg} = 1-e^{-loss}$
这个hit就比较形象了， $hit_{pos}$ 越接近1，说明正样本的预测效果效果越好， $hit_{neg}$ 越接近0，说明负样本的预测效果效果越好

多分类

损失函数
$L(y,\hat{y}) = -\sum_{c=1}^Cylog(\hat{y})$
其中真实标签表示为y（取值为 0 或 1，表示是否属于第c类），预测概率表示为 $\hat{y}$ （取值在 0 到 1 之间）
代码

import torch
import torch.nn as nncriterion = nn.CrossEntropyLoss()# 假设模型的输出 logits（未经过 sigmoid）
logits = torch.tensor([[1.0, 2.0],  # 类别 0 和 1 的 logits[0.0, 1.0],[0.5, 0.5],[0.0, 0.0]]) # shape：（4，2）# 真实标签，格式为类别索引
# 0 表示第一个类别，1 表示第二个类别
labels = torch.tensor([1, 1, 0, 0])  # shape：（1，4）# 计算损失
loss = criterion(logits, labels)print("Loss:", loss.item())

可视化损失值
对于输出的loss值，我们往往不能理解这个loss是好还是坏，我们重看损失函数，发现对于单个样本来说：
$-log(\hat{y})$
从这个公式我们可以反推模型对当前样本的正确类别预测的概率为：
$hit = e^{-loss}$
这个hit就比较形象了，hit越接近1，说明效果越好

二分类和多分类区别

从损失函数的物理含义上来看，二分类的损失函数不仅希望正样本输出概率接近1，并且希望负样本的输出概率接近0；而多分类的损失函数仅仅希望正样本输出概率接近1，对于负样本其实没有约束
对于二分类问题：如果你希望模型不仅能找出正样本，而且筛掉副样本，就用二分类损失。如果你仅仅希望找出正样本而不管负样本，多分类的损失也能用。

多分类问题中评价问题

TP（True Positive）：真实标签为正类，模型预测为正类的样本数量。
TN（True Negative）：真实标签为负类，模型预测为负类的样本数量。
FP（False Positive）：真实标签为负类，但模型预测为正类的样本数量。
FN（False Negative）：真实标签为正类，但模型预测为负类的样本数量。

准确率acc
关心模型预测的能力
$\frac{TP+TN}{TP+FP+FN+TN}$
精准率pre
关心模型预测负样本能力
$\frac{TP}{TP+FP}$
召回率Recall
关心模型预测正样本的能力
$\frac{TP}{TP+FN}$

损失函数-二分类和多分类

二分类和多分类的损失函数二分类损失函数 L ( y , y ^ ) − ( y l o g ( y ^ ) ) ( 1 − y ) l o g ( 1 − y ^ ) L(y,\hat{y}) -(ylog(\hat{y})) (1-y)log(1-\hat{y}) L(y,y^)−(ylog(y^))(1−y)log(1−y^) 其中真实标签表示为y（取值为 0 或 1&#…...

编程日记 2024/12/31 15:26:24

汽车损坏识别检测数据集，使用yolo，pasical voc xml，coco json格式标注，6696张图片，可识别11种损坏类型，识别率89.7%

汽车损坏识别检测数据集，使用yolo，pasical voc xml，coco json格式标注，6696张图片，可识别11种损坏类型损坏： 前挡风玻璃（damage-front-windscreen ） 损坏的门 （damaged-d…...

编程日记 2024/12/31 15:24:22

从 Elastic 迁移到 Easysearch 指引

从 Elasticsearch 迁移到 Easysearch 需要考虑多个方面，这取决于当前使用的 Elasticsearch 版本、能容忍的停机时间、应用需求等。在此背景下，我们梳理了一下通用的升级指引，方便大家进行迁移工作。迁移路径 Elasticsearch 版本快照兼容推…...

编程日记 2024/12/31 15:22:19

Yapi RCE 复现和批量编写

一、漏洞复现首先祭出fofa，搜索语句为 app"yapi"，但是为了避开国内，所以使用 app"yapi" && country"SG"，SG为新加坡，结果如图虽然有30页，但是能利用的可能也没几…...

编程日记 2024/12/31 15:14:09

【2024年-9月-21日-开源社区openEuler实践记录】PilotGo：简化运维管理的开源利器

开篇介绍大家好，我是 fzr123。在运维领域摸爬滚打许久，我发现了PilotGo这个超实用的开源项目，它正悄然改变着运维人员处理日常任务的方式，为复杂的运维管理工作带来了极大的便利与效率提升。技术亮点 1. 自动化运维任务编排 …...

编程日记 2024/12/31 15:13:03

ubuntu 20.04 国内源安装docker

先更新软件包，安装备要apt软件 # 更新软件包索引 sudo apt-get update# 安装需要的软件包以使apt能够通过HTTPS使用仓库 sudo apt-get install ca-certificates curl gnupg lsb-release使用阿里云源 # 添加阿里云官方GPG密钥 curl -fsSL http://mirrors.aliyun.co…...

编程日记 2024/12/31 15:12:01

比亚迪30亿教育慈善基金正式启动，助推中国科教进步

12月30日，比亚迪在深圳总部举行了30亿教育慈善基金启动仪式，比亚迪股份有限公司董事长兼总裁王传福与来自全国的35所高校代表及28所科技馆、博物馆代表共同启动比亚迪30亿教育慈善基金捐赠，推动中国科教进步。捐资30亿教育慈善基金&#xf…...

编程日记 2024/12/31 15:07:56

【链表】重排链表，看似复杂实则并不简单~

文章目录 143. 重排链表解题思路 143. 重排链表 143. 重排链表给定一个单链表 L 的头节点 head ，单链表 L 表示为： L0 → L1 → … → Ln - 1 → Ln 请将其重新排列后变为： L0 → Ln → L1 → Ln - 1 → L2 → Ln - 2 → … 不能…...

编程日记 2024/12/31 15:06:54

yakit-靶场-高级前端加解密与验签实战（for嵌套纯享版）

高级前端加解密与验签实战一、前端验证签名（验签）表单：HMAC-SHA256 使用hmac-sha256的十六进制key值可以加密与页面加密后的值相同热加载： encryptData func(p) { //sha256key值key codec.DecodeHex("313233343132333…...

编程日记 2024/12/31 15:04:51

洛谷 P1328 [NOIP2014 提高组] 生活大爆炸版石头剪刀布

题解： #include<iostream> #include<vector> //定义二维数组，直接标识不同出法相应对应关系 int mark[5][5]{{0,-1,1,1,-1},{1,0,-1,1,-1},{-1,1,0,-1,1},{-1,-1,1,0,1},{1,1,-1,-1,0}}; void JudgeScore(int A,int B,int& countA,int&…...

编程日记 2024/12/31 14:57:42

NLP论文速读(NeurIPS 2024)|BERT作为生成式上下文学习者BERTs are Generative In-Context Learners

论文速读|BERTs are Generative In-Context Learners 论文信息： 简介： 本文探讨了在自然语言处理（NLP）领域中，上下文学习（in-context learning）的能力，这通常与因果语言模型&#x…...

编程日记 2024/12/31 14:56:41

亚马逊云科技 | Amazon Nova：智能技术新势力

在2024年亚马逊云科技re:invent大会上，Amazon Nova 系列自研生成式 AI 多模态模型重磅登场，新一代的AI产品-Amazon Nova，隶属于 Amazon Bedrock，一共发布6款大模型，精准切入不同领域，解锁多元业务可能&…...

编程日记 2024/12/31 14:54:39

Kali 自动化换源脚本编写与使用

1. 背景与需求在使用 Kali Linux 的过程中，软件源的配置对系统的更新与软件安装速度至关重要。 Kali 的默认官方源提供了安全且最新的软件包，但有时由于网络条件或地理位置的限制，使用官方源可能会出现速度较慢的问题。为了解决这一问题&a…...

编程日记 2024/12/31 14:49:34

【已解决】PDF文档有密码怎么办（2024新）免费在线工具PDF2Go

强大的解密工具PDF2Go使用指南一、PDF2Go简介 PDF2Go是由德国QaamGo公司开发的在线PDF工具箱，以其强大的功能和用户友好的界面而闻名。它不仅免费，而且不需要用户注册或安装任何软件，只需打开浏览器即可使用。二、功能特点 1. 免费且无需…...

编程日记 2024/12/31 14:45:26

华为ensp-BGP联盟

学习新思想，争做新青年，今天学习BGP联盟实验介绍一个BGP联盟是一个具有内部层次结构的AS。一个BGP联盟由若干个子AS 组成，子AS也称为成员AS。对于一个BGP联盟，其成员AS内部的各路由器之间需要建立全互联的IBGP邻居关系或使用B…...

编程日记 2024/12/31 14:44:24

ArcGIS中怎么进行水文分析？（思路介绍）

最近有人咨询，ArcGIS中怎么进行水文分析，大致的说一下河网提取的思路哈解决思路：dem填洼→计算水流方向→计算水流累积矩阵→形成河网 dem填洼计算水流方向计算水流累积矩阵用栅格计算器，设阈值（自己多次尝试&…...

编程日记 2024/12/31 14:42:22

LabVIEW中实现多个Subpanel独立调用同一个VI

在LabVIEW中，如果需要通过多个Subpanel同时调用同一个VI并让这些VI实例独立运行，可以通过以下方法实现： 1. 问题背景 LabVIEW默认的VI是以单实例方式运行的。当将同一个VI加载到多个Subpanel时，会因为共享同一内存空间而导致冲突…...

编程日记 2024/12/31 14:41:17

【SpringMVC】Bean 加载控制

在实际开发中，SpringMVC 负责扫描和加载 Controller 层的 Bean 对象，而业务层和数据层等其他模块的 Bean 则由 Spring 框架负责扫描和加载。那么，如何控制 Spring 仅加载除了 Controller 层之外的其他 Bean 呢？为了解决这个问题&a…...

编程日记 2024/12/31 14:37:13

Socket编程中关于服务器端监听端口与新连接端口的深入剖析

Socket编程中关于服务器端监听端口与新连接端口的深入剖析在Socket编程领域，存在一个容易让初学者感到困惑的问题。尽管很多人在网络上进行了相关探讨，但不少解释要么不够清晰明了，要么太过肤浅，未能深入到问题的核心&#xff0…...

编程日记 2024/12/31 14:36:12

如何通过HTTP API更新Doc

本文介绍如何通过HTTP API更新Collection中已存在的Doc。说明若更新Doc时指定id不存在，则本次更新Doc操作无效如只更新部分属性fields，其他未更新属性fields默认被置为null 前提条件已创建Cluster：创建Cluster。已获得API-KEY&#…...

编程日记 2024/12/31 14:35:11

Prompt Tuning、P-Tuning、Prefix Tuning的区别

一、Prompt Tuning、P-Tuning、Prefix Tuning的区别 1. Prompt Tuning（提示调优）核心思想：固定预训练模型参数，仅学习额外的连续提示向量（通常是嵌入层的一部分）。实现方式：在输入文本前添加可训练的连续向量（软提示），模型只更新这些提示参数。优势：参数量少（仅提…...

编程新知 2026/2/11 1:23:00

ubuntu搭建nfs服务centos挂载访问

在Ubuntu上设置NFS服务器在Ubuntu上，你可以使用apt包管理器来安装NFS服务器。打开终端并运行： sudo apt update sudo apt install nfs-kernel-server创建共享目录创建一个目录用于共享，例如/shared： sudo mkdir /shared sud…...

编程新知 2026/2/6 23:18:59

多模态商品数据接口：融合图像、语音与文字的下一代商品详情体验

一、多模态商品数据接口的技术架构 （一）多模态数据融合引擎跨模态语义对齐通过Transformer架构实现图像、语音、文字的语义关联。例如，当用户上传一张“蓝色连衣裙”的图片时，接口可自动提取图像中的颜色（RGB值&…...

编程新知 2025/7/23 3:55:49

ESP32 I2S音频总线学习笔记（四）： INMP441采集音频并实时播放

简介前面两期文章我们介绍了I2S的读取和写入，一个是通过INMP441麦克风模块采集音频，一个是通过PCM5102A模块播放音频，那如果我们将两者结合起来，将麦克风采集到的音频通过PCM5102A播放，是不是就可以做一个扩音器了呢…...

编程新知 2026/2/9 20:01:01

import java.util.Arrays; import java.util.Scanner;public class DemoTest3 {public static void main(String[] args) {Scanner in new Scanner(System.in);// 注意 hasNext 和 hasNextLine 的区别while (in.hasNextLine()) { // 注意 while 处理多个 caseint a in.nextIn…...

编程新知 2026/1/28 11:11:03

关于 WASM：1. WASM 基础原理

一、WASM 简介 1.1 WebAssembly 是什么？ WebAssembly（WASM） 是一种能在现代浏览器中高效运行的二进制指令格式，它不是传统的编程语言，而是一种低级字节码格式，可由高级语言（如 C、C、Rust&am…...

编程新知 2025/11/19 10:53:07

安宝特方案丨船舶智造的“AR+AI+作业标准化管理解决方案”（装配）

船舶制造装配管理现状：装配工作依赖人工经验，装配工人凭借长期实践积累的操作技巧完成零部件组装。企业通常制定了装配作业指导书，但在实际执行中，工人对指导书的理解和遵循程度参差不齐。船舶装配过程中的挑战与需求挑战 (1…...

编程新知 2026/2/6 2:16:18

【VLNs篇】07：NavRL—在动态环境中学习安全飞行

项目内容论文标题NavRL: 在动态环境中学习安全飞行 (NavRL: Learning Safe Flight in Dynamic Environments)核心问题解决无人机在包含静态和动态障碍物的复杂环境中进行安全、高效自主导航的挑战，克服传统方法和现有强化学习方法的局限性。核心算法基于近端策略优化…...

编程新知 2026/2/7 4:16:41

nnUNet V2修改网络——暴力替换网络为UNet++

更换前，要用nnUNet V2跑通所用数据集，证明nnUNet V2、数据集、运行环境等没有问题阅读nnU-Net V2 的 U-Net结构，初步了解要修改的网络，知己知彼，修改起来才能游刃有余。 U-Net存在两个局限，一是网络的最佳深度因应用场景而异，这取决于任务的难度和可用于训练的标注数…...

编程新知 2026/2/7 10:22:16

ubuntu系统文件误删(/lib/x86_64-linux-gnu/libc.so.6)修复方案 [成功解决]

报错信息：libc.so.6: cannot open shared object file: No such file or directory： #ls, ln, sudo...命令都不能用 error while loading shared libraries: libc.so.6: cannot open shared object file: No such file or directory重启后报错信息&…...

编程新知 2026/2/5 14:35:21

损失函数-二分类和多分类

二分类和多分类的损失函数

二分类

多分类

二分类和多分类区别

多分类问题中评价问题

相关文章：

损失函数-二分类和多分类

汽车损坏识别检测数据集，使用yolo，pasical voc xml，coco json格式标注，6696张图片，可识别11种损坏类型，识别率89.7%

从 Elastic 迁移到 Easysearch 指引

Yapi RCE 复现和批量编写

【2024年-9月-21日-开源社区openEuler实践记录】PilotGo：简化运维管理的开源利器

ubuntu 20.04 国内源安装docker

比亚迪30亿教育慈善基金正式启动，助推中国科教进步

【链表】重排链表，看似复杂实则并不简单~

yakit-靶场-高级前端加解密与验签实战（for嵌套纯享版）

洛谷 P1328 [NOIP2014 提高组] 生活大爆炸版石头剪刀布

NLP论文速读(NeurIPS 2024)|BERT作为生成式上下文学习者BERTs are Generative In-Context Learners

亚马逊云科技 | Amazon Nova：智能技术新势力

Kali 自动化换源脚本编写与使用

【已解决】PDF文档有密码怎么办（2024新）免费在线工具PDF2Go

华为ensp-BGP联盟

ArcGIS中怎么进行水文分析？（思路介绍）

LabVIEW中实现多个Subpanel独立调用同一个VI

【SpringMVC】Bean 加载控制

Socket编程中关于服务器端监听端口与新连接端口的深入剖析

如何通过HTTP API更新Doc

Prompt Tuning、P-Tuning、Prefix Tuning的区别

ubuntu搭建nfs服务centos挂载访问

多模态商品数据接口：融合图像、语音与文字的下一代商品详情体验

ESP32 I2S音频总线学习笔记（四）： INMP441采集音频并实时播放

华为OD机试-食堂供餐-二分法

关于 WASM：1. WASM 基础原理

安宝特方案丨船舶智造的“AR+AI+作业标准化管理解决方案”（装配）

【VLNs篇】07：NavRL—在动态环境中学习安全飞行

nnUNet V2修改网络——暴力替换网络为UNet++

ubuntu系统文件误删(/lib/x86_64-linux-gnu/libc.so.6)修复方案 [成功解决]