Pytorch学习 day10(L1Loss、MSELoss、交叉熵Loss)
Loss
- loss的作用如下:
- 计算实际输出和真实值之间的差距
- 为我们更新模型提供一定的依据(反向传播)
L1Loss
- 绝对值损失函数:在每一个batch_size内,求每个输入x和标签y的差的绝对值,最后返回他们平均值

MSELoss
- 均方损失函数:在每一个batch_size内,求每个输入x和标签y的差的平方,最后返回他们的平均值

交叉熵Loss
- 当我们在处理分类问题时,经常使用交叉熵损失函数。
- 交叉熵能够衡量同一个随机变量中的两个不同概率分布的差异程度,在机器学习中就表示为真实概率分布与预测概率分布之间的差异。交叉熵的值越小,模型预测效果就越好。
- 交叉熵在分类问题中常常与softmax是标配,softmax将输出的结果进行处理,使其多个分类的预测值和为1,再通过交叉熵来计算损失。
- 由于以下内容需要理解Softmax函数和交叉熵损失函数,所以先回顾一遍:
- Softmax函数:
- 首先,分类任务的目标是通过比较每个类别的概率大小来判断预测的结果。但是,我们不能选择未规范化的线性输出作为我们的预测。原因有两点。
1. 线性输出的总和不一定为1
2. 线性输出可能有负值
- 因此我们采用Softmax规范手段来保证输出的非负、和为1,公式和举例如下:
- 左侧为Softmax函数公式,右侧的o为线性输出,y为Softmax规范后的输出

- 左侧为Softmax函数公式,右侧的o为线性输出,y为Softmax规范后的输出
- 交叉熵损失函数:
- 下图为交叉熵损失函数公式,P(x)为真实概率分布,q(x)为预测概率分布:

- 下图为交叉熵损失函数公式,P(x)为真实概率分布,q(x)为预测概率分布:
- 我们将Softmax规范后的输出代入交叉熵损失函数中,可得:
- 在训练中,我们已知该样本的类别,那么在该样本的真实概率分布中,只有该类别为1,其他都为0。
- 在计算机中的log,默认都是ln。

- 这就是Pytorch官网中的交叉熵损失函数公式:

相关文章:
Pytorch学习 day10(L1Loss、MSELoss、交叉熵Loss)
Loss loss的作用如下: 计算实际输出和真实值之间的差距为我们更新模型提供一定的依据(反向传播) L1Loss 绝对值损失函数:在每一个batch_size内,求每个输入x和标签y的差的绝对值,最后返回他们平均值 M…...
2.2 传统经济学在耍赖
传统经济学中,主体的行为决策是研究的重点对幸福的追求不是传统经济学的研究重点,决策才是。在传统经济学那里,只要能搞清楚是什么决定了决策就可以了。 传统经济学用人们对物品的喜好的排序去替代了对幸福的直接度量。这样做有一个好处&…...
【算法面试题】-04
执行时长 def min_execution_time(n, size, tasks):a 0ans sizei 0while i < size:tmp tasks[i]a tmpif a < n:a 0else:a - ni 1ans a // nif a % n ! 0:ans 1return ans# 读取输入 n int(input()) size int(input()) tasks list(map(int, input().split()))…...
力扣hot100:152.乘积最大子数组(动态规划)
一个子数组问题,我们要使用线性dp,最好先考虑以i结尾,如果定义dp[i]为前i个数最大子数组乘积值 那么dp[i-1]就无法转移到dp[i]。因此我们先考虑dp[i]定义为以第i个数结尾的最大子数组乘积值。 53. 最大子数组和 最大子数组和是一个动态规划问…...
【python 】----Pytest基础知识与进阶知识
定义 用于编写和执行Python测试全功能测试框架(工具),是一个第三方库 安装 pip insatll pytest 安装pytest --version 校验 pytest的组成构成 不写调用语句也可以执行函数内容 在用例运行语句里面: -s:指的是开启与终端的交互,如果没有-s(程序不会输入与打印),一条用…...
谷歌开源的LLM大模型 Gemma 简介
相关链接: Hugging face模型下载地址:https://huggingface.co/google/gemma-7bGithub地址:https://github.com/google/gemma_pytorch论文地址:https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf官方博客&…...
深入理解 Vuex:从基础到应用场景
前言 在之前的文章中,我们已经对 Vue.js 有了一定的了解。今天我们要对Vue官方的状态共享管理器Vuex进行详细讲解,将其基本吃透,目标是面对大多数业务需求; 一、介绍 Vuex 是一个专为 Vue.js 应用程序开发的状态管理模式。它采用…...
自定义 classNames hooks
什么是自定义 hooks 自定义hooks是react提供的编写公共函数的方法 自定hooks 和 通用函数的区别 一定有人会说 hooks 可以使用react 的方法,但是公共函数也可以,因为 jsx 语法的原因 函数必须开头进行大写 其实这些都是 react 的语法规范ÿ…...
玩转centos 下的core 文件
玩转centos 下的core 文件 ------------------------------------------------------------ author: hjjdebug date: 2024年 03月 06日 星期三 12:38:35 CST description: 玩转centos 下的core 文件 ------------------------------------------------------------ 一: 准备一…...
深入浅出计算机网络 day.1 概论③ 电路交换、分组交换和报文交换
人无法同时拥有青春和对青春的感受 —— 04.3.9 内容概述 01.电路交换、分组交换和报文交换 02.三种交换方式的对比 一、电路交换、分组交换和报文交换 1.电路交换 计算机之间的数据传送是突发式的,当使用电路交换来传送计算机数据时,其线路的传输效率一…...
linux:线程的控制
个人主页 : 个人主页 个人专栏 : 《数据结构》 《C语言》《C》《Linux》 文章目录 前言一、线程的总结1. 线程的优点2. 线程的缺点3. 线程异常4.线程和进程 二、线程的控制创建线程线程终止线程等待获取返回值 线程分离 总结 前言 本文作为我对于线程的…...
小程序分账方案:实现商户分账的简便与灵活
随着移动支付的普及和小程序的快速发展,越来越多的商家选择在微信小程序上开展业务。然而,对于一些有多个分账方的商户而言,如何实现快速、准确和灵活的资金分账成为了一个挑战。本文将介绍一种高效的小程序分账方案,帮助商户轻松…...
Python数值微积分,摆脱被高数支配的恐惧
文章目录 差分和累加积分多重积分 Python科学计算:数组💯数据生成 差分和累加 微积分是现代科学最基础的数学工具,但其应用对象往往是连续函数,而其在非连续函数的类比,便是差分与累加。在【numpy】中,可…...
使用express+nginx+pm2+postman实现推送zip包自动更新前端网页
1.nginx配置将80端口代理到项目的3000端口 server {listen 80; #监听的端口server_name localhost; #监听的域名#charset koi8-r;#access_log logs/host.access.log main;location / {#root html;#index index.html index.html;proxy_pass http://127.0.0.1:3000; #转…...
如何在小程序中绑定身份证
在小程序中绑定身份证信息是一项常见的需求,特别是在需要进行实名认证或者身份验证的场景下。通过绑定身份证信息,可以提高用户身份的真实性和安全性,同时也为小程序提供了更多的个性化服务和功能。下面就介绍一下怎么在小程序中绑定居民身份…...
【机器学习】【决策树】分类树|回归树学习笔记总结
决策树算法概述 基本概念 决策树:从根节点开始一步步走到叶子节点,每一步都是决策过程 对于判断的先后顺序把控特别严格 一旦将判断顺序进行变化则最终的结果将可能发生改变 往往将分类效果较佳的判断条件放在前面,即先初略分在进行细节分…...
运维随录实战(14)之docker搭建mysql主从集群(Replication))
1, 从官方景镜像中拉取mysql镜像: docker pull mysql:8.0.24 --platform linux/x86_64 2, 创建master和slave容器: 在创建之前先设置网段 docker network create --subnet=172.20.0.0/24 soil_network master: docker run -d -p 3306:3306 --name mysql-master --net soi…...
CI/CD笔记.Gitlab系列:2024更新后-设置GitLab导入源
CI/CD笔记.Gitlab系列 设置GitLab导入源 - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite:http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of this article:https://blog.csdn.net/qq_…...
一款Mac系统NTFS磁盘读写软件Tuxera NTFS 2023 for Mac
当您获得一台新 Mac 时,它只能读取 Windows NTFS 格式的 USB 驱动器。要将文件添加、保存或写入您的 Mac,您需要一个附加的 NTFS 驱动程序。Tuxera 的 Microsoft NTFS for Mac 2023是一款易于使用的软件,可以在 Mac 上打开、编辑、复制、移动…...
Error while Deploying HAP
第一个程序就遇到这么恶心的bug,也查了很多类似的问题是什么情况,后来无意中菜解决了这个bug,确实也是devicps下面加一个参数,但是找了半天 这是我遇到这个问题的解决办法。其他解决办法如下: https://blog.51cto.com…...
基于Python的社区团购管理系统毕业设计
博主介绍:✌ 专注于Java,python,✌关注✌私信我✌具体的问题,我会尽力帮助你。一、研究目的本研究旨在设计并实现一套基于Python的社区团购管理系统,以解决当前社区团购业务中存在的效率低下、信息不对称、用户体验不佳等问题。具体研究目的如…...
终极 .NET 逆向工程指南:dnSpyEx 深度调试与程序集编辑完全攻略
终极 .NET 逆向工程指南:dnSpyEx 深度调试与程序集编辑完全攻略 【免费下载链接】dnSpy Unofficial revival of the well known .NET debugger and assembly editor, dnSpy 项目地址: https://gitcode.com/gh_mirrors/dns/dnSpy dnSpyEx 作为 .NET 调试与逆向…...
Zotero PDF预览插件终极指南:告别频繁切换,实现高效文献管理
Zotero PDF预览插件终极指南:告别频繁切换,实现高效文献管理 【免费下载链接】zotero-pdf-preview Preview Zotero attachments in the library view. 项目地址: https://gitcode.com/gh_mirrors/zo/zotero-pdf-preview 在学术研究和文献整理过程…...
GLiNER实战项目:构建智能文档处理系统的完整指南
GLiNER实战项目:构建智能文档处理系统的完整指南 【免费下载链接】GLiNER Generalist and Lightweight Model for Named Entity Recognition (Extract any entity types from texts) 项目地址: https://gitcode.com/gh_mirrors/gl/GLiNER GLiNER(…...
AI开发-python-langchain框架(--并行流程 )耪
如果有多个供应商,你也可以使用 [[CC-Switch]] 来可视化管理这些API key,以及claude code 的skills。 # 多平台安装指令 curl -fsSL https://claude.ai/install.sh | bash ## Claude Code 配置 GLM Coding Plan curl -O "https://cdn.bigmodel.cn/i…...
nlp_structbert_sentence-similarity_chinese-large部署教程:CentOS 7最小化安装适配
nlp_structbert_sentence-similarity_chinese-large部署教程:CentOS 7最小化安装适配 1. 环境准备与系统配置 在开始部署之前,我们需要确保CentOS 7最小化安装系统满足基本的运行要求。最小化安装的CentOS 7默认只包含最基础的系统组件,需要…...
PyTorch 2.8镜像科研部署:支持WandB日志+HuggingFace Hub模型同步工作流
PyTorch 2.8镜像科研部署:支持WandB日志HuggingFace Hub模型同步工作流 1. 镜像概述与核心优势 PyTorch 2.8深度学习镜像是一个为科研工作者和开发者精心打造的通用训练/推理环境。这个镜像基于RTX 4090D 24GB显卡和CUDA 12.4深度优化,特别适合需要高性…...
Lychee Rerank MM智能助手场景:支持图文提问的本地化多模态搜索引擎构建指南
Lychee Rerank MM智能助手场景:支持图文提问的本地化多模态搜索引擎构建指南 1. 项目概述与核心价值 Lychee Rerank MM是一个基于Qwen2.5-VL构建的高性能多模态重排序系统,由哈工大(深圳)自然语言处理团队开发。这个系统专门解决…...
YOLOv8实战:用Grad-CAM可视化模型注意力区域(附完整代码)
YOLOv8实战:用Grad-CAM可视化模型注意力区域(附完整代码) 在计算机视觉领域,理解模型如何"看待"图像正变得越来越重要。想象一下,当你的目标检测模型将一只猫误判为狗时,如果能直观看到模型关注了…...
STM32F042轻量级内建调试工具DEBUG_F042F6P6
1. 项目概述DEBUG_F042F6P6是一个面向 STM32F042F6P6 微控制器的轻量级、可复用调试工具集,专为资源受限的 Cortex-M0 嵌入式系统设计。该工具并非通用型调试器(如 ST-Link 或 J-Link),而是一套嵌入在目标固件内部的运行时诊断子系…...
