当前位置: 首页 > news >正文

神经网络与深度学习Pytorch版 Softmax回归 笔记

Softmax回归

目录

Softmax回归

1. 独热编码

2. Softmax回归的网络架构是一个单层的全连接神经网络。

3. Softmax回归模型概述及其在多分类问题中的应用

4. Softmax运算在多分类问题中的应用及其数学原理

5. 小批量样本分类的矢量计算表达式

6. 交叉熵损失函数

7. 模型预测及评价

8. 小结


Softmax回归,也称为多类逻辑回归,是一种用于解决多分类问题的机器学习算法。它与普通的 logistic 回归不同之处在于,logistic 回归通常用于二分类问题,而 softmax 回归则适用于有两个以上的类别需要预测的场景。以下是对 softmax 回归的具体介绍:

  • 函数定义:softmax 函数能够将多个类别的输出值转换成概率分布,其特点是输出值的范围在0到1之间,并且所有输出值的和为1。这使得它可以用于表示一个样本属于每个类别的概率。
  • 模型优势:与传统的线性回归相比,softmax 回归提供了一种非线性的方法来处理分类问题,特别是当类别之间存在相互依赖关系时,它能够给出更合理的结果。
  • 应用场景:softmax 回归广泛应用于机器学习中的多分类问题,如图像识别、文本分类等领域,在这些场景中,模型需要预测出一个样本属于多个类别中的一个。
  • 参数估计:该模型通过最大化似然函数来估计参数,通常使用梯度上升或随机梯度上升等优化方法来进行参数的学习和优化。
  • 损失函数:softmax 回归使用交叉熵损失函数来衡量模型预测的概率分布与实际分布之间的差异,并通过最小化这个损失函数来训练模型。

总的来说,softmax 回归是一个强大的多分类算法,它通过将输出转换为概率分布,帮助确定样本最可能的类别。在实际应用中,softmax 回归因其能够处理多个类别并给出直观的概率解释而被广泛采用。

1. 独热编码

独热编码(One-Hot Encoding)是一种将类别变量(categorical variables)转换为机器学习算法易于挖掘的形式的过程。在许多机器学习问题中,特征可以是非数字的,例如颜色、位置、职业等。这些特征被称为类别特征。

独热编码的工作原理是将每个类别分配一个唯一的整数,并为每个整数创建一个二进制列。然后,它将这些整数替换为其相应的二进制列。这样,每个类别都被表示为一个二进制向量,其中只有一个元素是1,其余元素都是0。

例如,如果我们有一个颜色特征,包含三个可能的值:红色、绿色和蓝色。独热编码将这些值转换为以下形式:

  • 红色:[1, 0, 0]
  • 绿色:[0, 1, 0]
  • 蓝色:[0, 0, 1]

这种方法的优点是它可以将类别特征转换为数值形式,从而使机器学习算法能够处理它们。然而,它的缺点是它增加了数据集的大小,并且可能导致稀疏性问题。

2. Softmax回归的网络架构是一个单层的全连接神经网络

Softmax回归是处理多分类问题的一种有效方法,它可以看作是二分类问题的Logistic回归的扩展。在网络架构方面,Softmax回归与线性回归相似,都属于单层神经网络的范畴。以下是Softmax回归网络架构的关键点:

  • 输入层:接收特征向量作为输入,这些特征向量通常经过预处理,以便于模型更好地理解和学习数据。
  • 全连接层:Softmax回归的输出层是全连接的,意味着每个输入特征都与每个输出类别相连接。这一层的权重和偏置参数在学习过程中被优化,以便更好地对输入进行分类。
  • 输出层:输出层使用Softmax函数,它将神经网络的原始输出转换为概率分布。Softmax函数的每个输出代表一个类别的概率,所有输出之和为1。这样,模型的输出可以直接解释为样本属于每个类别的概率。
  • 损失函数:为了训练Softmax回归模型,需要定义一个损失函数,通常是交叉熵损失函数,它衡量模型预测的概率分布与实际分布之间的差异。通过最小化这个损失函数,模型能够学习到更好的参数。
  • 优化算法:使用优化算法(如梯度下降)来调整网络的权重和偏置,以最小化损失函数,从而提高模型的分类性能。

综上所述,Softmax回归的网络架构相对简单,但其在多分类问题中的表现非常出色,能够有效地将输入数据映射到相应的类别概率上。

3. Softmax回归模型概述及其在多分类问题中的应用

  • Softmax回归用于多分类问题,其中每个类别都有一个对应的输出。
  • 该模型有多个仿射函数,每个输出类别一个。
  • 在我们的例子中,有4个输入特征和3个输出类别,因此需要12个权重参数(w)和3个偏置参数(b)。
  • 对于每个输入样本,计算三个未规范化的预测值(logits):o1、o2和o3,每个都是输入特征和相应权重的线性组合加上偏置。
  • Softmax回归可以被视为一个单层的全连接神经网络。
  • 使用线性代数表示,所有权重被组织在一个矩阵W中,输出o通过矩阵-向量乘法 Wx+b 计算得出。

o1 = x1w11 +x2w12 +x3w13 +x4w14 +b1,

o2 = x1w21 +x2w22 +x3w23 +x4w24 +b2,

o3 = x1w31 +x2w32 +x3w33 +x4w34 +b3.

4. Softmax运算在多分类问题中的应用及其数学原理

  • Softmax运算的目的是将模型的输出转换为概率分布,确保每个类别的概率非负且总和为1。
  • 通过Softmax函数,可以将线性层的输出(logits)转换为有效的概率值,从而满足概率的基本公理。
  • Softmax函数的计算过程包括对每个未规范化的预测值求指数,然后除以所有类别的指数和,确保输出的概率分布合理。
  • 使用Softmax函数后,模型的输出可以被视为类别的概率,使得模型可以预测具有最大概率的类别作为输出。
  • 尽管Softmax是一个非线性变换,但Softmax回归的输出仍然由输入特征的线性(仿射)变换决定,因此它仍然是一个线性模型。

y\hat{} =softmax(o)

\mathbf{\hat{y}_j = \frac{\exp(o_j)}{\sum_{k} exp(o_k)}}

5. 小批量样本分类的矢量计算表达式

6. 交叉熵损失函数

7. 模型预测及评价

8. 小结

后面关于小批量样本分类的矢量计算表达式,交叉熵损失函数,模型预测及评价这几步我还不理解,之后再补充。

相关文章:

神经网络与深度学习Pytorch版 Softmax回归 笔记

Softmax回归 目录 Softmax回归 1. 独热编码 2. Softmax回归的网络架构是一个单层的全连接神经网络。 3. Softmax回归模型概述及其在多分类问题中的应用 4. Softmax运算在多分类问题中的应用及其数学原理 5. 小批量样本分类的矢量计算表达式 6. 交叉熵损失函数 7. 模型预…...

git学习及简单maven打包

前提: 已经有远程仓库地址 和账号密码了 已经安装git了 1.本地新建文件夹A用作本地仓库 2.在A文件夹下右键打开GIT BASH HERE 3.创建用户和密码,方便追踪提交记录 git config --global user.email “caoqingqing0108” //创建邮箱 git config --global …...

如何用MapTalks IDE来发布网站?

简介 MapTalks IDE 全称 MapTalks集成设计环境(Integrated Design Environment),是由MapTalks技术团队开发的新一代web地图设计软件。 通过MapTalks IDE,您可以自由的创建二维和三维地图,在其中载入或创建地理数据&a…...

我用selenium开发了一个自动创建任务,解放重复性工作

我用selenium开发了一个自动创建任务,大大解放了我做重复性工作带来的疲惫感,收获了更多的乐趣。 我司有100多个服务,运维忙不过来的时候,就会让我们自己创建云负载,你首先需要在云服务上创建负载,再创建容…...

安卓11修改HDMI自适应分辨率

客户需要hdmi自适应屏幕分辨率,没发现有相关的指令,我发现设置中有个hdmi的Auto选项,于是就试试选中这个选项,试下了可以自适应,于是就找到相关代码,在开机完成后执行这个代码,基本满足需求&…...

Linux实验记录:使用Apache的虚拟主机功能

前言: 本文是一篇关于Linux系统初学者的实验记录。 参考书籍:《Linux就该这么学》 实验环境: VmwareWorkStation 17——虚拟机软件 RedHatEnterpriseLinux[RHEL]8——红帽操作系统 正文: 目录 前言: 正文&…...

分布式空间索引了解与扩展

目录 一、空间索引快速理解 (一)区域编码 (二)区域编码检索 (三)Geohash 编码 (四)RTree及其变体 二、业内方案选取 三、分布式空间索引架构 (一)PG数…...

Set和Map的应用场景

Set: 1.成员不能重复 2.只有键值,没有键名,有点类似数组 3.可以遍历,方法 add,delete,has Map: 1.本质上是键值对的集合,类似集合; 2.可以遍历,方法很多,可以干跟各种数据格式转换 Set和…...

小白级教程,10秒开服《幻兽帕鲁》

在帕鲁的世界,你可以选择与神奇的生物「帕鲁」一同享受悠闲的生活,也可以投身于与偷猎者进行生死搏斗的冒险。帕鲁可以进行战斗、繁殖、协助你做农活,也可以为你在工厂工作。你也可以将它们进行售卖,或肢解后食用。 前言 马上过年…...

IDEA 构建开发环境

本博客主要讲解了如何创建一个Maven构建Java项目。(本文是创建一个用Maven构建项目的方式,所以需要对Maven有一定的了解) IDEA 构建开发环境 一、创建一个空工程二、构建一个普通的Maven模块 一、创建一个空工程 创建一个空的工程 * 设置整…...

归并排序----C语言数据结构

目录 引言 1.归并排序的实现----c2.归并排序的复杂度分析时间复杂度空间复杂度 引言 归并排序(Merge Sort) 是一种基于分治法的排序算法,它的基本思想是将原始数组划分成较小的数组,然后递归地对这些小数组进行排序,最后将排好序…...

【网站项目】065健康综合咨询问诊平台

🙊作者简介:拥有多年开发工作经验,分享技术代码帮助学生学习,独立完成自己的项目或者毕业设计。 代码可以私聊博主获取。🌹赠送计算机毕业设计600个选题excel文件,帮助大学选题。赠送开题报告模板&#xff…...

Adobe Camera Raw forMac/win:掌控原始之美的秘密武器

Adobe Camera Raw,这款由Adobe开发的插件,已经成为摄影师和设计师们的必备工具。对于那些追求完美、渴望探索更多创意可能性的专业人士来说,它不仅仅是一个插件,更是一个能够释放无尽创造力的平台。 在数字摄影时代,R…...

OpenHarmony—开发及引用静态共享包(API 9)

HAR(Harmony Archive)是静态共享包,可以包含代码、C库、资源和配置文件。通过HAR可以实现多个模块或多个工程共享ArkUI组件、资源等相关代码。HAR不同于HAP,不能独立安装运行在设备上,只能作为应用模块的依赖项被引用。 接下来&a…...

测试面试题常见题

文章目录 功能测试一个完整的测试计划应该包含哪些内容一个完整的测试用例包含哪些内容?什么时候需要发测试报告?一份测试报告应该包含哪些内容?一个完整的缺陷报告应该包含哪些内容?简述等价类划分法并举例针对具体场景的测试用例…...

代码随想录算法训练营第六天 - 哈希表part02

454.四数之和II 核心思想:利用字典的key,value 4个数组两两分组,nums1nums2 的两两元素之和 及 计数 先存入字典中,然后对nums3和nums4的进行元素相加 然后对比字典中是否有对应的key,有就countvalue class Solution…...

【Javaweb程序设计】【C00165】基于SSM的高考志愿辅助填报系统(论文+PPT)

基于SSM的高考志愿辅助填报系统(论文PPT) 项目简介项目获取开发环境项目技术运行截图 项目简介 这是一个基于ssm的高考志愿辅助填报系统 本系统分为前台系统模块、后台管理员模块以及后台学生模块 前台系统模块:当游客打开系统的网址后&…...

海外云手机为什么吸引用户?

近年来,随着全球化的飞速发展,海外云手机逐渐成为各行各业关注的焦点。那么,究竟是什么让海外云手机如此吸引用户呢?本文将深入探讨海外云手机的三大吸引力,揭示海外云手机的优势所在。 1. 高效的社交媒体运营 海外云…...

将`List<String>`转换为`List<Long>`

将List<String>转换为List<Long> 大家好&#xff0c;我是免费搭建查券返利机器人赚佣金就用微赚淘客系统3.0的小编&#xff0c;也是冬天不穿秋裤&#xff0c;天冷也要风度的程序猿&#xff01;在Java中&#xff0c;将List<String>转换为List<Long>可以…...

【Unity3D小功能】Unity3D中Text使用超链接并绑定点击事件

推荐阅读 CSDN主页GitHub开源地址Unity3D插件分享简书地址我的个人博客 大家好&#xff0c;我是佛系工程师☆恬静的小魔龙☆&#xff0c;不定时更新Unity开发技巧&#xff0c;觉得有用记得一键三连哦。 一、前言 在开发中遇到了要给Text加超链接的需求&#xff0c;研究了实现…...

Java 语言特性(面试系列2)

一、SQL 基础 1. 复杂查询 &#xff08;1&#xff09;连接查询&#xff08;JOIN&#xff09; 内连接&#xff08;INNER JOIN&#xff09;&#xff1a;返回两表匹配的记录。 SELECT e.name, d.dept_name FROM employees e INNER JOIN departments d ON e.dept_id d.dept_id; 左…...

盘古信息PCB行业解决方案:以全域场景重构,激活智造新未来

一、破局&#xff1a;PCB行业的时代之问 在数字经济蓬勃发展的浪潮中&#xff0c;PCB&#xff08;印制电路板&#xff09;作为 “电子产品之母”&#xff0c;其重要性愈发凸显。随着 5G、人工智能等新兴技术的加速渗透&#xff0c;PCB行业面临着前所未有的挑战与机遇。产品迭代…...

逻辑回归:给不确定性划界的分类大师

想象你是一名医生。面对患者的检查报告&#xff08;肿瘤大小、血液指标&#xff09;&#xff0c;你需要做出一个**决定性判断**&#xff1a;恶性还是良性&#xff1f;这种“非黑即白”的抉择&#xff0c;正是**逻辑回归&#xff08;Logistic Regression&#xff09;** 的战场&a…...

剑指offer20_链表中环的入口节点

链表中环的入口节点 给定一个链表&#xff0c;若其中包含环&#xff0c;则输出环的入口节点。 若其中不包含环&#xff0c;则输出null。 数据范围 节点 val 值取值范围 [ 1 , 1000 ] [1,1000] [1,1000]。 节点 val 值各不相同。 链表长度 [ 0 , 500 ] [0,500] [0,500]。 …...

江苏艾立泰跨国资源接力:废料变黄金的绿色供应链革命

在华东塑料包装行业面临限塑令深度调整的背景下&#xff0c;江苏艾立泰以一场跨国资源接力的创新实践&#xff0c;重新定义了绿色供应链的边界。 跨国回收网络&#xff1a;废料变黄金的全球棋局 艾立泰在欧洲、东南亚建立再生塑料回收点&#xff0c;将海外废弃包装箱通过标准…...

【SQL学习笔记1】增删改查+多表连接全解析(内附SQL免费在线练习工具)

可以使用Sqliteviz这个网站免费编写sql语句&#xff0c;它能够让用户直接在浏览器内练习SQL的语法&#xff0c;不需要安装任何软件。 链接如下&#xff1a; sqliteviz 注意&#xff1a; 在转写SQL语法时&#xff0c;关键字之间有一个特定的顺序&#xff0c;这个顺序会影响到…...

高防服务器能够抵御哪些网络攻击呢?

高防服务器作为一种有着高度防御能力的服务器&#xff0c;可以帮助网站应对分布式拒绝服务攻击&#xff0c;有效识别和清理一些恶意的网络流量&#xff0c;为用户提供安全且稳定的网络环境&#xff0c;那么&#xff0c;高防服务器一般都可以抵御哪些网络攻击呢&#xff1f;下面…...

【分享】推荐一些办公小工具

1、PDF 在线转换 https://smallpdf.com/cn/pdf-tools 推荐理由&#xff1a;大部分的转换软件需要收费&#xff0c;要么功能不齐全&#xff0c;而开会员又用不了几次浪费钱&#xff0c;借用别人的又不安全。 这个网站它不需要登录或下载安装。而且提供的免费功能就能满足日常…...

A2A JS SDK 完整教程:快速入门指南

目录 什么是 A2A JS SDK?A2A JS 安装与设置A2A JS 核心概念创建你的第一个 A2A JS 代理A2A JS 服务端开发A2A JS 客户端使用A2A JS 高级特性A2A JS 最佳实践A2A JS 故障排除 什么是 A2A JS SDK? A2A JS SDK 是一个专为 JavaScript/TypeScript 开发者设计的强大库&#xff…...

什么是VR全景技术

VR全景技术&#xff0c;全称为虚拟现实全景技术&#xff0c;是通过计算机图像模拟生成三维空间中的虚拟世界&#xff0c;使用户能够在该虚拟世界中进行全方位、无死角的观察和交互的技术。VR全景技术模拟人在真实空间中的视觉体验&#xff0c;结合图文、3D、音视频等多媒体元素…...