当前位置: 首页 > article >正文

深度学习--softmax回归

回归可以用于预测多少问题预测房屋出售价格棒球可能获胜常数或者患者住院天数

事实我们也对分类问题感兴趣不是 多少而是哪一个

1 某个电子邮件是否属于垃圾邮件

2 某个用户可能注册还是不注册订阅服务

3 某张图像描绘还是

4 某人接下来最有可能哪部电影

通常机器学习实践者用分类问题描述两个有微妙差别问题如果我们支队样本硬性类别感兴趣就属于某个类别如果我们希望得到类别就属于某个类别概率 这两者界限往往很模糊其中一个原因即使我们只关心类别我们仍然使用类别模型

3.4.1 分类问题

从一个图像分类问题开始每次输入一个2像素x2灰度图像每张图像对应4特征x1,x2,x3,x4.此外假设每张图像属于类别一个

接下来我们选择如何表示标签, 我们有两个明显选择最直接选择y 属于{1,2,3}其中整数分别对应 这是计算机上存储此类信息有效方法如果类别有一定自然顺序假如我们试图预测{婴儿,儿童,青少年,中年人,老年人}那么这个问题可以转变为回归问题并且保留这种格式是有意义

但是一般分类问题并不与类别之间自然顺序有关幸运统计学家很早以前一种表示分类简单方法独热编码独热编码是一个向量它的分量类别一样多类别对应分量设置为1其他所有分量设置0我们例子中标签y将是一个三维向量其中(1,0,0)对应(0,1,0)对应,(0,0,1)对应

3.4.2 网络架构

为了估计所有可能类别条件概率我们需要一个由多个输出模型每个类别对应一个输出为了解决现行模型分类问题我们需要输出一个放射函数每个输出对应自己的放射函数我们例子中由于我们4特征3可能输出类别我们将需要12标量来表示权重(带下标的w)3标量表示偏置(带下标的b)下面我们每个输入计算3规范预测logit

:O1,..On

O1 = x1w11 + x2W12 + x3w13 +b1

O1 = x1w21 + x2W22 + x3w23 +b2

O1 = x1w31 + x2W32 + x3w33 +b3

我们可以用神经网络图像描述这个计算过程如图3-4所示线性回归一样softmax回归也是一个单层神经网络由于计算每个输出o1,o2o1取决于所有输入x1,x2,.x3x4 因此softmax回归输出也是全连接

为了更简洁表达模型使用线性代数符号通过向量形式表示O = WX + b这是一适合数学编写代码形式由此我们已经所有权重放到一个3x4矩阵对于给定数据样本的特征x我们输出权重输入特征进行局长-向量 乘法加上偏置b得到

3.4.3 全链路层的参数开销

正如我们将在后续章节中看到的在深度学习中全连接无处不在然而顾名思义全连接层完全连接可能有很多学习参数具体来说对于任何具有d输入q输出全连接参数开销O(dq)这个数字实践中可能令人望而却步幸运d输入转换为q输出成本可以减少O(dq/n)其中超参数n可以我们灵活指定实际应用中在参数节省模型有效性之间进行权衡

3.4.4 softmax运算

现在我们优化参数最大观测数据概率为了得到预测结果我们设置一个阈值选择具有最大概率标签

我们希望模型输出Yi可以视为属于j概率然后选择具有最大输出类别argmaxxi,yi作为我们预测例如如果yi,y2,y3分别0.1,0.80.1 那么我们预测类别2我们例子中代表

然而我们能否规范预测O直接视作我们感兴趣输出答案是否定因为现行输出直接视为概率存在一些问题一方面我们没有限制这些输出数值1线性输出直接视为概率存在一些问题一方面我们没有限制这些输出数值总和1另一方面根据输入不同输出可以负值这些违反2.6所述概率论基本公里

要将输出视为概率我们必须保证任何数据上输出都是非负总和1此外我们需要一个训练目标函数激励模型精准估计概率例如分类器输出0.5所有样本中我们希望这些样本中刚好有一半实际属于预测这个属性叫作校准

在社会科学家1959奶奶选择模型理论基础上发明softmax函数正是这样做的softmax函数能够将规范预测变换为负数并且总和1,同时模型保持可导性质为了实现这一目标我们首先对每个未规范化概率这样可以确保输出非负值为了确保最终输出概率纵隔1,我们每个求幂结果除以结果总和

Y^ = softmax(a),其中Yi^ = exp(Oj)/sigma exp(Oi)

这里对于所有J总有0 <= Yj^ <=1因此,y^可以视为一个正确概率分布softmax运算不会改变规范化的预测O之间大小次序只会确定分配每个类别概率因此预测过程中我们仍然可以用下选择最优可能类别

argmax Y^j = argmax Oj

尽管softmax是一个非线性函数softmax回归输出仍然输入特征放射变换决定因此softmax回归是一个线性模型

相关文章:

深度学习--softmax回归

回归可以用于预测多少的问题&#xff0c;预测房屋出售价格&#xff0c;棒球队可能获胜的的常数或者患者住院的天数。 事实上&#xff0c;我们也对分类问题感兴趣&#xff0c;不是问 多少&#xff0c;而是问哪一个 1 某个电子邮件是否属于垃圾邮件 2 某个用户可能注册还是不注册…...

【计算机网络】记录一次校园网无法上网的解决方法

问题现象 环境&#xff1a;实训室教室内时间&#xff1a;近期突然出现 &#xff08;推测是学校在施工&#xff0c;部分设备可能出现问题&#xff09;症状&#xff1a; 连接校园网 SWXY-WIFI 后&#xff1a; 连接速度极慢偶发无 IP 分配&#xff08;DHCP 失败&#xff09;即使分…...

Java关于抽象类和抽象方法

引入抽象&#xff1a; 在之前把不同类中的共有成员变量和成员方法提取到父类中叫做继承。然后对于成员方法在不同子类中有不同的内容&#xff0c;对这些方法重新书写叫做重写&#xff1b;不过如果有的子类没有用继承的方法&#xff0c;用别的名字对这个方法命名的话&#xff0…...

第二十一章:Python-Plotly库实现数据动态可视化

Plotly是一个强大的Python可视化库&#xff0c;支持创建高质量的静态、动态和交互式图表。它特别擅长于绘制三维图形&#xff0c;能够直观地展示复杂的数据关系。本文将介绍如何使用Plotly库实现函数的二维和三维可视化&#xff0c;并提供一些优美的三维函数示例。资源绑定附上…...

LeetCode 热题 100_打家劫舍(83_198_中等_C++)(动态规划)

LeetCode 热题 100_打家劫舍&#xff08;83_198&#xff09; 题目描述&#xff1a;输入输出样例&#xff1a;题解&#xff1a;解题思路&#xff1a;思路一&#xff08;动态规划&#xff08;一维dp数组&#xff09;&#xff09;&#xff1a;思路二&#xff08;动态规划&#xff…...

C语言复习--assert断言

assert.h 头⽂件定义了宏 assert() &#xff0c;⽤于在运⾏时确保程序符合指定条件&#xff0c;如果不符合&#xff0c;就报错终止运行。这个宏常常被称为“断⾔”。 assert(p ! NULL); 代码在程序运⾏到这⼀⾏语句时&#xff0c;验证变量 p 是否等于 NULL 。如果确实不等于 NU…...

嵌入式软件设计规范框架(MISRA-C 2012增强版)

以下是一份基于MISRA-C的嵌入式软件设计规范&#xff08;完整技术文档框架&#xff09;&#xff0c;包含编码规范、安全设计原则和工程实践要求&#xff1a; 嵌入式软件设计规范&#xff08;MISRA-C 2012增强版&#xff09; 一、编码基础规范 1.1 文件组织 头文件保护 /* 示…...

系统思考反馈

最近交付的都是一些持续性的项目&#xff0c;越来越感觉到&#xff0c;系统思考和第五项修炼不只是简单的一门课程&#xff0c;它们能真正融入到我们的日常工作和业务中&#xff0c;帮助我们用更清晰的思维方式解决复杂问题&#xff0c;推动团队协作&#xff0c;激发创新。 特…...

【C++】vector常用方法总结

&#x1f4dd;前言&#xff1a; 在C中string常用方法总结中我们讲述了string的常见用法&#xff0c;vector中许多接口与string类似&#xff0c;作者水平有限&#xff0c;所以这篇文章我们主要通过读vector官方文档的方式来学习vector中一些较为常见的重要用法。 &#x1f3ac;个…...

Burpsuite 伪造 IP

可以用于绕过 IP 封禁检测&#xff0c;用来暴力、绕过配额限制。 也可以用来做 ff98sha 出的校赛题&#xff0c;要求用 129 个 /8 网段的 IP 地址访问同一个 domain 插件 - IPRotate 原理&#xff1a;利用云服务商的反向代理服务。把反向代理的域名指向到目标 ip 即可。 http…...

12.小节

1.认识 QLabel 类,能够在界面上显示字符串. 通过 setText 来设置的.参数 QString (Qt 中把 C 里的很多容器类, 进行了重新封装.历史原因&#xff09; c叫法容器类&#xff0c;java叫法集合类 2.内存泄露&#xff0c;文件资源泄露 3.对象树。Qt 中通过对象树,来统一的释放界面的…...

大模型专题10 —LangGraph高级教程:构建支持网页搜索+人工干预的可追溯对话系统

在本教程中,我们将使用 LangGraph 构建一个支持聊天机器人,该机器人能够: ✅ 通过搜索网络回答常见问题 ✅ 在多次调用之间保持对话状态 ✅ 将复杂查询路由给人工进行审核 ✅ 使用自定义状态来控制其行为 ✅ 进行回溯并探索替代的对话路径 我们将从一个基础的聊天机器人开…...

2025年数智化电商产业带发展研究报告260+份汇总解读|附PDF下载

原文链接&#xff1a;https://tecdat.cn/?p41286 在数字技术与实体经济深度融合的当下&#xff0c;数智化产业带正成为经济发展的关键引擎。 从云南鲜花产业带的直播热销到深圳3C数码的智能转型&#xff0c;数智化正重塑产业格局。2023年数字经济规模突破53.9万亿元&#xff…...

Linux中常用服务器监测命令(性能测试监控服务器实用指令)

1.查看进程 ps -ef|grep 进程名以下指令需要先安装:sysstat,安装指令: yum install sysstat2.查看CPU使用情况(间隔1s打印一个,打印6次) sar -u 1 63.#查看内存使用(间隔1s打印一个,打印6次) sar -r 1 6...

SQL:CASE WHEN使用详解

文章目录 1. 数据转换与映射2. 动态条件筛选3. 多条件分组统计4. 数据排名与分级5. 处理空值与默认值6. 动态排序 CASE WHEN 语句在 SQL 中是一个非常强大且灵活的工具&#xff0c;除了常规的条件判断外&#xff0c;还有很多巧妙的用法&#xff0c;以下为你详细总结&#xff1a…...

linux内核`fixmap`和`memblock`有什么不同?

Linux内核中的fixmap和memblock是两个不同层次的内存管理机制&#xff0c;分别用于不同的场景和阶段。以下是它们的核心区别和联系&#xff1a; 功能与作用 memblock 物理内存管理&#xff1a; memblock是内核启动早期的物理内存分配器&#xff0c;在伙伴系统&#xff08;Budd…...

基于 GEE 的区域降水数据可视化:从数据处理到等值线绘制

目录 1 引言 2 代码功能概述 3 代码详细解析 3.1 几何对象处理与地图显示 3.2 加载 CHIRPS 降水数据 3.3 筛选不同时间段的降水数据 3.4 绘制降水时间序列图 3.5 计算并可视化短期和长期降水总量 3.6 绘制降水等值线图 4 总结 5 完整代码 6 运行结果 1 引言 在气象…...

曲线拟合 | Matlab基于贝叶斯多项式的曲线拟合

效果一览 代码功能 代码功能简述 目标&#xff1a;实现贝叶斯多项式曲线拟合&#xff0c;动态展示随着数据点逐步增加&#xff0c;模型后验分布的更新过程。 核心步骤&#xff1a; 数据生成&#xff1a;在区间[0,1]生成带噪声的正弦曲线作为训练数据。 参数设置&#xff1a…...

Qt6调试项目找不到Bluetooth Component蓝牙组件

错误如图所示 Failed to find required Qt component "Bluetooth" 解决方法&#xff1a;搜索打开Qt maintenance tool 工具 打开后&#xff0c;找到这个Qt Connectivity&#xff0c;勾选上就能解决该错误...

JAVA- 锁机制介绍 进程锁

进程锁 基于文件的锁基于Socket的锁数据库锁分布式锁基于Redis的分布式锁基于ZooKeeper的分布式锁 实际工作中都是集群部署&#xff0c;通过负载均衡多台服务器工作&#xff0c;所以存在多个进程并发执行情况&#xff0c;而在每台服务器中又存在多个线程并发的情况&#xff0c;…...

Java Spring Boot 与前端结合打造图书管理系统:技术剖析与实现

目录 运行展示引言系统整体架构后端技术实现后端代码文件前端代码文件1. 项目启动与配置2. 实体类设计3. 控制器设计4. 异常处理 前端技术实现1. 页面布局与样式2. 交互逻辑 系统功能亮点1. 分页功能2. 搜索与筛选功能3. 图书操作功能 总结 运行展示 引言 本文将详细剖析一个基…...

深入剖析JavaScript多态:从原理到高性能实践

摘要 JavaScript多态作为面向对象编程的核心特性&#xff0c;在动态类型系统的支持下展现了独特的实现范式。本文深入解析多态的三大实现路径&#xff1a;参数多态、子类型多态与鸭子类型&#xff0c;详细揭示它们在动态类型系统中的理论基础与实践意义。结合V8引擎的优化机制…...

GalTransl开源程序支持GPT-4/Claude/Deepseek/Sakura等大语言模型的Galgame自动化翻译解决方案

一、软件介绍 文末提供程序和源码下载 GalTransl是一套将数个基础功能上的微小创新与对GPT提示工程&#xff08;Prompt Engineering&#xff09;的深度利用相结合的Galgame自动化翻译工具&#xff0c;用于制作内嵌式翻译补丁。支持GPT-4/Claude/Deepseek/Sakura等大语言模型的…...

TGES 2024 | 基于空间先验融合的任意尺度高光谱图像超分辨率

Arbitrary-Scale Hyperspectral Image Super-Resolution From a Fusion Perspective With Spatial Priors TGES 2024 10.1109/TGRS.2024.3481041 摘要&#xff1a;高分辨率高光谱图像&#xff08;HR-HSI&#xff09;在遥感应用中起着至关重要的作用。单HSI超分辨率&#xff…...

算法基础_基础算法【高精度 + 前缀和 + 差分 + 双指针】

算法基础_基础算法【高精度 前缀和 差分 双指针】 ---------------高精度---------------791.高精度加法题目介绍方法一&#xff1a;代码片段解释片段一&#xff1a; 解题思路分析 792. 高精度减法题目介绍方法一&#xff1a;代码片段解释片段一&#xff1a; 解题思路分析 7…...

多线程猜数问题

题目&#xff1a;线程 A 生成随机数&#xff0c;另外两个线程来猜数&#xff0c;线程 A 可以告诉猜的结果是大还是小&#xff0c;两个线程都猜对后&#xff0c;游戏结束&#xff0c;编写代码完成。 一、Semaphore 多个线程可以同时操作同一信号量&#xff0c;由此实现线程同步…...

Ubuntu环境安装

1. 安装gcc、g和make sudo apt update sudo apt install build-essential 2. 安装cmake ubuntu安装cmake的三种方法&#xff08;超方便&#xff01;&#xff09;-CSDN博客 3. 安装ssh sudo apt-get install libssl-dev...

【家政平台开发(6)】筑牢家政平台安全防线:全方位隐私与安全需求解析

本【家政平台开发】专栏聚焦家政平台从 0 到 1 的全流程打造。从前期需求分析&#xff0c;剖析家政行业现状、挖掘用户需求与梳理功能要点&#xff0c;到系统设计阶段的架构选型、数据库构建&#xff0c;再到开发阶段各模块逐一实现。涵盖移动与 PC 端设计、接口开发及性能优化…...

Python数据类型-list

列表(List)是Python中最常用的数据类型之一&#xff0c;它是一个有序、可变的元素集合。 1. 列表基础 创建列表 empty_list [] # 空列表 numbers [1, 2, 3, 4, 5] # 数字列表 fruits [apple, banana, orange] # 字符串列表 mixed [1, hello, 3.14, True] # 混合类型…...

SpringBoot工程如何考虑优化使其视频请求更流畅

为了优化Spring Boot以提升前端视频读取的流畅性&#xff0c;可以从以下几个关键方向入手&#xff1a; 1. 分块传输与HTTP范围请求&#xff08;Range Requests&#xff09; 视频播放通常需要支持随机跳转进度&#xff0c;需确保后端正确处理HTTP Range头&#xff0c;实现按需传…...