当前位置: 首页 > news >正文

机器学习算法原理——逻辑斯谛回归

文章目录

      • 逻辑斯谛回归
      • 二项逻辑斯谛回归模型
      • 极大似然估计
      • 多项逻辑斯谛回归模型
      • 总结归纳

逻辑斯谛回归

写在前面:逻辑斯谛回归最初是数学家 Verhulst 用来研究人口增长是所发现的,是一个非常有趣的发现过程, b 站有更详细的背景及过程推导,在此不再赘述:https://www.bilibili.com/video/BV1No4y1o7ac/?p=59

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-k9DMmgs6-1677676936475)(逻辑斯谛回归.assets/image-20230301153119470.png)]

逻辑斯谛分布的标准形式:
F(x)=11+e−xF(x) = \frac{1}{1 + e^{-x}} F(x)=1+ex1

f(x)=e−x(1+e−x)2f(x) = \frac{e^{-x}}{(1 + e^{-x})^2} f(x)=(1+ex)2ex

  • 分布函数是一条 SSS 形曲线,该曲线也被称为 sigmoid 曲线,关于点 (0,12)(0,\frac{1}{2})(0,21) 中心对称。
  • 概率密度函数一条钟型曲线,中间高两端低,关于 x=0x = 0x=0 对称,在此处取得最大值 (人口增速最大时刻)。

逻辑斯谛回归的一般形式:

X\rm XX 是连续随机变量, X\rm XX 服从逻辑斯谛分布是指 X\rm XX 具有下列分布函数和概率密度:
F(x)=P(X⩽x)=11+e−(x−μ)/γF(x)=P(X\leqslant x)={\frac{1}{1+\mathrm{{e}}^{-(x-\mu)/\gamma}}}\\ F(x)=P(Xx)=1+e(xμ)/γ1

f(x)=F′(x)=e−(x−μ)/γγ(1+e−(x−μ)/γ)2f(x)=F^{\prime}(x)={\frac{\mathrm{e}^{-(x-\mu)/\gamma}}{\gamma(1+\mathrm{e}^{-(x-\mu)/\gamma})^{2}}} f(x)=F(x)=γ(1+e(xμ)/γ)2e(xμ)/γ

式中, μ\muμ 为位置参数, γ>0\gamma > 0γ>0 为形式参数。

  • 分布函数是一条 SSS 形曲线,该曲线也被称为 sigmoid 曲线,关于点 (μ,12)(\mu,\frac{1}{2})(μ,21) 中心对称。
  • 概率密度函数一条钟型曲线,中间高两端低,关于 x=μx = \mux=μ 对称,在此处取得最大值 14γ\frac{1}{4 \gamma}4γ1 (人口增速最大时刻)。

二项逻辑斯谛回归模型

P(Y=1∣x)=exp⁡(w⋅x+b)1+exp⁡(w⋅x+b)P(Y=1 \mid x)=\frac{\exp (w \cdot x+b)}{1+\exp (w \cdot x+b)} P(Y=1x)=1+exp(wx+b)exp(wx+b)

P(Y=0∣x)=11+exp⁡(w⋅x+b)P(Y=0 \mid x)=\frac{1}{1+\exp (w \cdot x+b)} P(Y=0x)=1+exp(wx+b)1

其中,x∈Rnx \in {\bf R^n}xRn 是输入,Y∈0,1Y \in {0,1}Y0,1 是输出,w∈Rnw \in {\bf R^n}wRnb∈Rnb \in {\bf R^n}bRn 是参数,www 称为权值向量,bbb 称为偏置,w⋅xw \cdot xwxxxxxxx 的内积。

为了方便,将权重向量和输入向量加以扩充,仍记为 wwwxxx ,则有:
ω=(ω(1),ω(2),⋯,ω(n),b)T,x=(x(1),x(2),⋯,x(n),1)T,\omega=\left(\omega^{(1)}, \omega^{(2)}, \cdots, \omega^{(n)}, b\right)^T, \quad \quad x=\left(x^{(1)}, x^{(2)}, \cdots, x^{(n)}, 1\right)^T, ω=(ω(1),ω(2),,ω(n),b)T,x=(x(1),x(2),,x(n),1)T,
逻辑分布函数重写为:
P(Y=1∣x)=ew⋅x1+ew⋅xP(Y=1 \mid x)=\frac{e^{w \cdot x}}{1 + e^{w \cdot x}} P(Y=1x)=1+ewxewx

P(Y=0∣x)=11+ew⋅xP(Y=0 \mid x)=\frac{1}{1 + e^{w \cdot x}} P(Y=0x)=1+ewx1

极大似然估计

二项分布:
P(Y)={1−p,Y=0p,Y=1=(1−p)1−YpYP(Y)=\left\{\begin{array}{ll} 1-p, & Y=0 \\ p, & Y=1 \end{array}=(1-p)^{1-Y} p^Y\right. P(Y)={1p,p,Y=0Y=1=(1p)1YpY
对于 (xi,yi)(x_i, y_i)(xi,yi) ,有:
P(Y=yi∣xi)=(1−pi)1−yipiyiP(Y = y_i | x_i) = (1 - p_i)^{1 - y_i} p_i^{y_i} P(Y=yixi)=(1pi)1yipiyi
其中:
pi=ew⋅xi1+ew⋅xi1−pi=11+ew⋅xi\begin{align} p_i = \frac{e^{w \cdot x_i}}{1 + e^{w \cdot x_i}}\\ 1 - p_i = \frac{1}{1 +e^{w \cdot x_i}} \end{align} pi=1+ewxiewxi1pi=1+ewxi1
对于数据集 T=(X1,y1),(x2,y2),⋯,(xN,yN)T = {(X_1, y_1), (x_2, y_2), \cdots, (x_N, y_N)}T=(X1,y1),(x2,y2),,(xN,yN) 出现的概率:
∏i=1N(1−pi)1−yipiyi\prod_{i = 1}^N (1 - p_i)^{1 - y_i} p_i^{y_i} i=1N(1pi)1yipiyi
该概率只与 www 有关,即可得关于 www 的似然函数:
L(w)=∏i=1N(1−pi)1−yipiyiL(w) = \prod_{i = 1}^N (1 - p_i)^{1 - y_i} p_i^{y_i} L(w)=i=1N(1pi)1yipiyi
对数似然函数:
log⁡∏i=1Npiyi(1−pi)1−yi=∑i=1N[yilog⁡pi+(1−yi)log⁡(1−pi)]=∑i=1N[yilog⁡pi1−pi+log⁡(1−pi)]\begin{align} \log \prod_{i = 1}^{N} p_i^{y_i} (1 - p_i)^{1 - y_i} &= \sum_{i = 1}^{N}[y_i \log p_i + (1 - y_i) \log(1-p_i)]\\ &= \sum_{i = 1}^{N}[y_i \log \frac{p_i}{1 - p_i} + \log(1 - p_i)] \end{align} logi=1Npiyi(1pi)1yi=i=1N[yilogpi+(1yi)log(1pi)]=i=1N[yilog1pipi+log(1pi)]
代入(12)(13)式:
L(w)=∑i=1N[yiw⋅xi−log⁡(1+ew⋅xi)]L(w) = \sum_{i = 1}^{N}[y_i \ w \cdot x_i - \log(1 + e^{w \cdot x_i})] L(w)=i=1N[yi wxilog(1+ewxi)]
这样,问题就变成了以对数似然函数为目标函数的最优化问题,可以应用极大似然估计法估计模型参数,从而得到逻辑斯谛回归模型。逻辑斯谛回归学习中通常采用的方法是梯度下降法拟牛顿法

多项逻辑斯谛回归模型

二项逻辑斯谛回归模型可将其推广到多项逻辑斯谛回归模型(multi-nominal logistic regression model),用于多类分类。假设离散型随机变量 YYY 的取值集合是 1,2,⋯,K{1,2,\cdots, K}1,2,,K ,那么多项逻辑斯谛回归模型是:
P(Y=k∣x)=exp⁡(wk⋅x)1+∑k=1K−1exp⁡(wk⋅x),k=1,2,⋯,K−1P(Y=K∣x)=11+∑k=1K−1exp⁡(wk⋅x)\begin{align} P(Y&=k \mid x)=\frac{\exp \left(w_k \cdot x\right)}{1+\sum_{k=1}^{K-1} \exp \left(w_k \cdot x\right)}, \quad k=1,2, \cdots, K-1 \\ P(Y&=K \mid x)=\frac{1}{1+\sum_{k=1}^{K-1} \exp \left(w_k \cdot x\right)} \end{align} P(YP(Y=kx)=1+k=1K1exp(wkx)exp(wkx),k=1,2,,K1=Kx)=1+k=1K1exp(wkx)1
这里,x∈Rn+1x \in {\bf R^{n+1}}xRn+1wk∈Rn+1w_k \in {\bf R^{n+1}}wkRn+1

总结归纳

  • 逻辑斯谛回归归根结底是将分类问题用回归模型来解决。
  • 正态分布是在给定均值和方差的情况下具有最大熵的分布,这样的假设可以使得数据携带的信息量最大。通常在没有任何假设的情况下,连续型数据常被假设为正态分布,离散型数据常被假设为等概率分布。
  • P(Y=1∣x)+P(Y=0∣x)=1P(Y=1 \mid x) + P(Y=0 \mid x) = 1P(Y=1x)+P(Y=0x)=1
  • 逻辑斯谛回归学习中通常采用的方法是梯度下降法拟牛顿法
  • 逻辑回归模型不局限于输入变量和输出变量之间是否存在线性关系,可以通过 sigmoid 函数代替非连续型函数,当 sigmoid 函数大于等于 0.5时即可判断类别。
  • 逻辑回归的输入变量可以是连续变量,也可以是离散变量
  • 参数估计:说的是已知某个随机样本满足某种概率分布,但是其中具体的参数不清楚,参数估计就是通过若干次试验,观察其结果,利用结果推出参数的大概值。
  • 极大似然估计:极大似然估计就是建立在参数估计的思想上,已知某个参数能使这个样本出现的概率最大,我们当然不会再去选择其他小概率的样本,所以干脆就把这个参数作为估计的真实值。
  • sigmoid 激活函数在深度学习中应用广泛,逻辑斯谛回归更是在分类问题中被大量使用。

相关文章:

机器学习算法原理——逻辑斯谛回归

文章目录逻辑斯谛回归二项逻辑斯谛回归模型极大似然估计多项逻辑斯谛回归模型总结归纳逻辑斯谛回归 写在前面:逻辑斯谛回归最初是数学家 Verhulst 用来研究人口增长是所发现的,是一个非常有趣的发现过程, b 站有更详细的背景及过程推导&…...

【华为OD机试 】最优资源分配/芯片资源占用(C++ Java JavaScript Python)

文章目录 题目描述输入描述输出描述备注用例题目解析C++JavaScriptJavaPython题目描述 某块业务芯片最小容量单位为1.25G,总容量为M*1.25G,对该芯片资源编号为1,2,…,M。该芯片支持3种不同的配置,分别为A、B、C。 配置A:占用容量为 1.25 * 1 = 1.25G配置B:占用容量为 …...

600 条最强 Linux 命令总结

1、基本命令 uname -m 显示机器的处理器架构 uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作系统信息 arch 显示机器…...

python自学之《21天学通Python》(15)——第18章 数据结构基础

数据结构是用来描述一种或多种数据元素之间的特定关系,算法是程序设计中对数据操作的描述,数据结构和算法组成了程序。对于简单的任务,只要使用编程语言提供的基本数据类型就足够了。而对于较复杂的任务,就需要使用比基本的数据类…...

从功能到自动化,熬夜3天整理出这一份2000字学习指南~

学习自动化这个想法,其实自己在心里已经琢磨了很久,就是一直没付诸实践,觉得现在手工测试已经能满足当前的工作需要,不想浪费时间去学习新的东西,有点时间还不如刷刷视频、看看小说等。 第一次有学习Selenium的冲动是…...

客户端攻击(溯源攻击,获取客户端信息)

目录 背景 为什么 示例 探索HTML应用程序 HTA攻击行为(Powershell代码) 背景 如果创建的文件扩展名为.hta而不是.html,Internet Explorer将自动将其解释为html应用程序,并提供使...

visual studio 2022 社区版 c# 环境搭建及安装使用【图文解析-小白版】

visual studio 2022 社区版 c# 环境搭建及安装使用【图文解析-小白版】visual studio 安装 C# 环境安装流程创建c#窗体应用程序visual studio 安装 C# 环境 首先,进入其官网下载对应的visual studio社区版本,官网链接: https://visualstudio.microsoft…...

21- 神经网络模型_超参数搜索 (TensorFlow系列) (深度学习)

知识要点 fetch_california_housing:加利福尼亚的房价数据,总计20640个样本,每个样本8个属性表示,以及房价作为target 超参数搜索的方式: 网格搜索, 随机搜索, 遗传算法搜索, 启发式搜索 超参数训练后用: gv.estimat…...

《NFL橄榄球》:芝加哥熊·橄榄1号位

芝加哥熊(英语:Chicago Bears)是一支职业美式橄榄球球队。位于伊利诺伊州的芝加哥。现时为全国橄榄球联盟的国家联盟北区的球队。他们曾经赢出九次美式橄榄球比赛的冠军,分别为八次旧制全国橄榄球联盟和一次超级碗冠军&#xff08…...

【ES】Elasticsearch核心基础概念:文档与索引

es的核心概念主要是:index(索引)、Document(文档)、Clusters(集群)、Node(节点)与实例,下面我们先来了解一下Document与Index。 RESTful APIs 在讲解Document与Index概念之前,我们先来了解一下RESTful APIs,因为下面讲解Documen…...

实时手势识别(C++与python都可实现)

一、前提配置: Windows,visual studio 2019,opencv,python10,opencv-python,numpy,tensorflow,mediapipe,math 1.安装python环境 这里我个人使用的安装python10&#…...

15个Spring扩展点,一般人知道的不超过5个!

Spring的核心思想就是容器,当容器refresh的时候,外部看上去风平浪静,其实内部则是一片惊涛骇浪,汪洋一片。Spring Boot更是封装了Spring,遵循约定大于配置,加上自动装配的机制。很多时候我们只要引用了一个…...

Elasticsearch:以 “Painless” 方式保护你的映射

Elasticsearch 是一个很棒的工具,可以从各种来源收集日志和指标。 它为我们提供了许多默认处理,以便提供最佳用户体验。 但是,在某些情况下,默认处理可能不是最佳的(尤其是在生产环境中); 因此&…...

js几种对象创建方式

适用于不确定对象内部数据方式一:var p new Object(); p.name TOM; p.age 12 p.setName function(name) {this.name name; }// 测试 p.setName(jack) console.log(p.name,p.age)方式二: 对象字面量模式套路:使用{}创建对象,同…...

阿里云服务器ECS适用于哪些应用场景?

云服务器ECS具有广泛的应用场景,既可以作为Web服务器或者应用服务器单独使用,又可以与其他阿里云服务集成提供丰富的解决方案。 云服务器ECS的典型应用场景包括但不限于本文描述,您可以在使用云服务器ECS的同时发现云计算带来的技术红利。 阿…...

Ajax学习笔记01

引入 翻译成中文就是“异步的Javascript和XML”。即使用Javascript语言与服务器进行异步交互,传输的数据为XML(当然,传输的数据不只是XML)。 AJAX 不是新的编程语言,而是一种使用现有标准的新方法。 AJAX 最大的优点…...

Jinja2----------过滤器的使用、控制语句

目录 1.过滤器的使用 1.过滤器和测试器 2.过滤器 templates/filter.html app.py 效果 3.自定义过滤器 app.py templates/filter.html 效果 2.控制语句 1.if app.py templates/control.html 2.for app.py templates/control.htm 1.过滤器的使用 1.过滤器和测…...

面试了1个自动化测试,开口40W年薪,只能说痴人做梦...

公司前段缺人,也面了不少测试,结果竟然没有一个合适的。一开始瞄准的就是中级的水准,也没指望来大牛,提供的薪资在10-20k,面试的人很多,但平均水平很让人失望。看简历很多都是3年工作经验,但面试…...

冲鸭!33% 程序员月薪达到 5 万元以上~

2023年,随着互联网产业的蓬勃发展,程序员作为一个自带“高薪多金”标签的热门群体,被越来越多的人所关注。在过去充满未知的一年中,他们的职场现状发生了一定的改变。那么,程序员岗位的整体薪资水平、婚恋现状、职业方…...

【RSA】HTTPS中SSL/TLS握手时RSA前后端加密流程

SSL/TLS层的位置 SSL/TLS层在网络模型的位置,它属于应用层协议。接管应用层的数据加解密,并通过网络层发送给对方。 SSL/TLS协议分握手协议和记录协议,握手协议用来协商会话参数(比如会话密钥、应用层协议等等)&…...

web vue 项目 Docker化部署

Web 项目 Docker 化部署详细教程 目录 Web 项目 Docker 化部署概述Dockerfile 详解 构建阶段生产阶段 构建和运行 Docker 镜像 1. Web 项目 Docker 化部署概述 Docker 化部署的主要步骤分为以下几个阶段: 构建阶段(Build Stage)&#xff1a…...

椭圆曲线密码学(ECC)

一、ECC算法概述 椭圆曲线密码学(Elliptic Curve Cryptography)是基于椭圆曲线数学理论的公钥密码系统,由Neal Koblitz和Victor Miller在1985年独立提出。相比RSA,ECC在相同安全强度下密钥更短(256位ECC ≈ 3072位RSA…...

盘古信息PCB行业解决方案:以全域场景重构,激活智造新未来

一、破局:PCB行业的时代之问 在数字经济蓬勃发展的浪潮中,PCB(印制电路板)作为 “电子产品之母”,其重要性愈发凸显。随着 5G、人工智能等新兴技术的加速渗透,PCB行业面临着前所未有的挑战与机遇。产品迭代…...

中南大学无人机智能体的全面评估!BEDI:用于评估无人机上具身智能体的综合性基准测试

作者:Mingning Guo, Mengwei Wu, Jiarun He, Shaoxian Li, Haifeng Li, Chao Tao单位:中南大学地球科学与信息物理学院论文标题:BEDI: A Comprehensive Benchmark for Evaluating Embodied Agents on UAVs论文链接:https://arxiv.…...

关于iview组件中使用 table , 绑定序号分页后序号从1开始的解决方案

问题描述:iview使用table 中type: "index",分页之后 ,索引还是从1开始,试过绑定后台返回数据的id, 这种方法可行,就是后台返回数据的每个页面id都不完全是按照从1开始的升序,因此百度了下,找到了…...

蓝桥杯 2024 15届国赛 A组 儿童节快乐

P10576 [蓝桥杯 2024 国 A] 儿童节快乐 题目描述 五彩斑斓的气球在蓝天下悠然飘荡,轻快的音乐在耳边持续回荡,小朋友们手牵着手一同畅快欢笑。在这样一片安乐祥和的氛围下,六一来了。 今天是六一儿童节,小蓝老师为了让大家在节…...

什么是库存周转?如何用进销存系统提高库存周转率?

你可能听说过这样一句话: “利润不是赚出来的,是管出来的。” 尤其是在制造业、批发零售、电商这类“货堆成山”的行业,很多企业看着销售不错,账上却没钱、利润也不见了,一翻库存才发现: 一堆卖不动的旧货…...

srs linux

下载编译运行 git clone https:///ossrs/srs.git ./configure --h265on make 编译完成后即可启动SRS # 启动 ./objs/srs -c conf/srs.conf # 查看日志 tail -n 30 -f ./objs/srs.log 开放端口 默认RTMP接收推流端口是1935,SRS管理页面端口是8080,可…...

VTK如何让部分单位不可见

最近遇到一个需求&#xff0c;需要让一个vtkDataSet中的部分单元不可见&#xff0c;查阅了一些资料大概有以下几种方式 1.通过颜色映射表来进行&#xff0c;是最正规的做法 vtkNew<vtkLookupTable> lut; //值为0不显示&#xff0c;主要是最后一个参数&#xff0c;透明度…...

相机Camera日志分析之三十一:高通Camx HAL十种流程基础分析关键字汇总(后续持续更新中)

【关注我,后续持续新增专题博文,谢谢!!!】 上一篇我们讲了:有对最普通的场景进行各个日志注释讲解,但相机场景太多,日志差异也巨大。后面将展示各种场景下的日志。 通过notepad++打开场景下的日志,通过下列分类关键字搜索,即可清晰的分析不同场景的相机运行流程差异…...