当前位置: 首页 > news >正文

机器学习算法详解3:逻辑回归

机器学习算法详解3:逻辑回归

前言

​ 本系列主要对机器学习上算法的原理进行解读,给大家分享一下我的观点和总结。

本篇前言

​ 本篇对逻辑回归的算法原理进行解读。

目录结构

文章目录

    • 机器学习算法详解3:逻辑回归
      • 1. 引子
      • 2. sigmoid函数
      • 3. 原理推导
      • 4. 交叉熵损失函数推导
        • 4.1 信息熵
        • 4.2 KL散度
        • 4.3 交叉熵推导
        • 4.4 交叉熵损失函数推导
      • 5. 为什么选用sigmoid函数?
      • 6. 总结

1. 引子

​ 在上一篇提及一个概念广义线性回归,而逻辑回归也是与之相关。

​ 假设我们有一个曲线,如下:

在这里插入图片描述

​ 假设它的表达式为y=wx,其中y的值是符合lnx的分布的。那么,可以进行线性映射lny = wx ,变为y=e^(wx)即真正的表达式y=e^(wx)可以变为最初的广义线性形式y=wx(只是此处的y符合lnx分布而已)

​ 换而言之,我们可以将e^(wx)看作是一个普通的ax,那么逻辑回归就是将这个普通的ax作为某个函数的输入,让函数的输出在[0,1]之间,相当于输出的是概率值,就成了。

2. sigmoid函数

​ 上面提及某函数,那么选择什么样的函数呢?

​ 首先,函数必须满足的要求是:输出值在[0,1]之间。满足这个要求的函数非常多,比如符号函数:

在这里插入图片描述

​ 但是,这个函数有一个重要缺点:不是连续可导的(在x=0这个点)。这样会导致我们在优化损失函数的时候,无法直接求导,需要分情况进行求导。其次,这个函数有个小缺点:太僵硬了,只能取1、0这两个值

​ 针对上述情况,我们提出这个函数要满足的新要求:连续可导,最好是光滑曲线

​ 那么,前人们找到一个函数,名为 sigmoid函数,公式如下:

在这里插入图片描述

​ 函数图像如下:

在这里插入图片描述

​ 并且,值得注意的一点是,sigmoid函数的导数非常特殊,其倒数公式如下:
在这里插入图片描述

3. 原理推导

​ 基本的导数求法,非常的简单。

在这里插入图片描述

4. 交叉熵损失函数推导

4.1 信息熵

​ 要对交叉熵进行推导,首先需要明白什么是信息熵。(本来应该在决策树那里讲的)

​ 熵,大家应该都明白,就是描述一个系统的混乱程度。那么信息熵,就相当于描述一个信息的有用程度。

​ 公式如下:

在这里插入图片描述

4.2 KL散度

​ 有时候也称之为KL距离,但是其实并不是真正的距离,因为不符合距离的对称性质。

其衡量两个分布P、Q的相似程度,公式如下:

在这里插入图片描述

​ 举个计算的例子:

在这里插入图片描述

4.3 交叉熵推导

在这里插入图片描述

4.4 交叉熵损失函数推导

​ 该损失函数的推导可以从三个角度入手,分别是sigmoid入手、极大似然估计入手和KL散度入手。这里我接受最后一种推导。

​ 逻辑回归损失函数即衡量真实分布和预测分布的相似性——即KL散度,那么推导过程和上面相似,只是把P and Q换为了y and y^,通过上面可以知道最后的KL散度与交叉熵的值正相关,因此我们可以通过交叉熵构建出损失函数来代替KL散度以衡量真实分布和预测分布的相似程度,即公式:(下面分为两个部分是因为一个为正样本、一个为负样本而已)

在这里插入图片描述

5. 为什么选用sigmoid函数?

​ 这个问题也可以这么问:sigmoid函数怎么推出来的?这个是我偶然看视频发现的,我个人觉得有一定的道理,所以在这里分享一下:

​ 对于真实大数据场景,数据的每个特征基本都符合正太分布,并且一般标准差相同而均值不同(感觉上是对的,但是没有证明),那么如下图推导过程:

在这里插入图片描述

6. 总结

​ 本篇讲解了逻辑回归的原理,逻辑回归主要应用于二分类任务,也是分类任务中常用的一个算法。

​ 下一篇,讲解支持向量机算法。

相关文章:

机器学习算法详解3:逻辑回归

机器学习算法详解3:逻辑回归 前言 ​ 本系列主要对机器学习上算法的原理进行解读,给大家分享一下我的观点和总结。 本篇前言 ​ 本篇对逻辑回归的算法原理进行解读。 目录结构 文章目录 机器学习算法详解3:逻辑回归1. 引子2. sigmoid函数3. 原…...

linux命令集合

cd:切换文件路径 pwd:显示当前所处的路径 mkdir:创建目录比如mkdir test touch:创建一个空文件touch test.txt in:用于指定文件夹在另一个位置建立同步的链接in -s /lib/test1 /user/lj 在user目录下建立指向/lib/test1 目录的lj文件 cat:cat file(查看文件内…...

实现卓越供应链:RFID技术的革命性应用

在现代制造业中,供应链和物流的高效运作至关重要,它不仅影响着生产效率,还直接关系到企业的竞争力和客户满意度。为了应对这些挑战,越来越多的企业开始关注智能制造RFID智能设备,将其应用于供应链和物流管理&#xff0…...

从JVM角度看继承

从JVM角度看继承 最近重读了周志明老师的《深入理解JAVA虚拟机》一书,看完大有收获,但仍对继承情况下对象内存布局有所疑惑,所以查阅资料,结合本书进行分析 参考文档: 【深入理解JVM】:Java类继承关系中…...

基于Python和mysql开发的看图猜成语微信小程序(源码+数据库+程序配置说明书+程序使用说明书)

一、项目简介 本项目是一套基于Python和mysql开发的看图猜成语微信小程序,主要针对计算机相关专业的正在做毕设的学生与需要项目实战练习的Python学习者。 包含:项目源码、项目文档、数据库脚本等,该项目附带全部源码可作为毕设使用。 项目都…...

Unity入门教程||创建项目(上)

一、介绍 目的:通过尝试制作一款使用玩家角色把小球弹飞的简单小游戏,熟悉使用Unity进行游戏开发的基本流程。 软件环境:Unity 2017.3.0f3,Visual Studio 2013 二、创建新项目 1,启动Unity后将出现一个并列显示Pro…...

Openbmc编译

1.网址的问题解决 原文 Modifying /conf/local.conf was the only solution that worked for me. Simply add one of the two options:#check connectivity using google CONNECTIVITY_CHECK_URIS "https://www.google.com/"#skip connectivity checks CONNECTIVI…...

美国CN2服务器速度怎么样

美国服务器以免备案、大带宽、性价比高的优势,多用于企业、电商、外贸、视频等个中大型网站建设。但是,因中美服 务器接口原因,导致某些服务器的网络并不稳定,这时候就会对美国服务器产品失望,解决这种问题的方法就是选…...

K8S原理架构与实战教程

文章目录 一、背景1.1 物理机时代、虚拟机时代、容器化时代1.2 容器编排的需要 二、K8S架构2.2 Worker节点 三、核心概念3.1 Pod3.2 Deployment3.3 Service3.4 Volume3.5 Namespace 四、K8S安装五、kubectl常用命令六、K8S实战6.1 水平扩容6.2 自动装箱6.2.1 节点污点6.2.2 Pod…...

基于C#的图书管理系统数据库设计报告

第一章 问题描述 1.1 图书管理系统简介 本系统利用.NET处理数据库的功能,实现对图书馆信息的管理。主要功能为管理有关读者、出版社、书籍、借阅和管理者的信息等。 本系统的结构分为读者信息管理模块、出版社信息管理模块、书籍信息管理模块、借阅信息管理模块、…...

【Express.js】pm2进程管理

pm2进程管理 本节我们将介绍如何使用 pm2 运行和监管我们的 express 项目 准备工作 一个 express 项目全局安装 pm2 npm install -g pm2pm2使用介绍 启动应用 你可以用纯命令去运行一个node项目,假设原本运行项目使用 node src/index.js可以跑起来一个项目&am…...

Nginx部署前后端分离项目(Linux)

Nginx代理前端页面、后端接口 一、前端打包二、后端打包三、Linux部署Nginx启动、暂停、重启服务器部署文件地址: 一、前端打包 npm run build二、后端打包 通过Maven 使用package打包 三、Linux部署 安装Nginx 安装环境 yum -y install gcc pcre pcre-devel z…...

Docker网络

1 简介 网络原理 下载iproute工具&#xff08;linux&#xff09;ip addr查看地址映射 容器内ip地址会进行映射符号。docker分配的地址。 77: eth0if78: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc noqueue state UP group default link/ether 02:42:ac:11:00:…...

第15章_瑞萨MCU零基础入门系列教程之Common I2C总线模块

本教程基于韦东山百问网出的 DShanMCU-RA6M5开发板 进行编写&#xff0c;需要的同学可以在这里获取&#xff1a; https://item.taobao.com/item.htm?id728461040949 配套资料获取&#xff1a;https://renesas-docs.100ask.net 瑞萨MCU零基础入门系列教程汇总&#xff1a; ht…...

《TCP/IP网络编程》阅读笔记--多播与广播

目录 1--多播 2--多播代码实例 3--广播 4--广播代码实例 1--多播 多播方式的数据传输是基于 UDP 完成的&#xff0c;多播数据包的格式与 UDP 数据包相同&#xff1b; 多播与 UDP 的区别&#xff1a;UDP 数据传输以单一目标进行&#xff0c;多播数据同时传递到加入&#xff…...

聚观早报|华为Mate 60 Pro支持面容支付;特斯拉重回底特律车展

【聚观365】9月8日消息 华为Mate 60 Pro已支持面容支付 特斯拉将重回底特律车展 iPhone在美国有1.67亿用户 韩国半导体8月份出口85.6亿美元 比亚迪元PLUS冠军版将于9月15日上市 华为Mate 60 Pro已支持面容支付 毫无预热的华为Mate 60 Pro突然在华为商城首批开售&#xf…...

本地缓存Caffeine的缓存过期淘汰策略

本地缓存是一种将数据存储在应用程序的内存中&#xff0c;以加速数据访问的技术。缓存的数据可以是频繁访问的数据&#xff0c;以减少对慢速数据源&#xff08;如数据库或网络&#xff09;的访问。缓存通常有一些缓存过期淘汰策略&#xff0c;以确保缓存中的数据保持最新和有效…...

激光焊接汽车尼龙塑料配件透光率测试仪

激光塑性成型技术是近年来塑性加工界出现的一种新技术。通常塑料主要是通过加热加压依赖模具成型。这对于单品种、大批量生产是有效的&#xff1b;而对于各种不同形状的塑料制件则需要昂贵的模具‚装置也较庞大。 高度聚焦的激光束垂直照射在待变形的板料上‚由于塑料直接吸收激…...

2023年高校大数据实验室建设方案

大数据实验室建设方案具体内容包括&#xff1a;人才培养方案建设、课程资源建设、师资建设、实验室建设、教学服务建设。 泰迪打造国内领先的大数据人工智能及课程资源&#xff0c;包括&#xff1a;商务数据分析实训管理平台、云计算资源管理平台、大数据编程实训平台、商务数据…...

计网第五章(运输层)(一)

在前面的博客中&#xff0c;总是说主机之间进行通信。但实际上通信的真正的实体是位于通信两端主机中的进程。 一、运输层基本概述 运输层的任务就是为运行在不同主机上的应用进程提供直接的通信服务&#xff0c;运输层的协议又称为端到端协议。运输层中使用不同的端口来对应…...

告别混乱!用Cadence Allegro SPB17.4从DXF文件创建PCB封装的完整清洁流程

告别混乱&#xff01;用Cadence Allegro SPB17.4从DXF文件创建PCB封装的完整清洁流程 在PCB设计领域&#xff0c;从机械图纸&#xff08;DXF&#xff09;快速创建精确的封装是工程师常面临的挑战。许多设计师都经历过这样的困扰&#xff1a;导入DXF后&#xff0c;封装在3D预览中…...

别再死记硬背了!用Wireshark抓包实战,5分钟搞懂IP报文每个字段

用Wireshark解密IP协议&#xff1a;从抓包实战到网络诊断的完全指南 当你第一次打开网络教材看到IP报文那密密麻麻的字段时&#xff0c;是否感觉像在解读外星密码&#xff1f;传统的学习方法让我们死记硬背"版本号4位、首部长度4位、服务类型8位..."&#xff0c;但今…...

开源机械爪OpenClaw Max:从设计原理到实践应用全解析

1. 项目概述&#xff1a;从开源机械爪到OpenClaw Max的进化之路如果你和我一样&#xff0c;对机器人、自动化或者DIY硬件充满热情&#xff0c;那么“机械爪”这个组件一定不会陌生。它就像是机器人的“手”&#xff0c;是实现抓取、搬运、操作等复杂任务的核心执行器。市面上有…...

Tome:基于MCP协议的无代码AI桌面助手,轻松连接本地与云端模型

1. 项目概述&#xff1a;Tome&#xff0c;一个为普通人打造的魔法AI桌面应用 如果你对大型语言模型&#xff08;LLM&#xff09;和AI助手感兴趣&#xff0c;但又觉得那些命令行工具、复杂的API配置和JSON文件让人望而却步&#xff0c;那么Tome的出现&#xff0c;可能就是为你准…...

契约驱动开发:用AI守护代码质量,告别技术债

1. 项目概述&#xff1a;从“技术债”到“可持续开发”的范式转变 如果你和我一样&#xff0c;长期在技术一线摸爬滚打&#xff0c;那你一定对“技术债”这个词又爱又恨。爱它&#xff0c;是因为它给了我们一个快速交付的借口&#xff1b;恨它&#xff0c;是因为它总在项目最脆…...

Proxmox VE – 修复 LVM Thin Pool “pve/data” 激活失败

逐步诊断与恢复操作指南适用范围&#xff1a;PVE 宿主机&#xff0c;LVM thin pool pve/data 状态异常&#xff0c;错误信息&#xff1a; TASK ERROR: activating LV pve/data failed: Check of pool pve/data failed (status:1). Manual repair required! 风险提示&#xff1a…...

MCC-425 协议转换网关:打通制冷机组与 CAN 控制器数据链路

背景在工业精密温控领域&#xff0c;制冷机组的运行参数&#xff08;如温度、压力、流量&#xff09;直接决定了工艺流程的稳定性。为了实现生产现场的数字化管理&#xff0c;必须将分布在各工位的制冷机组数据实时汇聚至中控室&#xff0c;以便上位机进行统一监控与逻辑调度 。…...

基于React+TypeScript+Tailwind的ChatGPT应用UI模板开发指南

1. 项目概述&#xff1a;一个为ChatGPT应用量身定制的UI模板如果你正在开发一个基于ChatGPT或类似大语言模型的Web应用&#xff0c;无论是客服机器人、智能写作助手&#xff0c;还是企业内部的知识问答工具&#xff0c;那么你大概率会遇到一个绕不开的难题&#xff1a;如何快速…...

如何快速掌握WarcraftHelper:魔兽争霸III终极辅助工具完整指南

如何快速掌握WarcraftHelper&#xff1a;魔兽争霸III终极辅助工具完整指南 【免费下载链接】WarcraftHelper Warcraft III Helper , support 1.20e, 1.24e, 1.26a, 1.27a, 1.27b 项目地址: https://gitcode.com/gh_mirrors/wa/WarcraftHelper 还在为魔兽争霸III的画面拉…...

最火 AI 生图模型 Nano Banana Pro 国内免费使用指南

最近在设计圈和 AI 圈&#xff0c;几乎无人不知 Nano Banana Pro。它是谷歌基于 Gemini 3 Pro 打造的最新图像模型&#xff0c;一上线就斩获 LMArena 生图和图像编辑榜单第一名。虽然 Nano Banana 2 的历史成绩更亮眼&#xff0c;但实测体验发现 Pro 版更好用、操作更顺手。 为…...