sklearn之logistic回归
文章目录
- logistic回归
- logit
logistic回归
logistic regression被称之为logistic回归,对于logistic这个单词来说,他本身的翻译其实不太容易,比较有名的译法是对数几率回归,我也认为这种译法是比较合适的,虽然并非logistic的本意,但却是最贴切这个算法本身的译法
regression的意思是回归,但其实这个算法是一种分类算法
回到我们讲线性回归的时候,主要是对指数本身进行预测,但是想要更实用的话,我们其实更希望知道涨跌的情况,那其实这样的输出值就只有两类,涨或者跌,也就是二分类问题
这种情况其实非常常见,例如销售额和顾客买不买之间的问题,播放量和用户会不会点击的问题
但问题在于,我们统计出来的样本特征往往是一个连续的实数值,而目标则是一个0或1的问题,那么我们简单的线性回归模型就会失效,难以再进行有效的预测
如果直接拟合比较困难,那我们可以将输出值变化一下,从一个非0即1的问题变成涨跌的概率问题,那么概率是连续值,我们就又回到了从连续值到连续值的映射,这似乎就还是回归的内容
那我们给出一个阈值( θ \theta θ),当概率大于阈值时,认为涨的可能性大,当概率小于阈值时,认为跌的可能性大
用最直觉的想法,就是涨的概率大于不涨的概率就可以了,那么我们就可以设涨的概率是 P P P,不涨的概率就是 1 − P 1-P 1−P
当 P 1 − P > 1 \frac{P}{1-P}>1 1−PP>1时,就可以认为涨的可能性大
这个公式其实就是odds几率,接下来我们需要把观察的连续值和输出的连续值用数学模型联系起来
需要知道的是,假设 x x x表示事件涨, P ( x ) P(x) P(x)表示涨的概率,他的值域是就是 [ 0 , 1 ] [0,1] [0,1],然后我们通过几率的运算,其实得到的就是 o d d s ( x ) odds(x) odds(x),他的值域就变成了 [ 0 , + ∞ ) [0,+\infty) [0,+∞)(因为 o d d s ( x ) = P ( x ) 1 − P ( x ) odds(x)=\frac{P(x)}{1-P(x)} odds(x)=1−P(x)P(x)且 P ( x ) P(x) P(x)的范围是 [ 0 , 1 ] [0,1] [0,1])
logit
odds是几率,他在数学上的定义就是事件发生的概率比事件不发生的概率
logit其实就是给一个数取对数,我们接下来的操作是要给几率取对数,为什么呢
如果不取对数的话odds(x)的值域只有非负的部分,并不满足我们映射到全体实数的需求,因此我们对其再取对数即可,通常我们会取自然对数,并且用z表示logit(odds(x))
z = ln ( P ( x ) 1 − P ( x ) ) z=\ln(\frac{P(x)}{1-P(x)}) z=ln(1−P(x)P(x))
需要注意的是这里的小写z本质上仍然是几率,或者说是直接与几率相关的
那我们就可以轻松的反推出概率P的值 P = e z 1 + e z P=\frac{e^z}{1+e^z} P=1+ezez
然后再对这个式子做简单的变化,积分,就可以求出他的概率分布函数 P ( Z ≤ z ) = 1 1 + e z P(Z\leq z)=\frac{1}{1+e^z} P(Z≤z)=1+ez1
这里的大写Z表示的就是随机变量,取值为实数
这个公式称之为sigmoid函数,logistic函数,具有单调增,处处可导的性质
这个函数可以将任意实数的值映射到0到1之间,这个特性对于解决二分类问题十分重要,阈值也就可以在这里面选了
相关文章:
sklearn之logistic回归
文章目录 logistic回归logit logistic回归 logistic regression被称之为logistic回归,对于logistic这个单词来说,他本身的翻译其实不太容易,比较有名的译法是对数几率回归,我也认为这种译法是比较合适的,虽然并非logi…...
Warning: Each child in a list should have a unique “key“ prop.
问题描述: 使用ProTable的时候,报错如下 原因分析: 根据报错内容可以分析出,表格数据缺少唯一key, <PaginationTablecolumns{columns}pagination{{pageSize: 10,current: 1,showSizeChanger: true,showQuickJum…...
JavaSE:StringBuilder和StringBuffer类
1、引言 在上一篇文章中,我们理解了字符串的常用方法,细心的同学大概已经发现,不管是将字符串中的字符转变为大写或小写,或是完成字符串的替换,又或是去除空白字符等等,只要涉及到字符串的修改,…...
C语言在线编程网站:探索编程的奥秘与深度
C语言在线编程网站:探索编程的奥秘与深度 在数字世界的浩瀚海洋中,编程已成为连接现实与虚拟的桥梁。而C语言,作为编程领域的经典之作,其深度与广度令无数探索者着迷。为了满足广大编程爱好者的需求,C语言在线编程网站…...
Android 之广播监听网络变化
网络状态变化监听帮助类 NetBroadcastReceiverHelper public class NetBroadcastReceiverHelper {private static final String TAG "NetBroadcastReceiverHelper";private static final String NET_CHANGE_ACTION "android.net.conn.CONNECTIVITY_CHANGE&qu…...
Hono 框架使用经验谈
Hono🔥是一个小型、快速并开源的 Serverless Web 框架,用 TypeScript 写就。它适用于任何JavaScript运行时:Cloudflare Workers,Fastly ComputeEdge,Deno,Bun,Vercel,Netlify&#x…...
mac 下配置mysql的全局环境变量
前言 如果你还没有安装mysql,请参考这篇文章手把手教你MAC本地数据库的安装与使用:mysql python (pymysql)【一】 - 知乎 正文 1.打开终端,输入命令”echo $SHELL“,显示当前的shell ⚠️本人使用的终端shell是zsh,如果你使用…...
小红书云原生 Kafka 技术剖析:分层存储与弹性伸缩
面对 Kafka 规模快速增长带来的成本、效率和稳定性挑战时,小红书大数据存储团队采取云原生架构实践:通过引入冷热数据分层存储、容器化技术以及自研的负载均衡服务「Balance Control」,成功实现了集群存储成本的显著降低、分钟级的集群弹性迁…...
Python实现解码二进制数据以匹配给定的C++结构体
要在Python中实现解码二进制数据以匹配给定的C结构体Ytest,你需要了解每个字段在结构体中的偏移量(由于结构体内存对齐,这些偏移量可能与字段的顺序和大小不完全对应)。不过,在没有指定内存对齐的情况下,我…...
实施阶段(2024年5月)
【项目活动1】斐波拉契数列第n项的值? 数学思想:第一项和第二项的值都为1,从第三项开始值为前两项的和。 方法一:迭代 迭代变量:f1和f2 迭代表达式:f1,f2f2,f1f2 计数器:i 迭代表达式运算…...
(delphi11最新学习资料) Object Pascal 学习笔记---第13章第3节 (弱引用是系统托管的 )
13.4.2 弱引用是系统托管的 弱引用的托管是一个非常重要的内容。换句话说,系统会在内存中保存一个弱引用列表,当对象被销毁时,系统会检查是否有任何弱引用指向该对象,如果有,系统会将实际引用赋值为 nil࿰…...
安装WordPress
第 1 步:下载并解压 wget https://wordpress.org/latest.tar.gz 然后使用以下命令提取包: tar -xzvf latest.tar.gz 第 2 步:创建数据库 比如数据库名称为wordpress,编码格式为 utf8mb4_general_ci 第 3 步:设置wp-con…...
【STL库源码剖析】list 简单实现
从此音尘各悄然 春山如黛草如烟 目录 list 的结点设计 list 的迭代器 list 的部分框架 迭代器的实现 容量相关相关函数 实现 insert 在指定位置插入 val 实现 push_back 在尾部进行插入 实现 erase 在指定位置删除 实现 pop_back 在尾部进行删除 实现 list 的头插、头删 实现…...
web前端框架设计第十一课-常用插件
web前端框架设计第十一课-常用插件 一.预习笔记 1.路由的基础使用 2.动态路由 3.嵌套路由 二.课堂笔记 三.课后回顾 –行动是治愈恐惧的良药,犹豫拖延将不断滋养恐惧...
Java基础-注解
注解本质是继承了Annotation接口的一个接口 首先,我们通过键值对的形式可以为注解属性赋值,像这样:Hello(value “hello”)。 接着,你用注解修饰某个元素,编译器将在编译期扫描每个类或者方…...
SpringCloud之SSO单点登录-基于Gateway和OAuth2的跨系统统一认证和鉴权详解
单点登录(SSO)是一种身份验证过程,允许用户通过一次登录访问多个系统。本文将深入解析单点登录的原理,并详细介绍如何在Spring Cloud环境中实现单点登录。通过具体的架构图和代码示例,我们将展示SSO的工作机制和优势&a…...
二分查找算法详讲(三种版本写法)原创
介绍: 二分查找算法(Binary Search)是一种在有序数组中查找目标元素的算法。 它的基本思想是通过将目标元素与数组的中间元素进行比较,从而将搜索范围缩小一半。 如果目标元素等于中间元素,则搜索结束;如果目标元素小…...
Git钩子(Hooks)之commit之前自动执行脚本
介绍 官方文档: 英文:https://git-scm.com/book/en/v2/Customizing-Git-Git-Hooks中文:https://git-scm.com/book/zh/v2/自定义-Git-Git-钩子 下面只复制了pre-commit部分文档,其他详见官方文档。 Git Hooks Like many other…...
nano机器人2:机械臂的视觉抓取
前言 参考链接: 【机械臂入门教程】机械臂视觉抓取从理论到实战 GRCNN 通过神经网络,先进行模型训练,在进行模型评估。 机械臂逆运动学求解 所有串联型6自由度机械臂均是可解的,但这种解通常只能通过数值解法得到,计算难度大&am…...
技术速递|宣布 Java on Azure 开发工具支持 Java on Azure Container Apps
作者:Jialuo Gan 排版:Alan Wang 在 Microsoft Build 2024 期间宣布,Azure Container Apps 现在可为 Java 开发人员提供丰富的操作功能。(详细内容请参见本博客)。 我们很高兴地与大家分享,Azure Toolkit for Intelli…...
谷歌DeepMind让AI学会“主动查资料“
这项由爱丁堡大学与谷歌DeepMind联合开展的研究,以预印本形式发布于2026年5月13日,论文编号为arXiv:2605.13050v1,有兴趣深入了解的读者可以通过该编号查询完整论文。**研究概要**假设你有一位助理,学识渊博,但所有知识…...
一道2厘米的伤口,照见了人间的双重标准
一道2厘米的伤口,照见了人间的双重标准简介昨天清晨六点,天色刚泛白。我照例牵着家里那只黑白分明的边牧出门。它在晨光里撒腿跑开的姿势依旧敏捷而优雅——这个品种天生属于旷野,即使被圈养在城市的钢筋水泥里,那股源自苏格兰边境…...
Keil开发环境下的CANopen与DeviceNet协议实现指南
1. Keil开发工具对CANopen与DeviceNet协议的支持解析作为一名长期使用Keil工具链的嵌入式开发者,我经常遇到关于工业通信协议支持的咨询。最近在开发一个基于STM32的工业控制器时,就遇到了CANopen协议栈实现的问题。这里系统梳理下Keil开发环境对这两种主…...
不懂PMP的项目经理,正在被AI和敏捷时代淘汰
一、一个正在发生的残酷事实 张伟是一家传统制造企业的项目经理,拥有十年工作经验。他的日常工作是这样的:每天早上整理Excel进度表,中午开会协调资源,晚上更新甘特图,睡前发送项目周报。他觉得自己很忙、很重要。 直到…...
FanControl风扇控制软件:5分钟快速上手指南,轻松解决电脑噪音与散热难题
FanControl风扇控制软件:5分钟快速上手指南,轻松解决电脑噪音与散热难题 【免费下载链接】FanControl.Releases This is the release repository for Fan Control, a highly customizable fan controlling software for Windows. 项目地址: https://gi…...
VSCode + Modelsim 搭建Verilog开发环境:除了语法检查,还能这样玩?
VSCode与ModelSim深度集成:打造高效Verilog开发工作流 在数字电路设计领域,Verilog作为硬件描述语言的标准之一,其开发效率直接影响项目进度。传统开发模式中,工程师需要在多个工具间频繁切换——编辑器用于编码,Model…...
破解人类微生物组数据分析难题:curatedMetagenomicData的完整解决方案
破解人类微生物组数据分析难题:curatedMetagenomicData的完整解决方案 【免费下载链接】curatedMetagenomicData Curated Metagenomic Data of the Human Microbiome 项目地址: https://gitcode.com/gh_mirrors/cu/curatedMetagenomicData 宏基因组数据分析在…...
AI数字人驱动的矩阵内容生产:2026年技术架构与人效革命
一、背景:为什么2026年矩阵团队开始淘汰真人出镜?2024年之前,短视频矩阵的内容生产模式是这样的:环节传统方式瓶颈写脚本编剧手写1人1天最多写5条拍视频真人出镜拍摄1人1天最多拍3条剪辑剪辑师手动剪1人1天最多剪8条配音真人录音/…...
从项目实战出发:如何用AVL Cruise 2019与MATLAB/Simulink完成一个完整的DLL联合仿真流程?
从项目实战出发:如何用AVL Cruise 2019与MATLAB/Simulink完成一个完整的DLL联合仿真流程? 在汽车工程领域,系统级仿真已成为开发流程中不可或缺的一环。当我们需要评估整车动力系统性能时,AVL Cruise作为专业车辆仿真软件…...
八大排序算法 - 冒泡排序
一、算法简介冒泡排序是最基础的交换类排序,思路简单易懂。原理是相邻元素两两比较,逆序则交换,大数逐步向后沉,小数向前冒,如同气泡上浮。时间复杂度:最优(O(n)) 最坏 / 平均(O(n^2))空间复杂度࿱…...
