逻辑回归知识点
一、逻辑回归概念
逻辑回归(Logistic Regression)是一种广泛应用于分类问题的统计方法,尤其适用于二分类问题。
注意: 尽管名称中有"回归"二字,但它实际上是一种分类算法。
解决二分类的问题。
API:sklearn.linear_model.LogisticRegression
二、核心函数
Sigmoid函数:
其中,w是权重向量,x是特征向量,b是偏置项。
三、逻辑回归原理和优化手段
1.原理:(核心思想)逻辑回归通过将线性回归的输出映射到(0,1)区间,使用Sigmoid函数将连续值转换为概率值,然后根据概率值进行分类预测。
2.优化手段:极大似然估计和最小化交叉熵。
极大似然估计:(MLE,即 Maximum Likelihood Estimation)
是一种统计方法,用于从观测数据中估计概率分布的参数。核心思想是“在已知观测数据的情况下,选择使得这些数据出现概率最大的参数值。”
二分类公式:
其中表示第i个样本的真实标签,取值为0或1(1表示成功,0表示失败),
是模型预测的“成功”概率(即
),是带估计的参数。
最小化交叉熵:交叉熵损失函数(Cross-Entropy Loss),也称为对数损失(Log Loss)
交叉熵是衡量两个概率分布(真实分布 y和预测分布 p)差异的指标
二分类公式:
其中表示第i个样本的真实标签,通常取值0或1(二分类问题),
表示模型预测的第i个样本属于类别1的概率(即
)
关系:先用伯努利分布的似然函数,然后对其取负对数,直接得到交叉熵损失,然后不断的梯度下降迭代更新找到最优参数!(把最大化问题将其变为最小化问题,把连乘问题将其变为连加问题)
四、混淆矩阵
1.概念
混淆矩阵是机器学习中用于评估分类模型性能的表格。它展示了模型的预测结果与实际标签的对比情况。
2.图解
3.作用
直观显示模型的分类错误类型(如误诊、漏检),计算关键指标:准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数等。
五、分类结果评价指标
1.准确率(Accuracy_score)
准确率 = 预测正确的样本数 / 总样本数 其中预测正确指的是预测结果 = 真实结果(包含正例以及反例)
2.精确率(Precision_score)
精确率 是 预测正例中真实正例的个数占比
3.召回率(Recall_score)
召回率 是 真实正例中预测的正例的个数占比
4.F1-score
对模型的精确率和召回率都有要求,希望知道模型在这两个评估方向的综合预测能力
5.ROC曲线
概念:ROC曲线以模型的真正率为纵轴,假正率为横轴,它将模型在不同阈值下的表现以曲线的形式展现出来。
真正率: 正样本中被预测为正样本的概率TPR (True Positive Rate)
假正率: 负样本中被预测为正样本的概率FPR (False Positive Rate)
6.AUC面积
ROC曲线下方的面积,AUC越大,代表分类器越好
相关文章:
逻辑回归知识点
一、逻辑回归概念 逻辑回归(Logistic Regression)是一种广泛应用于分类问题的统计方法,尤其适用于二分类问题。 注意: 尽管名称中有"回归"二字,但它实际上是一种分类算法。 解决二分类的问题。 API:sklearn.linear_model.Logis…...
YARN架构解析:大数据资源管理核心
一、YARN的设计目标 解耦资源管理与作业调度:将资源管理(Resource Management)和任务执行(Task Execution)分离,提升集群资源利用率。支持多种计算框架:不再局限于MapRedu…...
嵌入式学习笔记 - freeRTOS在程序开始在任务内创建任务的好处是什么
在FreeRTOS中,程序启动后优先在初始任务(而非main()函数)内创建其他任务是一种常见且推荐的设计模式,其主要优势包括以下几点: 以下来自deepseek的回答,很全面很正确: 🔧 1. 避免…...

Ubuntu22.04 安装 CUDA12.8
1.下载CUDA 由于我装完 Ubuntu22.04 后就自动带了最新的显卡驱动,就没有再去配置驱动。 先查看驱动能支持的CUDA最高版本,这里显示可支持到12.8。 nvidia-smi在CUDA的 说明文档 可查看CUDA对应的驱动版本要求。 在 CUDA Toolkit Archive 查找需要的 …...

Android的uid~package~pid的关系
UID : Linux 系统级用户标识,Android 中每个应用安装时分配唯一 UID(如 1000)。 Package: Android 应用包名(例如android),一个 UID 可关联多个 Package(共享 UID 场景如android:sharedUserI…...
线段树刷题记录
一篇讲解很好的线段树博客:数据结构--线段树篇_数据结构线段树-CSDN博客 一、区间查询 无修改: (一)最值问题: 1.P1816 忠诚 - 洛谷 思路: 模板。 注意: 无。 代码: #include …...

20250530-C#知识:万物之父Object
C#知识:万物之父Object Object类(即object)是所有类的基类,这里面的方法还是需要好好了解一下。 1、Object类 是顶级父类,其他类默认都是Object类的子类(自定义类也会默认继承Object类)可以用O…...

多元素纳米颗粒:开启能源催化新纪元
在能源转型的浪潮中,纳米催化剂正成为推动能源技术突破的关键力量。多元素纳米颗粒(Polyelemental Nanoparticles)凭借其独特的元素协同效应,展现出在能源催化领域的巨大潜力。然而,合成这些复杂体系的纳米颗粒面临着诸…...

分布式锁优化:使用Lua脚本保证释放锁的原子性问题
分布式锁优化(二):使用Lua脚本保证释放锁的原子性问题 💻黑马视频链接:Lua脚本解决多条命令原子性问题 在上一章节视频实现了一个可用的Redis分布式锁,采用SET NX EX命令实现互斥和过期自动释放机制&…...

电脑wifi显示已禁用怎么点都无法启用
一、重启路由器与电脑 有时候,简单的重启可以解决很多小故障。试着先断开电源让路由器休息一会儿再接通;对于电脑,则可选择重启系统看看情况是否有改善。 二、检查驱动程序 无线网卡驱动程序的问题也是导致WiFi无法启用的常见原因之一。我…...

【FPGA开发】Ubuntu16.04环境下配置Vivado2018.3—附软件包
文章目录 环境介绍关键步骤记录安装虚拟机及镜像安装vivadolicense导入 环境介绍 vivado:2018.3 虚拟机:vmware 16 pro 镜像:Ubuntu16.04 64位 所有相关软件压缩包: 链接:https://pan.quark.cn/s/fd2730b46b20 提取码…...

vue-seamless-scroll 结束从头开始,加延时后滚动
今天遇到一个大屏需求: 1️⃣初始进入页面停留5秒,然后开始滚动 2️⃣最后一条数据出现在最后一行时候暂停5秒,然后返回1️⃣ 依次循环,发现vue-seamless-scroll的方法 ScrollEnd是监测最后一条数据消失在第一行才回调ÿ…...
不同的数据库操作方式:MongoDB(NoSQL)和 MySQL/SQL
这两种写法分别使用了不同的数据库操作方式:第一种是 MongoDB(NoSQL) 的写法,第二种是 MySQL/SQL 的写法。我们来对比它们的区别,并给出优化建议。 1. MongoDB(NoSQL)写法 const user await d…...

0-EATSA-GNN:基于图节点分类师生机制的边缘感知和两阶段注意力增强图神经网络(code)
code:https://github.com/afofanah/EATSA-GNN. 文章目录 Abstract1. Introduction1.1.动态图场景1.2.EATSA-GNN框架的背景化2. Background2.1.GNN边缘感知挑战2.2.GNN的可解释性问题2.3.EATSA-GNN可解释性3. Related worksAbstract 图神经网络(GNNs)从根本上改变了我们处理和…...
大数据学习(124)-spark数据倾斜
🍋🍋大数据学习🍋🍋 🔥系列专栏: 👑哲学语录: 用力所能及,改变世界。 💖如果觉得博主的文章还不错的话,请点赞👍收藏⭐️留言📝支持一…...

配置前端控制器
一、DispatcherServlet 详解 在使用 Spring MVC 框架构建 Web 应用时,DispatcherServlet是整个请求处理流程的核心。本文将深入解析DispatcherServlet的作用、工作原理及其在 Spring MVC 架构中的关键地位。 1.DispatcherServlet 是什么? DispatcherS…...

lua注意事项
感觉是lua的一大坑啊,它还不如函数内部就局部变量呢 注意函数等内部,全部给加上local得了...

Git的三种合并方式
在 Gitee(码云)中合并分支主要有三种方式:普通合并(Merge Commit)、压缩合并(Squash Merge)和变基合并(Rebase Merge)。每种方式适用于不同的场景,各有…...

从零到一:我的技术博客导航(持续更新)
作者:冰茶 最后更新:2025年6月3日 本文收录了我的C#编程学习心得与技术探索,将持续更新 前言 作为一名.NET开发者,C#语言的学习与探索一直是我技术成长的核心路径。本文集整理了我在C#学习过程中的思考与实践,希望能够…...

SpringBoot整合Flowable【08】- 前后端如何交互
引子 在第02篇中,我通过 Flowable-UI 绘制了一个简单的绩效流程,并在后续章节中基于这个流程演示了 Flowable 的各种API调用。然而,在实际业务场景中,如果要求前端将用户绘制的流程文件发送给后端再进行解析处理,这种…...
DM达梦数据库开启SQL日志记录功能
DM达梦数据库开启SQL日志记录功能 配置SQL日志(非必须的配置步骤,与主备集群配置无关,如果没有需求可以跳过配置SQL日志) sqllog.ini 配置文件用于SQL日志的配置,当且仅当 INI(dm.ini) 参数 SV…...
00 QEMU源码分析中文注释与架构讲解(v8.2.4版本)
QEMU-v8.2.4源码中文注释与架构讲解 文档会不定期更新 注释作者将狼才鲸创建日期2025-05-30更新日期2025-06-02 CSDN阅读地址:QEMU源码中文注释与架构讲解Gitee源码仓库地址:才鲸嵌入式/qemu 一、前言 其它参考教程的网址: QEMU 源码目录…...

【五模型时间序列预测对比】Transformer-LSTM、Transformer、CNN-LSTM、LSTM、CNN
【五模型时间序列预测对比】Transformer-LSTM、Transformer、CNN-LSTM、LSTM、CNN 目录 【五模型时间序列预测对比】Transformer-LSTM、Transformer、CNN-LSTM、LSTM、CNN预测效果基本介绍程序设计参考资料 预测效果 基本介绍 Transformer-LSTM、Transformer、CNN-LSTM、LSTM、…...

深入了解MCP基础与架构
一、引言 在人工智能技术以指数级速度渗透各行业领域的今天,我们正站在一个关键的技术拐点。当ChatGPT月活突破亿级、Gemini Pro实现多模态实时交互、Claude 3.5 Sonnet突破百万上下文长度,这些里程碑事件背后,一个崭新的大门逐步打开&#…...

实验设计与分析(第6版,Montgomery)第5章析因设计引导5.7节思考题5.13 R语言解题
本文是实验设计与分析(第6版,Montgomery著,傅珏生译) 第5章析因设计引导5.7节思考题5.13 R语言解题。主要涉及方差分析,正态假设检验,残差分析,交互作用图。 dataframe<-data.frame( yc(36,18,30,39,20…...
怎么选择合适的高防IP
选择合适的高防IP需要综合考虑业务需求、防护能力、服务稳定性、成本效益等多方面因素。以下是从多个权威来源整理的关键要点,帮助您做出科学决策: 一、明确业务需求 业务类型与规模 网站/应用类:需支持HTTP/HTTPS协议,并配置域名…...

【java面试】MySQL篇
MySQL篇 一、总体结构二、优化(一)定位慢查询1.1 开源工具1.2Mysql自带的慢日志查询1.3 总结 (二)定位后优化2.1 优化2.2 总结 (三)索引3.1 索引3.2 索引底层数据结构——B树3.3 总结 (四&#…...

贪心算法应用:欧拉路径(Fleury算法)详解
Java中的贪心算法应用:欧拉路径(Fleury算法)详解 一、欧拉路径与欧拉回路基础 1.1 基本概念 欧拉路径(Eulerian Path)是指在一个图中,经过图中每一条边且每一条边只经过一次的路径。如果这条路径的起点和…...

【算法设计与分析】实验——二维0-1背包问题(算法分析题:算法思路),独立任务最优调度问题(算法实现题:实验过程,描述,小结)
说明:博主是大学生,有一门课是算法设计与分析,这是博主记录课程实验报告的内容,题目是老师给的,其他内容和代码均为原创,可以参考学习,转载和搬运需评论吱声并注明出处哦。 要求:3-…...
P12592题解
题目传送门 思路 由于题目中说了可以任意交换两个字符的位置,我们只需要判断这个字符串是否满足回文串的条件即可。 代码: #include<bits/stdc.h> using namespace std; int a[30]; int main(){int T;cin>>T;while(T--){fill(a,a29,0);/…...