当前位置：首页 > news >正文

Logistic回归

news 2025/7/9 0:52:22

Logistic回归模型：

适用于二分类或多分类问题，样本特征是数值型（否则需要转换为数值型）

策略：极大似然估计

算法：随机梯度或 BFGS算法（改进的拟牛顿法）

线性回归表达式：

$y_i = w\cdot x_i+b$

式子中 $x_i = (x_i^{(1)},x_i^{(2)},...,x_i^{(N)})$ ;w为N个特征权重组成的向量，即 $w=(w_1,w_2,...,w_N)$ ;b是第i个样本对应的偏置常数。

Sigmoid函数：

$g(z)=\frac{1}{1+e^{-z}}$

对数概率

$y=log(\frac{p}{1-p})$

$p = \frac{e^y}{1+e^y}$

$p=\frac{e^{wx+b}}{1+e^{wx+b}}$

Logistic 回归模型：

$p(y=1|x)=\frac{e^{wx+b}}{1+e^{wx+b}}$ ， $p(y=0|x)=\frac{1}{1+e^{wx+b}}$

构造似然函数：

$log(L)=\sum_{i=1}^{N}y_i(wx_i+b)+log(1-p_i)$

$log(L)=\sum_{i=1}^{N}y_i(wx_i+b)-log(1+e^{wx_i+b})$

$\hat{w},\hat{b}=argmax_{w,b}\sum_{i=1}^{N}y_i(wx_i+b)-log(1+e^{wx_i+b})$

Logistic回归优化：梯度下降，分别对权重w，偏置b求导数：

$\frac{\partial }{\partial w}lnL(w,b)=\frac{\partial }{\partial w}\sum_{i=1}^{N}y_i(wx_i+b)-ln(1+e^{wx_i+b})$

$\frac{\partial }{\partial b}lnL(w,b)=\frac{\partial }{\partial b}\sum_{i=1}^{N}y_i(wx_i+b)-ln(1+e^{wx_i+b})$

综上，可归纳Logistic回归的过程：

实例：鸢尾花数据集划分：

class Logistic_Regression:def __init__(self):self.coef_ = Noneself.intercept_ = Noneself._theta = Nonedef _sigmoid(self,t):return 1./(1.+np.exp(-t)) def fit(self,X_train,y_train,eta = 0.01, n_iters =1e4):def J(theta,X_b,y):y_hat = self._sigmoid(X_b.dot(theta))try:return -np.sum(y*np.log(y_hat)  +(1-y)*np.log(1-y_hat)  )except:return float('inf')def dJ(theta,X_b,y):return X_b.T.dot(self._sigmoid(X_b.dot(theta))-y)def gradient_descent(initia_theta,X_b,y, eta,n_iters =1e4,epsilon =1e-8 ):theta = initia_thetacur_iter = 0while cur_iter < n_iters:gradient = dJ(theta,X_b, y)last_theta = thetatheta = theta - eta * gradientif (abs(J(theta,X_b, y)-J(last_theta,X_b, y)) < epsilon):breakcur_iter += 1return thetaX_b = np.hstack([np.ones(len(X_train)).reshape(-1,1),X_train])initia_theta = np.zeros(X_b.shape[1])self._theta = gradient_descent(initia_theta,X_b,y_train,eta,n_iters)self.intercept_ = self._theta[0]self.coef_ = self._theta[1:]return selfdef predict_proba(self,X_predict):X_b = np.hstack([np.ones(len(X_predict)).reshape(-1,1),X_predict])return self._sigmoid(X_b.dot(self._theta))def predict(self,X_predict):proba = self.predict_proba(X_predict)return np.array(proba >= 0.5,dtype = 'int')def score(self,X_test,y_test):y_predict = self.predict(X_test)return accuracy_score(y_test, y_predict)def __repr__(self):return "LogisticRegression()"

可视化划分：

from sklearn import datasets
iris = datasets.load_iris()
X = iris.data
y = iris.target
X = X[y<2,:2]
y = y[y<2]
plot_decision_boundary(log_reg,X_test)
plt.scatter(X_test[y_test==0,0],X_test[y_test==0,1])
plt.scatter(X_test[y_test==1,0],X_test[y_test==1,1])
plt.show()

总结

注意：虽然 Logistic 回归的名字叫作回归，但其实它是一种分类方法！！！

优点

逻辑斯蒂回归模型基于简单的线性函数，易于理解和实现。
Logistic 回归模型对一般的分类问题都可使用。
Logistic 回归模型不仅可以预测出样本类别，还可以得到预测为某类别的近似概率，这在许多需要利用概率辅助决策的任务中比较实用。
Logistic 回归模型中使用的对数损失函数是任意阶可导的凸函数，有很好的数学性质，可避免局部最小值问题。

缺点

Logis ic 回归模型本质上还是种线性模型，只能做线性分类，不适合处理非线性的情况，一般需要结合较多的人工特征处理使用。
Logistic 回归对正负样本的分布比较敏感，所以要注意样本的平衡性，即y=1的样本数不能太少。
模型不能自动捕捉特征之间的交互作用，需要手动进行特征工程。

Logistic回归

Logistic回归模型： 适用于二分类或多分类问题，样本特征是数值型（否则需要转换为数值型） 策略：极大似然估计算法：随机梯度或 BFGS算法（改进的拟牛顿法） 线性回归表达式&#xf…...

编程日记 2024/8/6 12:26:10

Langchain-Chatchat+Xinference集成部署

Langchain-ChatchatXinference集成部署安装环境： 系统：Anolis OS 8.9 python版本：Python 3.9.19 Langchain-Chatchat版本：0.3.1.3 Xinference版本：v0.13.3 模型选择（下载时需要科学上网）&#…...

编程日记 2024/8/6 12:23:06

江协科技51单片机学习- p33 PWM呼吸灯和直流驱动电机调速

🚀write in front🚀 🔎大家好，我是黄桃罐头，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流 🎁欢迎各位→点赞👍 收藏⭐️ 留言📝…...

编程日记 2024/8/6 12:22:05

使用Jetbrains.Rider反编译Unity的DLL文件看源码

直接将dll文件的打开方式用Rider打开即可，打开BattleSeqGenertor.dll文件的效果如下：...

编程日记 2024/8/6 12:21:04

【学习笔记】决策单调性优化DP

背景 GDCPC还在发力，清华出题组出的牛客还是 4 题。这次没有min25筛，不然我能5题（bushi 除了一道用 prufer 序列的恶心 DP 外，还有一道DP题是一个状态难想，并且还需要决策单调性优化的DP，被认为是偏简单…...

编程日记 2024/8/6 12:20:03

【每日一题】【二分图最大匹配】【经典板子题】有大家喜欢的零食吗河南萌新联赛2024第（一）场：河南农业大学 C题 C++

河南萌新联赛2024第（一）场：河南农业大学 C题有大家喜欢的零食吗题目描述在某幼儿园中共有 n n n个小朋友，该幼儿园的老师为这 n n n 个小朋友准备了 n n n 份不一样的零食大礼包。每个小朋友只能选择一个，但老…...

编程日记 2024/8/6 12:19:02

【python】OpenCV—Image Colorization

文章目录 1、CIELAB 色彩空间2、作色问题定义3、Caffe 模型4、代码实现——Image5、代码实现——Video6、参考 1、CIELAB 色彩空间 Lab颜色空间，也称为Lab色彩空间或CIELAB色彩空间，是一种基于人类视觉感知特性的颜色模型。它是在1931年国际照明委员会&…...

编程日记 2024/8/6 12:18:01

vue 学习笔记

模板语法 1. 插值语法用于解析标签体内容 { { 表达式 } } ，可以直接读取到 data 中的所有属性 2. 指令语法解析标签（标签属性， 标签内容， 绑定事件） v-bind : href " url " 或 : href &…...

编程日记 2024/8/6 12:14:58

武汉流星汇聚：‘中国制造’闪耀欧洲站，体育赛事成亚马逊增长点

随着2024年的欧洲体育赛事激情四溢，欧洲杯与奥运会的双重盛会不仅点燃了全球体育迷的热情，更为亚马逊欧洲站带来了前所未有的发展机遇。在这场体育盛宴的推动下，欧洲站正展现出其无限的发展潜力和广阔的市场前景，为中国卖家乃至全…...

编程日记 2024/8/6 12:12:57

RPA是什么?探讨RPA发展的最新趋势 | RPA研究

随着人工智能和自动化技术的飞速发展，机器人流程自动化（Robotic Process Automation，简称RPA）正逐渐成为企业数字化转型的关键工具。RPA通过模拟人类用户的操作行为，自动化执行重复性高、规则性强的任务，从…...

编程日记 2024/8/6 12:11:56

sqlalchemy时间范围查询

1、sqlalchemy时间范围查询在 SQLAlchemy 中，进行时间范围查询可以通过比较日期或时间字段来实现。假设你有一个模型 Event，它包含一个 timestamp 字段，你想查询在某个时间范围内的所有事件。以下是如何使用 SQLAlchemy 来实现这个查询的示例。首先，确保你有 SQLAlchem…...

编程日记 2024/8/6 12:10:55

电脑不小心删除的文件怎么恢复？教你文件恢复的绝招

在日常使用电脑的过程中，我们有时会因为误操作或不小心而删除了重要的文件。面对这种情况，很多人可能会感到焦虑和无助。但其实，通过一些专业的方法和工具，我们有可能恢复这些被误删的文件。本文将介绍两种常见的恢复方法&#xf…...

编程日记 2024/8/6 12:09:54

stm32：使用和学习--硬件和程序

一硬件 1. GPIO 1.FT, TT功能 ft：five tolerate tt：three tolerate 1. FT（Five-Volt Tolerant）引脚 FT 引脚能够容忍高于 VDD 的输入电压（例如 5V）。这些引脚通常不具有连接到 VDD 的保护二极管&…...

编程日记 2024/8/6 12:07:52

ARM知识点二

一、指令指令的生成过程指令执行过程示例 if (a 0) {x 0; } else {x x 3; } //翻译为 cmp r0,#0 MOVEQ R1,#0 ADDGT R1,R1,#3指令获取：从Flash中读取 CMP R0, #0，控制器开始执行。指令解码：解码器解析 CMP 指令，ALU比较R…...

编程日记 2024/8/6 12:04:50

C# ?的使用

栏目总目录可空类型标记符（?） 说明： 可空类型标记符?用于指示某个值类型（如int、float等）可以为null。这是C# 2.0引入的一个特性，用于处理数据库查询、JSON解析等场景中可能出现的空值。示例代码&am…...

编程日记 2024/8/6 11:58:43

【unity小技巧】unity性能优化以及如何进行性能测试

文章目录前言GPU性能优化打包素材 CPU性能优化代码执行优化性能测试Vector2.Distance 和 sqrMagnitude哪个好？动画切换优化shader属性优化 URP渲染器资产优化对象池优化删除没必要的空函数图片、音乐音效、贴图等素材压缩ScriptableObject优化参数参考完结前言 …...

编程日记 2024/8/6 11:56:40

算法参考改进点/知识点

1、clip文章中改进点图像编码器image encoder： 将全局平均池化层替换为注意力池化机制。注意力池化机制：通过一个单层的“transformer式”多头QKV注意力，其中查询query是基于图像的全局平均池表示。改进VIT（Vision Transformer…...

编程日记 2024/8/6 11:55:39

electron 配置、打包 -报错解决

目录一、配置途中遇到的问题： 二、 make 配置好后开始打包三、Electron-builder 打包报错一、配置途中遇到的问题： 1. 安装 yarn add electron -D 一直卡在这里失败一直卡可以使用下面这个，然后再重新装依赖 1. 采用新的镜像地址 npm …...

编程日记 2024/8/6 11:51:35

基于STM32设计的智能鱼缸(华为云IOT)(200)

文章目录一、前言1.1 项目介绍【1】项目功能介绍【2】设计实现的功能【3】项目硬件模块组成1.2 设计思路【1】整体设计思路【2】ESP8266工作模式配置【3】自动换水原理1.3 项目开发背景【1】选题的意义【2】可行性分析【3】参考文献1.4 开发工具的选择【1】设备端开发【2】上位…...

编程日记 2024/8/6 11:50:34

Django与数据库

目录创建项目app 路由子表数据库创建数据库什么是ORM 定义数据库表 Django Admin 管理数据过滤条件代码直接生成HTML 使用模板前后端分离架构对资源的增删改查处理列出客户添加客户临时取消 CSRF 校验修改客户信息删除客户 Django中ORM的处理数据模…...

编程日记 2024/8/6 11:49:33

未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？

编辑：陈萍萍的公主一点人工一点智能未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战，在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…...

编程新知 2025/7/7 13:25:45

conda相比python好处

Conda 作为 Python 的环境和包管理工具，相比原生 Python 生态（如 pip 虚拟环境）有许多独特优势，尤其在多项目管理、依赖处理和跨平台兼容性等方面表现更优。以下是 Conda 的核心好处： 一、一站式环境管理&#xff1a…...

编程新知 2025/6/15 5:36:36

【Linux】shell脚本忽略错误继续执行

在 shell 脚本中，可以使用 set -e 命令来设置脚本在遇到错误时退出执行。如果你希望脚本忽略错误并继续执行，可以在脚本开头添加 set e 命令来取消该设置。举例1 #!/bin/bash# 取消 set -e 的设置 set e# 执行命令，并忽略错误 rm somefile…...

编程新知 2025/6/21 16:23:04

从零实现富文本编辑器#5-编辑器选区模型的状态结构表达

先前我们总结了浏览器选区模型的交互策略，并且实现了基本的选区操作，还调研了自绘选区的实现。那么相对的，我们还需要设计编辑器的选区表达，也可以称为模型选区。编辑器中应用变更时的操作范围，就是以模型选区为基准来…...

编程新知 2025/6/27 7:16:49

条件运算符

C中的三目运算符（也称条件运算符，英文：ternary operator）是一种简洁的条件选择语句，语法如下： 条件表达式 ? 表达式1 : 表达式2• 如果“条件表达式”为true，则整个表达式的结果为“表达式1”…...

编程新知 2025/7/6 13:40:50

什么是EULA和DPA

文章目录 EULA（End User License Agreement）DPA（Data Protection Agreement）一、定义与背景二、核心内容三、法律效力与责任四、实际应用与意义 EULA（End User License Agreement） 定义： EULA即…...

编程新知 2025/7/4 8:55:29

12.找到字符串中所有字母异位词

🧠 题目解析题目描述： 给定两个字符串 s 和 p，找出 s 中所有 p 的字母异位词的起始索引。返回的答案以数组形式表示。字母异位词定义： 若两个字符串包含的字符种类和出现次数完全相同，顺序无所谓，则互为…...

编程新知 2025/7/7 22:04:10

CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文标题：CROME: Cross-Modal Adapters for Efficient Multimodal LLM ➡️ 论文作者：Sayna Ebrahimi, Sercan O. Arik, Tejas Nama, Tomas Pfister ➡️ 研究机构: Google Cloud AI Re…...

编程新知 2025/7/5 8:54:59

select、poll、epoll 与 Reactor 模式

在高并发网络编程领域，高效处理大量连接和 I/O 事件是系统性能的关键。select、poll、epoll 作为 I/O 多路复用技术的代表，以及基于它们实现的 Reactor 模式，为开发者提供了强大的工具。本文将深入探讨这些技术的底层原理、优缺点。一、I…...

编程新知 2025/7/6 19:09:54

React---day11

14.4 react-redux第三方库提供connect、thunk之类的函数以获取一个banner数据为例子 store： 我们在使用异步的时候理应是要使用中间件的，但是configureStore 已经自动集成了 redux-thunk，注意action里面要返回函数 import { configureS…...

编程新知 2025/7/3 22:17:31

Logistic回归

Logistic回归模型：

实例：鸢尾花数据集划分：

总结

优点

缺点

相关文章：

Logistic回归

Langchain-Chatchat+Xinference集成部署

江协科技51单片机学习- p33 PWM呼吸灯和直流驱动电机调速

使用Jetbrains.Rider反编译Unity的DLL文件看源码

【学习笔记】决策单调性优化DP

【每日一题】【二分图最大匹配】【经典板子题】有大家喜欢的零食吗河南萌新联赛2024第（一）场：河南农业大学 C题 C++

【python】OpenCV—Image Colorization

vue 学习笔记

武汉流星汇聚：‘中国制造’闪耀欧洲站，体育赛事成亚马逊增长点

RPA是什么?探讨RPA发展的最新趋势 | RPA研究

sqlalchemy时间范围查询

电脑不小心删除的文件怎么恢复？教你文件恢复的绝招

stm32：使用和学习--硬件和程序

ARM知识点二

C# ?的使用

【unity小技巧】unity性能优化以及如何进行性能测试

算法参考改进点/知识点

electron 配置、打包 -报错解决

基于STM32设计的智能鱼缸(华为云IOT)(200)

Django与数据库

未来机器人的大脑：如何用神经网络模拟器实现更智能的决策？

conda相比python好处

【Linux】shell脚本忽略错误继续执行

从零实现富文本编辑器#5-编辑器选区模型的状态结构表达

条件运算符

什么是EULA和DPA

12.找到字符串中所有字母异位词

多模态大语言模型arxiv论文略读（108）

select、poll、epoll 与 Reactor 模式

React---day11