当前位置：首页 > article >正文

【漫话机器学习系列】112.逻辑回归（Logistic Regression）

article 2026/3/28 3:25:09

逻辑回归（Logistic Regression）详解

1. 逻辑回归简介

逻辑回归（Logistic Regression）是一种广泛用于二分类任务的统计和机器学习方法，尽管它的名字中带有“回归”，但它实际上是一种分类算法。

在逻辑回归中，我们希望根据输入特征 xxx 预测某个事件发生的概率 P(y=1∣x)，并通过逻辑函数（Sigmoid） 将输出值限制在 (0,1) 之间，使其可以被解释为概率。

2. 逻辑回归的数学原理

2.1 线性回归的不足

假设我们使用线性回归来做二分类问题：

$y = w^T x + b$

然后我们希望通过某个阈值来决定类别：

如果 y ≥ 0.5，分类为 1；
如果 y < 0.5，分类为 0。

但这样有以下问题：

输出值没有限制：y 的取值范围是 (−∞,+∞)，但概率的范围应该是 (0,1)。
缺乏概率解释：二分类问题需要输出概率，但线性回归的输出无法自然解释为概率。

2.2 逻辑回归的核心思想

逻辑回归通过Sigmoid 函数（S 形函数） 来将线性回归的输出转换为概率：

$P(y=1 | x) = \sigma(w^T x + b)$

其中，Sigmoid 函数定义为：

$\sigma(z) = \frac{1}{1 + e^{-z}}$

性质：

当 z → +∞，σ(z) → 1；
当 z → −∞，σ(z) → 0；
当 z = 0，σ(z) = 0.5。

这个函数的形状如下：

这样，我们可以将输出值映射到 (0,1) 之间，并解释为概率。

2.3 逻辑回归的概率解释

逻辑回归实际上是在建模事件发生的概率：

$P(y=1 | x) = \frac{1}{1 + e^{-(w^T x + b)}}$

可以改写为对数几率（Log-Odds）：

$\log \frac{P(y=1 | x)}{1 - P(y=1 | x)} = w^T x + b$

其中：

左边是对数几率（log-odds），即事件发生和不发生的比值取对数；
右边是线性回归模型。

这说明逻辑回归是对数几率的线性模型，也是它名称中带有“回归”的原因。

3. 逻辑回归的损失函数

在训练逻辑回归模型时，我们需要找到合适的参数 w 和 b，使得模型对数据的预测概率尽可能接近真实值。

3.1 交叉熵损失

由于逻辑回归的输出是一个概率，我们不能直接使用均方误差（MSE），而是使用交叉熵损失（Cross Entropy Loss）：

$L(w, b) = - \sum_{i=1}^{m} \left[ y_i \log P(y_i | x_i) + (1 - y_i) \log (1 - P(y_i | x_i)) \right]$

其中：

$y_i$ 是真实标签（0 或 1）；
$P(y_i | x_i)$ 是模型预测的概率。

损失函数的直觉理解

如果真实标签是 1，那么只有第一项 $y_i \log P(y_i | x_i)$ 起作用，即希望模型预测的 $P(y_i | x_i)$ 尽可能接近 1，否则损失较大。
如果真实标签是 0，那么只有第二项 $(1 - y_i) \log (1 - P(y_i | x_i))$ 起作用，即希望模型预测的 $P(y_i | x_i)$ 尽可能接近 0，否则损失较大。

因此，最优的 w 和 b 是使得交叉熵损失最小的参数。

4. 逻辑回归的优化

为了找到最优参数 w 和 b，我们通常使用梯度下降法（Gradient Descent）进行优化。

4.1 梯度下降法

我们需要计算损失函数对参数的梯度，然后更新参数：

$w = w - \alpha \frac{\partial L}{\partial w}, \quad b = b - \alpha \frac{\partial L}{\partial b}$

其中：

α 是学习率（learning rate）。
$\frac{\partial L}{\partial w}$ 和 $\frac{\partial L}{\partial b}$ 是损失函数的梯度。

梯度计算如下：

$\frac{\partial L}{\partial w} = \sum_{i=1}^{m} (P(y_i | x_i) - y_i) x_i$

$\frac{\partial L}{\partial b} = \sum_{i=1}^{m} (P(y_i | x_i) - y_i)$

然后使用梯度下降进行迭代更新，直到收敛。

4.2 其他优化方法

批量梯度下降（BGD）：使用整个训练集计算梯度，适用于小规模数据。
随机梯度下降（SGD）：每次随机选取一个样本更新参数，适用于大规模数据。
小批量梯度下降（Mini-Batch SGD）：每次使用一个小批量的数据计算梯度，是最常用的方法。

5. 逻辑回归的应用

逻辑回归广泛应用于二分类问题，包括：

医学诊断（如判断患者是否患病）
信用评分（如判断贷款申请人是否违约）
垃圾邮件检测（如判断邮件是否是垃圾邮件）
广告点击率预测（如预测用户是否会点击广告）

此外，逻辑回归还可以扩展到多分类问题（Softmax 回归），用于处理多个类别的分类任务。

6. Python 代码实现

可以使用 sklearn 直接实现逻辑回归：

from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score# 生成数据集
X, y = make_classification(n_samples=1000, n_features=5, random_state=42)# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 训练逻辑回归模型
model = LogisticRegression()
model.fit(X_train, y_train)# 预测
y_pred = model.predict(X_test)# 计算准确率
print("Accuracy:", accuracy_score(y_test, y_pred))

7. 结论

逻辑回归是用于二分类问题的概率模型。
使用 Sigmoid 函数将线性回归的输出映射到 (0,1) 之间。
使用交叉熵损失函数来优化参数。
可以使用梯度下降进行优化，在实际应用中广泛使用。

逻辑回归虽然简单，但在许多实际任务中表现良好，尤其适用于可解释性要求较高的任务。

【漫话机器学习系列】112.逻辑回归（Logistic Regression）

逻辑回归（Logistic Regression）详解 1. 逻辑回归简介逻辑回归（Logistic Regression）是一种广泛用于二分类任务的统计和机器学习方法，尽管它的名字中带有“回归”，但它实际上是一种分类算法。在逻辑回归…...

编程日记 2026/3/18 6:22:29

【计算机网络入门】初学计算机网络（六）

目录 1.回忆数据链路层作用 2. 组帧 2.1 四种组帧方法 2.1.1 字符计数法 2.1.2 字节填充法 2.1.3 零比特填充法 2.1.4 违规编码法 3. 差错控制 3.1 检错编码 3.1.1 奇偶校验码 3.1.2 CRC（循环冗余校验）校验码 3.2 纠错编码 3.2.1 海明校验码…...

编程日记 2026/3/28 0:18:39

DeepSeek 与云原生后端：AI 赋能现代应用架构

📝个人主页🌹：一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 1. 引言在当今快速发展的互联网时代，云原生（Cloud Native）架构已成为后端开发的主流趋势。云…...

编程日记 2026/3/23 18:32:52

leetcode第17题求电话号码组合

原题出于leetcode第17题https://leetcode.cn/problems/letter-combinations-of-a-phone-number/description/题目如下： 题目稍微有点复杂，初看会感觉特别复杂，首先我们需要理清思路： 最后的结果是字母组合，因此遍历的是…...

编程日记 2026/3/27 1:35:03

DeepSeek-R1 论文笔记：通过强化学习提升大语言模型的推理能力

论文标题：DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 作者团队：DeepSeek-AI 发表时间：2025 前置知识 & 术语模型蒸馏语言模型蒸馏的目标是将大型教师模型的知识（如语义理解、上…...

编程日记 2026/3/27 4:44:05

PDF文档中表格以及形状解析

我们在做PDF文档解析时有时需要解析PDF文档中的表格、形状等数据。跟解析文本类似的常见的解决方案也是两种。文档解析跟ocr技术处理。下面我们来看看使用文档解析的方案来做PDF文档中的表格、图形解析（使用pdfium库）。表格解析： 在pdfium库…...

编程日记 2026/3/25 8:50:22

深入理解并实现自定义 unordered_map 和 unordered_set

亲爱的读者朋友们😃，此文开启知识盛宴与思想碰撞🎉。快来参与讨论💬，点赞👍、收藏⭐、分享📤，共创活力社区。在 C 的标准模板库（STL）中，unorder…...

编程日记 2026/3/24 17:11:58

228页PPT丨制造业核心业务流程优化咨询全案(战略营销计划生产研发质量)，附核心系统集成架构技术支撑体系，2月26日资料已更新

一、订单全生命周期管理优化 1. 智能订单承诺（CTP）系统 ●集成ERP/APS/MES数据，实时计算产能可视性 ●应用蒙特卡洛模拟评估订单交付风险 ●建立动态插单评估模型（基于边际贡献与产能占用系数） 2. 跨部门协同机制…...

编程日记 2026/3/27 15:58:29

6.6.5 SQL访问控制

文章目录 GRANT授予权限REVOKE回收权限 GRANT授予权限 GRANT语句可以给用户授予权限，基本格式是GRANT 权限 TO 用户。在授权时，WITH GRANT OPTION是可选项，有此句话，被授予权限的用户还能把权限赋给其他用户。 REVOKE回收权限 RE…...

编程日记 2026/3/27 11:50:09

PhyloSuite v1.2.3安装与使用-生信工具049

PhyloSuite 一个好用的win集成建树平台，官方相关文档视频等做的可好了PhyloSuite (jushengwu.com) 官网 https://github.com/dongzhang0725/PhyloSuite/releases #官网 http://phylosuite.jushengwu.com/dongzhang0725.github.io/installation/ #官方说明文档…...

编程日记 2026/3/12 11:01:08

【语法】C++中string类中的两个问题及解答

贴主在学习string类时遇到过两个困扰我的问题，今天拿出来给大家分享一下我是如何解决的一、扩容时capacity的增长问题在string的capacity()接口中，调用的是这个string对象的容量(可以存多少个有效字符)，而size()是调用的string对象现在有…...

编程日记 2026/3/26 12:16:49

智慧校园平台在学生学习与生活中的应用

随着科技的发展，教育领域也在不断探索新的模式与方法。智慧校园平台作为教育信息化的重要组成部分，正逐渐成为推动教育改革、提高教学质量的关键工具。一.智慧校园平台概述智慧校园平台是一种集成了教学管理、资源服务、数据分析等多功能于一体的数字…...

编程日记 2026/3/20 4:02:13

AtCoder Beginner Contest 001（A - 積雪深差、B - 視程の通報、C - 風力観測、D - 感雨時刻の整理）题解

由于我发现网上很少有人会发很久之前AtCoder Beginner Contes的题，所以我打算从AtCoder Beginner Contest 001开始写。大约两周一更，需要的可以订阅专栏，感谢支持Thanks♪(･ω･)ﾉ →题目翻译 A - 積雪深差…...

编程日记 2026/3/13 6:22:47

Windows本地Docker+Open-WebUI部署DeepSeek

最近想在自己的电脑本地部署一下DeepSeek试试，由于不希望污染电脑的Windows环境，所以在wsl中安装了ollama，使用ollama拉取DeepSeek模型。然后在Windows中安装了Docker Desktop，在Docker中部署了Open-WebUI，最后再在Ope…...

编程日记 2026/3/21 21:17:45

gmock和cppfreemock原理学习

1.gmock用法 gmock（Google Mock）是 Google Test 的一个扩展库，专门用于 C 单元测试中的模拟（mocking）。它的核心原理是通过继承和方法重载/覆盖来模拟 C 中的虚函数，从而在测试中隔离依赖对象&#xff0…...

编程日记 2025/12/6 20:51:32

ＷＳＢＤＦレクチア定义2 引理3 wsbdf的乘子

定义2 引理3 wsbdf的乘子ここまで寝みます❓...

编程日记 2026/3/24 17:54:46

AI日记app

一、需求分析与竞品调研 1. 核心功能需求多媒体日记记录：支持语音、视频、图片的实时录制或上传。语音/视频转文字：自动将音频、视频内容转为可编辑的文字。文字编辑与排版：富文本编辑（字体、颜色、标签）、Markdown…...

编程日记 2026/2/16 12:33:01

单一职责原则（设计模式）

目录问题： 定义： 解决： 方式 1：使用策略模式示例：用户管理方式 2：使用装饰者模式示例：用户操作方式 3：使用责任链模式示例：用户操作链总结推荐问题&a…...

编程日记 2026/3/15 18:51:07

Odoo免费开源CRM技术实战：从商机线索关联转化为售后工单的应用

文 / 开源智造 Odoo金牌服务 Odoo：功能强大且免费开源的CRM Odoo 引入了一种高效的客户支持管理方式，即将 CRM 线索转换为服务台工单。此功能确保销售和支持团队能够无缝协作，从而提升客户满意度并缩短问题解决时间。通过整合 CRM 模块与服…...

编程日记 2026/3/24 15:25:06

ChatGPT与DeepSeek：开源与闭源的AI模型之争

目录一、模型架构与技术原理二、性能能力与应用场景三、用户体验与部署灵活性四、成本与商业模式五、未来展望与市场影响六、总结随着人工智能技术的飞速发展，ChatGPT和DeepSeek作为两大领先的AI语言模型，成为了行业内外关注的焦点。它们在…...

编程日记 2026/3/26 22:28:36

C语言(3)—循环、数组、函数的详解

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、函数二、循环与数组 1.循环2.数组总结前言提示：以下是本篇文章正文内容，下面案例可供参考一、函数在C语言中，函数…...

编程日记 2026/3/27 14:58:51

架构师论文《论面向对象设计的应用与实现》

软考论文-系统架构设计师摘要我所在的公司是国内一家专注于智慧城市建设的科技企业，为适应城市数字化转型中对于高内聚、低耦合、可扩展性的技术需求，2021年3月，公司立项开发“智慧社区综合管理平台”，旨在整合物业管理、安防监…...

编程日记 2026/3/27 1:45:33

Deepseek Api Function Calling解析（tools、tool_calls）Deepseek函数调用流程图、Python代码示例

文章目录 Function Calling介绍**核心原理**1. **动态扩展模型能力**2. **JSON结构化交互** **实现步骤**（以支持Function Calling的模型为例）1. **定义可用函数**2. **模型匹配与生成**3. **开发者执行函数**4. **结果反馈给模型** **DeepSeek R1的当前…...

编程日记 2026/2/11 15:29:23

现代未来派品牌海报设计液体装饰英文字体安装包 Booster – Liquid Font

CS Booster – 具有动态流的液体显示字体具有液体美感的现代显示字体 CS Booster 是一种未来主义的显示字体，采用流畅和有机的形式设计，赋予其流畅、灵活和不断移动的外观。独特的液体灵感形状和非刚性边缘使这款字体脱颖而出，提供一种既俏…...

编程日记 2026/3/23 23:33:02

python流水线自动化项目教程

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言1. 项目环境准备Python安装选择Python开发环境安装必要库 2. 数据获取与理解4. 模型训练流水线6. 模型保存7. 模型部署（简单 Web 服务）8…...

编程日记 2026/3/26 12:09:54

(十四)趣学设计模式之策略模式！

目录一、啥是策略模式？二、为什么要用策略模式？三、策略模式的实现方式四、策略模式的优缺点五、策略模式的应用场景六、总结 🌟我的其他文章也讲解的比较有趣😁，如果喜欢博主的讲解方式，可以多多支…...

编程日记 2026/3/27 22:39:59

EMO模型详解及代码复现

EMO定义 EMO（Efficient Mobile Networks）是一种面向移动端的轻量化网络模型，旨在在参数、FLOPs和性能之间实现平衡，特别适用于密集预测任务。EMO的设计理念源于对CNN和Transformer架构的深入理解，通过整合两者的优势，实现了高效的模型性能。 EMO的核心是反向残差…...

编程日记 2026/3/25 21:43:06

kkfileview部署

kkfileview部署链接: 官方文档链接: gitee 链接: github 首先打开官网如下： OK，我们从官方文档的教程中看到，部署步骤如下: 是不是很简单，没错，于是我们按照步骤从码云上下载，然后解压，然…...

编程日记 2026/3/23 11:35:22

leetcode_34 在排序数组中查找元素的第一个和最后一个位置

1. 题意给定一个非递减的数组，找出给定元素的开始位置和结束位置。 2. 题解题目要求复杂度为 log ⁡ ( n ) \log (n) log(n), 因此不能用双指针了。这个题目练习二分挺好的。 2.1 双指针还是把双指针的写下来吧。 class Solution { public:vector<i…...

编程日记 2026/3/24 6:32:35

网络编程——UDP

UDP编程使用套接字（Socket）进行通信。下面是基于UDP协议进行网络编程的基本步骤。 1. 创建套接字首先，客户端和服务器都需要通过 socket() 系统调用创建一个UDP套接字。 2. 配置地址和端口 UDP是无连接的，因此你不需要像TCP一…...

编程日记 2026/3/27 20:39:37