【漫话机器学习系列】112.逻辑回归(Logistic Regression)
逻辑回归(Logistic Regression)详解
1. 逻辑回归简介
逻辑回归(Logistic Regression)是一种广泛用于二分类任务的统计和机器学习方法,尽管它的名字中带有“回归”,但它实际上是一种分类算法。
在逻辑回归中,我们希望根据输入特征 xxx 预测某个事件发生的概率 P(y=1∣x),并通过逻辑函数(Sigmoid) 将输出值限制在 (0,1) 之间,使其可以被解释为概率。
2. 逻辑回归的数学原理
2.1 线性回归的不足
假设我们使用线性回归来做二分类问题:
然后我们希望通过某个阈值来决定类别:
- 如果 y ≥ 0.5,分类为 1;
- 如果 y < 0.5,分类为 0。
但这样有以下问题:
- 输出值没有限制:y 的取值范围是 (−∞,+∞),但概率的范围应该是 (0,1)。
- 缺乏概率解释:二分类问题需要输出概率,但线性回归的输出无法自然解释为概率。
2.2 逻辑回归的核心思想
逻辑回归通过Sigmoid 函数(S 形函数) 来将线性回归的输出转换为概率:
其中,Sigmoid 函数定义为:
性质:
- 当 z → +∞,σ(z) → 1;
- 当 z → −∞,σ(z) → 0;
- 当 z = 0,σ(z) = 0.5。
这个函数的形状如下:

这样,我们可以将输出值映射到 (0,1) 之间,并解释为概率。
2.3 逻辑回归的概率解释
逻辑回归实际上是在建模事件发生的概率:
可以改写为对数几率(Log-Odds):
其中:
- 左边是对数几率(log-odds),即事件发生和不发生的比值取对数;
- 右边是线性回归模型。
这说明逻辑回归是对数几率的线性模型,也是它名称中带有“回归”的原因。
3. 逻辑回归的损失函数
在训练逻辑回归模型时,我们需要找到合适的参数 w 和 b,使得模型对数据的预测概率尽可能接近真实值。
3.1 交叉熵损失
由于逻辑回归的输出是一个概率,我们不能直接使用均方误差(MSE),而是使用交叉熵损失(Cross Entropy Loss):
其中:
是真实标签(0 或 1);
是模型预测的概率。
损失函数的直觉理解
- 如果真实标签是 1,那么只有第一项
起作用,即希望模型预测的
尽可能接近 1,否则损失较大。
- 如果真实标签是 0,那么只有第二项
起作用,即希望模型预测的
尽可能接近 0,否则损失较大。
因此,最优的 w 和 b 是使得交叉熵损失最小的参数。
4. 逻辑回归的优化
为了找到最优参数 w 和 b,我们通常使用梯度下降法(Gradient Descent)进行优化。
4.1 梯度下降法
我们需要计算损失函数对参数的梯度,然后更新参数:
其中:
- α 是学习率(learning rate)。
和
是损失函数的梯度。
梯度计算如下:
然后使用梯度下降进行迭代更新,直到收敛。
4.2 其他优化方法
- 批量梯度下降(BGD):使用整个训练集计算梯度,适用于小规模数据。
- 随机梯度下降(SGD):每次随机选取一个样本更新参数,适用于大规模数据。
- 小批量梯度下降(Mini-Batch SGD):每次使用一个小批量的数据计算梯度,是最常用的方法。
5. 逻辑回归的应用
逻辑回归广泛应用于二分类问题,包括:
- 医学诊断(如判断患者是否患病)
- 信用评分(如判断贷款申请人是否违约)
- 垃圾邮件检测(如判断邮件是否是垃圾邮件)
- 广告点击率预测(如预测用户是否会点击广告)
此外,逻辑回归还可以扩展到多分类问题(Softmax 回归),用于处理多个类别的分类任务。
6. Python 代码实现
可以使用 sklearn 直接实现逻辑回归:
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score# 生成数据集
X, y = make_classification(n_samples=1000, n_features=5, random_state=42)# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)# 训练逻辑回归模型
model = LogisticRegression()
model.fit(X_train, y_train)# 预测
y_pred = model.predict(X_test)# 计算准确率
print("Accuracy:", accuracy_score(y_test, y_pred))
7. 结论
- 逻辑回归是用于二分类问题的概率模型。
- 使用 Sigmoid 函数将线性回归的输出映射到 (0,1) 之间。
- 使用交叉熵损失函数来优化参数。
- 可以使用梯度下降进行优化,在实际应用中广泛使用。
逻辑回归虽然简单,但在许多实际任务中表现良好,尤其适用于可解释性要求较高的任务。
相关文章:
【漫话机器学习系列】112.逻辑回归(Logistic Regression)
逻辑回归(Logistic Regression)详解 1. 逻辑回归简介 逻辑回归(Logistic Regression)是一种广泛用于二分类任务的统计和机器学习方法,尽管它的名字中带有“回归”,但它实际上是一种分类算法。 在逻辑回归…...
【计算机网络入门】初学计算机网络(六)
目录 1.回忆数据链路层作用 2. 组帧 2.1 四种组帧方法 2.1.1 字符计数法 2.1.2 字节填充法 2.1.3 零比特填充法 2.1.4 违规编码法 3. 差错控制 3.1 检错编码 3.1.1 奇偶校验码 3.1.2 CRC(循环冗余校验)校验码 3.2 纠错编码 3.2.1 海明校验码…...
DeepSeek 与云原生后端:AI 赋能现代应用架构
📝个人主页🌹:一ge科研小菜鸡-CSDN博客 🌹🌹期待您的关注 🌹🌹 1. 引言 在当今快速发展的互联网时代,云原生(Cloud Native)架构已成为后端开发的主流趋势。云…...
leetcode第17题求电话号码组合
原题出于leetcode第17题https://leetcode.cn/problems/letter-combinations-of-a-phone-number/description/题目如下: 题目稍微有点复杂,初看会感觉特别复杂,首先我们需要理清思路: 最后的结果是字母组合,因此遍历的是…...
DeepSeek-R1 论文笔记:通过强化学习提升大语言模型的推理能力
论文标题:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 作者团队:DeepSeek-AI 发表时间:2025 前置知识 & 术语 模型蒸馏 语言模型蒸馏的目标是将大型教师模型的知识(如语义理解、上…...
PDF文档中表格以及形状解析
我们在做PDF文档解析时有时需要解析PDF文档中的表格、形状等数据。跟解析文本类似的常见的解决方案也是两种。文档解析跟ocr技术处理。下面我们来看看使用文档解析的方案来做PDF文档中的表格、图形解析(使用pdfium库)。 表格解析: 在pdfium库…...
深入理解并实现自定义 unordered_map 和 unordered_set
亲爱的读者朋友们😃,此文开启知识盛宴与思想碰撞🎉。 快来参与讨论💬,点赞👍、收藏⭐、分享📤,共创活力社区。 在 C 的标准模板库(STL)中,unorder…...
228页PPT丨制造业核心业务流程优化咨询全案(战略营销计划生产研发质量),附核心系统集成架构技术支撑体系,2月26日资料已更新
一、订单全生命周期管理优化 1. 智能订单承诺(CTP)系统 ●集成ERP/APS/MES数据,实时计算产能可视性 ●应用蒙特卡洛模拟评估订单交付风险 ●建立动态插单评估模型(基于边际贡献与产能占用系数) 2. 跨部门协同机制…...
6.6.5 SQL访问控制
文章目录 GRANT授予权限REVOKE回收权限 GRANT授予权限 GRANT语句可以给用户授予权限,基本格式是GRANT 权限 TO 用户。在授权时,WITH GRANT OPTION是可选项,有此句话,被授予权限的用户还能把权限赋给其他用户。 REVOKE回收权限 RE…...
PhyloSuite v1.2.3安装与使用-生信工具049
PhyloSuite 一个好用的win集成建树平台,官方相关文档视频等做的可好了PhyloSuite (jushengwu.com) 官网 https://github.com/dongzhang0725/PhyloSuite/releases #官网 http://phylosuite.jushengwu.com/dongzhang0725.github.io/installation/ #官方说明文档…...
【语法】C++中string类中的两个问题及解答
贴主在学习string类时遇到过两个困扰我的问题,今天拿出来给大家分享一下我是如何解决的 一、扩容时capacity的增长问题 在string的capacity()接口中,调用的是这个string对象的容量(可以存多少个有效字符),而size()是调用的string对象现在有…...
智慧校园平台在学生学习与生活中的应用
随着科技的发展,教育领域也在不断探索新的模式与方法。智慧校园平台作为教育信息化的重要组成部分,正逐渐成为推动教育改革、提高教学质量的关键工具。 一.智慧校园平台概述 智慧校园平台是一种集成了教学管理、资源服务、数据分析等多功能于一体的数字…...
AtCoder Beginner Contest 001(A - 積雪深差、B - 視程の通報、C - 風力観測、D - 感雨時刻の整理)题解
由于我发现网上很少有人会发很久之前AtCoder Beginner Contes的题,所以我打算从AtCoder Beginner Contest 001开始写。大约两周一更,需要的可以订阅专栏,感谢支持Thanks♪(・ω・)ノ →题目翻译 A - 積雪深差…...
Windows本地Docker+Open-WebUI部署DeepSeek
最近想在自己的电脑本地部署一下DeepSeek试试,由于不希望污染电脑的Windows环境,所以在wsl中安装了ollama,使用ollama拉取DeepSeek模型。然后在Windows中安装了Docker Desktop,在Docker中部署了Open-WebUI,最后再在Ope…...
gmock和cppfreemock原理学习
1.gmock用法 gmock(Google Mock)是 Google Test 的一个扩展库,专门用于 C 单元测试中的模拟(mocking)。它的核心原理是通过 继承和方法重载/覆盖 来模拟 C 中的虚函数,从而在测试中隔离依赖对象࿰…...
WSBDF レクチア 定义2 引理3 wsbdf的乘子
定义2 引理3 wsbdf的乘子 ここまで 寝みます❓...
AI日记app
一、需求分析与竞品调研 1. 核心功能需求 多媒体日记记录:支持语音、视频、图片的实时录制或上传。语音/视频转文字:自动将音频、视频内容转为可编辑的文字。文字编辑与排版:富文本编辑(字体、颜色、标签)、Markdown…...
单一职责原则(设计模式)
目录 问题: 定义: 解决: 方式 1:使用策略模式 示例:用户管理 方式 2:使用装饰者模式 示例:用户操作 方式 3:使用责任链模式 示例:用户操作链 总结 推荐 问题&a…...
Odoo免费开源CRM技术实战:从商机线索关联转化为售后工单的应用
文 / 开源智造 Odoo金牌服务 Odoo:功能强大且免费开源的CRM Odoo 引入了一种高效的客户支持管理方式,即将 CRM 线索转换为服务台工单。此功能确保销售和支持团队能够无缝协作,从而提升客户满意度并缩短问题解决时间。通过整合 CRM 模块与服…...
ChatGPT与DeepSeek:开源与闭源的AI模型之争
目录 一、模型架构与技术原理 二、性能能力与应用场景 三、用户体验与部署灵活性 四、成本与商业模式 五、未来展望与市场影响 六、总结 随着人工智能技术的飞速发展,ChatGPT和DeepSeek作为两大领先的AI语言模型,成为了行业内外关注的焦点。它们在…...
C语言(3)—循环、数组、函数的详解
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言一、函数二、循环与数组 1.循环2.数组 总结 前言 提示:以下是本篇文章正文内容,下面案例可供参考 一、函数 在C语言中,函数…...
架构师论文《论面向对象设计的应用与实现》
软考论文-系统架构设计师 摘要 我所在的公司是国内一家专注于智慧城市建设的科技企业,为适应城市数字化转型中对于高内聚、低耦合、可扩展性的技术需求,2021年3月,公司立项开发“智慧社区综合管理平台”,旨在整合物业管理、安防监…...
Deepseek Api Function Calling解析(tools、tool_calls)Deepseek函数调用流程图、Python代码示例
文章目录 Function Calling介绍**核心原理**1. **动态扩展模型能力**2. **JSON结构化交互** **实现步骤**(以支持Function Calling的模型为例)1. **定义可用函数**2. **模型匹配与生成**3. **开发者执行函数**4. **结果反馈给模型** **DeepSeek R1的当前…...
现代未来派品牌海报设计液体装饰英文字体安装包 Booster – Liquid Font
CS Booster – 具有动态流的液体显示字体 具有液体美感的现代显示字体 CS Booster 是一种未来主义的显示字体,采用流畅和有机的形式设计,赋予其流畅、灵活和不断移动的外观。独特的液体灵感形状和非刚性边缘使这款字体脱颖而出,提供一种既俏…...
python流水线自动化项目教程
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言1. 项目环境准备Python安装选择Python开发环境安装必要库 2. 数据获取与理解4. 模型训练流水线6. 模型保存7. 模型部署(简单 Web 服务)8…...
(十 四)趣学设计模式 之 策略模式!
目录 一、 啥是策略模式?二、 为什么要用策略模式?三、 策略模式的实现方式四、 策略模式的优缺点五、 策略模式的应用场景六、 总结 🌟我的其他文章也讲解的比较有趣😁,如果喜欢博主的讲解方式,可以多多支…...
EMO模型详解及代码复现
EMO定义 EMO(Efficient Mobile Networks)是一种 面向移动端的轻量化网络模型 ,旨在 在参数、FLOPs和性能之间实现平衡 ,特别适用于 密集预测任务 。EMO的设计理念源于对CNN和Transformer架构的深入理解,通过整合两者的优势,实现了高效的模型性能。 EMO的核心是 反向残差…...
kkfileview部署
kkfileview部署 链接: 官方文档 链接: gitee 链接: github 首先打开官网如下: OK,我们从官方文档的教程中看到,部署步骤如下: 是不是很简单,没错,于是我们按照步骤从码云上下载,然后解压,然…...
leetcode_34 在排序数组中查找元素的第一个和最后一个位置
1. 题意 给定一个非递减的数组,找出给定元素的开始位置和 结束位置。 2. 题解 题目要求复杂度为 log ( n ) \log (n) log(n), 因此不能用双指针了。 这个题目练习二分挺好的。 2.1 双指针 还是把双指针的写下来吧。 class Solution { public:vector<i…...
网络编程——UDP
UDP编程使用套接字(Socket)进行通信。下面是基于UDP协议进行网络编程的基本步骤。 1. 创建套接字 首先,客户端和服务器都需要通过 socket() 系统调用创建一个UDP套接字。 2. 配置地址和端口 UDP是无连接的,因此你不需要像TCP一…...

