当前位置：首页 > news >正文

【机器学习算法基础】（基础机器学习课程）-10-逻辑回归-笔记

news 2025/7/12 9:19:08

一、模型的保存与加载

逻辑回归是一种常见的机器学习算法，广泛用于分类问题。为了在不同的时间或环境下使用训练好的模型，我们通常需要将其保存和加载。

保存模型

训练模型：首先，你需要用你的数据训练一个逻辑回归模型。例如，在Python中使用scikit-learn库，你可以这样做：
```
from sklearn.linear_model import LogisticRegression 
model = LogisticRegression() 
model.fit(X_train, y_train)
```
保存模型：训练好模型后，你需要将其保存到一个文件中。这样你就不需要每次都重新训练模型。常用的方法是使用Python的pickle库或joblib库。以下是使用joblib库的示例：
```
import joblib
joblib.dump(model, 'logistic_regression_model.pkl')
```
这里的'logistic_regression_model.pkl'是你保存模型的文件名。你可以选择任何合适的文件名和路径。

加载模型

加载模型：当你需要使用之前保存的模型时，可以将其从文件中加载回来。继续使用joblib库，加载模型的方法如下：
```
model = joblib.load('logistic_regression_model.pkl')
```
使用模型进行预测：加载模型后，你就可以直接使用它进行预测，而不需要重新训练模型。例如：

使用模型进行预测：加载模型后，你就可以直接使用它进行预测，而不需要重新训练模型。例如：

    predictions = model.predict(X_test)

总结

为什么保存模型？ 保存模型的主要目的是为了节省时间和计算资源。训练模型可能需要大量的数据和时间，而保存模型后可以在需要时直接加载和使用。
保存模型的方法：常用的库包括pickle和joblib，joblib在处理大文件时效率更高。
加载模型：加载模型非常简单，只需一行代码就可以将保存的模型加载回来，方便快速进行预测或分析。

实际应用场景

想象你是一个数据科学家，在一个项目中你花了几个小时甚至几天时间来训练一个逻辑回归模型，用于预测某些客户是否会购买你的产品。模型训练好了，你不希望每次运行预测时都重新训练模型，所以你会将其保存。当你需要在下个月或明年再次运行预测时，你只需要加载保存好的模型，而无需重新训练，大大节省了时间和资源。

这种方法不仅适用于逻辑回归模型，还适用于其他机器学习模型，如决策树、支持向量机和神经网络等。模型的保存与加载是机器学习工作流程中非常重要的一部分，可以提高效率和便利性。

二、逻辑回归定义，损失函数，优化与线性回归比较

逻辑回归是一种用于分类问题的机器学习算法，尽管名字中有“回归”二字，但它实际上用于二分类或多分类任务。

小结

逻辑回归用于分类问题，通过逻辑函数将线性模型的输出映射到概率值。
损失函数为对数损失函数，最小化它以优化模型。
优化方法主要为梯度下降。
与线性回归的比较显示了它们在任务、输出、假设、模型和损失函数上的不同之处。

三、逻辑回归预测癌症案例

场景设定

假设我们有一组数据，记录了若干患者的健康状况及其是否患有癌症。数据包括患者的年龄、体重、是否吸烟等信息，以及是否患有癌症（0表示未患癌，1表示患癌）。

目标

我们的目标是利用这些数据训练一个逻辑回归模型，当我们输入新的患者信息时，模型可以预测该患者是否患有癌症的概率。

步骤

收集和准备数据：

数据集可能包含以下信息：

| 年龄 | 体重 | 吸烟 | 是否患癌 |
|----|----|----|-------|
| 45 | 70 | 1  | 1     |
| 50 | 65 | 0  | 0     |
| 40 | 80 | 1  | 1     |
| 30 | 60 | 0  | 0     |

每一行代表一个患者的信息。

训练模型：

使用这些数据来训练逻辑回归模型。

from sklearn.linear_model import LogisticRegression
import pandas as pd# 假设数据已经被加载到一个DataFrame中
data = pd.DataFrame({'age': [45, 50, 40, 30],'weight': [70, 65, 80, 60],'smoke': [1, 0, 1, 0],'cancer': [1, 0, 1, 0]
})X = data[['age', 'weight', 'smoke']]
y = data['cancer']model = LogisticRegression()
model.fit(X, y)

保存模型：
- 训练好模型后，将其保存到文件中，以便后续使用。
```
import joblib
joblib.dump(model, 'cancer_prediction_model.pkl')
```
加载模型和预测：

当有新的患者信息时，可以加载保存的模型并进行预测。

# 加载模型
model = joblib.load('cancer_prediction_model.pkl')# 新患者的信息
new_patient = [[50, 70, 1]]# 预测该患者患癌的概率
cancer_probability = model.predict_proba(new_patient)[0][1]
print(f'该患者患癌的概率是: {cancer_probability:.2f}')

结果解释

输出结果：模型会输出一个概率值，表示患者患癌的可能性。例如，输出值为0.81，表示该患者有81%的可能性患癌。

逻辑回归在癌症预测中的优势

处理概率问题：逻辑回归擅长处理二分类问题，如“是否患癌”这种是或否的问题。
概率输出：模型提供概率值而不是简单的分类，有助于医生根据概率值做进一步判断。
解释性强：逻辑回归的模型参数可以解释每个特征对预测结果的影响，帮助理解哪些因素更容易导致癌症。

小结

通过这个案例，我们可以看到逻辑回归在实际生活中的应用。它通过学习患者的历史数据，构建一个模型，帮助预测新患者是否患有癌症。这种方法不仅高效，而且能够提供概率结果，辅助医生进行决策。

四、逻辑回归总结

【机器学习算法基础】（基础机器学习课程）-10-逻辑回归-笔记

一、模型的保存与加载逻辑回归是一种常见的机器学习算法，广泛用于分类问题。为了在不同的时间或环境下使用训练好的模型，我们通常需要将其保存和加载。保存模型训练模型：首先，你需要用你的数据训练一个逻辑回归模型。例如&…...

编程日记 2024/8/4 15:06:00

自动驾驶行业知识汇总

应届生月薪2W的自动驾驶开发、机器人、后端开发，软件开发该如何学习相关技术栈_哔哩哔哩_bilibili 两万字详解自动驾驶开发工具链的现状与趋势 (qq.com) 九章智驾 - 2023年度文章大合集 (qq.com) 九章 - 2022年度文章大合集 (qq.com)...

编程日记 2024/8/4 15:04:59

C#根据反射操作对象

前言反射使用，让我们的程序可以动态增加一些功能，让原本固化的步骤逻辑变得动态，这是它的优点。当然使用反射首次加载会有性能损耗以及使用复杂；但是现在大家都在讲动态，使用好它应该是一个重要的编程理念提升。MVC、…...

编程日记 2024/8/4 15:03:58

打包python脚本（flask、jinja2）为exe文件

20240803 概述在我很早时候学习python的时候，就利用过某个工具将其打包为exe文件，然后在没有python环境的机器上运行，这样可以减少安装python环境和各种库的过程。最近在开发一个在虚拟机上运行的程序的时候就遇到了打包一些环境的问题&…...

编程日记 2024/8/4 14:59:54

嵌入式初学-C语言-练习三

#部分题目可能在之前的博客中有，请谅解，保证常见题型均被发出# 1.计算n以内所有正奇数的和 ? n值通过键盘输入代码： 1 /*2 需求：计算n以内所有正奇数的和 ? n值通过键盘输入3 */4 #include <stdio.h>5 6 int main()7 …...

编程日记 2024/8/4 14:55:49

一、需求描述实现简易版的B/S架构 1.1 Server package com.itheima.tcp4;import java.io.IOException; import java.net.ServerSocket; import java.net.Socket; import java.util.concurrent.ArrayBlockingQueue; import java.util.concurrent.Executors; import java.uti…...

编程日记 2024/8/4 14:53:47

【前端面试】五、框架

目录 1 Vue2 2 Vue3 3 React 4 Angular 1 Vue2 Vue2 是目前仍被广泛使用的前端框架之一，其特点包括响应式数据绑定、组件化开发等。响应式系统：Vue2 使用 Object.defineProperty 来实现数据的响应式。每个组件实例在创建时，会将 dat…...

编程日记 2024/8/4 14:52:45

C语言 | Leetcode C语言题解之第316题去除重复字母

题目： 题解： char* removeDuplicateLetters(char* s) {int vis[26], num[26];memset(vis, 0, sizeof(vis));memset(num, 0, sizeof(num));int n strlen(s);for (int i 0; i < n; i) {num[s[i] - a];}char* stk malloc(sizeof(char) * 27);int stk…...

编程日记 2024/8/4 14:51:44

本地部署 Llama-3-EvoVLM-JP-v2

本地部署 Llama-3-EvoVLM-JP-v2 0. 引言1. 关于 Llama-3-EvoVLM-JP-v22. 本地部署2-0. 克隆代码2-1. 安装依赖模块2-2. 创建 Web UI2-3.启动 Web UI2-4. 访问 Web UI 0. 引言 Sakana AI 提出了一种称为进化模型合并的方法，并使用该方法创建大规模语言模型&#xff…...

编程日记 2024/8/4 14:49:42

Evaluating the Generation Capabilities of Large Chinese Language Models

文章目录题目摘要相关工作CG-Eval实验题目评估大型中文语言模型的生成能力论文地址：https://arxiv.org/abs/2308.04823 项目地址：http://cgeval.besteasy.com/ 摘要本文介绍了 CG-Eval，这是有史以来第一个全面的自动化评估框架&#xf…...

编程日记 2024/8/4 14:48:41

YOLOv8添加注意力模块并测试和训练

YOLOv8添加注意力模块并测试和训练参考bilibili视频 yolov8代码库中写好了注意力模块，但是yolov8的yaml文件中并没用使用它，如下图的通道注意力和空间注意力以及两者的结合CBAM，打开conv.py文件可以看到，其中包含了各种卷积块的…...

编程日记 2024/8/4 14:43:36

「Unity3D」自动布局LayoutElement、ContentSizeFitter、AspectRatioFitter、GridLayoutGroup

布局元素与布局控制器布局元素实现ILayoutElement接口，布局控制器实现ILayoutController接口，后者根据前者的属性控制具体布局——有些布局控制器也是布局元素，即同时实现这两个接口，如LayoutGroup。 public interface ILayout…...

编程日记 2024/8/4 14:41:34

【Golang 面试 - 进阶题】每日 3 题（十六）

✍个人博客：Pandaconda-CSDN博客 📣专栏地址：http://t.csdnimg.cn/UWz06 📚专栏简介：在这个专栏中，我将会分享 Golang 面试中常见的面试题给大家~ ❤️如果有收获的话，欢迎点赞👍收藏…...

编程日记 2024/8/4 14:40:33

Redis2

为什么Redis要给缓存数据设置过期时间？ 内存是有限的，如果缓存中的所有数据都是一直保存，很容易OOM Redis如何判断数据是否过期？ 通过过期字典来保存数据的过期时间过期删除策略 Redis采用的是定期删除惰性删除 Redis内存淘…...

编程日记 2024/8/4 14:38:31

C语言--函数

1. 函数定义语法： 类型标识符函数名（形式参数） {函数体代码 } （1）类型标识符 --- 数据类型（函数要带出的结果的类型） 注：数组类型不能做函数返回结果的类型，如果函…...

编程日记 2024/8/4 14:35:29

Shell 编程的高级技巧和实战应用

第一步：高级函数和模块化设计 1.1 高级函数设计探讨函数的参数处理和默认值设置。示例：实现一个可以处理可选参数的函数。 #!/bin/bashgreet() {local name${1:-"World"} # 如果没有提供参数，使用默认值 "World"ech…...

编程日记 2024/8/4 14:34:26

VMWare虚拟机如何连接U盘

检查配置 1）Win R键，输入services.msc，打开服务。 2）将AMware USB Arbitration Services 服务开启，并设置为自动启动； 连接U盘目前作者了解有两种连接方式，如有其他连接方式，欢…...

编程日记 2024/8/4 14:33:25

【学习笔记】后缀自动机（SAM）

前言之前对后缀自动机的理解太浅薄了，故打算重新写一篇。后缀自动机是什么后缀自动机是一个字符串的所有后缀建起来的自动机。它把所有子串（后缀的前缀）用 O ( n ) O(n) O(n) 的空间装了起来。后缀自动机的边会构成一个 D A G DAG DA…...

编程日记 2024/8/4 14:32:24

Godot的节点与场景

要深入的理解节点与场景，我们需要跳出这两个概念来看他。说的再直白一些godot本质就是一个场景编辑器！ 场景的概念应该在我们平时看电影看电视时会经常提到，比如某一个打斗的场景，这个场景可能会被设在某一个街道，那么…...

编程日记 2024/8/4 14:31:23

应用升级/灾备测试时使用guarantee 闪回点迅速回退

1.场景应用要升级,当升级失败时,数据库回退到升级前. 要测试系统,测试完成后,数据库要回退到测试前。相对于RMAN恢复需要很长时间， 数据库闪回只需要几分钟。 2.技术实现数据库设置 2个db_recovery参数创建guarantee闪回点，不需要开启数据库闪回。…...

编程新知 2025/6/17 3:47:36

基于FPGA的PID算法学习———实现PID比例控制算法

基于FPGA的PID算法学习前言一、PID算法分析二、PID仿真分析1. PID代码2.PI代码3.P代码4.顶层5.测试文件6.仿真波形总结前言学习内容：参考网站： PID算法控制 PID即：Proportional（比例）、Integral（积分&…...

编程新知 2025/7/10 19:38:30

FFmpeg 低延迟同屏方案

引言在实时互动需求激增的当下，无论是在线教育中的师生同屏演示、远程办公的屏幕共享协作，还是游戏直播的画面实时传输，低延迟同屏已成为保障用户体验的核心指标。FFmpeg 作为一款功能强大的多媒体框架，凭借其灵活的编解码、数据…...

编程新知 2025/6/21 15:38:27

循环冗余码校验CRC码算法步骤+详细实例计算

通信过程：（白话解释） 我们将原始待发送的消息称为 M M M，依据发送接收消息双方约定的生成多项式 G ( x ) G(x) G(x)（意思就是 G （ x ) G（x) G（x) 是已知的）&#xff0…...

编程新知 2025/7/6 21:03:33

Day131 | 灵神 | 回溯算法 | 子集型子集

Day131 | 灵神 | 回溯算法 | 子集型子集 78.子集 78. 子集 - 力扣（LeetCode） 思路： 笔者写过很多次这道题了，不想写题解了，大家看灵神讲解吧回溯算法套路①子集型回溯【基础算法精讲 14】_哔哩哔哩_bilibili 完…...

编程新知 2025/7/11 18:58:27

【算法训练营Day07】字符串part1

文章目录反转字符串反转字符串II替换数字反转字符串题目链接：344. 反转字符串双指针法，两个指针的元素直接调转即可 class Solution {public void reverseString(char[] s) {int head 0;int end s.length - 1;while(head < end) {char temp …...

编程新知 2025/6/25 3:04:08

12.找到字符串中所有字母异位词

🧠 题目解析题目描述： 给定两个字符串 s 和 p，找出 s 中所有 p 的字母异位词的起始索引。返回的答案以数组形式表示。字母异位词定义： 若两个字符串包含的字符种类和出现次数完全相同，顺序无所谓，则互为…...

编程新知 2025/7/10 17:23:18

uniapp中使用aixos 报错

问题： 在uniapp中使用aixos，运行后报如下错误： AxiosError: There is no suitable adapter to dispatch the request since : - adapter xhr is not supported by the environment - adapter http is not available in the build 解决方案&…...

编程新知 2025/7/6 16:08:12

RNN避坑指南：从数学推导到LSTM/GRU工业级部署实战流程

本文较长，建议点赞收藏，以免遗失。更多AI大模型应用开发学习视频及资料，尽在聚客AI学院。本文全面剖析RNN核心原理，深入讲解梯度消失/爆炸问题，并通过LSTM/GRU结构实现解决方案，提供时间序列预测和文本生成…...

编程新知 2025/7/12 9:10:41

力扣-35.搜索插入位置

题目描述给定一个排序数组和一个目标值，在数组中找到目标值，并返回其索引。如果目标值不存在于数组中，返回它将会被按顺序插入的位置。请必须使用时间复杂度为 O(log n) 的算法。 class Solution {public int searchInsert(int[] nums, …...

编程新知 2025/7/10 1:51:09