当前位置：首页 > news >正文

机器学习之线性回归算法预测数据

news 2026/3/27 22:33:14

机器学习之线性回归算法预测数据

机器学习之线性回归算法预测数据
- 线性回归算法
- - 概念
  - 理解
  - 算法导入
  - 线性回归模型
  - 参数理解
  - 误差项分析
- LinearRegression理解
- - 参数理解
  - 返回值
  - 方法
  - 基本格式
- 预测一元线性回归数据
- - 问题及理解
  - 可视化数据理解
  - 数据预测
- 预测二元线性回归数据
- - 问题及理解
  - 数据测试
- 预测多元线性回归数据
- - 问题及理解
  - 数据测试

线性回归算法

概念

线性回归线性回归是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。

理解

有n个特征数据与数据结果有关，根据历史数据训练出线性回归模型，给定数据，预测结果。自变量为特征数据，因变量为数据结构。

算法导入

from sklearn.linear_model import LinearRegression

线性回归模型

一元线性回归
公式：
多元线性回归
公式：

参数理解

在这里插入图片描述

x可以理解为特征数据，y为要求的结果数据，线性回归只能求回归值，只能是数字结果。

误差项分析

误差项可以省略吗?
误差项不可省略，误差是必然产生的。并且由于产生了误差项，我们便可以基于误差的特点来进行对线性回归的参数估计的。
误差项有什么特点?
独立同分布。
每个样本点都是独立的，在同一个分布函数下。
例：贷款，每个人与每个间是没有联系的，贷多少钱完全基于你的工资和其他情况是独立的，同分布就是我的这套估计体系是我人民银行的估机体系，也就是说每个样本点是在同一个分布函数下。

LinearRegression理解

查看LinearRegression参数定义

def __init__(self,*,fit_intercept=True,normalize="deprecated",copy_X=True,n_jobs=None,positive=False,)

参数理解

fit_intercept：是否有截距（是否过原点）
normalize：是否归一化（归一化就是每个数据特征占比相同）
copy_X：是否复制x数据
n_jobs：任务个数占比CPU（-1代表所有）

一般不用设置，默认就可。

返回值

intercept：截距（β0）

(l.intercept_[0],2)

coef：系数（也就是β）

(l.coef_[0][0],2),如果有多个系数，更改第二个[0],为相应顺序，索引从0开始，第二个为(l.coef_[0][1],2),。

方法

fit(x,y)：训练模型，x为特征数据，y为结果
score(x,y)：拟合度，x,y为已知的数据及结果，计算fit()模型与数据的拟合度在[0,1]间，趋于1优，趋于0劣
predict([[]数据])：预测数据结果，括号内为二维数组
corr()：数据相关系数判断,若特征数据与数据结果的相关系数的绝对值为r，则
- r>=0.8，高度相关
- 0.5<=r<0.8，中度相关
- 0.3<=r<0.5，低度相关
- r<0.3，相关度极弱，可以视为不相关

基本格式

**
l = LinearRegression()
x=特征数据
y=数据结果
l.fit(x,y)
result = l.predict(x1)**
先引用LinearRegression函数，根据历史特征数据和数据结果，训练fit()模型，然后预测x1的回归结果result

预测一元线性回归数据

问题及理解

问题：给广告投入和销售额数据，预测其他广告投入的销售额

特征数据：广告投入
类别标签：销售额
给定的数据：
在这里插入图片描述

可视化数据理解

代码展示：

import pandas as pd
from matplotlib import pyplot as plt
from sklearn.linear_model import LinearRegressiondata = pd.read_csv('data.csv')
co = data.corr()plt.scatter(data.广告投入,data.销售额)
plt.show()

运行结果：
在这里插入图片描述

数据预测

代码展示：

import pandas as pd
from matplotlib import pyplot as plt
from sklearn.linear_model import LinearRegressiondata = pd.read_csv('data.csv')
co = data.corr()plt.scatter(data.广告投入,data.销售额)
plt.show()l = LinearRegression()
# 特征标签
x = data[['广告投入']]
# 回归结果
y = data[['销售额']]
# # 训练模型
l.fit(x,y)
# 拟合度
corr = data.corr()
re = l.predict(x)
sc = l.score(x,y)
# 截距
inte = round(l.intercept_[0],2)
# 系数
coef = round(l.coef_[0][0],2)
res = l.predict([[34]])
print(inte,coef)
print(f'一元线性回归：y={inte}+{coef}*x')
print(f'工资:34,预测：{res}')

运行结果：
相关系数调试查看：在这里插入图片描述

预测二元线性回归数据

问题及理解

问题：给体重、年龄和血压数据，预测其他体重、年龄的血压

特征数据：体重、年龄
类别标签：血压
给定的数据：

在这里插入图片描述

数据测试

代码展示：

import pandas as pd
from sklearn.linear_model import LinearRegression
data_2 = pd.read_csv('data2.csv', encoding='gbk')
# print(data_2)
co_2 = data_2.corr()
x_2 = data_2[['体重','年龄']]
y_2 = data_2[['血压收缩']]
ll = LinearRegression()
ll.fit(x_2,y_2)
# 预测结果
re_2 = ll.predict(x_2)
# 拟合度
sc_2 = ll.score(x_2,y_2)
# 截距
in_2 = round(ll.intercept_[0],2)
# 系数
coef_2 = round(ll.coef_[0][0],2)
coef_2_2 = round(ll.coef_[0][1],2)
print(in_2,coef_2,coef_2_2)
print(f'二元线性回归：y={in_2}+{coef_2}*x+{coef_2_2}*x2')
# 测试
result = ll.predict([[76,50]])
print(f'体重：70，年龄：50，血压预测：{result}')

运行结果：
在这里插入图片描述

预测多元线性回归数据

问题及理解

问题：给age,sex,bmi,bp,s1,s2,s3,s4,s5,s6和target数据，预测其他age,sex,bmi,bp,s1,s2,s3,s4,s5,s6的target

特征数据：age,sex,bmi,bp,s1,s2,s3,s4,s5,s6
类别标签：target
给定的数据：
在这里插入图片描述

数据测试

代码展示：

import pandas as pd
from sklearn.linear_model import LinearRegression
tdata = pd.read_csv('tnb.csv')
# age,sex,bmi,bp,s1,s2,s3,s4,s5,s6,target
# 拟合度
corr = tdata.corr()
l = LinearRegression()# 特征数据
x = tdata[["age","sex","bmi","bp","s1","s2","s3","s4","s5","s6"]]
y = tdata[['target']]
l.fit(x,y)
sc = l.score(x,y) #0.51,0.49
print(sc)
inte = round(l.intercept_[0],2)
# 系数
coef1 = round(l.coef_[0][0],2)
coef2 = round(l.coef_[0][1],2)
coef3 = round(l.coef_[0][2],2)
coef4 = round(l.coef_[0][3],2)
coef5 = round(l.coef_[0][4],2)
coef6 = round(l.coef_[0][5],2)
coef7 = round(l.coef_[0][6],2)
coef8 = round(l.coef_[0][7],2)
coef9 = round(l.coef_[0][8],2)
coef10 = round(l.coef_[0][9],2)
#0.0380759064334241,0.0506801187398187,0.0616962065186885,0.0218723549949558,-0.0442234984244464,-0.0348207628376986,-0.0434008456520269,-0.00259226199818282,0.0199084208763183,-0.0176461251598052
re = l.predict([[0.0380759064334241,0.0506801187398187,0.0616962065186885,0.0218723549949558,-0.0442234984244464,-0.0348207628376986,-0.0434008456520269,-0.00259226199818282,0.0199084208763183,-0.0176461251598052]])
print(f'预测：{re}')
print(f'线性回归：y={inte}+{coef1}*x1+{coef2}*x2+{coef3}*x3+{coef4}*x4+{coef5}*x5+{coef6}*x6+{coef7}*x7+{coef8}*x8+{coef9}*x9+{coef10}+*x10')

运行结果：

在这里插入图片描述

机器学习之线性回归算法预测数据

机器学习之线性回归算法预测数据目录机器学习之线性回归算法预测数据线性回归算法概念理解算法导入线性回归模型参数理解误差项分析 LinearRegression理解参数理解返回值方法基本格式预测一元线性回归数据问题及理解可视化数据理解数据预测预测二元线性回归数据问题及理解数…...

编程日记 2024/12/30 14:37:13

Python | 如何在Matplotlib中仅绘制热图的上/下三角形

热图是一种强大的可视化工具，用于以矩阵格式表示数据，其中各个值由颜色表示。它们对于可视化相关矩阵特别有用，其中矩阵的对称性质使得显示上下三角形变得多余。本文将指导您使用Matplotlib（Python中流行的绘图库）仅绘…...

编程日记 2024/12/30 14:35:11

Leetcode经典题20--长度最小的子数组

题目描述给定一个含有 n 个正整数的数组和一个正整数 target 。找出该数组中满足其总和大于等于 target 的长度最小的子数组 [numsl, numsl1, ..., numsr-1, numsr] ，并返回其长度。如果不存在符合条件的子数组，返回 0 。输入输出示例输入&…...

编程日记 2024/12/30 14:34:10

【计算机视觉】超简单！维纳滤波的经典案例

Hey小伙伴们！今天来给大家分享一个计算机视觉中非常经典且实用的技术——维纳滤波（Wiener Filter）。维纳滤波是一种基于最小均方误差准则的滤波方法，广泛应用于图像去噪、模糊恢复等领域。它不仅可以有效去除图像中的噪声&#…...

编程日记 2024/12/30 14:32:08

【closerAI ComfyUI】快速洗图！高效快速的提示词反推节点——cliption，让洗图出图快人一步不爆显存！

添加图片注释，不超过 140 字（可选）【closerAI ComfyUI】快速洗图！高效快速的提示词反推节点——cliption，让洗图出图快人一步不爆显存！大家好，我是Jimmy。反推提示词的节点有很多，像Florence2 、Joycaption2、喵手等。都是非常优秀的。但是呢，就是占用设备资源，加…...

编程日记 2024/12/30 14:28:02

AE Dressler CESAR 1312 Generator Model User Manual

AE Dressler CESAR 1312 Generator Model User Manual...

编程日记 2024/12/30 14:27:00

【513. 找树左下角的值中等】

题目： 给定一个二叉树的根节点 root，请找出该二叉树的最底层最左边节点的值。假设二叉树中至少有一个节点。示例 1: 输入: root [2,1,3] 输出: 1 示例 2: 输入: [1,2,3,4,null,5,6,null,null,7] 输出: 7 提示: 二叉树的节点个数的范围是 …...

编程日记 2024/12/30 14:24:55

网络通信的瑞士军刀：Python socket库全解析

文章目录网络通信的瑞士军刀：Python socket库全解析背景库介绍安装与重要性简单库函数使用方法场景应用常见Bug及解决方案总结网络通信的瑞士军刀：Python socket库全解析背景在现代编程中，网络通信是不可或缺的一部分。无论是构建客户端…...

编程日记 2024/12/30 14:23:52

【笔记️】魔爪 Mini mx 使用快捷键

B站教程地址：MOZA魔爪的个人空间-MOZA魔爪个人主页-哔哩哔哩视频 1、开关键: 单击 → 开启录制/拍照 → 再次单击结束；休眠时,单击晚醒双击 → 切换拍照/录制模式三击 → 切换横竖拍长按 → 关机 2、变焦键: 单击 → 切换航向俯仰跟随模式 ( 开机默…...

编程日记 2024/12/30 14:21:50

去除 el-input 输入框的边框（element-ui@2.15.13）

dgqdgqdeMac-mini spid-admin % yarn list --pattern element-ui yarn list v1.22.22 └─ element-ui2.15.13 ✨ Done in 0.23s.dgqdgqdeMac-mini spid-admin % yarn list vue yarn list v1.22.22 warning Filtering by arguments is deprecated. Please use the pattern opt…...

编程日记 2024/12/30 14:18:47

Vue中的一些用法

一、验证规则： 身份证的验证规则： 电话号码的验证规则： 二、选中一项后禁用其他选项： data(){ return{ dataForm{ medicalHistory:[] } }, 三、多选框选择后页面中不显示数据： 在表单提交时加 .join(",&…...

编程日记 2024/12/30 14:16:45

异步爬虫之协程的基本原理

我们知道爬虫是 IO 密集型任务，例如使用 requests 库来爬取某个站点，当发出一个请求后，程序必须等待网站返回响应，才能接着运行，而在等待响应的过程中，整个爬虫程序是一直在等待的，实际上没有做…...

编程日记 2024/12/30 14:15:44

Diffusion Transformer(DiT)——将扩散过程中的U-Net换成ViT：近频繁用于视频生成与机器人动作预测(含清华PAD详解)

前言本文最开始属于此文《视频生成Sora的全面解析：从AI绘画、ViT到ViViT、TECO、DiT、VDT、NaViT等》但考虑到DiT除了广泛应用于视频生成领域中，在机器人动作预测也被运用的越来越多，加之DiT确实是一个比较大的创新，影响力大&…...

编程日记 2024/12/30 14:14:43

CPT203 Software Engineering 软件工程 Pt.2 敏捷方法和需求工程（中英双语）

文章目录 3. Aglie methods（敏捷方法）3.1 Aglie methods（敏捷方法）3.1.1 特点3.1.2 优点3.1.3 缺点3.1.4 原则3.1.5 计划驱动与敏捷方法的对比 3.2 Scrum3.2.1 Scrum roles3.2.2 Scrum Activities and Artifacts3.2.2.1 Product B…...

编程日记 2024/12/30 14:12:41

【Git】-- 在本地执行 git fetch 发生异常

目录 1、现象 2、解决参考 2.1 检查网络连接 2.2 更新 Git 客户端 2.3 更改 GitHub URL 的访问协议 2.4 禁用 SSL 验证（临时解决） 2.5 检查系统的 CA 证书 2.6 重新克隆仓库 1、现象在本地执行 $ git fetch upstream 时，抛出以下…...

编程日记 2024/12/30 14:11:40

Apache Doris 创始人：何为“现代化”的数据仓库？

在 12 月 14 日的 Doris Summit Asia 2024 上，Apache Doris 创始人 & PMC 成员马如悦在开场演讲中，围绕“现代化数据仓库”这一主题，指出 3.0 版本是 Apache Doris 研发路程中的重要里程碑，他将这一进展总结为“实时之路”、“…...

编程日记 2024/12/30 14:06:34

高校网络安全存在的问题与对策研究

目　录摘　要1 第1章引言2 1.1研究背景2 1.2研究意义2 第2章系统开发的相关技术简介3 2.1 Spring boot框架3 2.2 MySQL简介3 2.3 Vue框架3 2.4 JAVA简介3 第3章系统需求分析4 3.1可行性分析4 3.1.1技术可行性4 3.1.2运行可行性4 3.1.3经济可行性5 3.2功能需求…...

编程日记 2024/12/30 14:04:32

Redis的数据类型，线程，持久化机制

1. Redis是单线程还是多线程的，为什么？ Redis是单线程的（传统实现） Redis在传统的实现中是单线程的。尽管它处理的任务很多，但它使用单线程来处理所有客户端的请求。这个设计决策有几个关键原因： 简化模型…...

编程日记 2024/12/30 13:58:26

什么是ondelete cascade以及使用sqlite演示ondelete cascade使用案例

什么是ondelete cascade ‌ON DELETE CASCADE是数据库中的一种约束，用于自动删除相关的记录‌。具体来说，当一个表中的记录（父表）被删除时，与其相关的其他表（子表）中的记录也会被自动删除&…...

编程日记 2024/12/30 13:52:20

Java设计模式 —— 【结构型模式】享元模式（Flyweight Pattern）详解

文章目录概述结构案例实现优缺点及使用场景概述享元模式也叫蝇量模式：运用共享技术有效地支持大量细粒度的对象； 常用于系统底层开发，解决系统的性能问题。像数据库连接池，里面都是创建好的连接对象，在这些连接对象…...

编程日记 2024/12/30 13:51:19

2026年03月26日全球AI前沿动态

一句话总结全球AI领域密集发布技术、产品、企业动态，覆盖通用/垂直大模型、专项技术、智能体、机器人、硬件基建等全赛道，中国AI在视频、音乐、办公智能体领域领跑，OpenAI关停Sora战略转型，Arm、苹果、腾讯等大厂新品落地&#xf…...

编程新知 2026/3/27 22:20:11

2026必看：八款热门AI编程工具横评

一、AI编程工具榜单综述当下AI技术全面渗透软件开发领域，各类AI编程工具大幅降低了开发门槛、提升了编码效率，成为开发者必备的效率神器。本次横评精选海内外8款主流产品，覆盖AI原生IDE、插件式编程助手等不同形态，全方位盘点各工…...

编程新知 2026/3/27 20:15:08

通用多模态检索——大模型微调

1、7B的模型，参数量就占到了16G，而且你要检索，要把所有的候选项candidate全部变成向量嵌入，然后计算相似度，3090的24G显存很容易爆，而且数据量一旦大了一点，达到几万，基本就很难跑通…...

编程新知 2026/3/27 19:40:59

AI写教材大揭秘！低查重技巧让你的教材脱颖而出！

在编写教材时，依赖相关资料是必不可少的，但传统的资料整合方法已经无法满足现实需求。以往，我们需要从各种渠道，比如课标文件、学术研究以及教学案例中寻找所需的信息，这往往需要耗费数天的时间。即便信息搜集齐全&…...

编程新知 2026/3/27 18:36:36

为ROS开发准备：在拯救者Y7000上搭建Win11+Ubuntu22.04双系统全流程

拯救者Y7000 Win11与Ubuntu22.04双系统配置：ROS开发环境搭建实战手册在机器人操作系统（ROS）开发领域，稳定的Linux环境是必不可少的基石。对于使用拯救者Y7000这类高性能笔记本的开发者而言，如何在保留Windows11系统的…...

编程新知 2026/3/27 18:30:32

C语言诞生秘史：从被逼出到首个编译器的坎坷之路

C语言，是运用C语言自身来进行编译的，这一情况听起来好似那鸡生蛋、蛋生鸡这般，但早年贝尔实验室的那帮人实则真就把它给做成了，并非依靠魔法做到的，而是被逼迫到那种程度才达成的。被逼出来的语言临近1970年的时候 &am…...

编程新知 2026/3/27 18:18:14

智慧生鲜配送：揭秘生鲜配送商城APP功能版块设计

在数字化消费浪潮中，生鲜配送商城APP成为居民采购食材的重要渠道。其功能版块设计聚焦用户需求，通过智能化、便捷化的操作体验，打造高效生鲜购物场景。以下揭秘其核心功能玩法，解析如何实现“从指尖到餐桌”的流畅服务。一、首页&…...

编程新知 2026/3/27 17:39:59

Comsol光学仿真连续域束缚态BIC，te，tm模式耦合，透射光谱远场偏振矢量（导出数据计算）

Comsol光学仿真连续域束缚态BIC，te，tm模式耦合，透射光谱远场偏振矢量（导出数据计算），所见即所得【手指在键盘上停顿三秒】这周在实验室搞COMSOL光学仿真差点被边界条件逼疯，连续域束缚态(BIC)…...

编程新知 2026/3/27 17:27:57

突破联想笔记本BIOS限制：LEGION BIOS高级设置工具全解析

突破联想笔记本BIOS限制：LEGION BIOS高级设置工具全解析【免费下载链接】LEGION_Y7000Series_Insyde_Advanced_Settings_Tools 支持一键修改 Insyde BIOS 隐藏选项的小工具，例如关闭CFG LOCK、修改DVMT等等项目地址: https://gitcode.com/gh_mirrors…...

编程新知 2026/3/27 15:22:56

PETRV2-BEV模型的高精度3D车道检测效果展示

PETRV2-BEV模型的高精度3D车道检测效果展示 1. 引言想象一下，一辆自动驾驶汽车在复杂的城市道路中行驶，需要实时识别车道线、判断可行驶区域、预测周围车辆轨迹。这背后离不开一项关键技术——3D车道检测。传统的2D检测方法在复杂道路场景中往往力不从…...

编程新知 2026/3/27 14:48:47

机器学习之线性回归算法预测数据

目录

线性回归算法

概念

理解

算法导入

线性回归模型

参数理解

误差项分析

LinearRegression理解

参数理解

返回值

方法

基本格式

预测一元线性回归数据

问题及理解

可视化数据理解

数据预测

预测二元线性回归数据

问题及理解

数据测试

预测多元线性回归数据

问题及理解

数据测试

相关文章：