简单线性回归:预测事物间简单关系的利器
文章目录
- 🍀简介
- 🍀什么是简单线性回归?
- 🍀简单线性回归的应用场景
- 使用步骤:
- 注意事项:
- 🍀代码演示
- 🍀结论
🍀简介
在数据科学领域,线性回归是一种基本而强大的统计分析方法。它广泛应用于各个领域,从经济学到生物医学研究,从市场营销到城市规划,目的是建立和利用变量之间的简单关系,以便预测未来趋势或做出决策。在本文中,我们将深入探讨简单线性回归的工作原理、应用场景和使用步骤,以帮助您更好地理解和应用这一强大的分析工具。
🍀什么是简单线性回归?
简单线性回归是一种线性回归模型的基本形式,用于分析两个变量之间的关系。其中一个变量被称为“自变量”或“预测变量”,而另一个变量被称为“因变量”或“响应变量”。简单线性回归假设自变量和因变量之间存在线性关系,即以自变量的值来预测因变量的值。
🍀简单线性回归的应用场景
- 预测销售量:根据广告投入金额预测产品销售量。
- 理解变量之间的关系:比如研究学习时间和考试分数之间是否存在正相关关系。
- 预测趋势:根据过去几年的数据,预测未来的市场趋势。
使用步骤:
- 收集数据:收集包含自变量和因变量的样本数据。
- 数据预处理:对数据进行清洗,去除异常值或缺失数据。
- 绘制散点图:可视化数据以了解自变量和因变量之间的总体关系。
- 拟合回归线:使用最小二乘法拟合一条直线,使其最好地拟合数据分布。
- 解释结果:根据回归线的斜率和截距解释变量之间的关系。
- 进行预测:利用已知自变量的值,通过回归方程预测因变量的值。
注意事项:
- 线性回归模型可能不适用于非线性关系的数据。
- 数据的质量对于回归分析的准确性至关重要,要确保数据的准确性和一致性。
- 线性回归模型的结果需要进行合理的解释和验证。
🍀代码演示
上代码前我们可以先了解一下最小二乘法
最小二乘法是一种常用的数学方法,用于拟合数据点与数学模型之间的关系。它的目标是通过调整模型的参数,使模型预测值与实际观测值之间的误差的平方和最小化。这种方法广泛应用于统计学、机器学习、工程学和自然科学等领域,用于分析和拟合数据,寻找数据背后的模式和趋势。
最小二乘法的基本思想是,通过最小化观测值与模型预测值之间的残差平方和来找到最优的模型参数。残差是指每个观测值与对应模型预测值之间的差异。通过求解最小化残差平方和的问题,可以得到最优的模型参数。

公式的推导可以看这位大佬的文章https://blog.csdn.net/weixin_40255714/article/details/125841394
import numpy as np
import matplotlib.pyplot as plt
x = np.array([1,2,3,4,5])
y = np.array([1,3,2,3,5])
plt.scatter(x,y)
plt.axis([0,6,0,6])
plt.show()
# y = a*x+b 需要计算出a和b
x_mean = np.mean(x)
y_mean = np.mean(y)
num = 0.0 # 分子
d = 0.0 # 分母
for x_i,y_i in zip(x,y):num += (x_i-x_mean)*(y_i-y_mean)d += (x_i-x_mean)**2
a = num/d
b = y_mean-a*x_mean
a和b求出来之后,我们就可以进行绘制一下,记住这里指的是找到一条直线,使得每一个点的预测值和真实值之差达到最小

预测就很简单了,带入求值即可

🍀结论
简单线性回归是一种简单而有效的分析方法,可用于预测和理解变量之间的关系。通过收集和处理数据,我们可以建立一个可靠的回归模型,从而进行预测和决策。但要注意变量之间的线性关系是否真实存在,并且合理解释结果。希望本文对您理解简单线性回归有所帮助,并且能够在您的实际问题中应用这一强大的分析工具。

挑战与创造都是很痛苦的,但是很充实。
相关文章:
简单线性回归:预测事物间简单关系的利器
文章目录 🍀简介🍀什么是简单线性回归?🍀简单线性回归的应用场景使用步骤:注意事项: 🍀代码演示🍀结论 🍀简介 在数据科学领域,线性回归是一种基本而强大的统…...
Vue2-收集表单数据、过滤器、内置指令与自定义指令、Vue生命周期
🥔:我徒越万重山 千帆过 万木自逢春 更多Vue知识请点击——Vue.js VUE2-Day4 收集表单数据1、不同标签的value属性2、v-model的三个修饰符 过滤器内置指令与自定义指令1、内置指令2、自定义指令定义语法(1)函数式(2&am…...
正则表达式学习详解
正则表达式 正则表达式(Regular Expression),通常简称为正则或正则表达式,是一种用于描述字符串模式的工具。它是由一系列字符和特殊字符组成的字符串,用于定义搜索模式或进行字符串匹配、替换、提取等操作。 正则表…...
工具箱:在线免费使用的文档工具:(PDF转换,图片压缩等)
这些都是博主亲自使用过的,可以使用。 PDF转换器: http://www.pdfdo.com/ 图片压缩: 免费在线图片/视频压缩工具 | 图片压缩 | 免费 JPG PNG GIF 图像压缩 (yalijuda.com) 文档OCR转EXCEL: 文字识别 OCR_ 图片文字识别_图片文字智能识别…...
Qt6之QStackedWidget——Qt仿ToDesk(2)
一、 QStackedWidget概述 QStackedWidget也叫堆栈窗体类,它继承于QFrame,主要与QListWidget等结合使用,实现“一个界面多个页面切换”。 二、QStackedWidget示例 如下图,当点击左边 QListWidget里的菜单时,右边跟随切…...
Harbor企业镜像仓库部署(本地)
简述: Docker 官方镜像仓库是用于管理公共镜像的地方,大家可以在上面找到想要的镜像,也可以把自己的镜像推送上去。但是有时候服务器无法访问互联网,或者不希望将自己的镜像放到互联网上,那么就需要用到 Docker Regis…...
【Linux】如何打包成动静态库,第三方动静态库如何使用?
文章目录 1. 打包成静态库2. 打包成动态库(共享库)3. 使用第三方静态库4. 使用第三方动态库 5. 动态库的加载6. 注意事项 库的名称:去掉前面的 lib 去掉后面的 .a(版本号) .so(版本号) 剩下的,才是库正真的名称。 查看文件依赖库…...
SAP MM学习笔记20- SAP中的英文2 - SD中英文,日语,中文
SD模块中的英文,日语,中文 对照。 販売管理 日本語英語中国語受注伝票sales order销售订单出荷伝票delivery order交货订单ピッキングリストpicking list领货清单シップメント伝票shipment document发运单据出庫確認post goods issue发货确认請求伝票b…...
计算机网络中的一些基本概念
IP地址: 址用于定位主机的网络地址。是一个32位的二进制数,通常被分割为4个“8位二进制数”(也就是4个字节).**端口号:**在网络通信中,IP地址用于标识主机网络地址,端口号可以标识主机中发送数据、接收数据的进程。简单…...
pytest 用例运行方式
一、命令行方式运行 执行某个目录下所有的用例,符合规范的所有用例 进入到对应的目录,直接执行pytest; 例如需要执行testcases 下的所有用例; 可以进入testcases 目录; 然后执行pytest 进入对应目录的上级目录,执行pytest 目录名称/ ; ; 例如需要执行testcases 下…...
简单入门seleniumUI自动化测试
目录 一、selenium的介绍 二、selenium的原理 三、selenium的八种元素定位的方法 1、ID定位: 2 、name定位: 3、class定位: 4、tag定位: 5、link_text定位: 6、partial_link_text定位: 7、css定位…...
Excel(1):表头或列头冻结
1.需求 对于较大的excel,通常需要固定一部分内容,另一份内容为可翻动。 2.解决方式 在视图中选择冻结窗格,需要注意的是,选择冻结窗格时,窗格的左上方的表格区域是固定不动的,只可以向下或者向右活动。...
通达OA SQL注入漏洞【CVE-2023-4166】
通达OA SQL注入漏洞【CVE-2023-4166】 一、产品简介二、漏洞概述三、影响范围四、复现环境POC小龙POC检测工具: 五、修复建议 免责声明:请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损…...
全网最细,Python接口自动化测试-Session会话保持(实战详细)
目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 在接口测试的过程…...
Java项目初始化ES、MYSQL表结构及表数据
一、初始化MYSQL数据 public boolean initMysql() throws Exception {log.info("initMysql.start");//获取所连接的数据库名称String database systemMapper.getDatabase();if (StringUtils.isBlank(database)) {throw new BusinessException("连接数据库失败,…...
2023-08-13力扣每日一题
链接: 88. 合并两个有序数组 题意: 如题 解: 从后往前(从大到小)插入排序,这样就不会影响原先的有序性 实际代码: #include<bits/stdc.h> using namespace std; void merge(vector…...
下一代深度学习的思考与若干问题
下一代深度学习的思考和若干问题...
【Linux】IP协议——网络层
目录 IP协议 基本概念 IP协议格式 分片与组装 网段划分 特殊的IP地址 IP地址的数量限制 私网IP地址和公网IP地址 路由 路由表生成算法 IP协议 IP协议全称为“网际互连协议(Internet Protocol)”,IP协议是TCP/IP体系中的网络层协议…...
【CSS学习笔记】
学习内容 1.css是什么 2.CSS怎么用(快速入门) 3.CSS选择器(重点 难点) 4.美化页面(文字、阴影、超链接、列表、渐变…) 5.盒子模型 6.浮动 7.定位 8.网页动画(特效) 1.什么是CSS C…...
2023-arxiv-LLaMA: Open and Efficient Foundation Language Models
开放和高效的基础语言模型 Paper:https://arxiv.org/abs/2302.13971 Code: https://github.com/facebookresearch/llama 摘要 本文介绍了 LLaMA,这是⼀个包含 7B 到 65B 参数的基础语⾔模型的集合。作者在数万亿个令牌上训练模型,并表明可以…...
UDOP-large多场景教程:英文发票/论文/表格/表单/说明书/合同六类Prompt模板库
UDOP-large多场景教程:英文发票/论文/表格/表单/说明书/合同六类Prompt模板库 1. 快速上手UDOP-large文档理解模型 Microsoft UDOP-large是微软研究院开发的通用文档处理模型,基于T5-large架构的视觉多模态模型。这个模型特别擅长处理各种英文文档&…...
**发散创新:基于Solidity的通证经济模型在去中心化应用中的落地实践**在区块链技术
发散创新:基于Solidity的通证经济模型在去中心化应用中的落地实践 在区块链技术日益成熟的今天,通证经济(Tokenomics) 已成为构建可持续价值网络的核心驱动力。它不仅是激励机制的设计工具,更是重塑用户行为、资源分配…...
保姆级教程:在Ubuntu 22.04上手动配置Ollama为Systemd服务(附用户权限管理详解)
深度解析:Ubuntu 22.04下Ollama的Systemd服务化与安全权限实践 在开源工具链中,Ollama作为轻量级模型服务框架正获得越来越多开发者的青睐。但生产环境中,简单的curl | sh安装方式往往隐藏着权限失控和服务不稳定的隐患。本文将彻底解构手动配…...
旅游安全监控:紧急求助与位置追踪的系统
旅游安全监控:紧急求助与位置追踪的系统 随着旅游业的蓬勃发展,游客的安全问题日益受到关注。无论是独自探险的背包客,还是家庭出游的亲子团,都可能面临迷路、突发疾病或意外事故等风险。为此,旅游安全监控系统应运而…...
Qwen2.5-7B-Instruct优化升级:高效模型缓存机制,大幅提升对话响应速度
Qwen2.5-7B-Instruct优化升级:高效模型缓存机制,大幅提升对话响应速度 1. 引言:大模型本地化部署的挑战 在本地化部署大型语言模型时,开发者常常面临两个核心挑战:显存占用过高和响应速度缓慢。特别是对于7B参数规模…...
告别复杂编译!vLLM-v0.17.1镜像一键部署,小白也能快速搭建LLM服务
告别复杂编译!vLLM-v0.17.1镜像一键部署,小白也能快速搭建LLM服务 1. vLLM框架简介 vLLM是一个专为大型语言模型(LLM)设计的高性能推理和服务库,最初由加州大学伯克利分校的天空计算实验室开发,现已发展成为社区驱动的开源项目。…...
PMD自定义规则开发终极指南:打造专属代码质量检查工具
PMD自定义规则开发终极指南:打造专属代码质量检查工具 【免费下载链接】pmd An extensible multilanguage static code analyzer. 项目地址: https://gitcode.com/gh_mirrors/pm/pmd PMD作为一款强大的多语言静态代码分析工具,允许开发者通过自定…...
资源优化攻略:如何在消费级显卡上高效运行lora-scripts训练
资源优化攻略:如何在消费级显卡上高效运行lora-scripts训练 1. 理解LoRA训练的资源挑战 LoRA(Low-Rank Adaptation)技术已经成为微调大型模型的主流方法,它通过冻结预训练模型的权重,只训练少量低秩矩阵来实现高效适…...
系统部署自动化
系统部署自动化:提升效率的关键利器 在数字化转型的浪潮中,系统部署自动化已成为企业提升运维效率、降低人为错误的核心技术。传统的手动部署方式不仅耗时耗力,还容易因操作失误导致系统故障。而自动化部署通过脚本和工具实现一键式操作&…...
Python如何找局部极值_scipy.signal.argrelextrema找波峰波谷
scipy.signal.argrelextrema 默认要求严格大于/小于邻点,故平台段、噪声或高采样率下易漏峰;需先平滑、确保一维输入、显式指定axis和比较函数,并用order3起调参;波峰波谷可统一用argrelextrema(-data)推导;索引须映射…...
