机器学习算法:线性回归
1. 基础概念
线性回归是一种用于建模连续型目标变量(如价格、销量、温度)与一个或多个特征变量(如面积、广告投入、时间)之间线性关系的统计方法。
-
核心思想:找到一条直线(或超平面),使得预测值与真实值的误差最小。
数学形式:
-
简单线性回归:
y = w*x + b
-
y
:目标变量(如房价) -
x
:特征变量(如房屋面积) -
w
:权重(斜率),b
:偏置(截距)
-
-
多元线性回归:
y = w₁x₁ + w₂x₂ + ... + wₙxₙ + b
-
多个特征共同预测目标(如面积、房间数、地段共同预测房价)。
-
-
2. 核心原理
损失函数:均方误差(MSE)
衡量预测值与真实值的差距: MSE = (1/N) * Σ(y_true - y_pred)²
目标是最小化MSE,找到最优的w
和b
。
优化方法:梯度下降
通过迭代调整参数w
和b
,逐步降低损失函数的值(类似“下山找最低点”)。
评估指标
-
R²(决定系数):模型解释数据变异的比例,越接近1越好。
-
均方误差(MSE):越小越好。
3. 实际生产中的例子
案例1:房价预测
-
场景:房地产平台根据历史数据预测房屋售价。
-
特征:面积、房间数、地段评分、房龄。
-
输出:房价(连续值)。
-
应用:用户输入房屋信息后,自动生成估价报告。
案例2:电商销售额预测
-
场景:预测某商品的月度销售额。
-
特征:广告投入、促销力度、季节性指数、竞品价格。
-
输出:销售额(连续值)。
-
应用:优化广告预算分配,制定促销策略。
案例3:能源消耗预测
-
场景:工厂预测电力消耗以降低能源成本。
-
特征:生产线数量、工作时间、室外温度。
-
输出:每小时用电量。
-
应用:动态调整用电计划,避开用电高峰。
案例4:用户行为分析(互联网)
-
场景:预测用户在某APP上的停留时长。
-
特征:用户点击次数、页面加载速度、推荐内容相关性。
-
输出:停留时间(分钟)。
-
应用:优化推荐算法,提升用户留存。
4. 生产中的改进方法
处理非线性关系
-
多项式回归:将特征转换为高次项(如
x²
,x³
),拟合曲线。-
例如:广告投入与销售额可能呈“边际递减”曲线关系。
-
正则化(防止过拟合)
-
岭回归(Ridge):对权重
w
的平方(L2范数)进行惩罚。 -
Lasso回归:对权重
w
的绝对值(L1范数)进行惩罚,可自动筛选重要特征。
特征工程
-
归一化/标准化:加速梯度下降收敛。
-
处理缺失值:填充均值或中位数。
-
异常值处理:剔除或缩尾。
5. 优缺点
优点
-
✅ 简单、高效、可解释性强(权重反映特征重要性)。
-
✅ 适合小数据集或低维特征场景。
-
✅ 可作为复杂模型(如神经网络)的基准参考。
缺点
-
❌ 假设特征与目标呈线性关系,难以捕捉复杂模式。
-
❌ 对异常值和多重共线性敏感。
-
❌ 特征需人工设计,无法自动学习高阶交互。
6. 代码工具示例(Python)
7. 适用场景总结
-
推荐使用线性回归:
-
特征与目标关系近似线性。
-
需要快速验证业务假设(如广告投入是否影响销量)。
-
结果需可解释(如向业务部门汇报“面积对房价的影响”)。
-
-
避免使用:
-
数据高度非线性(如图像、音频)。
-
特征维度极高且存在多重共线性。
-
一句话总结
线性回归是“用直线拟合数据”的经典方法,虽简单但广泛应用于工业界,尤其在需要快速验证和解释性的场景中。
相关文章:

机器学习算法:线性回归
1. 基础概念 线性回归是一种用于建模连续型目标变量(如价格、销量、温度)与一个或多个特征变量(如面积、广告投入、时间)之间线性关系的统计方法。 核心思想:找到一条直线(或超平面)࿰…...
NotePad++编辑Linux服务器文档
参考资料: 参考文章 相关插件链接:链接: https://pan.baidu.com/s/1PBX9NY0pPz0sBqtfNxngXA 提取码: r3t7 概要: 通常简单的文件编辑,可以直接在Linux服务器,或客户端利用VIM命令编辑,编辑即可 但是过于复杂的文件,比如Mycat的XML编辑,就很不方便,需要利用Notepad++…...

常见小问题(Open Folder as PyCharm Project)
1.删除pycharm鼠标右键快捷键打开项目 winr键打开,输入regedit,运行注册器 找到下面的路径:计算机\HKEY_CLASSES_ROOT\Directory\Background\shell\PyCharm 删除即可...

第四十四节:目标检测与跟踪-模板匹配
一、引言 模板匹配的核心思想是通过在输入图像中搜索与预定义模板最相似的区域来定位目标。这种方法计算效率高、实现简单,特别适用于目标外观变化不大且背景相对简单的场景。本文将深入探讨模板匹配的原理、OpenCV中的实现方法、优化技巧以及实际应用案例。 二、模板匹配基础…...
Trae中使用mcp连接MariaDB
开启mariadb远程权限 -- 登录 MariaDB(如果需要密码,会提示输入) mysql -u root -p -- 切换到权限管理数据库 USE mysql; -- 创建允许从任何 IP 访问的 root 用户(推荐使用强密码) GRANT ALL PRIVILEGES ON *.* …...
第12次04 :首页展示用户名
登录后,跳转到首页,首页会展示用户名;未登录时,首页将展示登录与注册的选项。 第一步:index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml…...
MFC: 文件加解密(单元测试模块)
背景: 对敏感配置文件(如 XML 格式的配置文件、用户信息等)进行加密,防止被人以文本形式直接查看。软件启动前加载加密的配置或资源文件,运行时再进行解密使用,提高逆向破解门槛。在传输 XML 文件…...

vue+ThreeJs 创建过渡圆圈效果
嗨,我是小路。今天主要和大家分享的主题是“vueThreeJs 创建过渡圆圈效果”。 今天在做着色器过渡效果练习,发现出现了很多新的函数,这些都超出了js之外,需要更多的掌握和学习。以下是自己的复盘和梳理。 1.获取距离 定…...

MySQL:12_视图
视图 跟事务里讲的视图没有任何关系 视图是一个虚拟表,其内容由查询定义。同真实的表一样,视图包含一系列带有名称的列和行数据。视图的数据变化会影响到基表,基表的数据变化也会影响到视图。 一.基本使用 创建视图 create view 视图名 …...
2025 年开源 LLM 发展趋势细致解读
1. 模型性能的持续跃进与架构创新 到 2025 年,开源 LLM 在性能上不仅持续追赶,甚至在特定任务和评估基准上已经能够与顶级的闭源模型并驾齐驱或展现出独特优势。MoE (Mixture of Experts) 架构的成熟和广泛应用是这一趋势中的核心驱动力之一。 MoE (Mix…...

win11+vs2022 安装opencv 4.11.0图解教程
1. 下载opencv opencv官网下载地址:Releases - OpenCV 2. 双击运行该exe,即可进行安装,安装文件夹可自行选择 安装后目录如下: 3. 配置环境变量 使用win键搜索环境变量,选中系统变量中的Path,然后点击编辑…...

n8n 读写本地文件
1.Docker Desktop 创建容器 docker run -d --name n8n -p 5566:5678 -v D:\docker\n8n_data:/home/node/.n8n -v D:\docker\n8n_files:/home/node/Files n8nio/n8n:latest 参数说明: 1.-d :表示以 detached 模式运行容器(后台运行) 2.--name n8n :指定容器名称为n8n。 3.-p 55…...
详解3DGS
4 可微分的3D高斯 splatting 核心目标与表示选择 我们的目标是从无法线的稀疏SfM点出发,优化出一种能够实现高质量新视角合成的场景表示。为此,我们选择3D高斯作为基本图元,它兼具可微分的体表示特性和非结构化的显式表示优势,既…...
DEBUG设置为False 时,django默认的后台样式等静态文件丢失的问题
1. 处理静态文件(解决后台样式丢失) 当 DEBUG False 时,Django 不再自动处理静态文件(CSS、JS 等),需手动配置: 步骤: 配置 STATIC_ROOT 和 STATIC_URL 在 settings.py 中确保以下…...
如何提高服务器的QPS来应对618活动的并发流量
在电商行业,618大促是继双十一之后最重要的一次“流量大战”。大量用户在短时间内涌入网站下单、抢购,服务器面临前所未有的并发压力。QPS(Queries Per Second,即每秒请求数)作为衡量服务器处理能力的重要指标,直接关系到用户体验…...

LlamaFirewall:开源框架助力检测与缓解AI核心安全风险
LlamaFirewall 是一款面向大语言模型(LLM)应用的系统级安全框架,采用模块化设计支持分层自适应防御。该框架旨在缓解各类AI代理安全风险,包括越狱攻击(jailbreaking)、间接提示注入(indirect pr…...

java基础知识回顾3(可用于Java基础速通)考前,面试前均可用!
目录 一、基本算数运算符 二、自增自减运算符 三、赋值运算符 四、关系运算符 五、逻辑运算符 六、三元运算符 七、 运算符的优先级 八、小案例:在程序中接收用户通过键盘输入的数据 声明:本文章根据黑马程序员b站教学视频做的笔记,可…...
嵌入式软件架构规范之 - 分层设计
一、规范的核心思想:驱动文件的“独立性”与“复用性” 该规范的本质是通过分层隔离,实现驱动代码的高复用性、低耦合性,确保驱动模块仅关注“硬件操作逻辑”,不依赖上层业务或下层硬件接口的具体实现细节。其核心要求包括&#…...

电脑无法识别打印机usb设备怎么办 一键解决!
在当今高度数字化的工作环境中,打印机作为重要的办公设备之一,承担着文件打印、扫描等关键任务。然而,有时我们可能会遇到一个令人头疼的问题——电脑无法识别通过USB连接的打印机。这种情况不仅会影响工作效率,还可能打断正常的工…...

Elasticsearch Synthetic _source
_source 字段包含索引时传入的原始 JSON 文档体。_source 字段本身不被索引(因此不可搜索),但会被存储,以便在执行获取请求(如 get 或 search)时返回。 如果磁盘使用很重要,可以考虑以下选项&a…...

C++ -- vector
vector 1. 关于vector1.1 对比原生数组1.2 vector的核心优势 2. 扩容2.1 底层实现2.2 扩容过程 3. 构造函数4. 接口模拟实现4.1 实现迭代器4.2 扩容4.3 重载[]4.4 插入和删除4.5 构造函数和析构函数 5. 迭代器失效5.1 扩容后失效5.2 越界失效 6. 深浅拷贝 1. 关于vector 1.1 对…...
GitLab-CI简介
概述 持续集成(CI)和 持续交付(CD) 是一种流行的软件开发实践,每次提交都通过自动化的构建(测试、编译、发布)来验证,从而尽早的发现错误。 持续集成实现了DevOps, 使开发人员和运维人员从繁琐的工作中解…...

深入研究Azure 容器网络接口 (CNI) overlay
启用cni overlay 在通过portal创建aks的时候,在networking配置上,选中下面的选项即可启用。 通过CLI创建AKS 要创建具有 CNI 覆盖网络的 AKS 群集,需要在创建群集时指定 --network-plugin azure 和 --network-plugin-mode 覆盖选项。 还需要指定 --pod-cidr 选项来定义群…...

Python打卡第37天
浙大疏锦行 早停策略和模型权重的保存 作业:对信贷数据集训练后保存权重,加载权重后继续训练50轮,并采取早停策略 import torch import torch.nn as nn import pandas as pd import matplotlib.pyplot as plt import torch.optim as optim fr…...

使用 OpenCV 构建稳定的多面镜片墙效果(镜面反射 + Delaunay 分块)
✨ 效果概览 我们将实现一种视觉效果,模拟由许多小镜面拼接而成的“镜子墙”。每个镜面是一个三角形区域,其内容做镜像反射(如水平翻转),在视频中形成奇特的万花筒、哈哈镜、空间折叠感。 使用 OpenCV 实现“随机镜面…...

HTTP协议版本的发展(HTTP/0.9、1.0、1.1、2、3)
目录 HTTP协议层次图 HTTP/0.9 例子 HTTP/1.0 Content-Type 字段 Content-Encoding 字段 例子 1.0版本存在的问题:短链接、队头阻塞 HTTP/1.1 Host字段 Content-Length 字段 分块传输编码 1.1版本存在的问题 HTTP/2 HTTP/2数据传输 2版本存在的问题…...

零基础设计模式——结构型模式 - 桥接模式
第三部分:结构型模式 - 桥接模式 (Bridge Pattern) 在学习了适配器模式如何解决接口不兼容问题后,我们来看看桥接模式。桥接模式是一种更侧重于系统设计的模式,它旨在将抽象部分与其实现部分分离,使它们可以独立地变化。 核心思…...
C++对象的内存模型
C++对象的内存模型涉及对象的数据成员(包括静态成员和非静态成员)、成员函数以及虚函数表等在内存中的布局和管理方式。以下是C++对象的内存模型的主要组成部分: 1. C++对象的组成 一个C++对象通常由以下几个部分组成: 非静态数据成员 对象的核心组成部分,每个对象都有自己…...

SpringBoot3集成Oauth2.1——4集成Swagger/OpenAPI3
文章目录 访问在线文档页面配置OpenApiConfig 在我之前的文章中,写了 SpringBoot3集成OpenAPI3(解决Boot2升级Boot3) 访问在线文档页面 当我们同样在SpringBoot3使用oauth2.1也就是我之前的文章中写的。现在我们要处理下面这两个的问题了。 <!-- 使用springdoc…...

基于深度学习的情绪识别检测系统【完整版】
最近很多小伙伴都在咨询,关于基于深度学习和神经网络算法的情绪识别检测系统。回顾往期文章【点击这里】,介绍了关于人脸数据的预处理和模型训练,这里就不在赘述。今天,将详细讲解如何从零基础手写情绪检测算法和情绪检测系统。主…...