当前位置：首页 > news >正文

机器学习--实现多元线性回归

news 2026/5/9 17:57:36

机器学习—实现多元线性回归

本节顺延机器学习--线性回归中的内容，进一步讨论多元函数的回归问题

$y^{\prime}=h(x)+w^\top\bullet x+b$
$\text{其中,}w^\mathrm{T}\cdot x\text{就是}_{W_1X_1}+w_2X_2+w_3X_3+\cdots+w_NX_N$

进一步按题目简化：
$y^{\prime}=h(x)=w_0x_0+w_1x_1+w_2x_2+w_3x_3$
其中 $w_0x_0$ 为引入的偏置b

import numpy as np #导入NumPy数学工具箱
import pandas as pd #导入Pandas数据处理工具箱
#读入数据并显示前面几行的内容，确保已经成功的读入数据
#示例代码是在Kaggle中数据集中读入文件，如果在本机中需要指定具体本地路径
# 如，当数据集和代码文件位于相同本地目录，路径
#名应为'./advertising.csv'，或直接放'advertising.csv'亦可
df_ads = pd.read_csv('/kaggle/input/online-store-sales-forecast-data/advertising.csv')
df_ads.head()

X = np.array(df_ads) # 构建特征集，含全部特征
X = np.delete(X, [3], axis = 1) # 删除掉标签
y = np.array(df_ads.sales) #构建标签集，销售金额
print ("张量X的阶:",X.ndim)
print ("张量X的形状:", X.shape)
print (X)

需要x和y都为2D向量

y = y.reshape(-1,1) #通过reshape函数把向量转换为矩阵，-1就是len(y),返回样本个数
print ("张量y的形状:", y.shape)

将数据集进行80%（训练集）和20%（验证集）的分割

# 将数据集进行80%（训练集）和20%（验证集）的分割
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)

定义归一化函数，进行数据压缩

def scaler(train, test): # 定义归一化函数 ，进行数据压缩    # 数据的压缩min = train.min(axis=0) # 训练集最小值max = train.max(axis=0) # 训练集最大值gap = max - min # 最大值和最小值的差train -= min # 所有数据减最小值train /= gap # 所有数据除以大小值差test -= min #把训练集最小值应用于测试集test /= gap #把训练集大小值差应用于测试集return train, test # 返回压缩后的数据

def min_max_gap(train): # 计算训练集最大，最小值以及他们的差，用于后面反归一化过程min = train.min(axis=0) # 训练集最小值max = train.max(axis=0) # 训练集最大值gap = max - min # 最大值和最小值的差return min, max, gapy_min, y_max, y_gap = min_max_gap(y_train)

X_train_original = X_train.copy() # 保留一份训练集数据副本，用于对要预测数据归一化

X_train,X_test = scaler(X_train,X_test) # 对特征归一化
y_train,y_test = scaler(y_train,y_test) # 对标签也归一化

x0_train = np.ones((len(X_train),1)) # 构造X_train长度的全1数组配合对Bias的点积
X_train = np.append(x0_train, X_train, axis=1) #把X增加一系列的1
x0_test = np.ones((len(X_test),1)) # 构造X_test长度的全1数组配合对Bias的点积
X_test = np.append(x0_test, X_test, axis=1) #把X增加一系列的1
print ("张量X的形状:", X_train.shape)
print (X_train)

通过向量化来实现损失函数

def loss_function(X, y, W): # 手工定义一个MSE均方误差函数,W此时是一个向量y_hat = X.dot(W.T) # 点积运算 h(x)=w_0*x_0 + w_1*x_1 + w_2*x_2 + w_3*x_3    loss = y_hat.reshape((len(y_hat),1))-y # 中间过程,求出当前W和真值的差异cost = np.sum(loss**2)/(2*len(X)) # 这是平方求和过程, 均方误差函数的代码实现return cost # 返回当前模型的均方误差值

$w=w-\frac{\alpha}{2N}\sum_{i=1}^N(y^{(i)}-(w\bullet x^{(i)}))\bullet x^{(i)}$

封装进一个梯度下降函数：

def gradient_descent(X, y, W, lr, iterations): # 定义梯度下降函数l_history = np.zeros(iterations) # 初始化记录梯度下降过程中损失的数组W_history = np.zeros((iterations,len(W))) # 初始化权重数组 for iter in range(iterations): # 进行梯度下降的迭代，就是下多少级台阶y_hat = X.dot(W.T) # 这个是向量化运行实现的假设函数   loss = y_hat.reshape((len(y_hat),1))-y # 中间过程, y_hat和y真值的差derivative_W = X.T.dot(loss)/len(X) #求出多项式的梯度向量derivative_W = derivative_W.reshape(len(W)) W = W - lr*derivative_W # 结合下降速率更新权重l_history[iter] = loss_function(X, y, W) # 损失的历史记录 W_history[iter] = W # 梯度下降过程中权重的历史记录return l_history, W_history # 返回梯度下降过程数据

初始化权重并训练机器

#首先确定参数的初始值
iterations = 300; # 迭代300次
alpha = 0.15; #学习速率设为0.15
weight = np.array([0.5,1,1,1]) # 权重向量，w[0] = bias
#计算一下初始值的损失
print ('当前损失：',loss_function(X_train, y_train, weight))

当前损失： 0.8039183733604858

构建线性回归模型

# 定义线性回归模型
def linear_regression(X, y, weight, alpha, iterations): loss_history, weight_history = gradient_descent(X, y, weight, alpha, iterations)print("训练最终损失:", loss_history[-1]) # 打印最终损失y_pred = X.dot(weight_history[-1]) # 进行预测traning_acc = 100 - np.mean(np.abs(y_pred - y))*100 # 计算准确率print("线性回归训练准确率: {:.2f}%".format(traning_acc))  # 打印准确率return loss_history, weight_history # 返回训练历史记录

# 调用刚才定义的线性回归模型
loss_history, weight_history = linear_regression(X_train, y_train,weight, alpha, iterations) #训练机器

训练最终损失: 0.002506723466186024
线性回归训练准确率: 75.67%

print("权重历史记录：", weight_history)
print("损失历史记录：", loss_history)

预测的数据

X_plan = [250,50,50] # 要预测的X特征数据
X_train,X_plan = scaler(X_train_original,X_plan) # 对预测数据也要归一化缩放
X_plan = np.append([1], X_plan ) # 加一个哑特征X0 = 1
y_plan = np.dot(weight_history[-1],X_plan) # [-1] 即模型收敛时的权重
# 对预测结果要做反向缩放，才能得到与原始广告费用对应的预测值
y_value = y_plan*y_gap + y_min # y_gap是当前y_train中最大值和最小值的差，y_min是最小值
print ("预计商品销售额： ",y_value, "千元")

预计商品销售额：  [7.42162744] 千元

机器学习--实现多元线性回归

机器学习—实现多元线性回归本节顺延机器学习--线性回归中的内容，进一步讨论多元函数的回归问题 y ′ h ( x ) w ⊤ ∙ x b y^{\prime}h(x)w^\top\bullet xb y′h(x)w⊤∙xb 其中, w T ⋅ x 就是 W 1 X 1 w 2 X 2 w 3 X 3 ⋯ w N X N \text{其中,}w^\math…...

编程日记 2025/2/17 18:10:15

【JavaScript】《JavaScript高级程序设计 (第4版) 》笔记-Chapter2-HTML 中的 JavaScript

二、HTML 中的 JavaScript 将 JavaScript 插入 HTML 的主要方法是使用<script>元素。 <script>元素有下列 8 个属性。 async：可选。表示应该立即开始下载脚本，但不能阻止其他页面动作，比如下载资源或等待其他脚本加载。只对外部…...

编程日记 2025/2/17 18:09:12

【人工智能】释放数据潜能：使用Featuretools进行自动化特征工程

《Python OpenCV从菜鸟到高手》带你进入图像处理与计算机视觉的大门！解锁Python编程的无限可能：《奇妙的Python》带你漫游代码世界特征工程是机器学习流程中至关重要的一步，它直接影响模型的性能。然而，手动特征工程既耗时又需要领域专业知识。Featuretools是一个强大的…...

编程日记 2025/2/17 18:08:11

算法——对比A算法与IDA算法

A*算法与IDA*算法详细解析 1. A*算法核心思想： A*算法是一种启发式搜索算法，结合了Dijkstra算法的最短路径保证和贪心最佳优先搜索的高效导向性。其核心是评估函数 ( f(n) g(n) h(n) )，其中： ( g(n) ): 从起点到当前节点 ( …...

编程日记 2025/2/17 18:06:08

GitLab CI/CD 的配置详解：从零开始使用 .gitlab-ci.yml 文件

在现代软件开发中，CI/CD（持续集成与持续部署）已成为提高开发效率和代码质量的核心实践。GitLab CI/CD 提供了强大的功能，帮助开发者自动化构建、测试和部署应用程序。而 .gitlab-ci.yml 文件是 GitLab CI/CD 配置的关键所在&#…...

编程日记 2025/2/17 18:05:04

python语言进阶之函数

目录前言函数的创建和调用函数创建调用函数参数传递形式参数和实际参数位置参数数量必须与定义时一致位置必须与定义时一致关键字参数为参数设置默认值可变参数 **parameter 返回值变量的作用域局部变量全局变量匿名函数前言提到函数&…...

编程日记 2025/2/17 18:02:59

网络安全等级保护基本要求、测评要求、高风险判定指引综合梳理

网络安全等级保护基本要求、测评要求、高风险判定指引综合梳理等级保护基本要求、测评要求、高风险判定指引综合梳理测评要求思维导图二级三级花了些时间把网络安全等级保护涉及的以下三份标准文件进行了整理，以表格的形式进行展现，能帮助初学者更加直…...

编程日记 2025/2/17 17:59:55

JSON入门略要

JavaScript对象表示法（JavaScript Object Notation，JSON）已经成为RESTful接口设计中的事实标准。 JSON数据格式使得应用程序可以通过RESTful API等方式在网络上进行数据通信。 REST: 表现层状态转化（REpresentation State Transf…...

编程日记 2025/2/17 17:50:40

Python爬虫抓取数据时，如何设置请求头？

在Python爬虫中设置请求头是确保爬虫能够正常运行并获取目标数据的关键步骤之一。请求头可以帮助我们模拟浏览器行为，避免被目标网站识别为爬虫。以下是如何在Python爬虫中设置请求头的详细指南： 一、使用requests库设置请求头 requests库是Python中最…...

编程日记 2025/2/17 17:47:35

以若依移动端版为基础，实现uniapp的flowable流程管理

1.前言此代码是若依移动端版为基础，实现flowable流程管理，支持H5、APP和微信小程序三端。其中，APP是在安卓在雷电模拟器环境下完成的，其他环境未测试，此文章中所提及的APP均指上述环境。移动端是需要配合若依前后端分…...

编程日记 2025/2/17 17:46:32

DeepSeek 助力 Vue 开发：打造丝滑的开关切换（Switch）

前言：哈喽，大家好，今天给大家分享一篇文章！并提供具体代码帮助大家深入理解，彻底掌握！创作不易，如果能帮助到大家或者给大家一些灵感和启发，欢迎收藏关注哦 💕 目录 Deep…...

编程日记 2025/2/17 17:45:31

unity学习39：连续动作之间的切换，用按键控制角色的移动

目录 1 不同状态之间的切换模式 1.1 在1个连续状态和一个连续状态之间的transition，使用trigger 1.2 在2个连续状态之间的转换，使用bool值切换转换 2 至少现在有2种角色的移动控制方式 2.1 用CharacterController 控制角色的移动 2.2 用animator…...

编程日记 2025/2/17 17:44:25

C++ ——构造函数

1、作用：创建对象时，给对象的属性进行初始化 2、特点 （1）构造函数与类同名 （2）如果没有显式给出构造函数，编译器会给出默认的构造函数（参数为空，并且函数体也为空&#…...

编程日记 2025/2/17 17:40:15

Python实现语音识别详细教程【2025】最新教程

文章目录前言一、环境搭建1. 下载 Python2. 安装 Python3 使用 pip 安装必要的库二、使用 SpeechRecognition 库进行语音识别1.识别本地音频文件2.实时语音识别3. 使用其他语音识别引擎注意事项前言以下是一份较为完整的 Python 语音识别教程，涵盖环境搭建、使…...

编程日记 2025/2/17 17:39:12

【第12章：深度学习与伦理、隐私—12.4 深度学习与伦理、隐私领域的未来挑战与应对策略】

凌晨三点的自动驾驶测试场，AI系统突然在暴雨中做出惊人决策——它选择撞向隔离带而不是紧急变道，因为算法推演发现隔离带后的应急车道站着五个工程师。这个惊悚的伦理困境，揭开了深度学习伦理危机最尖锐的冰山一角。一、潘多拉魔盒已开：深度学习伦理的四大原罪 1.1 数据原…...

编程日记 2025/2/17 17:37:09

Django中数据库迁移命令

在 Django 中，数据库迁移是确保数据库结构与 Django 模型定义保持一致的重要过程。以下是 Django 中常用的数据库迁移命令： 1. python manage.py makemigrations 功能：此命令用于根据 Django 项目的模型文件（models.py&#xff…...

编程日记 2025/2/17 17:36:05

Win11 远程连接 Ubuntu20.04(局域网）

Win11 远程连接 Ubuntu20.04(局域网） 0. Ubuntu 开启共享1. Ubuntu系统中安装RDP服务器2.windows中连接使用方式1：远程桌面连接(winr: mstsc)方式2：mobaXterm 3 问题远程连接后出现黑屏参考文献: 0. Ubuntu 开启共享在ubunt设置中&#x…...

编程日记 2025/2/17 17:33:01

安卓手游内存call综合工具/内部call/安卓注入call/数据分析（类人猿学院）

进程分析注入综合工具总界面模块分析函数分析遍历函数分析 so汇编分析汇编call植入器，支持模拟器x86 x64 和手机arm64指令全平台防ce搜索数据功能全国首套发布，阿凡老师学院最好的安卓内存逆向老师，几乎行业最强的，有兴趣可以…...

编程日记 2025/2/17 17:31:59

PPT工具集

PPT模版免费下载爱PPT优品PPTPPT之家第一PPTOfficePlus部分免费 AI生成PPT Kimi秘塔搜索可以输入内容生成PPT大纲。...

编程日记 2025/2/17 17:29:52

SpringBoot：使用spring-boot-test对web应用做单元测试时如何测试Filter?

对SpringBoot的Web应用做单元测试时，一般会使用spring-boot-test，pom.xml中会添加如下内容： <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-test</artifactId><…...

编程日记 2025/2/17 17:28:46

好用的电脑软件工具

MSEdgeRedirect：如果有默认浏览器是chrome，但是在QQ点开链接默认跳转到edge，可以使用这个软件。软件作用是强制重定向链接从edge->chrome。KMS：激活Windows系统激活office三件套。关闭Win11系统自动更新工具：联想官…...

编程新知 2026/5/9 17:54:19

CANN/opbase快速入门指南

快速入门【免费下载链接】opbase 本项目是CANN算子库的基础框架库，为算子提供公共依赖文件和基础调度能力。项目地址: https://gitcode.com/cann/opbase 快速体验项目前，请参考本项目README完成环境准备和源码下载，此处不再赘述。 …...

编程新知 2026/5/9 17:35:00

【免费下载链接】pto-isa Parallel Tile Operation (PTO) is a virtual instruction set architecture designed by Ascend CANN, focusing on tile-level operations. This repository offers high-performance, cross-platform tile operations across Ascend platforms. 项…...

编程新知 2026/5/9 16:16:05

从零构建GitHub Pages静态博客：Jekyll选型、部署与优化全指南

1. 项目概述：一个静态博客的诞生与演进 “lofder/lofder.github.io”，这个看似简单的GitHub仓库地址，背后代表的是一个非常经典且实用的个人项目：一个基于GitHub Pages托管的静态个人博客。对于很多开发者、技术爱好者乃至内容创…...

编程新知 2026/5/9 16:14:03

对比自行维护多个API密钥使用Taotoken聚合服务在稳定性上的体验差异

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度对比自行维护多个API密钥与使用Taotoken聚合服务在稳定性上的体验差异 1. 引言：从分散管理到统一接入的转变在开发过…...

编程新知 2026/5/9 15:15:33

【路径规划】基于启发式搜索与增量启发式搜索方法MRPP或MAPF的多机器人路径规划算法附matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长毕业设计辅导、数学建模、数据处理、程序设计科研仿真。🍎完整代码获取定制创新论文复现点击：Matlab科研工作室👇 关注我领取海量matlab电子书和数学建模资料 &#x1f3…...

编程新知 2026/5/9 14:44:50

WorkshopDL：革命性跨平台Steam创意工坊下载技术指南

WorkshopDL：革命性跨平台Steam创意工坊下载技术指南【免费下载链接】WorkshopDL WorkshopDL - The Best Steam Workshop Downloader 项目地址: https://gitcode.com/gh_mirrors/wo/WorkshopDL 1. 问题洞察你是否曾经在GOG平台购买了《巫师3》，…...

编程新知 2026/5/9 11:33:54

NeuroRebuild 动态孪生，虚实同步秒级应急推演

NeuroRebuild 动态孪生，虚实同步秒级应急推演前言危化园区危险源密集、事故蔓延快、应急处置窗口期极短，传统静态BIM、倾斜摄影孪生模型固化滞后，无法跟随现场实景实时变化，灾害推演失真滞后、应急决策被动迟缓，难以适…...

编程新知 2026/5/9 11:06:23

给老旧K2P路由器续命：保姆级OpenWrt 23.05.2官方纯净版刷机教程（附阿里云镜像）

给老旧K2P路由器续命：保姆级OpenWrt 23.05.2官方纯净版刷机教程（附阿里云镜像） 家里那台吃灰的K2P路由器最近频繁断流，刷过几个第三方固件不是功能冗余就是后台偷偷跑流量。偶然发现OpenWrt官方发布了23.05.2稳定版，6…...

编程新知 2026/5/9 9:43:13

AI加速器硬件软件协同设计优化实践

1. 硬件软件协同设计概述在AI加速器领域，硬件软件协同设计已成为突破性能瓶颈的关键策略。传统AI加速器设计往往将硬件和软件视为独立部分，导致计算单元与数据流之间出现严重不匹配。这种割裂的设计方式会造成两个主要问题：计算单元因等待数据…...

编程新知 2026/5/9 9:20:50

机器学习--实现多元线性回归

机器学习—实现多元线性回归

将数据集进行80%（训练集）和20%（验证集）的分割

定义归一化函数，进行数据压缩

通过向量化来实现损失函数

封装进一个梯度下降函数：

初始化权重并训练机器

构建线性回归模型

预测的数据

相关文章：

机器学习--实现多元线性回归

【JavaScript】《JavaScript高级程序设计 (第4版) 》笔记-Chapter2-HTML 中的 JavaScript

【人工智能】释放数据潜能：使用Featuretools进行自动化特征工程

算法——对比A算法与IDA算法

GitLab CI/CD 的配置详解：从零开始使用 .gitlab-ci.yml 文件

python语言进阶之函数

网络安全等级保护基本要求、测评要求、高风险判定指引综合梳理

JSON入门略要

Python爬虫抓取数据时，如何设置请求头？

以若依移动端版为基础，实现uniapp的flowable流程管理

DeepSeek 助力 Vue 开发：打造丝滑的开关切换（Switch）

unity学习39：连续动作之间的切换，用按键控制角色的移动

C++ ——构造函数

Python实现语音识别详细教程【2025】最新教程

【第12章：深度学习与伦理、隐私—12.4 深度学习与伦理、隐私领域的未来挑战与应对策略】

Django中数据库迁移命令

Win11 远程连接 Ubuntu20.04(局域网）

安卓手游内存call综合工具/内部call/安卓注入call/数据分析（类人猿学院）

PPT工具集

SpringBoot：使用spring-boot-test对web应用做单元测试时如何测试Filter?

好用的电脑软件工具

CANN/opbase快速入门指南

CANN/PTO-ISA通信算子开发指南

从零构建GitHub Pages静态博客：Jekyll选型、部署与优化全指南

对比自行维护多个API密钥使用Taotoken聚合服务在稳定性上的体验差异

【路径规划】基于启发式搜索与增量启发式搜索方法MRPP或MAPF的多机器人路径规划算法附matlab代码

WorkshopDL：革命性跨平台Steam创意工坊下载技术指南

NeuroRebuild 动态孪生，虚实同步秒级应急推演

给老旧K2P路由器续命：保姆级OpenWrt 23.05.2官方纯净版刷机教程（附阿里云镜像）

AI加速器硬件软件协同设计优化实践

机器学习—实现多元线性回归

将数据集进行80%（训练集）和20%（验证集）的分割

定义归一化函数 ，进行数据 压缩

通过向量化来实现损失函数

封装进一个梯度下降函数：

初始化权重并训练机器

构建线性回归模型

预测的数据

相关文章：

定义归一化函数，进行数据压缩