当前位置：首页 > news >正文

评估机器学习回归模型的性能和准确度

news 2025/7/17 20:40:48

回归是一种常用的预测模型，用于预测一个连续因变量和一个或多个自变量之间的关系。

那么，最后评估回归模型的性能和准确度非常重要，可以帮助我们判断模型是否有效并进行改进。

接下来，和大家分享如何评估回归模型的性能和准确度。

一、评估指标

1.1 均方误差（MSE）

均方误差（Mean Squared Error, MSE）衡量的是预测值与真实值之间的平均平方差异。MSE越小，模型的预测精度越高。由于平方误差将偏差放大，因此MSE对异常值（Outliers）比较敏感。

$MSE=\frac{1}{n}\sum_{i=1}^{n}\left ( y_{i}-\hat{y}_{i} \right )^{2}$

$y_{i}$ 是第 $i$ 个样本的真实值。 $\hat{y}_{i}$ 是第 $i$ 个样本的预测值。 $n$ 是样本总数。

from sklearn.metrics import mean_squared_error# y_true 是真实值数组，y_pred 是预测值数组
mse = mean_squared_error(y_true, y_pred)
print("Mean Squared Error (MSE):", mse)

1.2 均方根误差（RMSE）

均方根误差（Root Mean Squared Error, RMSE）是MSE的平方根，具有与原数据相同的量纲（单位），因此更容易解释。它同样对异常值敏感。

$RMSE=\sqrt{\frac{1}{n}\sum_{i=1}^{n}\left ( y_{i}-\hat{y}_{i} \right )^{2}}$

import numpy as nprmse = np.sqrt(mean_squared_error(y_true, y_pred))
print("Root Mean Squared Error (RMSE):", rmse)

1.3 平均绝对误差（MAE）

平均绝对误差（Mean Absolute Error, MAE）衡量的是预测值与真实值之间的平均绝对差异。相比MSE和RMSE，MAE对异常值不那么敏感。

$MAE=\frac{1}{n}\sum_{i=1}^{n} \left | y_{i}-\hat{y}_{i} \right |$

from sklearn.metrics import mean_absolute_errormae = mean_absolute_error(y_true, y_pred)
print("Mean Absolute Error (MAE):", mae)

1.4. 决定系数（R²）

决定系数（R²）衡量的是模型解释数据变异的比例。其取值范围在0到1之间，值越接近1，模型解释能力越强。如果R²为0，表示模型没有解释任何数据变异；如果R²为1，表示模型完美地解释了数据变异。

$R^{2}=\frac{\sum_{i=1}^{n}\left ( y_{i}-\hat{y}_{i} \right )^{2}}{\sum_{i=1}^{n}\left ( y_{i}-\bar{y}_{i} \right )^{2}}$

$\bar{y}_{i}$ 是真实值的平均值。

from sklearn.metrics import r2_scorer2 = r2_score(y_true, y_pred)
print("R² (Coefficient of Determination):", r2)

二、评估图

import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression# 生成示例数据
np.random.seed(0)
X = 2 * np.random.rand(1000, 1)
y = 4 + 3 * X + np.random.randn(1000, 1)# 拆分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)# 训练线性回归模型
model = LinearRegression()
model.fit(X_train, y_train)# 预测
y_train_pred = model.predict(X_train)
y_test_pred = model.predict(X_test)

2.1 真实值与预测值的散点图

我们可以通过散点图比较真实值与预测值，直观展示模型的预测效果。

plt.scatter(X_test, y_test, color='black', label='Actual Values')
plt.scatter(X_test, y_test_pred, color='blue', label='Predicted Values')
plt.plot(X_test, y_test_pred, color='red', linewidth=2, label='Regression Line')
plt.xlabel('X')
plt.ylabel('y')
plt.title('Actual vs Predicted Values')
plt.legend()
plt.show()

2.2 预测误差的分布图

预测误差（真实值与预测值的差异）的分布图可以帮助我们了解模型误差的分布情况。

errors = y_test - y_test_predplt.hist(errors, bins=20, edgecolor='black')
plt.xlabel('Prediction Error')
plt.ylabel('Frequency')
plt.title('Distribution of Prediction Errors')
plt.show()

2.3 学习曲线

习曲线展示了训练误差和验证误差随训练集大小的变化情况，有助于我们诊断模型是否存在欠拟合或过拟合问题。

from sklearn.model_selection import learning_curvetrain_sizes, train_scores, test_scores = learning_curve(model, X, y, cv=5, scoring='neg_mean_squared_error')train_scores_mean = -train_scores.mean(axis=1)
test_scores_mean = -test_scores.mean(axis=1)plt.plot(train_sizes, train_scores_mean, label='Training error')
plt.plot(train_sizes, test_scores_mean, label='Validation error')
plt.ylabel('MSE')
plt.xlabel('Training set size')
plt.title('Learning Curves')
plt.legend()
plt.show()

以上是详细介绍如何评估回归模型的性能和准确度，包括各个评估指标的原理、公式推导以及在Python中的实现。

参考：

机器学习模型评估的方法总结（回归、分类模型的评估）_分类模型评估方法-CSDN博客

模型评估指标总结（预测指标、分类指标、回归指标）_常见模型误差评价指标-CSDN博客

机器学习笔记：回归模型评估指标——MAE、MSE、RMSE、MAPE、R2等 - Hider1214 - 博客园

持续更新中。。。

评估机器学习回归模型的性能和准确度

回归是一种常用的预测模型，用于预测一个连续因变量和一个或多个自变量之间的关系。那么，最后评估回归模型的性能和准确度非常重要，可以帮助我们判断模型是否有效并进行改进。接下来，和大家分享如何评估回归模型的性能和准…...

编程日记 2024/11/3 8:03:49

如何下载安装TestLink？

一、下载TestLink、XAMPP TestLink 下载 |SourceForge.net 备用：GitHub - TestLinkOpenSourceTRMS/testlink-code： TestLink开源测试和需求管理系统下载XAMPP： Download XAMPP 注意：TestLink与PHP版本有关系，所以XA…...

编程日记 2024/11/3 7:58:44

基于SSM+微信小程序的订餐管理系统（点餐2）

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1、项目介绍基于SSM微信小程序的订餐管理系统实现了管理员和用户。管理端实现了首页、个人中心、用户管理、菜品分类管理、菜品信息管理、订单信息管理、配送信息管理、菜品评价管理、订单投诉管理、…...

编程日记 2024/11/3 7:56:42

【C++排序双指针】1996. 游戏中弱角色的数量|1996

本文涉及的基础知识点排序 C算法：滑动窗口及双指针总结本题其它解法【C单调栈排序】1996. 游戏中弱角色的数量|1996 LeetCode1996. 游戏中弱角色的数量你正在参加一个多角色游戏，每个角色都有两个主要属性：攻击和防御。给你一个…...

编程日记 2024/11/3 7:55:41

参考程序代码： #include <iostream> using namespace std;double divide(double a, double b) {if (b 0) {throw "Division by zero error"; // 抛出异常}return a / b; }int main() {double num1, num2;cout << "Enter two numbers:…...

编程日记 2024/11/3 7:51:38

HTML 基础标签——元数据标签＜meta＞

文章目录 1. `<meta>` 标签概述2. 属性详解2.1 `charset` 属性2.2 `name` 属性2.3 `content` 属性2.4 `http-equiv` 属性3. 其他常见属性小结在 HTML 文档中，元数据标签 <meta> 是一种重要的标签，用于提供关于文档的信息，这些信息不直接显示在网页内容中，但对于…...

编程日记 2024/11/3 7:49:36

栈虚拟机和寄存器虚拟机，有什么不同？

本来这节内容是打算直接讲字节码指令的，但讲之前又必须得先讲指令集架构，而指令集架构又分为两种，一种是基于栈的，一种是基于寄存器的。那不妨我们这节就单独来讲讲栈虚拟机和寄存器虚拟机，它们有什么不同&#xff0…...

编程日记 2024/11/3 7:48:35

Windows下基于fping进行批量IP测试

fping是Linux下一个很好用的IP测试工具，结合代码可以完成批量的IP测试，在网络调试中用途很广。本文是基于fping for Windows结合bat批处理，定制的测试脚本样例。一、程序信息本次测试使用fpingV5.1 for Windows版，版本信息如下…...

编程日记 2024/11/3 7:47:34

一款实用的Word文档图片转换与水印保护工具

目录前言软件功能简介软件实现方法及关键代码 1. Word 文档转图片的实现2. 图片水印添加功能3. 生成数字指纹（哈希值）4. 保存图片信息到 JSON 文件软件的实际使用场景软件操作指南 1. 下载和安装2. 操作流程总结 1，前言在日常办公和内…...

编程日记 2024/11/3 7:43:31

优化用于传感应用的衬底集成波导技术

ANSYS HFSS 是一款功能强大的电磁仿真软件，支持为微流体生物传感器应用设计和分析衬底集成波导 （SIW） 技术。它为快速设计优化、材料选择、系统集成和虚拟原型制作提供了一个强大的平台。借助 ANSYS HFSS，研究人员和工程师可以高效…...

编程日记 2024/11/3 7:40:28

Java多态特性的向上转型

Java的多态特性通过向上转型来实现。向上转型指的是将子类对象赋值给父类引用变量的操作。这样做的好处是可以使用父类引用变量来调用子类对象的方法。例如，有一个父类Animal和一个子类Dog，可以这样进行向上转型： Animal animal new Dog(…...

编程日记 2024/11/3 7:37:23

C++ 判断语句的深入解析

C 判断语句的深入解析 C 是一种广泛使用的编程语言，以其高效性和灵活性著称。在 C 中，判断语句是控制程序流程的关键组成部分，它们允许程序根据不同的条件执行不同的代码路径。本文将深入探讨 C 中的判断语句，包括 if、else if、…...

编程日记 2024/11/3 7:36:22

15分钟学 Go 第 33 天：项目结构

第33天：项目结构目标：了解Go项目的典型结构在Go语言的开发中，项目结构的合理性直接影响着代码的可维护性、可扩展性和团队协作效率。本篇文章将深入探讨Go语言的典型项目结构，并提供实际示例代码和相关的流程图。一、Go项目…...

编程日记 2024/11/3 7:35:19

conda迁移虚拟环境路径

方法一：使用软连接 ln -s ~/Anaconda3/envs /new/path/envs 方法二：修改~/.condarc文件 1.打开~/.condarc文件 #添加下面参数 envs_dirs: - /newpath/anaconda3/envs pkgs_dirs: - /newpath/anaconda3/pkgs 2. source ~/.bashrc 3.查看是否成功con…...

编程日记 2024/11/3 7:34:17

（八）JavaWeb后端开发——Tomcat

目录 1.Web服务器概念 2.tomcat 1.Web服务器概念服务器：安装了服务器软件的计算机服务器软件：接收用户的请求，处理请求，做出响应web服务器软件：在web服务器软件中，可以部署web项目，让用户通…...

编程日记 2024/11/3 7:33:15

yocto中通常不直接修改提供的recipes的bb文件

不直接在 Yocto 官方提供的 recipe 中修改通常是创建新的 metadata 和 recipe 来配置相关软件编译等过程主要有以下几个原因： 1. 便于维护和升级隔离自定义修改：Yocto 官方的 recipe 可能会随着版本更新而变化。如果直接修改官方 recipe&#xff0…...

编程日记 2024/11/3 7:31:11

智能座舱相关术语全解及多模态交互在智能座舱中的应用

文章目录座舱相关术语全解1. 智能座舱2. UFS3. 多模态交互4. 3D虚拟引擎5. AR/VR6. GNSS7. TTS8. DPU9. 摄像头10. 屏幕/显示器11. 音频12. 无线连接13. 其他组件多模态交互在智能座舱中有以下一些应用座舱相关术语全解 1. 智能座舱智能座舱（intelligent cabi…...

编程日记 2024/11/3 7:30:10

【Fastjson反序列化漏洞：深入了解与防范】

一、Fastjson反序列化漏洞概述 Fastjson是一款高性能的Java语言JSON处理库，广泛应用于Web开发、数据交换等领域。然而，由于fastjson在解析JSON数据时存在安全漏洞，攻击者可以利用该漏洞执行任意代码，导致严重的安全威胁。二、F…...

编程日记 2024/11/3 7:28:08

【OJ题解】C++实现反转字符串中的每个单词

💵个人主页: 起名字真南 💵个人专栏:【数据结构初阶】【C语言】【C】【OJ题解】题目要求：给定一个字符串 s ，你需要反转字符串中每个单词的字符顺序，同时仍保留空格和单词的初始顺序。题目链接: 反转字符串中的所…...

编程日记 2024/11/3 7:26:06

万字长文详解Hive聚合函数 grouping sets、cube、rollup原理、语法、案例和优化

目录原理与语法使用场景多维度报表生成复杂的数据分析实际案例原理与语法与GROUPINGSETS的区别实际案例原理与语法与CUBE的对比实际案例执行效率比较优化建议 Hive提供了三个强大的高级聚合函数： GROUPING SETS 、 CUBE 和 ROLLUP ，用于处理复杂的…...

编程日记 2024/11/3 7:24:03

iOS 26 携众系统重磅更新，但“苹果智能”仍与国行无缘

美国西海岸的夏天，再次被苹果点燃。一年一度的全球开发者大会 WWDC25 如期而至，这不仅是开发者的盛宴，更是全球数亿苹果用户翘首以盼的科技春晚。今年，苹果依旧为我们带来了全家桶式的系统更新，包括 iOS 26、iPadOS 26…...

编程新知 2025/7/17 3:25:11

三维GIS开发cesium智慧地铁教程（5）Cesium相机控制

一、环境搭建 <script src"../cesium1.99/Build/Cesium/Cesium.js"></script> <link rel"stylesheet" href"../cesium1.99/Build/Cesium/Widgets/widgets.css"> 关键配置点： 路径验证：确保相对路径.…...

编程新知 2025/6/21 4:17:55

汽车生产虚拟实训中的技能提升与生产优化

在制造业蓬勃发展的大背景下，虚拟教学实训宛如一颗璀璨的新星，正发挥着不可或缺且日益凸显的关键作用，源源不断地为企业的稳健前行与创新发展注入磅礴强大的动力。就以汽车制造企业这一极具代表性的行业主体为例，汽车生产线上各类…...

编程新知 2025/7/15 19:51:10

【单片机期末】单片机系统设计

主要内容：系统状态机，系统时基，系统需求分析，系统构建，系统状态流图一、题目要求二、绘制系统状态流图题目：根据上述描述绘制系统状态流图，注明状态转移条件及方向。三、利用定时器产生时…...

编程新知 2025/7/15 4:44:55

【RockeMQ】第2节｜RocketMQ快速实战以及核⼼概念详解（二）

升级Dledger高可用集群一、主从架构的不足与Dledger的定位主从架构缺陷数据备份依赖Slave节点，但无自动故障转移能力，Master宕机后需人工切换，期间消息可能无法读取。Slave仅存储数据，无法主动升级为Master响应请求&#xff…...

编程新知 2025/6/18 22:53:06

全面解析各类VPN技术：GRE、IPsec、L2TP、SSL与MPLS VPN对比

目录引言 VPN技术概述 GRE VPN 3.1 GRE封装结构 3.2 GRE的应用场景 GRE over IPsec 4.1 GRE over IPsec封装结构 4.2 为什么使用GRE over IPsec？ IPsec VPN 5.1 IPsec传输模式（Transport Mode） 5.2 IPsec隧道模式（Tunne…...

编程新知 2025/7/8 16:12:53

大语言模型（LLM）中的KV缓存压缩与动态稀疏注意力机制设计

随着大语言模型（LLM）参数规模的增长，推理阶段的内存占用和计算复杂度成为核心挑战。传统注意力机制的计算复杂度随序列长度呈二次方增长，而KV缓存的内存消耗可能高达数十GB（例如Llama2-7B处理100K token时需50GB内存&a…...

编程新知 2025/6/16 21:35:46

【生成模型】视频生成论文调研

工作清单上游应用方向：控制、速度、时长、高动态、多主体驱动类型工作基础模型WAN / WAN-VACE / HunyuanVideo控制条件轨迹控制ATI~镜头控制ReCamMaster~多主体驱动Phantom~音频驱动Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation速…...

编程新知 2025/6/19 5:33:21

【Linux】Linux 系统默认的目录及作用说明

博主介绍：✌全网粉丝23W，CSDN博客专家、Java领域优质创作者，掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域✌ 技术范围：SpringBoot、SpringCloud、Vue、SSM、HTML、Nodejs、Python、MySQL、PostgreSQL、大数据、物…...

编程新知 2025/7/13 20:10:59

掌握 HTTP 请求：理解 cURL GET 语法

cURL 是一个强大的命令行工具，用于发送 HTTP 请求和与 Web 服务器交互。在 Web 开发和测试中，cURL 经常用于发送 GET 请求来获取服务器资源。本文将详细介绍 cURL GET 请求的语法和使用方法。一、cURL 基本概念 cURL 是 "Client URL" 的缩写…...

编程新知 2025/7/9 20:52:19

一、 评估指标