当前位置: 首页 > article >正文

【机器学习及深度学习】机器学习模型的误差:偏差、方差及噪声

机器学习模型的误差分析

    • V1.0
    • 机器学习模型的衡量准则
    • 概念引入
    • 机器学习模型误差分析
    • 误差出现的原因及消除

V1.0

机器学习模型的衡量准则

衡量机器学习模型的好坏可以考虑以下几个方面:

  • 偏差(Bias)
    在充分训练的情况下,机器学习模型是否能够较好地拟合训练数据,以反映真实规律。

    这些问题可以被称为模型的能力,衡量这一问题的指标称为偏差(Bias)。

  • 方差(Variance)
    在充分训练的情况下,不同的机器学习模型对不同训练数据集敏感程度不同。某些机器学习模型使用不同的训练数据进行训练,所得到的模型的输出结果较为稳定。而某些机器学习模型使用不同的训练数据进行训练,所得到的模型的输出结果不稳定,有较大波动,即对不同训练数据的鲁棒程度较低。

    衡量机器学习对训练数据的鲁棒程度这一问题的指标称为方差(Variance)。

  • 噪声(Noise)
    机器学习模型是为了拟合训练数据,以达到反映真实数据规律的功能。在实际情况中,采集到的训练数据往往不等于真实数据,训练数据往往会包含随机波动,因此会对模型的结果造成一定的误差。训练数据的随机波动往往是因为测量方法限制、测量精度限制、标注错误等而产生的。

    衡量训练数据中真实规律数据以外的随机扰动的指标称为噪声(Noise)。

概念引入

为了对机器学习模型的误差进行分析,需要明确以下几个概念

  • f ^ ( x ) \space\hat{f}(x)\space  f^(x) 数据预测函数(Estimated function)
    数据预测函数 f ^ ( x ) \space\hat{f}(x)\space  f^(x) 是通过训练过程得到的机器学习模型,使用该模型对输入数据进行预测。
    同样结构的机器学习模型,使用不同的训练集和初始值以及训练方法进行训练,应该会得到有差异的结果。因此对预测函数的输出结果求期望值 E ( f ^ ( x ) ) \space E(\hat{f}(x))\space  E(f^(x)) 是有意义的,该期望值能够反映不同训练条件下,模型结果的平均水平。

  • y \space y\space  y 观测值(Observed Value)
    使用观测手段观测所得到的数据,即训练时模型使用的实际数据。观测值是包含噪声的真实数据,由于测量方法限制、测量精度限制、标注错误等原因会和真实值 f ( x ) \space f(x)\space  f(x) 有偏差。

    观测值 y \space y\space  y 与真实函数 f ( x ) \space f(x)\space  f(x) 的关系如下:
    y = f ( x ) + ϵ y=f(x)+\epsilon y=f(x)+ϵ

    其中 ϵ \space \epsilon\space  ϵ 是噪声,噪声的方差为 V a r ( ϵ ) = σ 2 \space{Var(\epsilon)}=\sigma^2  Var(ϵ)=σ2

  • f ( x ) \space f(x)\space  f(x) 真实函数(True Function)
    真实函数 f ( x ) \space f(x)\space  f(x) 反映问题的数据的客观真实规律,具体来说,即反映真实的数据输入到输出的映射规律,是理想的不包含噪声的。采集的训练数据往往是由真实数据及随机扰动的噪声 ϵ \space \epsilon\space  ϵ 两部分组成的。

机器学习模型误差分析

机器学习模型误差可以分解为偏差、方差和噪声3个部分,公式如下:
E [ ( f ^ ( x ) − y ) 2 ] = Bias 2 ( f ^ ( x ) ) ⏟ 偏差 + Var ( f ^ ( x ) ) ⏟ 方差 + σ 2 ⏟ 噪声 E[(\hat{f}(x)-y)^2]=\underbrace{\text{Bias}^2(\hat{f}(x))}_{偏差}+\underbrace{\text{Var}(\hat{f}(x))}_{方差}+\underbrace{\sigma^2}_{噪声} E[(f^(x)y)2]=偏差 Bias2(f^(x))+方差 Var(f^(x))+噪声 σ2
机器学习的误差分析公式,在满足噪声独立性、零均值噪声和模型针对多个训练集求期望时,公式是严谨的。这部分内容更加复杂,本文不进行探讨,可以自行寻找资料研究。

  • 偏差(Bias)
    偏差反映了多次训练模型预测结果与真实结果之间的系统性误差。公式如下:
    B i a s ( f ^ ( x ) ) = E [ f ^ ( x ) ] − f ( x ) Bias(\hat{f}(x))=E[\hat{f}(x)]-f(x) Bias(f^(x))=E[f^(x)]f(x)
    公式理解:偏差即为预测模型的预测结果的期望与真实函数预测结果的差值。

    偏差反映了在充分训练的情况下模型结构的能力。
    偏差越小,说明模型拟合能力越强,更适用于该种问题。偏差越小,也有可能是过拟合的原因,此时通常会偏差小而方差大。偏差越大,说明预测模型的预测结果的系统性偏离了要拟合的训练数据,无法有效反应真实规律。

  • 方差(Variance)
    方差反映了模型对不同的训练数据是否鲁棒。训练数据的随机波动会对模型训练结果产生影响。方差的公式如下:
    V a r ( f ^ ( x ) ) = E [ ( f ^ ( x ) − E [ f ^ ( x ) ] ) 2 ] Var(\hat{f}(x))=E[(\hat{f}(x)-E[\hat{f}(x)])^2] Var(f^(x))=E[(f^(x)E[f^(x)])2]

    公式理解:方差为各个训练集训练结果 f ^ ( x ) \space \hat{f}(x)\space  f^(x) 分别减去所有预测结果的期望值 E [ f ^ ( x ) ] \space E[\hat{f}(x)]  E[f^(x)],每个差值 ( f ^ ( x ) − E [ f ^ ( x ) ] ) \space (\hat{f}(x)-E[\hat{f}(x)])\space  (f^(x)E[f^(x)]) 平方后求期望,即正常求方差的过程。

    方差反映了模型对不同训练数据的敏感程度。方差高,同样的训练程度,不同的训练集训练出的机器学习模型的预测结果差异大。这通常是由于模型训练发生了过拟合,模型过多的拟合了训练数据中的噪声,造成其泛化能力下降。低方差的情况下,不同训练集训练出的模型预测结果更稳定。

  • 噪声(Noise)
    噪声是由于训练数据本身包含的不可约误差,给机器学习模型造成的误差。由于噪声的存在,导致采集到的训练数据偏离真实数据,这些有噪声的训练数据会限制模型性能的上限。

误差出现的原因及消除

  • 高偏差的原因
    训练不充分,或模型能力不足,可能是模型类型选择不当或模型参数量不够。

    解决方法:
    – 选择更合适的模型。
    – 增加同种模型的复杂度或参数量。如线性回归模型可使用多项式线性回归,或神经网络增加网络层数和参数数量。

  • 高方差的原因
    模型过于复杂,拟合能力过强,导致过度拟合了特定训练数据或噪声,导致其泛化能力差。

    解决方法
    – 可以进行模型简化,例如神经网络减少参数数量。
    – 增加训练数据量。
    – 使用正则化手段,如L1、L2正则化。
    – 使用集成学习方法。

  • 噪声出现的原因
    噪声产生于数据生成过程中的不确定因素,所导致的训练数据的随机扰动。
    噪声产生的原因包括数据采集层面的原因,如摄像头像素噪声,声音采集时的环境噪声等。以及数据标注层面的噪声,例如正负评论类别标注错误等。

    解决方法
    噪声不可能完全消除,可以对数据进行处理尽量降低其影响。
    – 可以使用更加鲁棒的模型。
    – 使用集成学习方法。

相关文章:

【机器学习及深度学习】机器学习模型的误差:偏差、方差及噪声

机器学习模型的误差分析 V1.0机器学习模型的衡量准则概念引入机器学习模型误差分析误差出现的原因及消除 V1.0 机器学习模型的衡量准则 衡量机器学习模型的好坏可以考虑以下几个方面: 偏差(Bias): 在充分训练的情况下&#xff0…...

【学习笔记】On the Biology of a Large Language Model

On the Biology of a Large Language Model 1 Introduction 目标是对这些模型的内部工作机制进行逆向工程,从而更好地理解它们,并评估它们是否适合特定用途。 正如细胞是生物系统的基本构建单元,我们假设特征是模型内部计算的基本单位。仅仅…...

飞腾D2000,麒麟系统V10,docker,ubuntu1804,小白入门喂饭级教程

#下载docker Index of linux/static/stable/ 根据电脑的CPU类型选择: Intel和AMD选x86_64飞腾D2000选aarch64 #选择较新的版本 #在包含下载的docker-XX.X.X.tgz的文件夹中右键->打开终端 # 解压安装包(根据实际下载的文件) tar -zxvf …...

星野录(博客系统)测试报告

目录 一. 项目背景 二、项目功能 三、测试计划 1. 功能测试 1.1 测试用例 1.2 执行测试部分操作截图 2. 使用selenium进行自动化测试 2.1 添加相关依赖 2.2 登录页面测试 3.3 注册页面测试 3.4 博客列表页面测试 3.5 博客详情页测试 3.6 博客编辑页面测试 3.7 个人…...

使用 Java 实现一个简单且高效的任务调度框架

目录 一、任务调度系统概述 (一)任务调度的目标 (二)任务调度框架的关键组成 二、任务状态设计 (一)任务状态流转设计 (二)任务表设计(SQL) 三、单机任务调度实现 (一)获取待处理任务 (二)执行任务 代码实现(单线程版本) (三)多线程提高吞吐量 四…...

2022—2025年:申博之路及硕士阶段总结

文章目录 1 前景概要2 打造神兵利器2.1 夺天地之精2.2 锻兵魂之形2.3 契人兵之命 3 潜心闭关修炼3.1 第一阶段:苦心智3.2 第二阶段:劳筋骨3.3 第三阶段:摧意志 4 突破晋级4.1 突破失败4.2 聚气凝神4.3 心魔再现4.4 新起点 5 回顾及深思 1 前景…...

项目执行中缺乏灵活应对机制,如何增强适应性?

项目执行中缺乏灵活应对机制可以通过建立风险预警机制、培养团队快速响应能力、制定动态调整方案、加强团队沟通协作、引入敏捷管理理念来增强适应性。 其中,培养团队快速响应能力尤为重要。这种能力意味着当项目遇到突发状况时,团队能迅速评估问题、确定…...

Agentic Workflow是什么?Agentic Workflow会成为下一个AI风口吗?

无论是想要学习人工智能当做主业营收,还是像我一样作为开发工程师但依然要运用这个颠覆开发的时代宠儿,都有必要了解、学习一下人工智能。 近期发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,入行门槛低&#x…...

大模型模型推理的成本过高,如何进行量化或蒸馏优化

在人工智能的浪潮中,大模型已经成为推动技术革新的核心引擎。从自然语言处理到图像生成,再到复杂的多模态任务,像GPT、BERT、T5这样的庞大模型展现出了惊人的能力。它们在翻译、对话系统、内容生成等领域大放异彩,甚至在医疗、金融等行业中也开始扮演重要角色。可以说,这些…...

BUUCTF[极客大挑战 2019]EasySQL 1题解

[极客大挑战 2019]EasySQL题解 分析解题过程漏洞原理分析明确注入点:尝试万能密码法法一法二 总结 分析 从题目分析,这道题应该与SQL注入有关,启动靶机之后,访问url是一个登录界面,随便输入用户名密码之后&#xff0…...

Css样式中设置gap: 12px以后左右出现距离问题解析

原因核心&#xff1a; 虽然写的是&#xff1a; display: flex; gap: 12px;但在实际 DOM 中&#xff0c;这段结构&#xff1a; <div class"el-form-item__content"><div class"el-input"><input type"text" class"el-inpu…...

MySQL问题:count(*)与count(1)有什么区别

Count&#xff08;1&#xff09;查询过程 如果表里只有主键索引&#xff0c;没有二级索引时&#xff0c;InnoDB循环遍历主键索引&#xff0c;将读取到的记录返回给Server层&#xff0c;但是不会读取记录中的任何字段的值&#xff0c;因为count函数的参数是1&#xff0c;不是字…...

大模型 提示模板 设计

大模型 提示模板 设计 论文介绍:LangGPT - 从编程语言视角重构大语言模型结构化可复用提示设计框架 核心问题: 现有提示工程缺乏结构化设计模板,依赖经验优化,学习成本高且复用性低,难以支持提示的迭代更新。 创新思路: 受编程语言的结构化和可复用性启发,提出LangGP…...

excel表格记账 : 操作单元格进行加减乘除 | Excel中Evaluate函数

文章目录 引用I 基础求和∑II Excel中Evaluate函数基于字符串表达式进行计算用法案例 :基于Evaluate实现汇率计算利润知识扩展在单元格内的换行选择整列单元格引用 需求: 基于汇率计算利润,调整金额以及进汇率和出汇率自动算出利润,已经统计总利润。 基于Evaluate实现汇率计…...

20250602在荣品的PRO-RK3566开发板的Android13下的uboot启动阶段配置BOOTDELAY为10s

20250602在荣品的PRO-RK3566开发板的Android13下的uboot启动阶段配置BOOTDELAY为10s 2025/6/2 18:15 缘起&#xff1a;有些时候&#xff0c;需要在uboot阶段做一些事情。 于是&#xff0c;希望在荣品的PRO-RK3566开发板的Android13下的uboot启动停下。 1、【原始的LOG&#xff…...

如何合理设计缓存 Key的命名规范,以避免在共享 Redis 或跨服务场景下的冲突?

设计合理的缓存 Key 命名规范对于避免冲突、提高可维护性和可读性至关重要&#xff0c;尤其是在共享 Redis 实例或跨服务调用的场景下。 以下是一个推荐的缓存 Key 命名规范和设计思路&#xff1a; 一、核心原则 唯一性 (Uniqueness): 这是最重要的原则&#xff0c;确保不同…...

Trae CN IDE自动生成注释功能测试与效率提升全解析

Trae CN IDE 的自动注释功能可以通过 AI 驱动的代码分析生成自然语言注释&#xff0c;以下是具体测试方法和优势总结&#xff1a; 一、Python 代码注释生成测试 1. 测试环境 IDE&#xff1a;Trae CN IDE&#xff08;需确认支持 Python&#xff09;代码示例&#xff1a; def …...

让AI弹琴作曲不再是梦:Python+深度学习玩转自动化音乐创作

让AI弹琴作曲不再是梦:Python+深度学习玩转自动化音乐创作 一、AI也能谱出动人的旋律?真不是科幻! 还记得小时候学钢琴时老师的那句经典:“感觉不到情绪的乐句,是没灵魂的。” 当时我一边练琴一边想:要是有个机器能帮我写谱、调性又不跑调就好了! 结果几年后,真被我碰…...

C++概率论算法详解:理论基础与实践应用

清言神力&#xff0c;创作奇迹。接受福利&#xff0c;做篇笔记。 参考资料 [0] 概率论中均值、方差、标准差介绍及C/OpenCV/Eigen的三种实现. https://blog.csdn.net/fengbingchun/article/details/73323475. [4] C中的随机数及其在算法竞赛中的使用 - 博客园. https://www.…...

ssh登录wsl2

1. ssh服务重新安装 Ubuntu20.04子系统自带的ssh服务无法连接&#xff0c;需卸载后重新安装。 sudo apt-get remove openssh-server sudo apt-get install openssh-server2. 修改配置信息 sudo vim /etc/ssh/sshd_config修改内容&#xff1a; # 最好一模一样 Port 33 # 这…...

黑马Java面试笔记之 消息中间件篇(Kafka)

一. Kafka保证消息不丢失 Kafka如何保证消息不丢失 使用Kafka在消息的收发过程中都会出现消息丢失&#xff0c;Kafka分别给出了解决方案 生产者发送消息到Brocker丢失消息在Brocker中存储丢失消费者从Brocker接收消息丢失 1.1 生产者发送消息到Brocker丢失 设置异步发送 消息…...

LeetCode - 234. 回文链表

目录 题目 快慢双指针步骤 读者可能的错误写法 正确的写法 题目 234. 回文链表 - 力扣&#xff08;LeetCode&#xff09; 快慢双指针步骤 找到链表的中点&#xff08;find_mid函数&#xff09;&#xff1a; 使用快慢指针&#xff0c;慢指针每次走一步&#xff0c;快指针…...

PYTHON通过VOSK实现离线听写支持WINDOWSLinux_X86架构

在当今人工智能快速发展的时代&#xff0c;语音识别技术已经成为人机交互的重要方式之一。本文将介绍如何使用Python结合Vosk和PyAudio库实现一个离线语音识别系统&#xff0c;无需依赖网络连接即可完成语音转文字的功能。 技术栈概述 1. Vosk语音识别引擎 Vosk是一个开源的…...

nginx+tomcat动静分离、负载均衡

一、理论 nginx用于处理静态页面以及做调度器&#xff0c;tomcat用于处理动态页面 lvs&#xff08;四层&#xff09; 轮询&#xff08;rr&#xff09; 加权轮询&#xff08;wrr&#xff09; 最小连接&#xff08;lc&#xff09; 加权最小连接&#xff08;wlc&#xff09; ngi…...

SQL进阶之旅 Day 13:CTE与递归查询技术

【SQL进阶之旅 Day 13】CTE与递归查询技术 引言 欢迎来到“SQL进阶之旅”的第13天&#xff01;今天我们重点探讨的是CTE&#xff08;公用表表达式&#xff09;与递归查询技术。CTE是现代SQL中的一个重要特性&#xff0c;能够极大地提高复杂查询的可读性与维护性。而递归CTE则…...

【PmHub面试篇】Gateway全局过滤器统计接口调用耗时面试要点解析

你好&#xff0c;欢迎来到本次关于Gateway全局过滤器统计接口调用耗时的面试系列分享。在这篇文章中&#xff0c;我们将深入探讨这一技术领域的相关面试题预测。若想对相关内容有更透彻的理解&#xff0c;强烈推荐参考之前发布的博文&#xff1a;【PmHub后端篇】PmHub Gateway全…...

neo4j 5.19.0两种基于向量进行相似度查询的方式

介绍 主要讲的是两种相似度查询 一种是创建向量索引&#xff0c;然后直接从索引的所有数据中进行相似度搜索&#xff0c;这种不支持基于自己查询的结果中进行相似度匹配另一种是自己调用向量方法生产相似度进行相似度搜索&#xff0c;这种可以基于自己的查询结果中进行相似度…...

项目课题——基于ESP32的智能插座

一、功能需求 1.1 基础功能 ✅ 远程控制 通过Wi-Fi实现手机APP/小程序远程开关支持定时任务&#xff08;如定时开启热水器&#xff09; &#x1f50c; 用电监测 实时显示电压/电流/功率电能统计&#xff08;日/月/年用电量报表&#xff09; &#x1f50b;多接口支持 220V三线…...

华为云Flexus+DeepSeek征文|利用华为云 Flexus 云服务一键部署 Dify 平台开发文本转语音助手全流程实践

目录 前言 1 华为云 Flexus 与 Dify 平台简介 1.1 Flexus&#xff1a;为AI而生的轻量级云服务 1.2 Dify&#xff1a;开源的LLM应用开发平台 2 一键部署Dify平台至Flexus环境 3 构建文本转语音助手应用 3.1 创建ChatFlow类型应用 3.2 配置语音合成API的HTTP请求 3.3 设…...

ck-editor5的研究 (7):自定义配置 CKeditor5 的 toolbar 工具栏

文章目录 一、前言二、实现步骤1. 第一步: 搭建目录结构2. 第二步:配置toolbar工具栏的步骤(2-1). 配置粗体和斜体(2-2). 配置链接和标题+正文(2-3). 配置列表和引用(2-4). 配置自动格式化3. 第三步:更多工具三、测试效果和细节四、总结一、前言 在前面的文章中,我们已经对…...