当前位置：首页 > news >正文

【ML】欠拟合和过拟合的一些判别和优化方法（吴恩达机器学习笔记）

news 2026/5/28 4:12:55

吴恩达老师的机器学习教程笔记

减少误差的一些方法

获得更多的训练实例——解决高方差
尝试减少特征的数量——解决高方差
尝试获得更多的特征——解决高偏差
尝试增加多项式特征——解决高偏差
尝试减少正则化程度 λ——解决高偏差
尝试增加正则化程度 λ——解决高方差

什么是欠拟合？什么是过拟合？

欠拟合：在训练集上存在较大误差
过拟合：在训练集上误差较小，在测试集（实际使用）上误差较大

如何计算？
将数据集分为70%训练集，30%测试集。
在训练集上进行训练，在测试集上计算误差。

对于线性回归模型：利用测试集计算误差
对于逻辑回归模型：利用测试集计算误差、还要计算误分类比率（错误分类占总分类的比率）

多模型选择

假设有多个不同次数的二项式模型等待选择：
在这里插入图片描述
将训练集分为训练集60%，交叉验证集20%，测试集20%
模型选择的方法为：

使用训练集训练出 10 个模型
用 10 个模型分别对交叉验证集计算得出交叉验证误差（代价函数的值）
选取代价函数值最小的模型
用步骤 3 中选出的模型对测试集计算得出推广误差（代价函数的值）

判断欠拟合和过拟合

在这里插入图片描述

训练集误差和交叉验证集误差近似时：偏差/欠拟合
交叉验证集误差远大于训练集误差时：方差/过拟合

正则化方法来防止过拟合

在我们在训练模型的过程中，一般会使用一些正则化方法来防止过拟合。但是我们可能会正则化的程度太高或太小了，即我们在选择 λ 的值时也需要思考与刚才选择多项式模型次数类似的问题。
在这里插入图片描述
我们选择一系列的想要测试的 𝜆 值，通常是 0-10 之间的呈现 2 倍关系的值（如：0,0.01,0.02,0.04,0.08,0.15,0.32,0.64,1.28,2.56,5.12,10共 12 个）。我们同样把数据分为训练集、交叉验证集和测试集。

选择𝜆的方法为：
1.使用训练集训练出 12 个不同程度正则化的模型
2.用 12 个模型分别对交叉验证集计算的出交叉验证误差
3.选择得出交叉验证误差最小的模型
4.运用步骤 3 中选出模型对测试集计算得出推广误差，我们也可以同时将训练集和交叉验证集模型的代价函数误差与 λ 的值绘制在一张图表上：
在这里插入图片描述
1.当 𝜆 较小时，训练集误差较小（过拟合）而交叉验证集误差较大
2.𝜆 的增加，训练集误差不断增加（欠拟合），而交叉验证集误差则是先减小后增加

学习曲线

欠拟合状态：
在这里插入图片描述
随着训练集加入更多的数据，绘制误差，发现增加数据并不能减少误差。

过拟合状态：
在这里插入图片描述
欠拟合状态，随着测试集的增加，可以减少误差。

【ML】欠拟合和过拟合的一些判别和优化方法（吴恩达机器学习笔记）

减少误差的一些方法

什么是欠拟合？什么是过拟合？

多模型选择

判断欠拟合和过拟合

正则化方法来防止过拟合

学习曲线

相关文章：

【ML】欠拟合和过拟合的一些判别和优化方法（吴恩达机器学习笔记）

服务器数据恢复—服务器发生故障导致数据丢失如何恢复服务器数据？

SLAM中提到的相机位姿到底指什么？

《视觉SLAM十四讲》-- 后端 1（上）

南昌市西湖区棒球特色规划

nginx启动命令

防爆五参数气象仪的科技力量

J. Chem. Theory Comput. | AI驱动的柔性蛋白-小分子复合物建模

数据库sql语句设置外键

excel在函数中插入函数

保姆级前端翻牌效果(CSS)

Mac环境配置的相关知识

业务连续性：确保稳健运营的关键战略

【Pytorch和深度学习】栏目导读

sklearn笔记：neighbors.NearestNeighbors

V-for中 key 值的作用，如何选择key

linux内核驱动开发

2.3.5 交换机的VRRP技术

Knowledge Graph Reasoning with Relational Digraph

力扣203：移除链表元素

top50 BF16算力(TFLOPS) 显卡排行榜天梯图

收藏必看｜2026 版大厂 AI 岗位薪资曝光！普通程序员转型大模型最全指南

别再死记硬背Payload了！我用XSS-Game靶场，带你拆解18种过滤规则背后的绕过逻辑

【数据结构与算法】数据结构基础——栈和队列

基于MAX78000的边缘AI语音识别：从模型训练到嵌入式部署实战

终极虚拟显示器解决方案：ParsecVDisplay完整使用指南

从Figma设计到Python GUI：Tkinter-Designer如何重塑可视化开发范式

条件Shapley值：用shapr包实现更公平的模型可解释性

为什么你的DeepSeek沙箱被绕过了？揭秘3种未公开的上下文逃逸技术及熔断防护配置

突破百度网盘速度壁垒：Python直链解析工具的技术实现与应用