当前位置：首页 > news >正文

机器学习——正则化

news 2026/2/8 23:57:27

正则化

在机器学习学习中往往不知道需要不知道选取的特征个数，假如特征个数选取过少，容易造成欠拟合，特征个数选取过多，则容易造成过拟合。由此为了保证模型能够很好的拟合样本，同时为了不要出现过拟合现象，引入了一个正则项。

book-py_ml_2nd-03_07

如图所示：

当选用特征过少时，函数的拟合程度如左边的图一样，不能很好的拟合

当选用特征适中时，函数的拟合程度如中间的图一样，可以比较好的拟合

当选用特征过多时，函数的拟合程度如右边的图一样，能够完全拟合样本，但是可能在测试数据上不佳。

当选用均方误差作为损失函数时

Loss function： $\sum (y-Wx_i)^2$ ，当选择模型过于复杂时（即 $W$ 维度过高， $X$ 特征过多时）损失函数往往趋近于0甚至等于0，能够很好的拟合样本但是不具有很好的泛化能力，所以为了降低模型的复杂度我们引入了一个正则项 $\lambda W^TW$ 。即损失函数为 $\sum (y-Wx_i)^2+\lambda W^TW$ 。由此最小化损失函数时。会考虑模型的复杂度，保证模型不至于太复杂。

当存在一个样本 $\mathbf{ X=\{x_1,x_2,\cdots,x_n\}}$ ， $y=ax^2+bx+c+\xi$ ，其中 $\xi$ 为一个高斯噪声，

当选择模型： $\theta_1 x+\theta_2$ 时，模型无法很好的拟合样本

当选择模型： $\theta_1 x^2+\theta_2 x+\theta_3$ 时，模型可以较好的拟合样本

当选择模型： $\theta_1 x^5+\theta_2 x^4+\theta_3 x^3+\theta_4 x^2+\theta_5 x+\theta_6$ 时，模型可以完全拟合样本，当引入正则项 $\lambda W^TW$ ，可以保证 $W$ 不至于太复杂，由此可以使 $\theta_1,\theta_2,\theta_3$ 足够小，不至于使给模型造成太大的影响，所以可以避免模型太过于复杂以至于过拟合。

机器学习——正则化

正则化

相关文章：

机器学习——正则化

【c++】打家劫舍（动态规划）

eslint提示 xxx should be listed in the project's dependencies

H3C LC-5120-52SC-HI配置管理IP

数据结构与算法之排序: 归并排序 (Javascript版)

Java练习题2021-2

深度学习面试题目01

ESP32网络开发实例-HTTP-POST请求

怎么把成绩发给家长

Banana Pi BPI-W3 RK3588开发板基本使用文档

源码解析SpringMVC之RequestMapping注解原理

biocParallel学习

AWTK实现汽车仪表Cluster/DashBoard嵌入式GUI开发（六）：一个AWTK工程

MySQL主从复制（基于binlog日志方式）

计算机网络【CN】介质访问控制

CDR和AI哪个软件更好用？

保姆级认识AVL树【C++】（精讲：AVL Insert）

pinia中使用reactive声明变量，子页面使用时，值未改变,即不是响应式的（解决方法）

基于springboot零食商城管理系统

C++程序练习

DeepSeek 赋能智慧能源：微电网优化调度的智能革新路径

Python实现prophet 理论及参数优化

剑指offer20_链表中环的入口节点

【SQL学习笔记1】增删改查+多表连接全解析（内附SQL免费在线练习工具）

【算法训练营Day07】字符串part1

在Ubuntu中设置开机自动运行（sudo）指令的指南

c#开发AI模型对话

Angular微前端架构：Module Federation + ngx-build-plus (Webpack)

深入理解Optional：处理空指针异常

上位机开发过程中的设计模式体会(1)：工厂方法模式、单例模式和生成器模式