当前位置: 首页 > article >正文

下篇:欠拟合——那个还没开始就放弃的“躺平族”

一、欠拟合有什么作用——它是个“最低标准报警器”先说直白点欠拟合本身不是好事但“发现欠拟合”这件事非常有用。作用1它是模型复杂度的“下限检测器”你训练一个模型发现训练集准确率只有55%而瞎猜是50%验证集也差不多。这时候欠拟合告诉你你的模型太弱了连训练数据都搞不定。这就像你请了一个家教结果孩子考试从40分变成了41分——家教确实有点用但用处微乎其微。这时候你就知道要么换家教换模型要么改变教学方法加特征、调参数。没有欠拟合这个概念你可能会误以为“模型还有救再多训练一会儿就行”——但实际上如果模型容量本身不够你训练一万年也没用。作用2主动欠拟合是一种“正则化”策略你没看错有时候你故意让模型欠拟合反而能提高泛化能力。场景一防止过拟合的极端手段。如果你的数据噪声很大模型太强反而会把噪声全学进去。这时候你会故意用一个弱模型比如线性模型而不是深度网络让它“欠拟合”那些噪声——这叫用欠拟合对抗过拟合。场景二早期停止的另一种解释。我们在过拟合那篇里说过“早停”可以防止过拟合。早停的那个“停止点”其实就是模型刚好处在既不欠拟合也不过拟合的位置。如果你停得太早那就是主动制造了欠拟合——但如果你故意停得特别早可以用作一种粗糙的特征提取。场景三解释性要求极高的场景。比如医疗诊断、金融风控你需要模型非常简单比如只有两三个特征的线性模型。这时候你宁可接受一定程度的欠拟合也要换来可解释性。总结一下欠拟合是一个“红灯”——它告诉你模型太弱了但你可以利用这个红灯来校准你的模型选择。主动欠拟合则是一种“以退为进”的策略。二、怎么解决欠拟合——5大方法从简单到暴力如果你的模型真的欠拟合了训练集准确率低验证集也低别慌。欠拟合比过拟合好治多了——因为它本质上就是“学不够”你往反方向使劲就行。方法1增加模型复杂度给模型“增肌”欠拟合最常见的原因就是模型太弱。那就让它变强。增加层数或神经元神经网络里从1层加到3层或者每层从10个神经元加到100个。使用更强的算法从线性回归换成多项式回归加平方项、立方项或者从决策树换成随机森林、GBDT。减少正则化强度如果你加了L1或L2正则化把惩罚系数调小甚至设为0让模型敢于把参数变大。生活中类比你让一个小学生去解微积分他解不出来——这不是他懒是他能力不够。换一个大学生来就能解了。欠拟合就是“人不对”换更强的模型就行。方法2增加更多特征给模型更多“线索”模型学不会可能是因为你给的信息太少。添加领域相关的特征预测房价时除了面积再加楼层、房龄、地铁距离、学区等。构造交叉特征比如“面积 × 楼层”这个组合特征可能比单独的面积和楼层更有用。使用特征工程对连续变量做多项式扩展、分箱、傅里叶变换等让线性模型也能拟合非线性关系。生活中类比你想猜一个人是不是程序员。只给“戴不戴眼镜”这个特征准确率可能只有55%。再加“穿不穿格子衬衫”、“发际线高低”、“用不用MacBook”这三个特征准确率能到80%。特征越多模型越能学到位。方法3降低欠拟合导向的正则化反过来正则化本来是防止过拟合的但如果你已经欠拟合了正则化就是“帮倒忙”。减小L1/L2惩罚系数如果之前设了λ0.1试试λ0.01甚至0。关闭Dropout在神经网络里Dropout会随机丢弃一些神经元这会让模型变弱。欠拟合时把Dropout关掉或降低丢弃率。放宽早停条件如果之前用了早停可能停得太早了。让模型多训练几轮看看损失还能不能下降。生活中类比你给孩子戴了很重的沙袋让他跑步他跑得慢。你以为是能力问题其实只是沙袋的问题。欠拟合时先检查是不是“人为限制了模型的能力”。方法4增加训练时间别急着下结论有时候欠拟合只是因为你没训练够。增加迭代次数把epoch从10加到100观察训练损失是否还在下降。调整学习率如果学习率太小模型收敛太慢如果太大可能震荡不收敛。用学习率衰减或自适应优化器Adam可以缓解。更好的初始化有些模型对初始值敏感换一种初始化方法比如He初始化或Xavier能加速收敛。生活中类比你学一门新语言只学了一周就考试成绩很差。这不是你学不会是时间不够。再多学一个月成绩就上去了。方法5清洗数据排除干扰项这条比较少见但如果你训练数据里有大量错误标签或异常值模型会被“带偏”表现为欠拟合。检查标签质量有没有把猫标成狗有没有标注不一致去除明显的异常值比如身高2.6米、月收入负数的样本。增加数据量有时候欠拟合是因为数据太少模型无法从中总结出稳定规律。加数据往往能同时缓解欠拟合和过拟合——神奇吧总结一下欠拟合 vs 过拟合对比项 欠拟合 过拟合 训练集表现 差 极好 测试集表现 也差 也差但比训练集差很多 本质 没学会主要规律 连噪音都背下来了 原因 模型太弱、特征太少、训练不够 模型太强、数据太少、训练过度 怎么治 增加复杂度、加特征、多训练 降低复杂度、加数据、正则化、早停欠拟合了就“加码”——加模型复杂度、加特征、加训练时间。过拟合了就“减负”——减模型复杂度、减特征、加正则化。记住这两条你就能在欠拟合和过拟合之间找到那个“刚刚好”的点。那个点就是真正的机器学习高手所在的区间。

相关文章:

下篇:欠拟合——那个还没开始就放弃的“躺平族”

一、欠拟合有什么作用?——它是个“最低标准报警器” 先说直白点:欠拟合本身不是好事,但“发现欠拟合”这件事非常有用。作用1:它是模型复杂度的“下限检测器” 你训练一个模型,发现训练集准确率只有55%(而…...

别再迷信仿真!实测STM32的3.3V PWM也能驱动IR2104(附完整代码与波形分析)

实测揭秘:STM32的3.3V PWM驱动IR2104全攻略 在嵌入式硬件开发中,仿真工具常被视为"真理标准",但真实电路往往给我们上生动一课。最近遇到一个典型案例:使用STM32的3.3V PWM信号驱动IR2104半桥驱动器时,仿真…...

Gitee本土化战略深度解析:中国开发者生态的“新基建“ Gitee本土化战略深度解析:中国开发者生态的“新基建“

在数字化转型浪潮席卷全球的当下,代码托管平台作为软件开发的基础设施,其战略价值日益凸显。Gitee作为中国本土领先的代码托管平台,凭借其独特的本土化优势,正在重塑国内开发者的协作生态。与GitHub等国际平台相比,Git…...

新浪舆情通:数据大屏让信息一目了然

新浪舆情通:数据大屏让信息一目了然网络时代,面对海量数据,如何快速发现重要信息、准确判断发展态势、及时开展分析研判?新浪舆情通数据大屏,通过多维数据的可视化大屏,将复杂的数据转化为直观的分析图表&a…...

内存测试指标和工具

1.dmidecode作用:把系统BIOS中的硬件信息提取出来使用方法dmidecode | grep "Configured Memory Speed"这个示例用于查看内存实际频率,内存实际频率代表了内存处理数据的速度实际项目中会告诉你测试1DPC还是2DPC,这里的DPC&#xf…...

Spring IOC 源码学习 事务相关的 BeanDefinition 解析过程 (XML)感

从0构建WAV文件:读懂计算机文件的本质 虽然接触计算机有一段时间了,但是我的视野一直局限于一个较小的范围之内,往往只能看到于算法竞赛相关的内容,计算机各种文件在我看来十分复杂,认为构建他们并能达到目的是一件困难…...

这是我的第一篇文章

以后将会发布一些有关我Java的学习过程...

从零开始掌握时序逻辑电路:状态机设计与FPGA实战解析

1. 时序逻辑电路基础入门 第一次接触时序逻辑电路时,我盯着教科书上的波形图发呆了半小时。直到在实验室用FPGA开发板亲眼看到LED灯随着时钟信号有规律地闪烁,才真正理解这个抽象概念。时序逻辑电路和组合逻辑电路最大的区别,就像音乐会现场和…...

手把手教你用GPT-oss:20b:CSDN平台图文教程,小白也能快速部署

手把手教你用GPT-oss:20b:CSDN平台图文教程,小白也能快速部署 想体验接近GPT-4级别的智能对话,但又担心数据隐私、网络延迟或持续付费?今天,我将带你通过CSDN平台,在几分钟内免费部署一个完全开源、本地运…...

Harness Engineering(驾驭工程)-2026年最强的智能体-周红伟

AI 模型已经能写出 100 万行代码。真正的挑战不再是让它写得更好,而是怎么驾驭它稳定、可靠、不失控地工作。这套围绕 AI 智能体构建约束、反馈与控制系统的方法论,就是 2026 年初迅速席卷工程圈的新范式——Harness Engineering(驾驭工程&am…...

提示词工程(Prompt Engineering)-周红伟

你有没有遇到过这种情况:明明给了 AI 一个问题,得到的回答却空泛、跑题、毫无用处? 这不是 AI 的问题,往往是提问方式的问题。 提示词工程(Prompt Engineering)就是一门关于如何构造和精炼你的提示词的艺术…...

Rustup进阶指南:5个高效管理Rust工具链的实战技巧

Rustup进阶指南:5个高效管理Rust工具链的实战技巧 【免费下载链接】rustup The Rust toolchain installer 项目地址: https://gitcode.com/gh_mirrors/ru/rustup Rustup作为Rust官方工具链安装器,让开发者能够轻松管理多个Rust版本、切换发布渠道…...

AIMP(音乐播放软件)

AIMP是一款免费的音频播放器,支持多种音频格式,包括MP3、OGG、FLAC、WAV、AAC等。它具有简洁的界面和强大的功能,是一款非常受欢迎的音频播放器。 软件功能 1. 支持多种音频格式,包括MP3、OGG、FLAC、WAV、AAC等。 2. 支持自动歌…...

200+技术改进实现环世界400%帧率提升的架构解析

200技术改进实现环世界400%帧率提升的架构解析 【免费下载链接】Performance-Fish Performance Mod for RimWorld 项目地址: https://gitcode.com/gh_mirrors/pe/Performance-Fish 随着殖民地规模扩大,《环世界》玩家常面临严重的性能瓶颈问题。游戏在后期处…...

Notepad--完全指南:掌握跨平台国产文本编辑器的3个实用技巧

Notepad--完全指南:掌握跨平台国产文本编辑器的3个实用技巧 【免费下载链接】notepad-- 一个支持windows/linux/mac的文本编辑器,目标是做中国人自己的编辑器,来自中国。 项目地址: https://gitcode.com/GitHub_Trending/no/notepad-- …...

大卫小东(Sheldon)唾

Issue 概述 先来看看提交这个 Issue 的作者是为什么想到这个点子的,以及他初步的核心设计概念。?? 本 PR 实现了 Apache Gravitino 与 SeaTunnel 的集成,将其作为非关系型连接器的外部元数据服务。通过 Gravitino 的 REST API 自动获取表结构和元数据&…...

防静电门禁(ESD 闸机)系统深度技术方案:原理、硬件、接线、调试、故障排查

本文从硬件原理、电气接口、通信协议、联动逻辑、调试步骤、故障树六个维度,完整拆解防静电门禁闸机系统(ESD) 的技术实现与工程落地,内容适用于:电子 / 半导体车间 EHS、设备、IE 工程师智能化工程、安防系统 集成商 …...

Apache Solr 详解:企业级搜索平台的核心特性与架构

Apache Solr 详解:企业级搜索平台的核心特性与架构 文章目录 Apache Solr 详解:企业级搜索平台的核心特性与架构1. 核心功能2. 核心概念与架构2.1 关键术语2.2 工作流程 3. Solr vs. Elasticsearch4. 典型应用场景5. 快速入门与资源5.1 安装准备5.2 启动…...

GetQzonehistory:让QQ空间记忆不再“云端漂浮”,你的青春值得永久保存

GetQzonehistory:让QQ空间记忆不再“云端漂浮”,你的青春值得永久保存 【免费下载链接】GetQzonehistory 获取QQ空间发布的历史说说 项目地址: https://gitcode.com/GitHub_Trending/ge/GetQzonehistory 还记得那些深夜发的说说、毕业时的感慨、旅…...

CentOS 7.9源码编译glibc 2.28:从“cannot find -lnss_test2”报错到成功部署的实战复盘

1. 问题背景与复现 最近在CentOS 7.9系统上源码编译glibc 2.28时,遇到了一个让人头疼的报错:/usr/bin/ld: cannot find -lnss_test2。这个错误发生在编译的最后阶段,直接导致安装失败。作为一个长期和Linux系统打交道的老手,我决定…...

零基础转行大模型选哪个岗位方向最易上手?常见问题全解析

零基础转行大模型选哪个岗位方向最易上手?常见问题全解析 标签:#人工智能、#深度学习、#自然语言处理、#神经网络、#机器学习、#计算机视觉、#ai ### 先打破一个误区:大模型≠只有算法岗,普通人也能进### 大模型岗位:哪…...

AIAgent响应延迟超800ms?SITS2026案例实测:4步将LCEL流水线性能提升6.8倍(附压测对比数据)

第一章:SITS2026案例:AIAgent个人助理开发 2026奇点智能技术大会(https://ml-summit.org) SITS2026(Smart Intelligence Technology Showcase 2026)是面向下一代AI原生应用的标杆性实践平台,其中“AIAgent个人助理”…...

非计算机专业转AI Agent:补哪些基础最有效

【本段核心】现在很多大学生都有转AI的想法,但每天做的却是收藏一堆教程、刷一堆概念、看一堆“LLM 从入门到精通”,然后继续焦虑、继续拖沓、继续投简历没回音。我就是双非野鸡二本经济学转Agent的,成效把 Agent 这条路跑通之后,…...

FirPE 维护系统 v2.1.0

FirPE 是一款系统预安装环境(Windows PE),它具有简约、易操作等特点,使用起来十分人性化。以U盘作为使用载体,空间更为充分,携带更为方便。同时整合各种装机必备工具,有效提高系统安装效率。Fir…...

FreeRTOS队列实战:uxQueueMessagesWaiting在UART中断中的那些坑

FreeRTOS队列深度解析:UART中断中的uxQueueMessagesWaiting陷阱与实战对策 在嵌入式开发中,UART通信与FreeRTOS队列的结合使用堪称经典组合,但正是这种看似简单的组合,却暗藏诸多玄机。我曾在一个工业传感器采集项目中&#xff0c…...

3步解锁B站专业直播:告别直播姬限制的终极方案

3步解锁B站专业直播:告别直播姬限制的终极方案 【免费下载链接】bilibili_live_stream_code 用于在准备直播时获取第三方推流码,以便可以绕开哔哩哔哩直播姬,直接在如OBS等软件中进行直播,软件同时提供定义直播分区和标题功能 项…...

Nebula Console深度解析:高效管理图数据库的核心技巧与实战指南

Nebula Console深度解析:高效管理图数据库的核心技巧与实战指南 【免费下载链接】nebula-console Command line interface for the Nebula Graph service 项目地址: https://gitcode.com/gh_mirrors/ne/nebula-console Nebula Console作为NebulaGraph图数据库…...

基于VScode的安装——MinGW的介绍和安装

1、MinGW介绍 MinGW开源免费,是Windows上的GNU编译工具链,核心是把GCC编译器移植到Windows。主要作用是在Windows上用GCC编译C/C等编程语言,直接生成原生Windows .exe可执行文件,只依赖Windows自带的MSVCRT系统库,不依…...

3步实现Chrome浏览器与KeePass密码库无缝同步

3步实现Chrome浏览器与KeePass密码库无缝同步 【免费下载链接】ChromeKeePass Chrome extensions for automatically filling credentials from KeePass/KeeWeb 项目地址: https://gitcode.com/gh_mirrors/ch/ChromeKeePass 你是否厌倦了每次登录网站都要手动输入密码&a…...

B站资源下载终极指南:跨平台BiliTools使用全攻略

B站资源下载终极指南:跨平台BiliTools使用全攻略 【免费下载链接】BiliTools A cross-platform bilibili toolbox. 跨平台哔哩哔哩工具箱,支持下载视频、番剧等等各类资源 项目地址: https://gitcode.com/GitHub_Trending/bilit/BiliTools 还在为…...