当前位置：首页 > news >正文

【漫话机器学习系列】103.学习曲线（Learning Curve）

news 2026/2/10 12:12:02

学习曲线（Learning Curve）详解

1. 什么是学习曲线？

学习曲线（Learning Curve）是机器学习和深度学习领域中用于评估模型性能随训练过程变化的图示。它通常用于分析模型的学习能力、是否存在过拟合或欠拟合等问题。

从图中可以看到，学习曲线由两条曲线组成：

训练数据集曲线（红色）：表示模型在训练集上的性能。
测试数据集或交叉验证数据集曲线（蓝色）：表示模型在测试集或交叉验证集上的性能。

横轴表示观察数（通常是训练的样本数或迭代次数），纵轴表示性能度量标准（如准确率、损失函数值等）。

2. 为什么需要学习曲线？

学习曲线的主要作用是帮助我们判断模型的训练状态，并根据其变化趋势调整模型。通过观察曲线，我们可以回答以下问题：

模型是否欠拟合？
模型是否过拟合？
是否需要更多数据？
是否应该调整超参数（如正则化、神经网络层数、学习率等）？

3. 如何解释学习曲线？

3.1 理想情况

在理想情况下：

训练曲线（红色）和测试曲线（蓝色）随着训练样本数增加逐渐收敛。
两条曲线之间的差距很小，说明模型在训练集和测试集上的表现一致，没有明显的过拟合或欠拟合问题。

如果模型表现接近理想状态，我们可以进一步微调超参数，使模型达到最佳效果。

3.2 欠拟合（Underfitting）

特点：

训练曲线和测试曲线都很低，说明模型在训练集和测试集上都表现较差。
两条曲线几乎重合，但整体性能较低。

原因：

模型过于简单，无法有效学习数据中的模式。例如，使用线性回归来拟合复杂的非线性数据。
训练时间不够，模型尚未收敛。
特征不足，模型无法充分学习数据的特征信息。

解决方案：

增加模型的复杂度（如增加神经网络层数、使用更复杂的算法）。
增加特征，进行特征工程。
增加训练时间，使模型充分学习数据特征。

3.3 过拟合（Overfitting）

特点：

训练曲线（红色）表现很好，接近最优值，但测试曲线（蓝色）明显低于训练曲线，说明模型在训练集上表现优秀，但在测试集上泛化能力较差。
两条曲线之间存在明显差距。

原因：

模型过于复杂，学习了数据中的噪声，导致泛化能力下降。
训练数据量较少，模型容易记住训练集数据，缺乏泛化能力。
过度训练，导致模型记住了训练数据，而不是学习数据的模式。

解决方案：

使用**正则化（L1/L2 正则化、Dropout）**减少过拟合。
增加训练数据，让模型学习更全面的数据模式。
降低模型复杂度，如减少神经网络的层数或参数数量。
使用数据增强（Data Augmentation），提高模型的泛化能力。

3.4 数据不足

特点：

训练曲线和测试曲线的差距较大，并且随着数据量增加仍然没有收敛。
测试曲线较不稳定，波动较大，说明测试数据不足，模型的泛化能力不够。

解决方案：

收集更多数据，增加训练样本，提高模型的学习能力。
使用数据增强（Data Augmentation），提高模型对不同数据的适应能力。
使用交叉验证，特别是 K 折交叉验证（K-Fold Cross Validation），使模型在有限数据集上更稳定。

4. 实际应用中的学习曲线

4.1 在深度学习中的应用

在深度学习任务（如图像识别、自然语言处理）中，学习曲线可以用于监控训练过程：

如果训练损失持续下降，而验证损失开始上升，可能存在过拟合。
如果训练和验证损失都很高，则可能是欠拟合。

4.2 在机器学习中的应用

在传统机器学习（如决策树、SVM）中，学习曲线可以用于超参数调整：

在决策树模型中，树的深度过深可能会导致过拟合，而深度过浅可能会导致欠拟合。
在支持向量机（SVM）中，核函数的选择和正则化参数的调整可以通过学习曲线进行优化。

4.3 在强化学习中的应用

在强化学习中，学习曲线可以用于评估智能体的学习进度：

如果奖励（reward）曲线长时间不上升，可能需要调整策略。
如果奖励曲线波动较大，可能需要调整探索（exploration）和利用（exploitation）的平衡。

5. 如何绘制学习曲线？

在 Python 中，我们可以使用 matplotlib 绘制学习曲线，例如在 scikit-learn 机器学习库中：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.model_selection import learning_curve
from sklearn.linear_model import LogisticRegression
from sklearn.datasets import make_classification# 生成数据集
X, y = make_classification(n_samples=1000, n_features=20, random_state=42)# 创建模型
model = LogisticRegression()# 计算学习曲线
train_sizes, train_scores, test_scores = learning_curve(model, X, y, cv=5, scoring='accuracy')# 计算均值和标准差
train_mean = np.mean(train_scores, axis=1)
test_mean = np.mean(test_scores, axis=1)# 绘制学习曲线
plt.plot(train_sizes, train_mean, label='Training Score', color='red')
plt.plot(train_sizes, test_mean, label='Validation Score', color='blue')
plt.xlabel('Training Size')
plt.ylabel('Accuracy')
plt.title('Learning Curve')
plt.legend()
plt.show()

6. 总结

学习曲线是评估模型训练效果的重要工具。
通过学习曲线，我们可以判断模型是否欠拟合、过拟合或数据不足。
理想的学习曲线应该是训练和测试曲线收敛，并且性能较高。
过拟合问题可以通过正则化、增加数据、降低模型复杂度等方法解决。
欠拟合问题可以通过增加模型复杂度、特征工程、增加训练时间等方式改善。

学习曲线是深度学习和机器学习中优化模型的重要工具，合理利用学习曲线可以帮助我们构建更加精准和泛化能力强的模型！

【漫话机器学习系列】103.学习曲线（Learning Curve）

学习曲线（Learning Curve）详解 1. 什么是学习曲线？ 学习曲线（Learning Curve）是机器学习和深度学习领域中用于评估模型性能随训练过程变化的图示。它通常用于分析模型的学习能力、是否存在过拟合或欠拟合等问题。从…...

编程日记 2025/2/24 5:19:59

电商运营中私域流量的转化与变现：以开源AI智能名片2+1链动模式S2B2C商城小程序为例

摘要电商运营的核心目标在于高效地将产品推向市场，实现私域流量的转化和变现。本文以“罗辑思维”的电商实践为背景，探讨了私域流量变现的重要性，并深入分析了开源AI智能名片21链动模式S2B2C商城小程序在电商运营中的应用与价值。通过该模式…...

编程日记 2025/2/24 5:17:55

Python常见面试题的详解19

1. 如何使用Django 中间件 Django 中间件宛如一个灵活且强大的插件系统，它为开发者提供了在请求处理流程的不同关键节点插入自定义代码的能力。这些节点包括请求抵达视图之前、视图完成处理之后以及响应即将返回给客户端之前。借助中间件，我们可以实现诸…...

编程日记 2025/2/24 5:16:51

Python 数据类型转换

目录整数（int）与浮点数（float）之间的转换 （1）int()：将浮点数或字符串转换为整数 （2）float()：将整数或字符串转换为浮点数字符串（str&#xf…...

编程日记 2025/2/24 5:15:49

进程概念、PCB及进程查看

文章目录一.进程的概念进程控制块（PCB） 二.进程查看通过指令查看进程通过proc目录查看进程的cwd和exe获取进程pid和ppid通过fork()创建子进程一.进程的概念进程是一个运行起来的程序，而程序是存放在磁盘的，cpu要想执行程序的指…...

编程日记 2025/2/24 5:13:45

PyEcharts 数据可视化：从入门到实战

一、PyEcharts 简介 PyEcharts 是基于百度开源可视化库 ECharts 的 Python 数据可视化工具，支持生成交互式的 HTML 格式图表。相较于 Matplotlib 等静态图表库，PyEcharts 具有以下优势： 丰富的图表类型（30）动态交互功…...

编程日记 2025/2/24 5:11:41

RT-Thread+STM32L475VET6——ADC采集电压

文章目录前言一、板载资源二、具体步骤1.打开CubeMX进行配置1.1 使用外部高速时钟，并修改时钟树1.2 打开ADC1的通道3，并配置为连续采集模式(ADC根据自己需求调整）1.3 打开串口1.4 生成工程 2. 配置ADC2.1 打开ADC驱动2.2 声明ADC2.3 剪切stm…...

编程日记 2025/2/24 5:10:39

easyexcel 2.2.6版本导出excel模板时，标题带下拉框及其下拉值过多不显示问题

需求背景：有一个需求要做下拉框的值有100多条，同时这个excel是一个多sheet的导入模板直接用easyexcel 导出，会出现下拉框的值过多，导致生成出来的excel模板无法正常展示下拉功能使用的easyexcel版本：<depende…...

编程日记 2025/2/24 5:07:36

树（数据结构·）

树（数据结构篇） 里面没有结点时，称之为空树树型结构是一对多的形式深度优先遍历： 所谓的DFS，也就是说每次都尝试向更深的节点走，也就是一条路走到黑当一条路走完，走到…...

编程日记 2025/2/24 5:04:33

XUnity.AutoTranslator-deepseek——调用腾讯的DeepSeek V3 API，实现Unity游戏中日文文本的自动翻译

XUnity.AutoTranslator-deepseek 本项目通过调用腾讯的DeepSeek V3 API，实现Unity游戏中日文文本的自动翻译。准备工作 1. 获取API密钥访问腾讯云API控制台申请DeepSeek的API密钥（限时免费）。也可以使用其他平台提供的DeepSeek API。 …...

编程日记 2025/2/24 5:02:31

谈谈 ES 6.8 到 7.10 的功能变迁（1）- 性能优化篇

前言 ES 7.10 可能是现在比较常见的 ES 版本。但是对于一些相迭代比较慢的早期业务系统来说，ES 6.8 是一个名副其实的“钉子户”。借着工作内升级调研的任务东风，我整理从 ES 6.8 到 ES 7.10 ELastic 重点列出的新增功能和优化内容。将分为 6 个篇幅给…...

编程日记 2025/2/24 4:56:23

[250222] Kimi Latest 模型发布：尝鲜最新特性与追求稳定性的平衡 | SQLPage v0.33 发布

目录 Kimi Latest 模型发布：尝鲜最新特性与追求稳定性的平衡SQLPage v0.33 发布：使用 SQL 构建自定义 UI 和 API！ Kimi Latest 模型发布：尝鲜最新特性与追求稳定性的平衡 Kimi 开放平台推出全新模型 kimi-latest，旨在…...

编程日记 2025/2/24 4:55:22

深入理解设计模式之解释器模式

深入理解设计模式之解释器模式在软件开发的复杂世界中，我们常常会遇到需要处理特定领域语言的情况。比如在开发一个计算器程序时，需要解析和计算数学表达式；在实现正则表达式功能时，要解析用户输入的正则表达式来匹配文本。这些场景都涉及到对特定语言的解释和执行，而解…...

编程日记 2025/2/24 4:54:20

深入理解设计模式之代理模式

深入理解设计模式之代理模式在软件开发的复杂体系中，我们常常会遇到这样的情况：需要控制对某个对象的访问，或者在访问对象前后添加一些额外的处理逻辑，又或者希望在不改变原对象代码的基础上扩展其功能。代理模式（Pr…...

编程日记 2025/2/24 4:49:12

Golang | 每日一练 (3)

💢欢迎来到张胤尘的技术站 💥技术如江河，汇聚众志成。代码似星辰，照亮行征程。开源精神长，传承永不忘。携手共前行，未来更辉煌💥 文章目录 Golang | 每日一练 (3)题目参考答案map 实现原理hmapb…...

编程日记 2025/2/24 4:44:05

企业数据集成：实现高效调拨出库自动化

调拨出库对接调出单-v：旺店通企业奇门数据集成到用友BIP 在企业信息化管理中，数据的高效流转和准确对接是实现业务流程自动化的关键。本文将分享一个实际案例，展示如何通过轻易云数据集成平台，将旺店通企业奇门的数据无缝集成到用…...

编程日记 2025/2/24 4:41:01

提效10倍：基于Paimon+Dolphin湖仓一体新架构在阿里妈妈品牌业务探索实践

1. 业务背景阿里妈妈品牌广告数据包括投放引擎、下发、曝光、点击等日志，面向运筹调控、算法特征、分析报表、诊断监控等应用场景，进行了品牌数仓能力建设。随着业务发展，基于Lambda架构的数仓开发模式，缺陷日益突出：…...

编程日记 2025/2/24 4:35:57

Deepseek快速做PPT

背景： DeepSeek大纲生成 → Kimi结构化排版 → 数据审查，细节调整 DeepSeek 拥有深度思考能力，擅长逻辑构建与内容生成，它会根据我们的问题进行思考，其深度思考能力当前测试下来，不愧为国内No.1，而且还会把中间的思考过程展示出来，大多时候会给出很多我们意想不到的思…...

编程日记 2025/2/24 4:29:45

论文解读 | AAAI'25 Cobra：多模态扩展的大型语言模型，以实现高效推理

点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入！ 点击阅读原文观看作者讲解回放！ 个人信息作者：赵晗，浙江大学-西湖大学联合培养博士生内容简介近年来，在各个领域应用多模态大语言模型（MLLMs&…...

编程日记 2025/2/24 4:28:37

uniapp修改picker-view样式

解决问题： 1.选中文案样式，比如字体颜色 2.修改分割线颜色 3.多列时，修改两边间距让其平分展示效果： 代码如下 <template><u-popup :show"showPicker" :safeAreaInsetBottom"false" close&quo…...

编程日记 2025/2/24 4:25:33

HTML 语义化

目录 HTML 语义化HTML5 新特性HTML 语义化的好处语义化标签的使用场景最佳实践 HTML 语义化 HTML5 新特性标准答案： 语义化标签： <header>：页头<nav>：导航<main>：主要内容<article>&#x…...

编程新知 2026/1/15 21:24:41

Linux 文件类型，目录与路径，文件与目录管理

文件类型后面的字符表示文件类型标志普通文件：-（纯文本文件，二进制文件，数据格式文件） 如文本文件、图片、程序文件等。目录文件：d（directory） 用来存放其他文件或子目录。设备…...

编程新知 2026/2/8 20:42:46

Zustand 状态管理库：极简而强大的解决方案

Zustand 是一个轻量级、快速和可扩展的状态管理库，特别适合 React 应用。它以简洁的 API 和高效的性能解决了 Redux 等状态管理方案中的繁琐问题。核心优势对比基本使用指南 1. 创建 Store // store.js import create from zustandconst useStore create((set)…...

编程新知 2026/2/8 10:56:57

Go 语言并发编程基础：无缓冲与有缓冲通道

在上一章节中，我们了解了 Channel 的基本用法。本章将重点分析 Go 中通道的两种类型 —— 无缓冲通道与有缓冲通道，它们在并发编程中各具特点和应用场景。一、通道的基本分类类型定义形式特点无缓冲通道make(chan T)发送和接收都必须准备好&#xff0…...

编程新知 2026/1/29 3:25:02

基于Springboot+Vue的办公管理系统

角色： 管理员、员工技术： 后端: SpringBoot, Vue2, MySQL, Mybatis-Plus 前端: Vue2, Element-UI, Axios, Echarts, Vue-Router 核心功能： 该办公管理系统是一个综合性的企业内部管理平台，旨在提升企业运营效率和员工管理水…...

编程新知 2026/1/31 8:55:37

[KCTF]CORE CrackMe v2.0

这个Reverse比较古老，已经有20多年了，但难度确实不小。先查壳 upx压缩壳，0.72，废弃版本，工具无法解压。反正不用IDA进行调试，直接x32dbg中，dump内存，保存后拖入IDA。这里说一下…...

编程新知 2026/2/1 4:57:13

Caliper 配置文件解析：config.yaml 和 fisco-bcos.json 附加在caliper中执行不同的合约方法

Caliper 配置文件解析：config.yaml 和 fisco-bcos.json Caliper 是一个区块链性能基准测试工具，用于评估不同区块链平台的性能。下面我将详细解释你提供的 fisco-bcos.json 文件结构，并说明它与 config.yaml 文件的关系。 fisco-bcos.json 文件解析这个文件是针对 FISCO…...

编程新知 2025/9/4 19:34:58