从过拟合到强化学习:机器学习核心知识全解析
Langchain系列文章目录
01-玩转LangChain:从模型调用到Prompt模板与输出解析的完整指南
02-玩转 LangChain Memory 模块:四种记忆类型详解及应用场景全覆盖
03-全面掌握 LangChain:从核心链条构建到动态任务分配的实战指南
04-玩转 LangChain:从文档加载到高效问答系统构建的全程实战
05-玩转 LangChain:深度评估问答系统的三种高效方法(示例生成、手动评估与LLM辅助评估)
06-从 0 到 1 掌握 LangChain Agents:自定义工具 + LLM 打造智能工作流!
07-【深度解析】从GPT-1到GPT-4:ChatGPT背后的核心原理全揭秘
PyTorch系列文章目录
Python系列文章目录
机器学习系列文章目录
01-什么是机器学习?从零基础到自动驾驶案例全解析
02-从过拟合到强化学习:机器学习核心知识全解析
文章目录
- Langchain系列文章目录
- PyTorch系列文章目录
- Python系列文章目录
- 机器学习系列文章目录
- 前言
- 一、机器学习的核心概念
- 1.1 监督学习、无监督学习与强化学习
- 1.1.1 监督学习
- 1.1.2 无监督学习
- 1.1.3 强化学习
- 1.2 训练集、验证集与测试集
- 1.2.1 训练集
- 1.2.2 验证集
- 1.2.3 测试集
- 1.3 过拟合与欠拟合
- 1.3.1 过拟合
- 1.3.2 欠拟合
- 二、可视化与应用
- 2.1 过拟合与欠拟合的可视化
- 2.1.1 欠拟合示例
- 2.1.2 过拟合示例
- 2.1.3 理想拟合
- 2.2 实际应用案例
- 三、总结
- 3.1 核心要点回顾
- 3.2 学习建议
前言
机器学习(Machine Learning)作为人工智能领域的核心技术,正在深刻改变我们的生活。从智能推荐到自动驾驶,机器学习的应用无处不在。然而,对于初学者来说,机器学习的概念可能显得抽象而复杂。本文将以通俗易懂的语言,系统地讲解机器学习的基本概念,包括监督学习、无监督学习、强化学习,以及训练集划分和过拟合等关键知识点。通过图文并茂的讲解和实际案例,带你从零基础迈向进阶理解。无论你是新手还是有一定经验的开发者,这篇文章都将为你提供清晰的学习路径。
一、机器学习的核心概念
机器学习的核心在于让计算机从数据中学习规律,而非通过显式的编程规则实现任务。本节将从三种主要学习类型入手,逐步展开相关知识点。
1.1 监督学习、无监督学习与强化学习
机器学习可以分为三大类:监督学习、无监督学习和强化学习。每种类型都有其独特的适用场景和方法。
1.1.1 监督学习
监督学习(Supervised Learning)是指通过带标签的数据训练模型,让其学会预测或分类。简单来说,就像老师教学生,数据中包含“问题”和“答案”,模型通过学习找到规律。
- 示例:假设我们有房屋面积和价格的数据集,监督学习可以根据面积预测房价。
- 实际应用:垃圾邮件分类(判断邮件是否为垃圾邮件)、人脸识别。
- 操作步骤:
- 收集带标签的数据(如房屋面积和价格)。
- 选择模型(如线性回归)。
- 用训练数据调整模型参数。
- 对新数据进行预测。
1.1.2 无监督学习
无监督学习(Unsupervised Learning)处理的是无标签数据,模型的目标是发现数据的内在结构或模式。就像让机器自己探索规律,没有老师指导。
- 示例:将客户按购买习惯分组,用于市场细分。
- 实际应用:聚类分析(如用户分组)、异常检测(如信用卡欺诈)。
- 操作步骤:
- 收集无标签数据(如客户购买记录)。
- 选择聚类算法(如 K-Means)。
- 分析聚类结果,提取模式。
1.1.3 强化学习
强化学习(Reinforcement Learning)通过试错学习,模型(称为代理)在环境中采取行动,根据结果获得奖励或惩罚,目标是最大化长期奖励。
- 示例:训练游戏 AI,让它通过不断尝试学会通关。
- 实际应用:机器人导航、AlphaGo。
- 操作步骤:
- 定义环境和奖励机制(如游戏得分)。
- 初始化代理策略。
- 通过多次试错优化策略。
1.2 训练集、验证集与测试集
数据是机器学习的基础,而如何划分数据直接影响模型的性能。通常,我们将数据集分为三部分:训练集、验证集和测试集。
1.2.1 训练集
训练集(Training Set)用于模型的学习,模型通过这些数据调整参数,捕捉规律。
- 作用:让模型学会数据的特征和模式。
- 示例:用 70% 的房屋数据训练房价预测模型。
1.2.2 验证集
验证集(Validation Set)用于在训练过程中评估模型,调整超参数(如学习率),防止过拟合。
- 作用:优化模型配置,提升泛化能力。
- 示例:用 15% 的数据测试不同模型,挑选最佳配置。
1.2.3 测试集
测试集(Test Set)用于最终评估模型性能,数据完全独立于训练和验证过程。
- 作用:检验模型在新数据上的表现。
- 注意事项:测试集只能使用一次,避免“数据泄露”影响评估客观性。
代码示例(Python):
from sklearn.model_selection import train_test_split# 假设 data 是数据,labels 是标签
X_train, X_temp, y_train, y_temp = train_test_split(data, labels, test_size=0.3, random_state=42)
X_val, X_test, y_val, y_test = train_test_split(X_temp, y_temp, test_size=0.5, random_state=42)# 数据划分比例:训练集 70%,验证集 15%,测试集 15%
print(f"训练集: {len(X_train)}, 验证集: {len(X_val)}, 测试集: {len(X_test)}")
1.3 过拟合与欠拟合
过拟合和欠拟合是机器学习中的两大难题,直接影响模型的预测能力。
1.3.1 过拟合
过拟合(Overfitting)是指模型在训练集上表现极好,但在测试集上表现很差。原因是模型过于复杂,捕捉了训练数据的噪声而非真实规律。
- 现象:训练误差低,测试误差高。
- 原因:模型复杂度过高、数据量不足。
- 解决方案:
- 增加训练数据。
- 使用正则化(如 L2 正则)。
- 减少模型复杂度(如减少神经网络层数)。
1.3.2 欠拟合
欠拟合(Underfitting)是指模型在训练集和测试集上都表现不好,原因是模型过于简单,无法捕捉数据规律。
- 现象:训练误差和测试误差都高。
- 原因:模型复杂度不足、特征不够。
- 解决方案:
- 增加模型复杂度(如加深神经网络)。
- 添加更多特征。
- 延长训练时间。
二、可视化与应用
为了更直观地理解机器学习概念,本节通过图表和案例展示关键知识点。
2.1 过拟合与欠拟合的可视化
过拟合和欠拟合可以通过训练和测试误差的变化来观察。以下是三种情况的示意图:
2.1.1 欠拟合示例
模型过于简单,无法拟合数据:
2.1.2 过拟合示例
模型过于复杂,过度贴合训练数据:
2.1.3 理想拟合
模型复杂度适中,兼顾训练和测试表现:
可视化代码(Python):
import numpy as np
import matplotlib.pyplot as pltx = np.linspace(0, 10, 100)
y_true = np.sin(x) # 真实数据
y_underfit = 0.5 * x # 欠拟合
y_overfit = np.sin(x) + np.random.normal(0, 0.1, 100) # 过拟合plt.scatter(x, y_true, label="真实数据", s=10)
plt.plot(x, y_underfit, label="欠拟合", color="red")
plt.plot(x, y_overfit, label="过拟合", color="green")
plt.legend()
plt.show()
2.2 实际应用案例
- 监督学习:用房价数据预测新房价格。
- 无监督学习:分析电商用户购买行为,优化营销策略。
- 强化学习:训练自动驾驶系统避障。
三、总结
本文系统讲解了机器学习的基本概念,从监督学习到强化学习,再到数据划分和过拟合问题,帮助读者建立清晰的知识框架。
3.1 核心要点回顾
- 监督学习:利用带标签数据预测结果。
- 无监督学习:发现无标签数据的隐藏模式。
- 强化学习:通过试错优化策略。
- 训练集/验证集/测试集:分别用于训练、调参和评估。
- 过拟合:模型过于贴合训练数据,泛化能力差。
- 欠拟合:模型过于简单,学习能力不足。
3.2 学习建议
- 动手实践:用 Python 和 Scikit-Learn 实现简单模型。
- 深入理解:结合可视化工具分析模型表现。
- 持续学习:关注最新技术趋势,如深度学习。
相关文章:
从过拟合到强化学习:机器学习核心知识全解析
Langchain系列文章目录 01-玩转LangChain:从模型调用到Prompt模板与输出解析的完整指南 02-玩转 LangChain Memory 模块:四种记忆类型详解及应用场景全覆盖 03-全面掌握 LangChain:从核心链条构建到动态任务分配的实战指南 04-玩转 LangChai…...
【MySQL基础-9】深入理解MySQL中的聚合函数
在数据库操作中,聚合函数是一类非常重要的函数,它们用于对一组值执行计算并返回单个值。MySQL提供了多种聚合函数,如COUNT、SUM、AVG、MIN和MAX等。这些函数在数据分析和报表生成中扮演着关键角色。本文将深入探讨这些聚合函数的使用方法、注…...
Lora 中 怎么 实现 矩阵压缩
Lora 中 怎么 实现 矩阵压缩 1. 导入必要的库 import torch import re from datasets import Dataset from transformers import AutoTokenizer, AutoModelForCausalLM, TrainingArguments, Trainer, \get_cosine_schedule_with_warmup, EarlyStoppingCallback from peft...
MATLAB 控制系统设计与仿真 - 27
状态空间的标准型 传递函数和状态空间可以相互转换,接下来会举例如何有传递函数转成状态空间标准型。 对角标准型 当 G(s)可以写成: 即: 根据上图可知: 约当标准型 当 G(s)可以写成: 即: 根据上图…...
linux 命令 cp
cp 是 Linux 中用于复制文件和目录的命令,基本功能是将源文件或目录复制到目标位置 基本语法 cp [选项] 源文件 目标文件 cp [选项] 源文件1 源文件2 ... 目标目录 常用选项 选项说明-i交互模式(覆盖前询问确认)-r 或 -R递归复制目录&#…...
从FFmpeg命令行到Rust:多场景实战指南
FFmpeg作为功能强大的多媒体处理工具,被广泛应用于视频编辑、格式转换等领域。然而,直接使用FFmpeg的命令行界面(CLI)可能会遇到以下挑战: 命令复杂度高:FFmpeg的命令行参数众多且复杂,初学者可…...
蓝桥杯高频考点——进制转换
进制转换 二进制转十进制代码演示 十六进制转十进制代码演示 十进制转K进制代码演示 任意进制之间的转换代码演示 二进制转十进制 代码演示 // 定义函数 calc,用于将字符转换为对应的数值 int calc(char c) {// 若字符 c 大于等于 9(注:此处…...
【算法百题】专题七_分治快排_专题八_分治归并
文章目录 前言分治快排题:043. [颜⾊分类(medium)](https://leetcode.cn/problems/sort-colors/description/)分析 044. [快速排序(medium)](https://leetcode.cn/problems/sort-an-array/description/)分析 045. [快速…...
DOM4J解析XML, 修改xml的值
1. 引入pom依赖 <dependency><groupId>org.dom4j</groupId><artifactId>dom4j</artifactId><version>2.1.3</version> </dependency> 2. 解析xml, 修改xml节点的值 import org.apache.commons.io.IOUtils; import org.dom4…...
3.16[A]FPGA
FPGA的工作原理是通过配置存储器中的数据来控制可编程逻辑单元和互连资源,从而实现用户定义的逻辑功能。用户可以通过硬件描述语言(HDL)编写代码,然后通过综合、映射、布局布线等步骤生成配置数据,最后将这些数据加载到…...
ssh转发笔记
工作中又学到了,大脑转不过来 现有主机A,主机B,主机C A能访问B,B能访问C,A不能访问C C上80端口有个服务,现在A想访问这个服务,领导让用ssh转发,研究半天没找到理想的语句…...
使用OBS进行webRTC推流参考
参考腾讯云官方文档: 云直播 OBS WebRTC 推流_腾讯云 说明非常详细,分为通过WHIP和OBS插件的形式进行推流。 注意:通过OBS插件的形式进行推流需要使用较低的版本,文档里有说明,需要仔细阅读。...
(链表)面试题 02.07. 链表相交
给你两个单链表的头节点 headA 和 headB ,请你找出并返回两个单链表相交的起始节点。如果两个链表没有交点,返回 null 。 图示两个链表在节点 c1 开始相交: 题目数据 保证 整个链式结构中不存在环。 注意,函数返回结果后ÿ…...
Python----数据可视化(Pyecharts三:绘图二:涟漪散点图,K线图,漏斗图,雷达图,词云图,地图,柱状图折线图组合,时间线轮廓图)
1、涟漪特效散点图 from pyecharts.globals import SymbolType from pyecharts.charts import EffectScatter from pyecharts.faker import Faker from pyecharts import options as opts from pyecharts.globals import ThemeType # 绘制图表 es (EffectScatter(init_optsop…...
正则表达式:贪婪匹配与非贪婪匹配
正则表达式:贪婪匹配与非贪婪匹配 非贪婪匹配 .*?这三个字符的组合就是非贪婪匹配,意思是匹配任意字符直到遇到第一个后面指定的字符,比如.*?_就表示匹配任意字符直到碰到下划线,还可以组合^来表示从头匹配,比如^.*?_就是从头…...
IP风险度自检,互联网的安全“指南针”
IP地址就像我们的网络“身份证”,而IP风险度则是衡量这个“身份证”安全性的重要指标。它关乎着我们的隐私保护、账号安全以及网络体验,今天就让我们一起深入了解一下IP风险度。 什么是IP风险度 IP风险度是指一个IP地址可能暴露用户真实身份或被网络平台…...
数据结构与算法-图论-拓扑排序
前置芝士 概念 拓扑排序(Topological Sorting)是对有向无环图(DAG,Directed Acyclic Graph)的顶点进行排序的一种算法。它将图中的所有顶点排成一个线性序列,使得对于图中的任意一条有向边 (u, v)&#x…...
Gan网络公式了解
Gan网络 生成器和判别器是亦敌亦友的关系 对于生成模型,损失函数很难定义->所以我们可以将生成模型的输出交给判别模型进行处理,来分辨好坏。 生成器的损失是通过判别器的输出来计算的,而判别器的输出是一个概率值,我们可以通过…...
解决linux mysql命令 bash: mysql: command not found 的方法
首先得知道mysql命令或mysqladmin命令的完整路径 比如mysql的路径是: /usr/local/mysql/bin/mysql,我们则可以这样执行命令: ln -s /usr/local/mysql/bin/mysql /usr/bin © 著作权归作者所有,转载或内容合作请联系作者 喜欢的朋友记得点…...
微服务存在的问题及解决方案
微服务存在的问题及解决方案 1. 存在问题 1.1 接口拖慢 因为一个接口在并发时,正好执行时长又比较长,那么当前这个接口占用过多的 Tomcat 连接,导致其他接口无法即时获取到 Tomcat 连接来完成请求,导致接口拖慢,甚至…...
【css酷炫效果】纯CSS实现立体纸张折叠动效
【css酷炫效果】纯CSS实现悬浮阴影扩散交互 缘创作背景html结构css样式完整代码基础版进阶版(3d 悬浮效果) 效果图 通过CSS box-shadow与transition属性实现悬浮阴影扩散交互,为元素添加细腻的悬浮反馈。 想直接拿走的老板,链接放在这里:htt…...
案例5_1:单位数码管显示0
文章目录 文章介绍效果图仿真图5_1放置单位数码管 代码5_1.c 文章介绍 效果图 仿真图5_1 复制案例1_2的仿真图,在此基础上修改 注意:栅格大小需要缩小 放置单位数码管 代码5_1.c #include <reg52.h>#define uchar unsigned char #define uint un…...
Linux centos7误删/boot拯救方法
1.进入救援模式 插入CentOS 7安装光盘,重启系统。在开机时按BIOS设置对应的按键(通常是F2等),将启动顺序调整为CD - ROM优先。 系统从光盘启动后,选择“Troubleshooting”,然后选择“Rescue a CentOS s…...
操作系统八股文整理(一)
操作系统八股文整理 一、进程和线程的区别二、进程与线程的切换过程一、进程切换进程切换的步骤: 二、线程切换线程切换的步骤: 三、进程切换与线程切换的对比四、上下文切换的优化 三、系统调用一、系统调用的触发二、从用户空间切换到内核空间三、执行…...
20250317笔记本电脑在ubuntu22.04下使用acpi命令查看电池电量
20250317笔记本电脑在ubuntu22.04下使用acpi命令查看电池电量 2025/3/17 18:05 百度:ubuntu查看电池电量 百度为您找到以下结果 ubuntu查看电池电量 在Ubuntu操作系统中,查看电池电量通常可以通过命令行或者图形界面来完成。下面是一些常见的方法&…...
蓝桥杯备考----模拟算法 phone number
嗯。这道题可以在两个和三个数字加-,我们只要随便输出一个奏行 那么!我们规范一下,我们尽可能的只在两个数字之间加,但是如果一共奇数个的话,我们就让最后三个成一组,也就是说,我们用的是个小贪…...
【数据分享】2000—2024年我国省市县三级逐月归一化植被指数(NDVI)数据(Shp/Excel格式)
之前我们分享过2000—2024年逐月归一化植被指数(NDVI)栅格数据(可查看之前的文章获悉详情),该数据来源于NASA定期发布的MOD13A3数据集!很多小伙伴拿到数据后反馈栅格数据不太方便使用,问我们能不…...
算法基础篇(蓝桥杯常考点)
算法基础篇 前言 算法内容还有搜索,数据结构(进阶),动态规划和图论 数学那个的话大家也知道比较难,放在最后讲 这期包含的内容可以看目录 模拟那个算法的话就是题说什么写什么,就不再分入目录中了 注意事…...
Python中使用vlc库实现视频播放功能
文章目录 前言1. 环境准备1.1Python安装1.2选择Python开发环境1.3安装必要库 2. 基础播放示例3. 常用播放控制功能4. 事件监听5. 播放网络流媒体6. 结合 GUI 库制作视频播放器(以 Tkinter 为例) 前言 本教程主要包含打开文件、播放和停止按钮࿰…...
蓝桥杯真题——洛谷 Day10 并查集(枚举)
目录 P8651 [蓝桥杯 2017 省 B] 日期问题 P8635 [蓝桥杯 2016 省 AB] 四平方和 P8651 [蓝桥杯 2017 省 B] 日期问题 思路: 使用scanf读入,枚举从1960到2059,若符合题目形式,加入答案, 从小到大输出:存入结…...
