当前位置：首页 > news >正文

【深度学习详解】Task3 实践方法论-分类任务实践 Datawhale X 李宏毅苹果书 AI夏令营

news 2026/2/9 12:59:07

前言

综合之前的学习内容，
本篇将探究机器学习实践方法论
出现的问题及其原因

🍎 🍎 🍎

系列文章导航

【深度学习详解】Task1 机器学习基础-线性模型 Datawhale X 李宏毅苹果书 AI夏令营
【深度学习详解】Task2 分段线性模型-引入深度学习 Datawhale X 李宏毅苹果书 AI夏令营
【深度学习详解】Task3 实践方法论-分类任务实践 Datawhale X 李宏毅苹果书 AI夏令营

本篇目录导航

前言
系列文章导航

实践方法论
问题描述：large loss on training data
模型偏差
优化问题
is 模型偏差 or 优化问题？

问题描述：large loss on testing data
过拟合【交叉验证】
不匹配

Python 分类任务实践
Read more

实践方法论

在这里插入图片描述

本篇笔记 General Guide 从原视频课件进行修改：
李宏毅《机器学习/深度学习》2021课程 -> 机器学习任务攻略

问题描述：large loss on training data

训练数据的损失很大，显然它在训练集上面也没有训练好

模型偏差

鼠标右键 -> 在新标签页中打开图像
在这里插入图片描述

原因分析

模型过于简单

该函数的集合太小了，没有包含任何一个函数，
可以让损失变低的函数不在模型可以描述的范围内。
想要在大海里面捞针（一个损失低的函数），
结果针根本就不在海里。

解决方案

给模型更大的灵活性

增加输入的特征，即同时考虑更多训练数据
（得到更有灵活性 flexibility 的函数）
重新设计一个模型，使用深度学习
（更多的 layer 层数）

优化问题

鼠标右键 -> 在新标签页中打开图像
在这里插入图片描述

原因分析

优化器不给力

优化器（梯度下降）在寻找代价函数最低点的过程，
会出现局部最小值干扰，无法找到全局最小值。
想要在大海里面捞针（一个损失低的函数），
针确实在海里，但是无法把针捞起来。

解决方案

尝试更强大的优化器，寻找损失低的函数

is 模型偏差 or 优化问题？

判断是模型偏差 or 优化问题？

问题描述：large loss on testing data

训练数据上面的损失小，但在测试数据上的损失大

过拟合【交叉验证】

鼠标右键 -> 在新标签页中打开图像
在这里插入图片描述

原因分析

模型过于复杂

模型灵活性过大，学习到了训练数据的噪声。
（模型过于复杂，对数据过度适应）

解决方案

增加训练集数据限制住拟合的模型
（往往是最有效的方向）

需要增加额外的训练集数据（不容易。）
不用增加额外的训练集数据（很建议！）
data augmentation 数据增强：
根据问题的理解创造出新的合理数据

给模型更多的限制性

减少输入的特征，即同时考虑更少训练数据
（不要过大灵活性 flexibility 的函数）
重新设计一个模型：减少参数 / 共用参数（可以让一些参数有一样的数值）
eg. 神经元数量
重新设计一个模型：使用更受限的模型。
eg. 卷积神经网络（Convolutional Neural Network，CNN）
是比全连接网络（fully-connected network）更有限制的架构
Early stopping 早停
Regularization 正则化
Dropout 丢弃法

trade-off（权衡模型的灵活性和限制性）
比较合理选择模型的方法是：
将训练数据分成“训练集”和“进行模型选择的验证集”
即，
在训练集上训练出来的模型
会使用验证集来衡量分数和挑选模型，即基线（baseline）算法
（避免在公开的测试集上面频繁挑选模型导致的过拟合）

Cross Validation 交叉验证
将训练数据按照百分比随机分成“训练集”和“进行模型选择的验证集”。例如：
90%训练数据作为“训练集”，
10%训练数据作为“进行模型选择的验证集”。

N-fold Cross Validation N 折交叉验证
将训练数据切成 n 等份，这件事情要重复 3 次：
n - 1 份作为“训练集”，
还有 1 份作为“进行模型选择的验证集”。

不匹配

鼠标右键 -> 在新标签页中打开图像
在这里插入图片描述

原因分析

训练集和测试集的分布不同，
导致模型在测试集上的预测表现不佳。

解决方案

要对训练数据和测试数据的产生方式有一些理解，
确保重新收集的训练数据与数据数据的分布尽可能一致

Python 分类任务实践

baseline 教程
https://datawhaler.feishu.cn/wiki/M7tqwIHYdiz5ULkRkD9cPPWTntg

数据集下载
【2023机器学习】的系列资料包括视频、课件、代码等资源已经系统顺序命名并整理到百度网盘：
https://pan.baidu.com/s/1-zfs0wn5rccTRVk34YZWaA，提取码：2023。
来源：https://blog.csdn.net/qq_39975984/article/details/133103314

李宏毅深度学习教程 LeeDL-Tutorial（苹果书）
https://github.com/datawhalechina/leedl-tutorial
李宏毅《机器学习/深度学习》2021课程（视频教程 24 h 46 min）
https://www.bilibili.com/video/BV1JA411c7VT/
Hung-yi Lee (李宏毅) MACHINE LEARNING 2023 SPRING
https://speech.ee.ntu.edu.tw/~hylee/ml/2023-spring.php
作业数据集搬运：
https://blog.csdn.net/qq_39975984/article/details/133103314
https://github.com/keepstumz/LHY-ML

【深度学习详解】Task3 实践方法论-分类任务实践 Datawhale X 李宏毅苹果书 AI夏令营

前言综合之前的学习内容， 本篇将探究机器学习实践方法论出现的问题及其原因 🍎 🍎 🍎 系列文章导航【深度学习详解】Task1 机器学习基础-线性模型 Datawhale X 李宏毅苹果书 AI夏令营【深度学习详解】Task2 分段线性模型-引入…...

编程日记 2024/9/8 17:45:59

乐凡北斗 | 手持北斗智能终端的作用与应用场景

在科技日新月异的今天，北斗智能终端作为一项融合了北斗导航系统与现代智能技术的创新成果，正悄然改变着我们的生活方式和工作模式。北斗智能终端，是以北斗卫星导航系统为核心，集成了高精度定位、导航、授时等功能的智能设备。它…...

编程日记 2024/9/8 17:42:57

线程互斥先看到一个抢票案例： class customer { public:int _ticket_num 0;pthread_t _tid;string _name; };int g_ticket 10000;void* buyTicket(void* args) {customer* cust (customer*)args;while(true){if(g_ticket > 0){usleep(1000);cout << …...

编程日记 2024/9/8 17:37:52

misc流量分析

一、wireshark语法 1、wireshark过滤语法 （1）过滤IP地址 ip.srcx.x..x.x 过滤源IP地址 ip.dstx.x.x.x 过滤目的IP ip.addrx.x.x.x 过滤某个IP （2）过滤端口号 tcp.port80tcp.srcport80 显示TCP的源端口80tcp.dstport80 显示…...

编程日记 2024/9/8 17:34:50

Linux驱动（五）：Linux2.6驱动编写之设备树

目录前言一、设备树是个啥？二、设备树编写语法规则1.文件类型2.设备树源文件（DTS）结构3.设备树源文件（DTS）解析三、设备树API函数1.在内核中获取设备树节点（三种）2.获取设备树节点的属性四、…...

编程日记 2024/9/8 17:33:49

算法【Java】 —— 前缀和

模板引入一维前缀和 https://www.nowcoder.com/share/jump/9257752291725692504394 解法一：暴力枚举在每次提供 l 与 r 的时候，都从 l 开始遍历数组，直到遇到 r 停止，这个方法的时间复杂度为 O(N * q) 解法二：前…...

编程日记 2024/9/8 17:32:48

python网络爬虫（四）——实战练习

0.为什么要学习网络爬虫深度学习一般过程: 收集数据，尤其是有标签、高质量的数据是一件昂贵的工作。爬虫的过程，就是模仿浏览器的行为，往目标站点发送请求，接收服务器的响应数据，提取需要的信息&#xff0c…...

编程日记 2024/9/8 17:30:46

tio websocket 客户端 java 代码工具类

为了更好地组织代码并提高可复用性，我们可以将WebSocket客户端封装成一个工具类。这样可以在多个地方方便地使用WebSocket客户端功能。以下是使用tio库实现的一个WebSocket客户端工具类。 1. 添加依赖确保项目中添加了tio的依赖。如果使用的是Maven，可以…...

编程日记 2024/9/8 17:27:43

通过卷积神经网络（CNN）识别和预测手写数字

一：卷积神经网络（CNN）和手写数字识别MNIST数据集的介绍卷积神经网络（Convolutional Neural Networks，简称CNN）是一种深度学习模型，它在图像和视频识别、分类和分割任务中表现出色。CNN通过模仿…...

编程日记 2024/9/8 17:25:41

【A题第二套完整论文已出】2024数模国赛A题第二套完整论文+可运行代码参考（无偿分享）

“板凳龙” 闹元宵路径速度问题摘要本文针对传统舞龙进行了轨迹分析，并针对一系列问题提出了解决方案，将这一运动进行了模型可视化。针对问题一，我们首先对舞龙的螺线轨迹进行了建模，将直角坐标系转换为极坐标系&#xff0…...

编程日记 2024/9/8 17:24:40

一份热乎的数据分析(数仓)面试题 | 每天一点点，收获不止一点

目录 1. 已有ods层⽤⼾表为ods_online.user_info，有两个字段userid和age，现设计数仓⽤⼾表结构如下： 2. 设计数据仓库的保单表（⾃⾏命名） 3. 根据上述两表，查询2024年8⽉份，每⽇&#xff0c…...

编程日记 2024/9/8 17:23:39

3 html5之css新选择器和属性

要说css的变化那是发展比较快的，新增的选择器也很多，而且还有很多都是比较实用的。这里举出一些案例，看看你平时都是否用过。 1 新增的一些写法： 1.1 导入css 这个是非常好的一个变化。这样可以让我们将css拆分成公共部分或者多…...

编程日记 2024/9/8 17:21:37

【Kubernetes】K8s 的鉴权管理（一）：基于角色的访问控制（RBAC 鉴权）

K8s 的鉴权管理（一）：基于角色的访问控制（RBAC 鉴权） 1.Kubernetes 的鉴权管理1.1 审查客户端请求的属性1.2 确定请求的操作 2.基于角色的访问控制（RBAC 鉴权）2.1 基于角色的访问控制中的概念2.1…...

编程日记 2024/9/8 17:20:36

保研比赛利器：用AI比赛助手降维打击数学建模

数学建模作为一个热门但又具有挑战性的赛道，在保研、学分加分、简历增色等方面具有独特优势。近年来，随着AI技术的发展，特别是像GPT-4模型的应用，数学建模的比赛变得不再那么“艰深”。通过利用AI比赛助手，不仅可以大大…...

编程日记 2024/9/8 17:19:34

秋招校招，在线性格测评应该如何应对

秋招校招，如果遇到在线测评，如何应对？ 这里写个总结稿，希望对大家有些帮助。在线测评是企业深入了解求职人的渠道，如果是性格测试，会要求测试者能够快速答出，以便于反应实际情况（时间…...

编程日记 2024/9/8 17:17:32

chrome 插件开发入门

1. 介绍 Chrome 插件可用于在谷歌浏览器上控制当前页面的一些操作，可自主控制网页，提升效率。平常我们可在谷歌应用商店中下载谷歌插件来增强浏览器功能，作为开发者，我们也可以自己开发一个浏览器插件来配合我们的日常学习工作…...

编程日记 2024/9/8 17:14:29

揭开面纱--机器学习

一、人工智能三大概念 1.1 AI、ML、DL 1.1.1 什么是人工智能? AI：Artificial Intelligence 人工智能 AI is the field that studies the synthesis and analysis of computational agents that act intelligently AI is to use computers to analog and instead…...

编程日记 2024/9/8 17:12:27

Python中的私有属性与方法：解锁面向对象编程的秘密

在Python的广阔世界里，面向对象编程（OOP）是一种强大而灵活的方法论，它帮助我们更好地组织代码、管理状态，并构建可复用的软件组件。而在这个框架内，私有属性与方法则是实现封装的关键机制之一。它们不仅有助…...

编程日记 2024/9/8 17:11:26

开篇_____何谓安卓机型“工程固件” 与其他固件的区别作用

此系列博文将分析安卓系列机型与一些车机 wifi板子等工程固件的一些常识。从早期安卓1.0起始到目前的安卓15，一些厂家发布新机型的常规流程都是从工程机到量产的过程。在其中就需要调试各种参数以便后续的量产参数可以固定到最佳，工程固件由此诞生。后…...

编程日记 2024/9/8 17:10:25

DBeaver 连接 MySQL 报错 Public Key Retrieval is not allowed

DBeaver 连接 MySQL 报错 Public Key Retrieval is not allowed 文章目录 DBeaver 连接 MySQL 报错 Public Key Retrieval is not allowed问题解决办法问题使用 DBeaver 连接 MySQL 数据库的时候， 一直报错下面的错误 Public Key Retrieval is not allowed详细…...

编程日记 2024/9/8 17:09:23

Ubuntu系统下交叉编译openssl

一、参考资料 OpenSSL&&libcurl库的交叉编译 - hesetone - 博客园二、准备工作 1. 编译环境宿主机：Ubuntu 20.04.6 LTSHost：ARM32位交叉编译器：arm-linux-gnueabihf-gcc-11.1.0 2. 设置交叉编译工具链在交叉编译之前&#x…...

编程新知 2025/11/10 15:33:04

《从零掌握MIPI CSI-2: 协议精解与FPGA摄像头开发实战》-- CSI-2 协议详细解析 (一）

CSI-2 协议详细解析 (一） 1. CSI-2层定义（CSI-2 Layer Definitions） 分层结构 ：CSI-2协议分为6层： 物理层（PHY Layer） ： 定义电气特性、时钟机制和传输介质（导线&#…...

编程新知 2026/1/23 12:18:20

pam_env.so模块配置解析

在PAM（Pluggable Authentication Modules）配置中， /etc/pam.d/su 文件相关配置含义如下： 配置解析 auth required pam_env.so1. 字段分解字段值说明模块类型auth认证类模块，负责验证用户身份&am…...

编程新知 2025/10/5 8:09:39

数据链路层的主要功能是什么

数据链路层（OSI模型第2层）的核心功能是在相邻网络节点（如交换机、主机）间提供可靠的数据帧传输服务，主要职责包括： 🔑 核心功能详解： 帧封装与解封装封装： 将网络层下发…...

编程新知 2026/2/1 7:31:51

mysql已经安装，但是通过rpm -q 没有找mysql相关的已安装包

文章目录现象：mysql已经安装，但是通过rpm -q 没有找mysql相关的已安装包遇到 rpm 命令找不到已经安装的 MySQL 包时，可能是因为以下几个原因：1.MySQL 不是通过 RPM 包安装的2.RPM 数据库损坏3.使用了不同的包名或路径4.使用其他包…...

编程新知 2026/2/4 16:17:25

RNN避坑指南：从数学推导到LSTM/GRU工业级部署实战流程

本文较长，建议点赞收藏，以免遗失。更多AI大模型应用开发学习视频及资料，尽在聚客AI学院。本文全面剖析RNN核心原理，深入讲解梯度消失/爆炸问题，并通过LSTM/GRU结构实现解决方案，提供时间序列预测和文本生成…...

编程新知 2026/1/20 17:16:46

【VLNs篇】07：NavRL—在动态环境中学习安全飞行

项目内容论文标题NavRL: 在动态环境中学习安全飞行 (NavRL: Learning Safe Flight in Dynamic Environments)核心问题解决无人机在包含静态和动态障碍物的复杂环境中进行安全、高效自主导航的挑战，克服传统方法和现有强化学习方法的局限性。核心算法基于近端策略优化…...

编程新知 2026/2/7 4:16:41

QT3D学习笔记——圆台、圆锥

类名作用Qt3DWindow3D渲染窗口容器QEntity场景中的实体（对象或容器）QCamera控制观察视角QPointLight点光源QConeMesh圆锥几何网格QTransform控制实体的位置/旋转/缩放QPhongMaterialPhong光照材质（定义颜色、反光等）QFirstPersonC…...

编程新知 2026/1/29 5:26:37

CRMEB 中 PHP 短信扩展开发：涵盖一号通、阿里云、腾讯云、创蓝

目前已有一号通短信、阿里云短信、腾讯云短信扩展扩展入口文件文件目录 crmeb\services\sms\Sms.php 默认驱动类型为：一号通 namespace crmeb\services\sms;use crmeb\basic\BaseManager; use crmeb\services\AccessTokenServeService; use crmeb\services\sms\…...

编程新知 2025/10/5 5:38:24

pgsql：还原数据库后出现重复序列导致“more than one owned sequence found“报错问题的解决

问题： pgsql数据库通过备份数据库文件进行还原时，如果表中有自增序列，还原后可能会出现重复的序列，此时若向表中插入新行时会出现“more than one owned sequence found”的报错提示。点击菜单“其它”-》“序列”，…...

编程新知 2026/1/26 21:38:28

前言

系列文章导航

本篇目录导航

实践方法论

问题描述：large loss on training data

模型偏差

优化问题

is 模型偏差 or 优化问题 ？

问题描述：large loss on testing data

过拟合【交叉验证】

不匹配

Python 分类任务实践

Read more

相关文章：

is 模型偏差 or 优化问题？