当前位置: 首页 > article >正文

深度学习 Deep Learning 第11章 实用方法论

深度学习 Deep Learning 第11章 实用方法论

章节概述

本章深入探讨了机器学习在实际应用中的方法论,强调了从确定目标到逐步优化的系统性过程。在机器学习项目中,明确的目标和性能指标是指导整个开发过程的关键。通过建立初始的端到端系统,快速评估和改进,可以有效地提升模型性能。本章还讨论了如何选择合适的算法作为基线模型,以及在不同情况下如何决定是否收集更多数据。此外,详细介绍了手动和自动选择超参数的方法,包括网格搜索、随机搜索和基于模型的优化算法。最后,通过具体的案例研究,展示了如何将这些方法应用于实际问题,如街道视图地址号码识别系统。
在这里插入图片描述

11.1 性能指标

确定项目的目标和性能指标是机器学习项目的首要步骤。问题导向,性能指标应与应用问题的需求相匹配,例如罕见事件检测(如疾病筛查)关注精确率(Precision)和召回率(Recall),用F1分数或PR曲线综合评估;需平衡覆盖率的系统(如Google街景门牌号识别)需设定**覆盖率(Coverage)和准确率(Accuracy)**的双重目标(如98%准确率+95%覆盖率)。
在某些情况下,可能需要自定义指标以反映特定的成本结构。例如,在垃圾邮件检测中,误判合法邮件为垃圾邮件的成本远高于误判垃圾邮件为合法邮件,因此需要使用能够反映这种成本差异的性能指标。

11.2 默认基线模型

在确定性能指标后,下一步是建立一个合理的端到端系统。根据问题的性质选择合适的模型类别,如前馈网络、卷积网络或循环网络。对于复杂问题,可以从小规模模型开始,逐步增加模型复杂度。正则化技术如dropout和batch normalization有助于提高模型的泛化能力。

标准架构先行:

  • 图像任务用CNN+ReLU,序列任务用LSTM/GRU,通用优化选Adam或SGD+动量。
  • 引入Batch Normalization加速训练,Dropout防止过拟合。

迁移学习:

  • 利用预训练模型(如ImageNet的CNN)加速收敛,尤其在数据较少时效果显著。

11.3 数据与模型优化:诊断与迭代

训练误差高:

  • 模型容量不足:增加层数/神经元,或用更复杂结构(如残差块)。
  • 优化问题:调整学习率(常用对数尺度尝试如0.1→0.01→0.001),检查梯度是否正常。

测试误差高:

  • 数据不足:收集更多数据,或通过增强(旋转、裁剪等)扩充数据集。
  • 过拟合:加强正则化(增大Dropout比例、权重衰减系数)。

学习曲线分析:

绘制训练集大小与误差关系图,预估数据需求。若数据收集成本高,则通过模型压缩(剪枝、量化)或改进正则化弥补。

11.4 选择超参数

超参数对模型性能有显著影响。手动调参需要理解超参数与模型容量之间的关系,通过调整超参数来平衡训练误差和泛化误差。自动调参算法如网格搜索、随机搜索和基于模型的优化算法可以减少手动调参的工作量,但通常需要更多的计算资源。

  • 学习率优先:对模型收敛影响最大,可先用学习率扫描(如1e-5到1的对数空间)。
  • 随机搜索 > 网格搜索:尤其在高维参数空间中效率更高(如图11.2所示)。
  • 自动化工具:贝叶斯优化(如Hyperopt)、TPE算法等可减少人工调参时间,但需权衡计算成本。

11.5 调试策略

当机器学习系统表现不佳时,可能是算法本身的问题,也可能是实现中的错误。通过可视化模型输出、分析最差错误、拟合小型数据集和比较反向传播导数与数值导数等方法,可以有效诊断和修复系统中的问题。

可视化关键节点:

  • 激活值分布:检查ReLU是否大量死亡(输出恒为0),Tanh是否饱和。
  • 梯度统计:监控梯度幅值,防止爆炸/消失(如权重更新幅度应为参数的1%左右)。

小数据集过拟合测试:

用几十个样本训练,确保模型能快速拟合(若不能,可能存在实现错误)。

数值梯度检验:

验证反向传播实现是否正确,特别是自定义层或损失函数时。

11.6 案例:Google街景门牌号识别

迭代过程:

  • 初始基线:CNN输出多个Softmax预测每位数字,发现覆盖不足。
  • 错误分析:可视化高置信度错误,发现裁剪过紧导致漏字。
  • 数据调整:扩大检测框宽度,覆盖率提升10%。
  • 输出层改进:替换独立Softmax为序列损失(如CTC),提升概率估计质量。
  • 超参数调优:增大模型规模,平衡计算开销与准确率。

成果:达到人类水平(98%准确率),覆盖95%地址,显著降低人工标注成本。

章节总结

本章提供了机器学习项目从目标确定到模型优化的实用指南。通过明确性能指标、建立基线模型、评估数据需求、选择合适的超参数和应用有效的调试策略,可以系统地提升机器学习模型的性能。这些方法在实际应用中经过验证,能够帮助从业者高效地解决复杂问题。

精彩语录

  1. 中文:在机器学习项目中,明确的目标和性能指标是指导整个开发过程的关键。
    英文原文:In machine learning projects, clear goals and performance metrics are crucial for guiding the entire development process.
    解释:这句话强调了在项目开始阶段确定性能指标的重要性。性能指标不仅决定了模型的优化方向,还影响了后续所有决策的制定。

  2. 中文:通过建立初始的端到端系统,快速评估和改进,可以有效地提升模型性能。
    英文原文:By establishing an initial end-to-end system and making rapid assessments and improvements, model performance can be effectively enhanced.
    解释:这句话说明了敏捷开发在机器学习项目中的应用。通过快速迭代和持续改进,可以在较短时间内显著提升模型的性能。

  3. 中文:对于复杂问题,从小规模模型开始,逐步增加模型复杂度,有助于找到最佳解决方案。
    英文原文:For complex problems, starting with small-scale models and gradually increasing model complexity helps find the optimal solution.
    解释:这句话建议了一种逐步构建模型的策略。从小模型开始,可以更容易地识别和解决问题,同时避免一开始就陷入复杂的模型结构中。

  4. 中文:正则化技术如dropout和batch normalization有助于提高模型的泛化能力。
    英文原文:Regularization techniques such as dropout and batch normalization help improve the generalization ability of models.
    解释:这句话介绍了两种常用的正则化方法。dropout通过随机失活神经元来防止过拟合,而batch normalization通过标准化层输入来加速训练并提高模型稳定性。

  5. 中文:当模型在训练集上表现良好但在测试集上表现不佳时,收集更多数据是一个有效的解决方案。
    英文原文:When a model performs well on the training set but poorly on the test set, collecting more data is an effective solution.
    解释:这句话指出了过拟合问题的常见解决方案。更多的训练数据可以帮助模型更好地泛化到未见过的数据,从而提高测试集性能。

相关文章:

深度学习 Deep Learning 第11章 实用方法论

深度学习 Deep Learning 第11章 实用方法论 章节概述 本章深入探讨了机器学习在实际应用中的方法论,强调了从确定目标到逐步优化的系统性过程。在机器学习项目中,明确的目标和性能指标是指导整个开发过程的关键。通过建立初始的端到端系统,…...

【常用的中间件】

中间件(Middleware)是位于客户端和服务器之间的软件层,用于处理客户端请求和服务器响应之间的各种任务。中间件可以提供多种功能,如负载均衡、消息队列、缓存、身份验证等。以下是常用的中间件及其作用: 1. 消息队列中…...

如何排查C++程序的CPU占用过高的问题

文章目录 可能的原因程序设计的BUG系统资源问题恶意软件硬件问题 通常步骤一个简单的问题代码在windows平台上如何排查Windows Process ExplorerWinDBG 在Linux平台如何排查使用TOP GDBPerf 可能的原因 程序设计的BUG 有死循环低效算法与数据结构滥用自旋锁频繁的系统调用&a…...

个人学习编程(3-29) leetcode刷题

最后一个单词的长度: 思路:跳过末尾的空格,可以从后向前遍历 然后再利用 while(i>0 && s[i] ! ) 可以得到字符串的长度, int lengthOfLastWord(char* s) {int length 0;int i strlen(s) - 1; //从字符串末尾开始//…...

Linux云计算SRE-第二十一周

构建单节点prometheus,部署node exporter和mongo exporter。构建kibana大盘。包含主机PU使用率,主机MEM使用率,主机网络包速度。mongo db大盘,包含节点在线状态,读操作延迟等 一、实验环境准备 - 节点信息&#xff1…...

无人机,云台参数设置,PWM输出控制云台俯仰

目录 1、云台与飞控的连接 2、PX4飞控控制云台,QGC地面站的设置 3、遥控器映射通道设置 4、其他设置 4.1、COM_PREARM_MODE,预解锁模式 4.2、RC9_DZ ,遥控器通道死区设置 1、云台与飞控的连接 首先确定一下,设置飞控第几路…...

EtherCAT转ProfiNet协议转换网关构建西门子PLC与海克斯康机器人的冗余通信链路

一、案例背景 某电子制造企业的5G通信模块组装线,采用西门子S7-1200PLC(ProfiNet主站)进行产线调度,而精密组装工序由3台海克斯康工业机器人(EtherCAT从站)完成。由于协议差异,机器人动作与PLC…...

Android R adb remount 调用流程

目的:调查adb remount 与adb shell进去后执行remount的差异 调试方法:添加log编译adbd,替换system\apex\com.android.adbd\bin\adbd 一、调查adb remount实现 关键代码:system\core\adb\daemon\services.cpp unique_fd daemon_service_to…...

网络中常用协议

一, TCP协议 TCP(Transmission Control Protocol,传输控制协议)是互联网核心协议之一,位于传输层,为应用层提供可靠的、面向连接的数据传输服务。 1. TCP的核心特点 特性说明面向连接通信前需通过三次握手建立连接&a…...

自动驾驶04:点云预处理03

点云组帧 感知算法人员在完成点云的运动畸变补偿后,会发现一个问题:激光雷达发送的点云数据包中的点云数量其实非常少,完全无法用来进行后续感知和定位层面的处理工作。 此时,感知算法人员就需要对这些数据包进行点云组帧的处理…...

Linux内核软中断分析

一、软中断类型 在Linux内核中,中断处理分为上半部(硬中断)和下半部。上半部负责快速响应硬件事件,而下半部用于处理耗时任务,避免阻塞系统。下半部有三种机制:软中断(Softirq)、小任…...

Linux修改默认shell为zsh

一、修改模型shell为zsh 1、检查当前使用的shell echo $SHELL 2、检查当前系统支持的shell cat /etc/shells# 输出结果显示如下: """ /bin/sh /bin/bash /usr/bin/sh /usr/bin/bash /bin/csh /bin/tcsh /usr/bin/csh /usr/bin/tcsh /usr/bin/zsh…...

k8s scheduler几种扩展方式的关系及区别

网上关于scheduler扩展介绍的文章很多,但都是东说一句西说一嘴,完全没有逻辑性,对于逻辑建构者看着很痛苦,这篇文章不会深入教你怎么扩展,而是教你几种扩展方式的关系和逻辑结构: 目前Kubernetes支持五种方…...

react 封装无缝滚动组件

记录,以防忘记 SeamlessScroll.tsx import React, { useEffect, useRef, useState } from react;interface SeamlessScrollProps {children: React.ReactNode;speed?: number; // 滚动速度,单位:像素/秒minItems?: number; // 最小项目数…...

[ComfyUI] 如何升级自定义节点(Custom Nodes)

ComfyUI 提供了灵活的 自定义节点(Custom Nodes) 功能,允许用户扩展其能力。随着插件的更新,保持 Custom Nodes 处于最新状态是确保兼容性和功能完整性的关键。 1. 手动升级(Git Pull 方式) 如果你的 自定义节点 是通过 Git 克隆的,可以使用 Git 命令来升级: 步骤: …...

软件项目管理课程之第4讲:软件需求管理

讲授内容 项目案例 软件需求管理的基本概念 软件需求开发 软件需求管理 项目案例 案例背景:小王作为软件项目负责人,带领团队开展需求调查工作,但在需求分析和后续开发过程中出现了一系列问题。 问题表现: 项目规模庞大&…...

深入理解 dispatchEvent:前端事件触发的艺术

dispatchEvent 是 DOM 元素的一个方法,用于手动触发/派发一个事件。这个方法允许开发者以编程方式触发事件,而不是等待用户交互或浏览器自动触发。 1.基本概念 ★ 基础 作用:dispatchEvent 用于在指定的 DOM 节点上触发一个事件 使用场景&a…...

linux和windows是采用何种机制保存密码的?

传统Linux的不足: 1)存在特权用户root 任何人只要得到root的权限,对于整个系统都可以为所欲为。这一点Windows也一样。 2)对于文件的访问权划分不够细 在linux系统里,对于文件的操作,只有「所有者」…...

matlab打开两个工程

1、问题描述 写代码时,需要实时参考别人的代码,需要同时打开2个模型,当模型在同一个工程内时,这是可以直接打开的,如图所示 2、解决方案 再打开一个MATLAB主窗口 这个时候就可以同时打开多个模型了 3、正确的打开方…...

Unity中的MaterialPropertyBlock的作用和 Material 的区别

MaterialPropertyBlock 是 Unity 提供的一个用于动态修改材质属性的轻量级工具,核心作用是避免材质实例化(Material Instantiation),从而优化性能。以下是它的关键特性和使用方法: 1. 核心作用 避免材质实例化 直接修改…...

Python与文件——保存文件

1.以下关于Python二维数据的描述中,错误的是()。 A、CSV文件的每一行是一维数据,可以用列表、元组表示。 B、从CSV文件获得数据内容后,可以用replace()来去掉每行最后的换行符。 C、若一个列表变量里的元素都是字符串类型,则可以用join()合成字符串。 D、列表中保存的二维数据,…...

HarmonyOS主题管理工具封装:动态切换、持久化存储与常见问题解析

注:适用版本(Harmony OS NEXT / 5.0 / API 12 ) 一、效果展示 二、技术栈 HarmonyOS ArkUI框架 使用AppStorage实现跨组件状态管理,PersistentStorage持久化存储用户偏好。 系统配置常量 ConfigurationConstant.Color…...

60V单通道高精度线性恒流LED驱动器防60V反接SOD123封装

产品描述: PC561A 系列产品是用于产生单通道、高精度恒流源( Constant Current Regulator, CCR) 的LED 驱动芯片,为各类 LED 照明应用提供高性价比恒流方案。PC561A 采用晶体管自偏置技术,可在超宽工作电压范围内维持…...

学习threejs,使用Sprite精灵、SpriteMaterial精灵材质

👨‍⚕️ 主页: gis分享者 👨‍⚕️ 感谢各位大佬 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍⚕️ 收录于专栏:threejs gis工程师 文章目录 一、🍀前言1.1 ☘️THREE.Sprite1.1.1 ☘️代码…...

网络相关的知识总结1

1.设备可以通过以太网电缆(如双绞线)连接到交换机的端口,交换机也通过以太网电缆连接到路由器。但是如果距离过远,比如跨国路由器如何连接? 1.专用通信线路(如 MPLS、光纤专线):租用…...

Cent OS7+Docker+Dify

由于我之前安装了Dify v1.0.0,出现了一些问题:无法删除,包括:知识库中的文件、应用、智能体、工作流,都无法删除。现在把服务器初始化,一步步重新安装,从0到有。 目录 1、服务器重装系统和配置…...

本地AI大模型部署革命:Ollama部署和API调试教程

Ollama:你的私人AI助手 还在为云端AI服务的高昂费用和隐私问题而烦恼吗?Ollama横空出世,它是一款专为本地环境打造的大模型部署神器,让你轻松在自己的设备上运行各种强大的AI模型。无论你是开发者还是普通用户,Ollama…...

centos7 linux VMware虚拟机新添加的网卡,能看到网卡名称,但是看不到网卡的配置文件

问题现象:VMware虚拟机新添加的网卡,能看到网卡,但是看不到网卡的配置文件 解决方案: nmcli connection show nmcli connection add con-name ens36 ifname ens36 type ethernet #创建一个网卡连接配置文件,这里con…...

SRT协议

SRT(Secure Reliable Transport)是一种开源的视频传输协议,专为高丢包、高延迟网络环境设计,结合了UDP的低延迟和TCP的可靠性,广泛应用于直播、远程制作、视频会议等场景。 定位:SRT协议的官方C/C实现库&am…...

K8S学习之基础五十一:k8s部署jenkins

k8s部署jenkins 创建nfs共享目录, mkdir -p /data/v2 echo /data/v2 *(rw,no_root_squash) > /etc/exports exportfs -arv创建pv、pvc vi pv.yaml apiVersion: v1 kind: PersistentVolume metadata:name: jenkins-k8s-pv spec:capacity:storage: 1GiaccessMod…...