【Day44】
DAY 44 预训练模型
知识点回顾:
- 预训练的概念
- 常见的分类预训练模型
- 图像预训练模型的发展史
- 预训练的策略
- 预训练代码实战:resnet18
作业:
- 尝试在cifar10对比如下其他的预训练模型,观察差异,尽可能和他人选择的不同
- 尝试通过ctrl进入resnet的内部,观察残差究竟是什么
在统计学和机器学习领域,**残差(Residual)是一个核心概念**,用于衡量模型预测值与实际观测值之间的差异。理解残差有助于评估模型性能、诊断模型问题,并优化模型效果。以下是关于残差的详细解析:### **一、残差的定义**
- **数学表达式**: 对于给定的观测值 \( y_i \) 和模型预测值 \( \hat{y}_i \),残差 \( e_i \) 定义为: \[e_i = y_i - \hat{y}_i\] 例如:若实际房价为100万元,模型预测为95万元,则残差为 \( 100 - 95 = 5 \) 万元。### **二、残差与误差的区别**
残差常与“误差(Error)”混淆,但两者含义不同:
| **对比维度** | **残差(Residual)** | **误差(Error)** |
|--------------------|-------------------------------------|------------------------------------|
| **本质** | 模型预测值与实际观测值的差异 | 真实值与理论值(不可观测)的差异 |
| **可观测性** | 可通过数据直接计算得出 | 理论上存在,无法直接观测 |
| **用途** | 用于模型评估、诊断和优化 | 用于描述模型的理论偏差 |### **三、残差的作用**
#### 1. **评估模型拟合效果** - **直观判断**:残差绝对值越小,模型预测越准确;反之,模型拟合效果差。 - **统计指标**:通过残差的统计量(如均值、方差、均方误差(MSE)、平均绝对误差(MAE))量化模型性能。 - 例如:若残差均值接近0,说明模型无系统性偏差;若残差方差大,说明预测值波动大。#### 2. **诊断模型问题** - **残差分析图**:通过绘制残差图(如残差-预测值图、残差-自变量图),识别模型缺陷: - **非线性关系**:若残差呈现曲线趋势(如U型、倒U型),说明模型可能忽略了非线性关系(需引入多项式特征或换用非线性模型)。 - **异方差性**:若残差随预测值增大而扩散(如扇形分布),说明数据存在异方差性(需数据变换或使用加权回归)。 - **异常值**:若个别残差绝对值显著偏大,可能对应数据中的异常值,需检查数据或调整模型。#### 3. **优化模型** - 通过分析残差模式,指导模型改进: - 增加特征(如交互项、多项式项)以捕捉非线性关系; - 更换模型(如从线性回归换为随机森林、神经网络); - 处理异常值或对数据进行标准化/归一化。### **四、残差的类型(以回归模型为例)**
1. **普通残差(Ordinary Residual)** 即最基础的残差 \( e_i = y_i - \hat{y}_i \),适用于初步模型评估。 2. **标准化残差(Standardized Residual)** - 对残差进行标准化处理,消除量纲影响: \[\text{标准化残差} = \frac{e_i}{\hat{\sigma}}\] 其中 \( \hat{\sigma} \) 为残差的估计标准差,用于比较不同样本的残差大小。 3. **学生化残差(Studentized Residual)** - 进一步考虑单个样本对模型的影响,剔除当前样本后计算残差,用于检测异常值。### **五、残差的假设(以线性回归为例)**
在经典线性回归模型中,残差需满足以下假设(**高斯-马尔可夫假设**):
1. **零均值**:\( E(e_i) = 0 \)(模型无系统性偏差);
2. **同方差性**:\( \text{Var}(e_i) = \sigma^2 \)(残差方差恒定);
3. **无自相关性**:\( \text{Cov}(e_i, e_j) = 0 \)(残差之间相互独立);
4. **正态性**:\( e_i \sim N(0, \sigma^2) \)(残差服从正态分布)。
若残差不满足这些假设,模型的参数估计和统计检验将失效,需通过数据变换或模型调整解决。### **六、残差在机器学习中的应用**
在机器学习中,残差的概念同样重要:
- **集成学习**:如梯度提升树(GBDT)通过拟合残差逐步优化模型,每棵树学习前序模型的残差,最终累加预测值。
- **模型诊断**:通过交叉验证计算残差,检测模型是否过拟合(如训练集残差低但测试集残差高,可能过拟合)。 ### **总结**
残差是连接模型预测与实际数据的桥梁,其核心价值在于:
- **量化差异**:衡量模型预测的准确性;
- **揭示规律**:通过残差模式发现数据中的隐藏信息(如非线性、异常值);
- **指导优化**:为模型改进提供方向。
熟练运用残差分析,是提升数据分析和建模能力的关键环节。
浙大疏锦行
相关文章:
【Day44】
DAY 44 预训练模型 知识点回顾: 预训练的概念常见的分类预训练模型图像预训练模型的发展史预训练的策略预训练代码实战:resnet18 作业: 尝试在cifar10对比如下其他的预训练模型,观察差异,尽可能和他人选择的不同尝试通…...

基于 Alpine 定制单功能用途(kiosk)电脑
前言 故事回到 7 年前, 在网上冲浪的时候发现了一篇介绍使用 Ubuntu 打造 kiosk 单功能用途电脑的文章, 挺好玩的, 就翻译了一下并比葫芦画瓢先后用了 CentOS 7, ArchLinux 进行了实现. 历史文章: 翻译 - 使用Ubutnu14.04和Chrome打造单功能用途电脑(大屏展示电脑) 使用CentOS…...

知识图谱系统功能实现,技术解决方案,附源码
基于Java、Neo4j和ElasticSearch构建的医疗知识图谱知识库,是一个融合图数据库技术与搜索引擎的智能化医疗知识管理系统。该系统以Neo4j图数据库为核心,利用其高效的图结构存储能力,将疾病、症状、药品、检查项目、科室等医疗实体抽象为节点&…...
第12节 Node.js 函数
在JavaScript中,一个函数可以作为另一个函数接收一个参数。我们可以先定义一个函数,然后传递,也可以在传递参数的地方直接定义函数。 Node.js中函数的使用与Javascript类似,举例来说,你可以这样做: funct…...

洛谷P12610 ——[CCC 2025 Junior] Donut Shop
题目背景 Score: 15. 题目描述 The owner of a donut shop spends the day baking and selling donuts. Given the events that happen over the course of the day, your job is to determine the number of donuts remaining when the shop closes. 输入格式 The first …...

1. 数据库基础
1.1 什么是数据库 ⭐ mysql 本质是一种网络服务, 是基于 C(mysql) S(mysqld)的 网络服务. 存储数据用文件就可以了,为什么还要弄个数据库?文件保存数据存在以下缺点: 文件的安全性问题。文件不利于数据查询和管理。文件不利于存储海量数据。…...

英伟达288GB HBM4+50P算力
英伟达CEO黄仁勋在COMPUTEX 2025上突然官宣:以暗物质研究先驱Vera Rubin命名的新一代AI芯片即将量产!这颗被称作“算力巨兽”的Rubin GPU,不仅搭载288GB HBM4显存和50 Petaflops推理算力,更携三大颠覆性技术直击AI行业痛点。更可怕…...
【Pandas】pandas DataFrame reset_index
Pandas2.2 DataFrame Reindexing selection label manipulation 方法描述DataFrame.add_prefix(prefix[, axis])用于在 DataFrame 的行标签或列标签前添加指定前缀的方法DataFrame.add_suffix(suffix[, axis])用于在 DataFrame 的行标签或列标签后添加指定后缀的方法DataFram…...

综合案例:斗地主
综合案例:斗地主 1.程序概述 这是一个模拟斗地主游戏发牌过程的C语言程序,实现了扑克牌的初始化、洗牌和发牌功能。 2.功能需求 2.1 扑克牌定义 使用结构体 Card 表示一张牌,包含: 花色属性suit(0-3表示普通花色♥…...

前端组件推荐 Swiper 轮播与 Lightbox 灯箱组件深度解析
在互联网产品不断迭代升级的今天,用户对于页面交互和视觉效果的要求越来越高。想要快速打造出吸睛又实用的项目,合适的组件必不可少。今天就为大家推荐两款超好用的组件 ——Swiper 轮播组件和 Lightbox 灯箱组件,轻松解决你的展示难题&#…...
解密并下载受DRM保护的MPD(DASH流媒体)加密视频
要解密并下载受DRM保护的MPD(DASH流媒体)加密视频,需结合技术工具与合法授权。以下是关键方法与步骤: 一、工具与技术要求 Widevine-DL 这是一个开源Python工具,支持下载和解密Widevine DRM保护的MPD内容。它依赖ffmpe…...
数据可视化有哪些步骤?2025高效落地指南
分享大纲 1、科学框架:从数据到洞察落地 2、可视化实战:捷码快速搭建专业大屏 3、关键避坑指南 根据IBM研究,规范的数据可视化流程,可以使得数据可视化搭建效率提升41%。那有标准的数据可视化搭建方法是哪些呢?本文将借…...

Deepfashion2 数据集使用笔记
目录 数据类别: 筛选类别数据: 验证精度筛选前2个类别: 提取类别数据 可视化类别数据: Deepfashion2 的解压码 旋转数据增强 数据类别: 类别含义: Class idx类别名称英文名称0短上衣short sleeve top1长上衣long sleeve top2短外套short sleeve outwear3长外套lo…...

Dify知识库下载小程序
一、Dify配置 1.查看或创建知识库的API 二、下载程序配置 1. 安装依赖resquirements.txt ######requirements.txt##### flask2.3.3 psycopg2-binary2.9.9 requests2.31.0 python-dotenv1.0.0#####安装依赖 pip3 install -r requirements.txt -i https://pypi.tuna.tsinghua.…...
匀速旋转动画的终极对决:requestAnimationFrame vs CSS Animation
引言:旋转动画的隐藏陷阱 在现代Web开发中,实现一个流畅的无限旋转动画似乎是个简单任务。但当我深入探究时,发现这个看似基础的需求背后隐藏着性能陷阱、数学精度问题和浏览器渲染机制的深层奥秘。本文将带你从一段常见的requestAnimationF…...

数据库中求最小函数依赖集-最后附解题过程
今天来攻克数据库设计里一个超重要的知识点 —— 最小函数依赖集。对于刚接触数据库的小白来说,这概念可能有点绕,但别担心,咱们一步步拆解,轻松搞定💪! (最后fuyou) 什么是最小函数…...

嵌入式系统中常用的开源协议
目录 1、GNU通用公共许可证(GPL) 2、GNU宽松通用公共许可证(LGPL) 3、MIT许可证 4、Apache许可证2.0 5、BSD许可证 6、如何选择合适的协议 在嵌入式系统开发中,开源软件的使用已成为主流趋势。从物联网设备到汽车…...
MySQL 索引底层原理剖析:B+ 树结构、索引创建维护与性能优化策略全解读
引言 在 MySQL 数据库的世界里,索引是提升查询性能的关键利器。然而,很多开发者虽然知道索引的重要性,但对于索引背后的底层原理却知之甚少。本文将深入 MySQL 索引的底层实现,剖析 B 树的结构特点,以及如何利用这些知…...
系统架构设计论文
disstertation 软考高级-系统架构设计师-论文:论文范围(十大知识领域)、历年论题、预测论题及论述过程、论文要点、论文模板等。 —— 2025 年 4 月 4 日 甲辰年三月初七 清明 目录 disstertation1、论文范围(十大核心领域&#x…...

第二篇:Liunx环境下搭建PaddleOCR识别
第二篇:Liunx环境下搭建Paddleocr识别 一:前言二:安装PaddleOCR三:验证PaddleOCR是否安装成功 一:前言 PaddleOCR作为业界领先的多语言开源OCR工具库,其核心优势在于深度整合了百度自主研发的飞桨PaddlePa…...
图片上传问题解决方案与实践
一、问题描述 在校园二手交易平台中,上传商品图片后出现以下异常情况: 图片访问返回404错误,无法正常加载服务器错误识别文件类型为text/plain图片 URL 路径存在不完整问题 二、原因分析 (一)静态资源访问配置问题…...

复杂业务场景下 JSON 规范设计:Map<String,Object>快速开发 与 ResponseEntity精细化控制HTTP 的本质区别与应用场景解析
Moudle 1 Json使用示例 在企业开发中,构造 JSON 格式数据的方式需兼顾 可读性、兼容性、安全性和开发效率,以下是几种常用方式及适用场景: 一、直接使用 Map / 对象转换(简单场景) 通过 键值对集合(如 M…...

二叉数-965.单值二叉数-力扣(LeetCode)
一、题目解析 顾名思义,就是二叉树中所存储的值是相同,如果有不同则返回false 二、算法原理 对于二叉树的遍历,递归无疑是最便捷、最简单的方法,本题需要用到递归的思想。 采取前序遍历的方法,即根、左、右。 我们…...
redis集群和哨兵的区别
Redis Sentinel系统监控并确保主从数据库的正常运行,当主数据库故障时自动进行故障迁移。哨兵模式提供高可用性,客户端通过Sentinel获取主服务器地址,简化管理。Redis集群实现数据分布式存储,通过槽分区提高并发量,解决…...

[蓝桥杯]对局匹配
对局匹配 题目描述 小明喜欢在一个围棋网站上找别人在线对弈。这个网站上所有注册用户都有一个积分,代表他的围棋水平。 小明发现网站的自动对局系统在匹配对手时,只会将积分差恰好是 K 的两名用户匹配在一起。如果两人分差小于或大于 KK,…...
BBU 电源市场报告:深入剖析与未来展望
在当今数字化时代,数据中心的稳定运行至关重要。BBU 电源作为保障数据中心设备在停电或电压下降期间临时电力供应的关键系统,其市场发展备受关注。本文将从市场规模、竞争格局、产品类型、应用领域等多个维度对 BBU 电源市场进行深入分析,并为…...

Redis 持久化机制详解:RDB 与 AOF 的原理、优缺点与最佳实践
目录 前言1. Redis 持久化机制概述2. RDB 持久化机制详解2.1 RDB 的工作原理2.2 RDB 的优点2.3 RDB 的缺点 3. AOF 持久化机制详解3.1 AOF 的工作原理3.2 AOF 的优点3.3 AOF 的缺点 4. RDB 与 AOF 的对比分析5. 持久化机制的组合使用与最佳实践6. 结语 前言 Redis 作为一款高性…...
Hadoop企业级高可用与自愈机制源码深度剖析
Hadoop企业级高可用与自愈机制源码深度剖析 前言 在大数据平台生产环境中,高可用(HA)与自动化自愈能力直接决定了数据安全与服务稳定性。本文结合源码与实战,深入剖析Hadoop生态中YARN高可用、HDFS自动扩容、故障自愈三大核心机…...

【Kotlin】简介变量类接口
【Kotlin】简介&变量&类&接口 【Kotlin】数字&字符串&数组&集合 【Kotlin】高阶函数&Lambda&内联函数 【Kotlin】表达式&关键字 文章目录 Kotlin_简介&变量&类&接口Kotlin的特性Kotlin优势创建Kotlin项目变量变量保存了指向对…...

Mybatis入门到精通
一:什么是Mybatis 二:Mybatis就是简化jdbc代码的 三:Mybatis的操作步骤 1:在数据库中创建一个表,并添加数据 我们这里就省略了 2:Mybatis通过maven来导入坐标(jar包) 3:…...