机器学习的数学基础:假设检验
假设检验
默认以错误率为性能度量
,错误率由下式给出:
E ( f , D ) = ∫ x ∼ D I I ( f ( x ) ≠ y ) p ( x ) d x E(f,\mathcal{D})=\int_{\boldsymbol{x}\sim \mathcal{D}}\mathbb{II}(f(\boldsymbol{x})\ne y )p(\boldsymbol{x})\text{d}\boldsymbol{x} E(f,D)=∫x∼DII(f(x)=y)p(x)dx
假设检验中的"假设"是对学习泛化错误率
分布的某种判断或者猜想,例如:
ε = ε 0 \varepsilon=\varepsilon_0 ε=ε0
其中,我们 ε 0 \varepsilon_0 ε0为测试错误率是已知的。
对单个学习器泛化能力的假设检验
对于一个样本上的留出法得到的错误率 ε 0 \varepsilon_0 ε0,这意味着 m m m个测试样本中,恰好有 m × ε 0 m\times \varepsilon_0 m×ε0个错误分类。假设测试样本是从总体中独立同分布采样获得
,那么泛化错误率为 ε \varepsilon ε的学习器,将其中 m × ε 0 m\times \varepsilon_0 m×ε0个分类错误,其余分类正确的概率为:
单次留出法
P ( ε ; ε 0 ) = ( m m × ε 0 ) ε ε 0 × m ( 1 − ε ) m − ε 0 × m P(\varepsilon;\varepsilon_0)=\binom{m}{m\times \varepsilon_0}\varepsilon^{\varepsilon_0\times m}(1-\varepsilon)^{m-\varepsilon_0 \times m} P(ε;ε0)=(m×ε0m)εε0×m(1−ε)m−ε0×m
所以由极值条件得到:
∂ P ∂ ε = 0 \frac{\partial P}{\partial \varepsilon}=0 ∂ε∂P=0
然后选取一个显著性水平 α \alpha α,对于 ε ∼ B ( m , ε 0 ) \varepsilon \sim B(m,\varepsilon_0) ε∼B(m,ε0),我们假设 ε ≤ ε ′ \varepsilon\leq\varepsilon^{\prime} ε≤ε′,满足:
$$
\overline{\varepsilon}=\min \varepsilon
\mathbf{s.t.}:
\sum_{i=\varepsilon^{\prime}\times m+1}{m}\binom{m}{i}\varepsilon{i}(1-\varepsilon)^{m-i}
$$
若此时 ε ≤ ε ‾ \varepsilon \leq \overline{\varepsilon} ε≤ε则有 1 − α 1-\alpha 1−α的概率认为,学习器的泛化错误率不大于 ε ′ \varepsilon^{\prime} ε′。
多次留出法或交叉验证法
类似的,假定我们得到了 k k k个测试错误率, ε ^ 1 \hat{\varepsilon}_1 ε^1, ε ^ 2 \hat{\varepsilon}_2 ε^2, ⋯ \cdots ⋯, ε ^ k \hat{\varepsilon}_k ε^k,则平均测试错误率 μ \mu μ和方差 σ 2 \sigma^2 σ2分别为:
μ = 1 k ∑ i = 1 k ε ^ i \mu=\frac{1}{k}\sum_{i=1}^{k}\hat{\varepsilon}_i μ=k1i=1∑kε^i
σ 2 = 1 k − 1 ∑ i = 1 k ( ε ^ i − μ ) 2 \sigma^2=\frac{1}{k-1}\sum_{i=1}^{k}(\hat{\varepsilon}_i-\mu)^2 σ2=k−11i=1∑k(ε^i−μ)2
其中有假设:
每个测试错误率 ε ^ 1 , ε ^ 2 , … , ε ^ k \hat{\varepsilon}_1, \hat{\varepsilon}_2, \ldots, \hat{\varepsilon}_k ε^1,ε^2,…,ε^k 必须是独立同分布(independent and identically distributed, i.i.d.)的随机变量。且样本量足够大或者它们服从正态分布。
则:
τ t = ( μ − ε 0 ) σ k ∼ t ( k − 1 ) \tau_t=\frac{(\mu-\varepsilon_0)}{\frac{\sigma}{\sqrt{k}}}\sim t(k-1) τt=kσ(μ−ε0)∼t(k−1)
对两个学习器泛化能力的假设检验
对于两个学习器 A A A和 B B B,使用 k k k折交叉验证法得到: ε 1 A \varepsilon_{1}^A ε1A, ε 2 A \varepsilon_{2}^A ε2A, … \dots … ε k A \varepsilon_{k}^A εkA和 ε 1 B \varepsilon_{1}^B ε1B, ε 2 B \varepsilon_{2}^B ε2B, … \dots … ε k B \varepsilon_{k}^B εkB
我们是对
ε i A = ε i B \varepsilon_{i}^A=\varepsilon_{i}^B εiA=εiB
进行假设,取独立变量:
Δ i = ε i A − ε i B \Delta_i=\varepsilon_{i}^A-\varepsilon_{i}^B Δi=εiA−εiB
对样本均值进行标准化得到:
τ t = μ σ k ∼ t ( k − 1 ) \tau_t=\frac{\mu}{\frac{\sigma}{\sqrt{k}}}\sim t(k-1) τt=kσμ∼t(k−1)
5×2交叉验证
其统计量为:
τ t = μ 0.2 ∑ i = 1 5 σ i 2 ∼ t ( 4 ) \tau_t=\frac{\mu}{\sqrt{0.2\sum\limits_{i=1}^{5}}\sigma^2_i}\sim t(4) τt=0.2i=1∑5σi2μ∼t(4)
McNemar检验
对于二分类问题,我们通过列联表,基于两学习器的性能相同的假设,构造统计量:
方法B 阳性 | 方法B 阴性 | |
---|---|---|
方法A 阳性 | a a a | b b b |
方法A 阴性 | c c c | d d d |
τ χ 2 = ( ∣ b − c ∣ − 1 ) 2 b + c ∼ χ 2 ( 1 ) \tau_{\chi^2}=\frac{(|b-c|-1)^2}{b+c} \sim \chi^2(1) τχ2=b+c(∣b−c∣−1)2∼χ2(1)
对多于两个学习器泛化能力的假设检验
对多个算法,要进行Friedman检验和Nemenyi检验。
相关文章:
机器学习的数学基础:假设检验
假设检验 默认以错误率为性能度量,错误率由下式给出: E ( f , D ) ∫ x ∼ D I I ( f ( x ) ≠ y ) p ( x ) d x E(f,\mathcal{D})\int_{\boldsymbol{x}\sim \mathcal{D}}\mathbb{II}(f(\boldsymbol{x})\ne y )p(\boldsymbol{x})\text{d}\boldsymbol{x…...
余氯传感器在智慧水务系统中如何实现IoT集成
现代余氯传感器(关键词:智能余氯监测、物联网水质传感器、LoRaWAN水监测)通过(关键词:Modbus RTU、4-20mA输出、NB-IoT传输)协议与SCADA系统对接,实现(关键词:远程氯浓度…...

操作系统学习(九)——存储系统
一、存储系统 在操作系统中,存储系统(Storage System) 是计算机系统的核心组成部分之一,它负责数据的存储、组织、管理和访问。 它不仅包括物理设备(如内存、硬盘),还包括操作系统提供的逻辑抽…...

服务器安装软件失败或缺依赖怎么办?
服务器在安装软件时失败或提示缺少依赖,是运维中非常常见的问题。这个问题大多发生在 Linux 云服务器环境,原因和解决方法也有共性。以下是详细说明和解决建议: 🧠 一、常见原因分析 问题类型描述🔌 软件源不可用服务器…...
linux nm/objdump/readelf/addr2line命令详解
我们在开发过程中通过需要反汇编查看问题,那么我们这里使用rk3568开发板来举例nm/objdump/readelf/addr2line 分析动态库和可执行文件以及.o文件。 1,我们举例nm/objdump/readelf/addr2line解析linux 内核文件vmlinux (1),addr2…...

006网上订餐系统技术解析:打造高效便捷的餐饮服务平台
网上订餐系统技术解析:打造高效便捷的餐饮服务平台 在数字化生活方式普及的当下,网上订餐系统成为连接餐饮商家与消费者的重要桥梁。该系统以菜品分类、订单管理等模块为核心,通过前台展示与后台录入的分工协作,为管理员和会员提…...

[10-2]MPU6050简介 江协科技学习笔记(22个知识点)
1 2 3 欧拉角是描述三维空间中刚体或坐标系之间相对旋转的一种方法。它们由三个角度组成,通常表示为: • 偏航角(Yaw):绕垂直轴(通常是z轴)的旋转,表示偏航方向的变化。 • 俯仰角&a…...
基于行为分析的下一代安全防御指南
一、技术原理演进 从特征匹配到行为建模传统防火墙依赖特征库匹配(如病毒指纹),而行为分析技术通过建立用户/设备/应用的正常行为基线(基线构建误差<0.8%),利用隐马尔可夫模型检测异常。微软Az…...
Redis持久化机制详解:RDB与AOF的深度剖析
一、为什么需要持久化? Redis作为内存数据库,数据存储在易失性内存中。持久化机制解决两大核心问题: 数据安全:防止服务器宕机导致数据丢失灾难恢复:支持数据备份与快速重建 二、RDB:内存快照持久化 ▶ …...
记录一次 apt-key curl导入失败的处理方式
在配置 Kubernetes APT 仓库的过程中,我们通常会执行如下命令来添加阿里云的 GPG 公钥: curl https://mirrors.aliyun.com/kubernetes/apt/doc/apt-key.gpg | apt-key add -但这次在某台新机器上执行时,出现了访问失败的问题。具体表现为 cu…...

Spring Boot 3.X 下Redis缓存的尝试(二):自动注解实现自动化缓存操作
前言 上文我们做了在Spring Boot下对Redis的基本操作,如果频繁对Redis进行操作而写对应的方法显示使用注释更会更高效; 比如: 依之前操作对一个业务进行定入缓存需要把数据拉取到后再定入; 而今天我们可以通过注释的方式不需要额外…...

【03】完整开发腾讯云播放器SDK的UniApp官方UTS插件——优雅草上架插件市场-卓伊凡
【03】完整开发腾讯云播放器SDK的UniApp官方UTS插件——优雅草上架插件市场-卓伊凡 一、项目背景与转型原因 1.1 原定计划的变更 本系列教程最初规划是开发即构美颜SDK的UTS插件,但由于甲方公司内部战略调整,原项目被迫中止。考虑到: 技术…...

C:\Users\中文名修改为英文名
C:\Users\中文名修改为英文名 背景操作步骤 背景 买了台新电脑,初始化好不知道啥操作把自己的登录用户名改成了中文,有些安装的软件看见有中文直接就水土不服了。 操作步骤 以下称中文用户名为张三。 正常登录张三用户 进入用户管理页面修改用户名&a…...
Web 架构相关文章目录(持续更新中)
文章目录 目录结构总结 目录结构 序号标题链接1Web 架构之数据库开发规范Web 架构之数据库开发规范2Web 架构之状态码全解Web 架构之状态码全解3Web 架构之会话保持深度解析Web 架构之会话保持深度解析4Web 架构之负载均衡会话保持Web 架构之负载均衡会话保持5Web 架构之攻击应…...
Redis 安装配置和性能优化
目录 简介 一、Redis 基础概念与优势 1.1 关系型与非关系型数据库对比 1.2 Redis 核心特性 二、Redis 部署 2.1 环境准备与源码安装 2.2 服务脚本配置与启动 三、Redis 配置参数 四、Redis 命令工具与常用操作 4.1 命令行工具(redis-cli) 4.2…...

购物商城网站 Java+Vue.js+SpringBoot,包括商家管理、商品分类管理、商品管理、在线客服管理、购物订单模块
购物商城网站 JavaVue.jsSpringBoot,包括商家管理、商品分类管理、商品管理、在线客服管理、购物订单模块 百度云盘链接:https://pan.baidu.com/s/10W0kpwswDSmtbqYFsQmm5w 密码:68jy 摘 要 随着科学技术的飞速发展,各行各业都在…...
PostgreSQL 安全纵深防御:从权限到加密
文章目录 PostgreSQL 安全纵深防御:从权限到加密 第一章:角色与权限体系 - PostgreSQL的安全基石 1.1 角色(ROLE)的本质与演进1.2 权限模型的三层架构1.3 GRANT/REVOKE 实战精解1.4 默认权限(DEFAULT PRIVILEGES&#…...
【美团技术团队】从实际案例聊聊Java应用的GC优化
【美团技术团队】从实际案例聊聊Java应用的GC优化 1. 美团技术团队优秀文章2. 绪论 1. 美团技术团队优秀文章 Java NIO浅析 https://tech.meituan.com/2016/11/04/nio.html红黑树深入剖析及Java实现 https://tech.meituan.com/2016/12/02/redblack-tree.htmlJava 8系列之重新认…...

在word中点击zotero Add/Edit Citation没有反应的解决办法
重新安装了word插件 1.关掉word 2.进入Zotero左上角编辑-引用 3.往下滑找到Microsoft Word,点重新安装加载项...

整合swagger,以及Knife4j优化界面
因为是前后端项目,需要前端的参与,所以一个好看的接口文档非常的重要 1、引入依赖 美化插件其中自带swagger的依赖了 <dependency><groupId>com.github.xiaoymin</groupId><artifactId>knife4j-openapi3-spring-boot-starter&…...

Unity | AmplifyShaderEditor插件基础(第四集:简易shader)
一、👋🏻前言 大家好,我是菌菌巧乐兹~本节内容主要讲一下,第一个用ASE的shader。 我们用通用的光照模版吧。(universal-通用/Lit-光照) 通用的光照模版 如果你尝试建设了,会发现Universal这个…...
【安全攻防与漏洞】量子计算对HTTPS的威胁:后量子密码学进展
⚛️ 一、量子计算对HTTPS的核心威胁 Shor算法破解非对称加密 Shor算法可高效分解大整数(破解RSA)和计算椭圆曲线离散对数(破解ECC),而HTTPS依赖的TLS握手阶段依赖RSA/ECC进行密钥交换和身份验证。一旦实用化量子计算…...

linux C语言中的动态库 静态库说明
静态库 gcc -fpic -c add.c sub.c 这个命令之后会得到 add.o 于 sub.o (-c 只编译不链接) ar rcs mymath.a add.o sub.o 将编译好的文件编译成.a静态库用于调用 在使用中 gcc main.c -I../include ../lib/mymarh.a -0 mytest 需要这个函数的声明放在include文件下…...

Flash烧录速度和加载配置速度(纯FPGA ZYNQ)
在工程综合完成或者implement完成后,打开综合设计或者实现设计。 toots--->Edit Device Properties--->打开比特流设置 将bitstream进行压缩 上图中,时钟频率选择的档位有限,最大为66MHZ io的bus width可以设置为x1,x2,x4 vivado在设计…...

解构与重构:PLM 系统如何从管理工具进化为创新操作系统?
在智能汽车、工业物联网等新兴领域的冲击下,传统产品生命周期管理(PLM)系统正在经历前所未有的范式转换。当某头部车企因 ECU 软件与硬件模具版本失配导致 10 万辆智能电车召回,损失高达 6 亿美元时,这场危机不仅暴露了…...

Redis:介绍和认识,通用命令,数据类型和内部编码,单线程模型
介绍和认识 Redis是一个基于内存的,高性能的,支持许多数据类型的NoSQL数据库,可以持久化,也支持分布式。 在许多的互联网产品中,对于数据库的访问速度要求很高,例如Mysql数据库无法满足其要求,…...
N2语法 強調、限定
1,~限りでは 接続:认知类动词 意味:据…所… 例文: 私の知る限りでは、彼は悪い人ではありません。(据我所知,他不是坏人) 私の調べた限りでは、彼は悪人では…...
OpenAI 即将推出 GPT-5:开启多模态、持续记忆对话新时代
2025年5月起,关于 OpenAI 新一代旗舰模型 GPT-5 的传闻不断升温。根据多方可信消息,OpenAI 正在积极准备 GPT-5 的正式发布,预计将在 2025 年夏末上线。这一代模型不仅是在规模上的升级,更是在能力与交互模式上的一次突破。 本文…...
《前端面试题:CSS预处理器(Sass、Less等)》
CSS预处理器深度解析:Sass与Less的全面指南 掌握CSS预处理器是现代前端开发的必备技能,也是提升开发效率的关键工具 一、为什么需要CSS预处理器? 在现代前端开发中,原生CSS的局限性日益明显: 缺乏编程特性࿰…...

嵌入式开发之STM32学习笔记day20
STM32F103C8T6 PWR电源控制 1 PWR简介 PWR(Power Control)电源控制单元是STM32微控制器中一个重要的组成部分,它负责管理系统的电源管理功能,以优化功耗并提高效率。PWR负责管理STM32内部的电源供电部分,可以实现可编…...