【机器学习第十二章——计算学习理论】
机器学习第十二章——计算学习理论
- 12.计算学习理论
- 12.1 基础知识
- 12.1 可能学习近似正确假设(PAC)
- 12.3 有限假设空间
- 12.4 VC维
12.计算学习理论
12.1 基础知识
-
从理论上刻画了若干类型的机器学习问题中的困难和若干类型的机器学习算法的能力
-
这个理论要回答的问题是:
- 在什么样的条件下成功的学习是可能的?
- 在什么条件下某个特定的学习算法可保证成功运行?
-
机器学习理论的一些问题:
- 是否可能独立于学习算法确定学习问题中固有的难度?
- 能否知道为保证成功的学习有多少训练样例是必要的或充足的?
- 如果学习器被允许向施加者提出查询,而不是观察训练集的随机样本,会对所需样例数目有怎样的影响?
- 能否刻画出学习器在学到目标函数前会有多少次出错?
- 能否刻画出一类学习问题中固有的计算复杂度?
-
主要解决的问题是:
- 需要多少训练样例才足以成功地学习到目标函数
- 学习器在达到目标前会出多少次错
12.1 可能学习近似正确假设(PAC)
- 可能近似正确学习模型(PAC)
- 指定PAC学习模型适用的问题
- 在此模型下,学习不同类别的目标函数需要多少训练样例和多大的计算量
X表示所有实例的集合,C代表学习器要学习的目标概念集合,C中每个目标概念c对应于X的某个子集或一个等效的布尔函数c:
X → { 0 , 1 } X→\{0,1\} X→{0,1}
假定实例按照某概率分布D从X中随机产生
学习器L在学习目标概念时考虑可能假设的集合H。在观察了一系列关于目标概念c的训练样例后,L必须从H中输出某假设h,它是对c的估计
我们通过h在从X中抽取的新实例上的性能来评估L是否成功。新实例与训练数据具有相同的概率分布
我们要求L足够一般,以至可以从C中学到任何目标概念而不管训练样例的分布如何,因此,我们会对C中所有可能的目标概念和所有可能的实例分布D进行最差情况的分析
12.3 有限假设空间
- PAC可学习性很大程度上由所需的训练样例数确定
- 随着问题规模的增长所带来的所需训练样例的增长称为该学习问题的样本复杂度
- 我们把样本复杂度的讨论限定于一致学习器(输出完美拟合训练数据的学习器)
- 能够独立于特定算法,推导出任意一致学习器所需训练样例数的界限
- 变型空间:能正确分类训练样例D的所有假设的集合。
V S H , D = { h ∈ H ∣ ( ∀ < x , c ( x ) > ∈ D ( h ( x ) = c ( x ) ) ) } VS_{H,D}=\{h\in H|(\forall\quad <x,c(x)>\quad\in D(h(x)=c(x)))\} VSH,D={h∈H∣(∀<x,c(x)>∈D(h(x)=c(x)))}
-
变型空间的重要意义是:每个一致学习器都输出一个属于变型空间的假设
-
因此界定任意一个一致学习器所需的样例数量,只需要界定为保证变型中没有不可接受假设所需的样例数量
-
定义:考虑一假设空间H,目标概念c,实例分布D以及c的一组训练样例S。当
V S H , D VS_{H,D} VSH,D
中每个假设h关于c和D错误率小于ε时,变型空间被称为c和D是ε-详尽的。
( ∀ h ∈ V S H , D ) e r r o r D ( h ) < ε (\forall h\in VS_{H,D})error_D(h)<ε (∀h∈VSH,D)errorD(h)<ε
-
详尽的变型空间表示与训练样例一致的所有假设的真实错误率都小于ε
-
从学习器的角度看,所能知道的只是这些假设能同等地拟合训练数据,它们都有零训练错误率
-
只有知道目标概念的观察者才能确定变型空间是否为ε-详尽的
-
但是,即使不知道确切的目标概念或训练样例抽取的分布,一种概率方法可在给定数目的训练样例之后界定变型空间为ε-详尽的
-
定理7.1(变型空间的ε-详尽化)
-
若假设空间H有限,且D为目标概念c的一系列m>=1个独立随机抽取的样例,那么对于任意0=<ε<=1,变型空间不是ε-详尽的概率小于或等于:
∣ H ∣ e − ε m |H|e^{-εm} ∣H∣e−εm -
证明:
-
令
h 1 , . . . , h k h_1,...,h_k h1,...,hk
为H中关于c的真实错误率大于ε的所有假设。当且仅当k个假设中至少有一个恰好与所有m个独立随机抽取样例一致时,不能使变型空间ε-详尽化。 -
任一假设真实错误率大于ε,且与一个随机抽取样例一致的可能性最多为1-ε,因此,该假设与m个独立抽取样例一致的概率最多为
( 1 − ε ) m (1-ε)^m (1−ε)m -
由于已知有k个假设错误率大于ε,那么至少有一个与所有m个训练样例都不一致的概率最多为
当 0 ≤ ε ≤ 1 , 则 1 − ε ≤ e ε k ( 1 − ε ) m ≤ ∣ H ∣ ( 1 − ε ) m ≤ ∣ H ∣ e − ε m ( 7.2 ) 当0\leqε\leq1,则1-ε\leq e^ε\\ k(1-ε)^m\leq|H|(1-ε)^m\leq|H|e^{-εm}\quad\quad(7.2) 当0≤ε≤1,则1−ε≤eεk(1−ε)m≤∣H∣(1−ε)m≤∣H∣e−εm(7.2)
-
-
-
定理7.1基于训练样例的数目m、允许的错误率ε和H的大小,给出了变型空间不是ε-详尽的概率的上界
-
即它对于使用假设空间H的任意学习器界定了m个训练样例未能将所有“坏”的假设(错误率大于ε的假设)剔除出去的概率
-
利用上面的结论来确定为了减少此“未剔除”概率到一希望程度ε所需的训练样例数
由 ∣ H ∣ e − ε m ≤ δ → m ≥ 1 ε ( ln ∣ H ∣ + ln ( 1 / δ ) ) 由|H|e^{-εm}\leq\delta→m\geq\frac{1}{ε}(\ln|H|+\ln(1/\delta)) 由∣H∣e−εm≤δ→m≥ε1(ln∣H∣+ln(1/δ)) -
式子7.2提供了训练样例数目的一般边界,该数目的样例足以在所期望的值ε和δ程度下,使任何一致学习器成功地学习到H中的任意目标概念
-
训练样例的数目m足以保证任意一致假设是可能(可能性为1-δ)近似(错误率为ε)正确的
-
m随着1/ε线性增长,随着1/δ和假设空间的规模对数增长
-
上面的界限可能是过高的估计,主要来源于|H|项,它产生于证明过程中在所有可能假设上计算那些不可接受的假设的概率和
12.4 VC维
-
分层有向无环图的特点:
- 节点可划分成层,即所有第1层出来的有向边进入到第l+1层节点
- 没有有向环,即有向弧形成的回路
-
这样网络的VC维的界定可以基于其图的结构和构造该图的基本单元的VC维
-
定义一些术语
-
G表示神经网络
-
n是G的输入数目
-
G只有1个输出节点
-
G的每个内部单元Ni最多有r个输入,并实现布尔函数
c i : R r → { 0 , 1 } c_i:R^r→\{0,1\} ci:Rr→{0,1}
形成函数类C -
定义C的G-合成:网络G能实现的所有函数的类,即网络G表示的假设空间,表示成
C G C_G CG
-
-
定理7.4分层有向无环网络的VC维
- 令G为一分层有向无环图,有n个输入节点和s>=2个内部节点,每个至少有r个输入,令C为VC维为d的
R r R^r Rr
上的概念类,对应于可由每个内部节点s描述的函数集合,令
C G C_G CG
为C的G合成,对应于可由G表示的函数集合,则
V C ( C G ) < = 2 d s log ( e s ) VC(C_G)<=2ds\log(es) VC(CG)<=2dslog(es)
- 令G为一分层有向无环图,有n个输入节点和s>=2个内部节点,每个至少有r个输入,令C为VC维为d的
-
假定要考虑的分层有向无环网络中单个节点都是感知器,由于单独的r输入感知器VC维为r+1,代入定理7.4和式子7.7,得到
V C ( C G p e r c e p t i o n s ) ≤ 2 ( r + 1 ) s log ( e s ) VC(C_G^{perceptions})\leq2(r+1)s\log(es) VC(CGperceptions)≤2(r+1)slog(es)m ≥ 1 ε ( 4 log ( 2 / δ ) + 16 ( r + 1 ) s log ( e s ) log ( 13 / ε ) ) m\geq\frac{1}{\varepsilon}(4\log(2/\delta)+16(r+1)s\log(es)\log(13/\varepsilon)) m≥ε1(4log(2/δ)+16(r+1)slog(es)log(13/ε))
-
上面的结果不能直接应用于反向传播的网络,原因有两个:
- 此结果应用于感知器网络,而不是sigmoid单元网络
- 不能处理反向传播中的训练过程
相关文章:
【机器学习第十二章——计算学习理论】
机器学习第十二章——计算学习理论 12.计算学习理论12.1 基础知识12.1 可能学习近似正确假设(PAC)12.3 有限假设空间12.4 VC维 12.计算学习理论 12.1 基础知识 从理论上刻画了若干类型的机器学习问题中的困难和若干类型的机器学习算法的能力 这个理论要…...
Docker私人学习笔记
俗话说“好记性不如烂笔头”,编程的海洋如此的浩大,养成做笔记的习惯是成功的一步! 此笔记主要是antlr4.13版本的笔记,并且笔记都是博主自己一字一字编写和记录,有错误的地方欢迎大家指正。 一、基础概念:…...
谷粒商城实战笔记-233~235-商城业务-认证服务-单点登录流程-原理
文章目录 一,场景二,单点登录流程 一,场景 包含以下三节的内容: 一,233-商城业务-认证服务-单点登录流程-1二,233-商城业务-认证服务-单点登录流程-2三,233-商城业务-认证服务-单点登录流程-3…...
机器学习在旅游业的革新之旅
机器学习在旅游业的革新之旅 随着科技的飞速发展,尤其是人工智能(AI)技术的广泛应用,各个行业都迎来了前所未有的变革。其中,旅游业作为全球经济的重要支柱之一,更是受益匪浅。机器学习(Machin…...
OpenCTI:开源网络威胁情报平台
OpenCTI 是一个开源平台,旨在帮助组织管理其网络威胁情报 (CTI) 数据和可观察数据。 该平台由 Filigran 开发,使用基于 STIX2 标准的知识模式构建数据。 它采用现代 Web 应用程序架构,配备 GraphQL API 和用户友好的前端。 OpenCTI 与 MIS…...
linux shell 脚本 let 数学计算
linux shell 脚本 let 数学计算 http://www.codebaoku.com/it-shell/ let命令中的算术表达式必须用双引号括起来,以避免解释器对特殊字符进行处理。 在变量的计算中,不需要使用$符号来表示变量, #!/bin/shweek_daydate %u echo $week_day…...
mp3和mp4的区别是什么?怎么把mp3转成mp4?(全)
在生活中我们或多或少会听到“mp3”和“mp4”,那么什么是mp3和mp4呢?mp3和mp4的区别是什么?mp3是一种音频压缩技术,旨在在不显著牺牲音质的前提下减小音频文件的体积,使其适用于音乐和其他音频内容的存储与传输。相比之…...
合并params和query参数
场景:三级分类只有query参数,搜索框使用params参数。为了解决这个问题,文中在typeNav的index.vue和Head/index.vue分别进行了判断和处理,确保在不同的路径下合并params和query参数能正确合并并传递。 如何当点击联动框时跳转到se…...
[数据集][目标检测]工程机械车辆检测数据集VOC+YOLO格式3189张10类别
数据集格式:Pascal VOC格式YOLO格式(不包含分割路径的txt文件,仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件) 图片数量(jpg文件个数):3189 标注数量(xml文件个数):3189 标注数量(txt文件个数):3189 标注…...
构建域名服务器-BIND:Linux端的安装过程及配置文件详解
文章目录 构建域名服务器工具-BINDBIND的安装BIND配置文件详解1. /etc/named.conf:2. /etc/named.rfc1912.zones:3. /var/named/named.localhost:4./etc/logrotate.d/named5./etc/named.iscdlv.key6./etc/named.root.key7./etc/rndc.conf8./e…...
linux查询目录文件基础操作
基础命令 展示所有目录 ls 长格式列出(显示文件权限、所有者、大小和最后修改时间): ls -l 忽略大小写查询 ls | grep -i name 查找特定名称的文件: find /path/to/search -name "filename" 忽略大小写查找文件&#…...
搭建TestBench,收藏这几条基本框架就够了
Verilog功能模块HDL设计完成后,并不代表设计工作的结束,还需要对设计进行进一步的仿真验证。掌握验证的方法,即如何调试自己的程序非常重要。在RTL逻辑设计中,要学会根据硬件逻辑来写测试程序即写Testbench。Verilog测试平台是一个…...
怎么利用住宅代理提高数据抓取效率
在大数据时代,数据抓取已经是从互联网收集数据的关键手段,得到了广泛的应用。不论是网络营销、电商平台、或者是新闻网站,数据抓取都可以帮助企业或者是个人收集到大量的数据。但是随着反爬虫技术的不断发展,传统的爬虫方法已经不…...
c#中的ManuaResetEvent
在C#中,ManualResetEvent 是一个同步事件,用于线程间通信。它允许一个或多个等待的线程等待某个事件的发生。当事件被设置为已发生(或称为“信号”)状态时,所有等待的线程都会被释放,并且可以继续执行。 以…...
EE trade:黄金投资的利弊与要点
黄金投资作为一种相对传统的投资途径,存在着特定的优势与风险。接下来详细剖析一下黄金投资的优缺点。 1、黄金投资的优点 有效对抗通货膨胀 在通货膨胀时期,黄金往往能有出色的表现,其价值通常会上升,如此一来便能够为投资者提…...
数据仓库模型评估的标准
面试中,肯定有数仓同学被问到:数据模型如何去评估、如何优化,那今天就聊一聊这个话题。 基本概念 模型:表达的是某一个主题、某一个业务过程,赋值业务价值,最终落地还是一个建表的过程 数仓模型…...
121231
实打实大苏打...
【机器学习】逻辑回归原理(极大似然估计,逻辑函数Sigmod函数模型详解!!!)
目录 🍔 逻辑回归应用场景 🍔 极大似然估计 2.1 为什么要有极大似然估计? 2.2 极大似然估计步骤 2.3 极大似然估计的例子 🍔 Sigmod函数模型 3.1 逻辑斯特函数的由来 3.2 Sigmod函数绘图 3.3 进一步探究-加入线性回归 3…...
网络热门编程项目导学:黑马点评
本文作者:程序员鱼皮 免费编程学习 - 编程导航网:https://www.code-nav.cn 大家好,我是鱼皮。 之前已经给大家分享了三个全栈项目,比如瑞吉外卖什么的,这几个项目都是侧重于带大家学习框架的运用、以及一些简单的业务…...
如何在本地和远程删除 Git 分支?
如何在本地和远程删除 Git 分支? 欢迎来到英杰社区https://bbs.csdn.net/topics/617804998 欢迎来到我的主页,我是博主英杰,211科班出身,就职于医疗科技公司,热衷分享知识,武汉城市开发者社区主理人 擅长.n…...
SpringBoot-17-MyBatis动态SQL标签之常用标签
文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...
3.3.1_1 检错编码(奇偶校验码)
从这节课开始,我们会探讨数据链路层的差错控制功能,差错控制功能的主要目标是要发现并且解决一个帧内部的位错误,我们需要使用特殊的编码技术去发现帧内部的位错误,当我们发现位错误之后,通常来说有两种解决方案。第一…...
vscode(仍待补充)
写于2025 6.9 主包将加入vscode这个更权威的圈子 vscode的基本使用 侧边栏 vscode还能连接ssh? debug时使用的launch文件 1.task.json {"tasks": [{"type": "cppbuild","label": "C/C: gcc.exe 生成活动文件"…...
抖音增长新引擎:品融电商,一站式全案代运营领跑者
抖音增长新引擎:品融电商,一站式全案代运营领跑者 在抖音这个日活超7亿的流量汪洋中,品牌如何破浪前行?自建团队成本高、效果难控;碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...
在 Nginx Stream 层“改写”MQTT ngx_stream_mqtt_filter_module
1、为什么要修改 CONNECT 报文? 多租户隔离:自动为接入设备追加租户前缀,后端按 ClientID 拆分队列。零代码鉴权:将入站用户名替换为 OAuth Access-Token,后端 Broker 统一校验。灰度发布:根据 IP/地理位写…...
转转集团旗下首家二手多品类循环仓店“超级转转”开业
6月9日,国内领先的循环经济企业转转集团旗下首家二手多品类循环仓店“超级转转”正式开业。 转转集团创始人兼CEO黄炜、转转循环时尚发起人朱珠、转转集团COO兼红布林CEO胡伟琨、王府井集团副总裁祝捷等出席了开业剪彩仪式。 据「TMT星球」了解,“超级…...
1.3 VSCode安装与环境配置
进入网址Visual Studio Code - Code Editing. Redefined下载.deb文件,然后打开终端,进入下载文件夹,键入命令 sudo dpkg -i code_1.100.3-1748872405_amd64.deb 在终端键入命令code即启动vscode 需要安装插件列表 1.Chinese简化 2.ros …...
(二)原型模式
原型的功能是将一个已经存在的对象作为源目标,其余对象都是通过这个源目标创建。发挥复制的作用就是原型模式的核心思想。 一、源型模式的定义 原型模式是指第二次创建对象可以通过复制已经存在的原型对象来实现,忽略对象创建过程中的其它细节。 📌 核心特点: 避免重复初…...
SpringBoot+uniapp 的 Champion 俱乐部微信小程序设计与实现,论文初版实现
摘要 本论文旨在设计并实现基于 SpringBoot 和 uniapp 的 Champion 俱乐部微信小程序,以满足俱乐部线上活动推广、会员管理、社交互动等需求。通过 SpringBoot 搭建后端服务,提供稳定高效的数据处理与业务逻辑支持;利用 uniapp 实现跨平台前…...
tree 树组件大数据卡顿问题优化
问题背景 项目中有用到树组件用来做文件目录,但是由于这个树组件的节点越来越多,导致页面在滚动这个树组件的时候浏览器就很容易卡死。这种问题基本上都是因为dom节点太多,导致的浏览器卡顿,这里很明显就需要用到虚拟列表的技术&…...
