当前位置：首页 > news >正文

机器学习中的一些经典理论定理

news 2026/2/11 1:29:24

PAC学习理论

当使用机器学习方法来解决某个特定问题时，通常靠经验或者多次试验来选择合适的模型、训练样本数量以及学习算法收敛的速度等。但是经验判断或多次试验往往成本比较高，也不太可靠，因此希望有一套理论能够分析问题难度、计算模型能力，为学习算法提供理论保证，并指导机器学习模型和学习算法的设计，这就是计算学习理论。计算学习理论是机器学习的理论基础，其中最基础的理论就是可能近似正确学习理论。
机器学习中一个很关键的问题是期望错误和经验错误之间的差异，称为泛化错误。泛化错误可以衡量一个机器学习模型𝑓 是否可以很好地泛化到未知数据。

根据大数定律，当训练集大小|𝒟|趋向于无穷大时，泛化错误趋向于0，即经验风险趋近于期望风险。

由于我们不知道真实的数据分布 𝑝(𝒙, 𝑦)，也不知道真实的目标函数 𝑔(𝒙)，因此期望从有限的训练样本上学习到一个期望错误为0的函数𝑓(𝒙)是不切实际的。因此，需要降低对学习算法能力的期望，只要求学习算法可以以一定的概率学习到一个近似正确的假设，即PAC 学习。一个PAC 可学习的算法是指该学习算法能够在多项式时间内从合理数量的训练数据中学习到一个近似正确的𝑓(𝒙)。

PAC学习可以分为两部分：
（1）近似正确：一个假设𝑓 ∈ ℱ 是“近似正确”的，是指其在泛化错误𝒢𝒟(𝑓)小于一个界限𝜖。𝜖一般为0到 1/2之间的数，0 < 𝜖 <1/2。如果𝒢𝒟(𝑓)比较大，说明模型不能用来做正确的“预测”。
（2）可能：一个学习算法𝒜 有“可能”以1 − 𝛿 的概率学习到这样一个“近似正确”的假设。𝛿 一般为0到 1/2之间的数，0 < 𝛿 < 1/2。

PAC学习可以下面公式描述：

其中𝜖,𝛿 是和样本数量𝑁 以及假设空间ℱ 相关的变量。如果固定𝜖,𝛿，可以反过来计算出需要的样本数量

其中|ℱ|为假设空间的大小．从上面公式可以看出，模型越复杂，即假设空间ℱ 越大，模型的泛化能力越差。要达到相同的泛化能力，越复杂的模型需要的样本数量越多。为了提高模型的泛化能力，通常需要正则化（Regularization）来限制模型复杂度。
PAC学习理论也可以帮助分析一个机器学习方法在什么条件下可以学习到一个近似正确的分类器。从上面的公式可以看出，如果希望模型的假设空间越大，泛化错误越小，其需要的样本数量越多。

没有免费午餐定理

没有免费午餐定理证明：对于基于迭代的最优化算法，不存在某种算法对所有问题（有限的搜索空间内）都有效。如果一个算法对某些问题有效，那么它一定在另外一些问题上比纯随机搜索算法更差．也就是说，不能脱离具体问题来谈论算法的优劣，任何算法都有局限性．必须要“具体问题具体分析”。
没有免费午餐定理对于机器学习算法也同样适用。不存在一种机器学习算法适合于任何领域或任务．如果有人宣称自己的模型在所有问题上都好于其他模型，那么他肯定是在吹牛。

奥卡姆剃刀原理

奥卡姆剃刀原理是由14世纪逻辑学家William of Occam提出的一个解决问题的法则：“如无必要，勿增实体”．它的思想和机器学习中的正则化思想十分类似：简单的模型泛化能力更好。如果有两个性能相近的模型，我们应该选择更简单的模型．因此，在机器学习的学习准则上，我们经常会引入参数正则化来限制模型能力，避免过拟合。
奥卡姆剃刀的一种形式化是最小描述长度原则，即对一个数据集𝒟，最好的模型𝑓 ∈ ℱ 会使得数据集的压缩效果最好，即编码长度最小。

最小描述长度也可以通过贝叶斯学习的观点来解释。模型𝑓 在数据集𝒟 上的对数后验概率为

其中 log 𝑝(𝑓) 和 log 𝑝(𝒟|𝑓) 可以分别看作模型 𝑓 的编码长度和在该模型下数据集 𝒟 的编码长度。也就是说，我们不但要使得模型 𝑓 可以编码数据集 𝒟，也要使得模型𝑓 尽可能简单。

丑小鸭定理

丑小鸭定理（Ugly Duckling Theorem）是1969年由渡边慧提出的．“丑小鸭与白天鹅之间的区别和两只白天鹅之间的区别一样大”．这个定理初看好像不符合常识，但是仔细思考后是非常有道理的。因为世界上不存在相似性的客观标准，一切相似性的标准都是主观的．如果从体型大小或外貌的角度来看，丑小鸭和白天鹅的区别大于两只白天鹅的区别；但是如果从基因的角度来看，丑小鸭与它父母的差别要小于它父母和其他白天鹅之间的差别。

归纳偏置

在机器学习中，很多学习算法经常会对学习的问题做一些假设，这些假设就称为归纳偏置。比如在最近邻分类器中，我们会假设在特征空间中，一个小的局部区域中的大部分样本同属一类。在朴素贝叶斯分类器中，我们会假设每个特征的条件概率是互相独立的。
归纳偏置在贝叶斯学习中也经常称为先验（Prior）。

机器学习中的一些经典理论定理

PAC学习理论

没有免费午餐定理

奥卡姆剃刀原理

丑小鸭定理

归纳偏置

相关文章：

机器学习中的一些经典理论定理

c语言：成本100元，40%的利润怎么计算｜练习题

【Python必做100题】之第二十二题（复制列表）

Java 数据结构篇-实现堆的核心方法与堆的应用（实现 TOP-K 问题：最小 k 个数）

startUML6.0.1破解方法

Python实现多种图像分割方法：基于阈值分割和基于区域分割

SQL学习笔记+MySQL+SQLyog工具教程

SpringBoot的日志管理

leetcode---76. 最小覆盖子串 [C++/滑动窗口+哈希表]

Kafka 分级存储在腾讯云的实践与演进

域架构下的功能安全思考

python多线程介绍

征文榜单 | 腾讯云向量数据库获奖名单公布

如何预防[[MyFile@waifu.club]].wis [[backup@waifu.club]].wis勒索病毒感染您的计算机？

中国风春节倒计时【实时倒计时】

基于RBAC的k8s集群权限管控案例

【华为数据之道学习笔记】5-11 算法模型设计

Flink系列之：SELECT WHERE clause

C#基础——委托、Action和Func的使用

不止业务缓存，分布式系统中还有哪些缓存？

椭圆曲线密码学(ECC)

Docker 运行 Kafka 带 SASL 认证教程

【CSS position 属性】static、relative、fixed、absolute 、sticky详细介绍，多层嵌套定位示例

C++.OpenGL （10/64）基础光照（Basic Lighting）

视频行为标注工具BehaviLabel（源码+使用介绍+Windows.Exe版本）

libfmt: 现代C++的格式化工具库介绍与酷炫功能

【Kafka】Kafka从入门到实战：构建高吞吐量分布式消息系统

数据结构第5章：树和二叉树完全指南（自整理详细图文笔记）

【iOS】 Block再学习

工厂方法模式和抽象工厂方法模式的battle