当前位置：首页 > news >正文

【深度学习 | 核心概念】那些深度学习路上必经的核心概念，确定不来看看？（六）

news 2026/5/27 14:02:20

在这里插入图片描述

🤵‍♂️ 个人主页: @AI_magician
📡主页地址：作者简介：CSDN内容合伙人，全栈领域优质创作者。
👨‍💻景愿：旨在于能和更多的热爱计算机的伙伴一起成长！！🐱‍🏍
🙋‍♂️声明：本人目前大学就读于大二，研究兴趣方向人工智能&硬件（虽然硬件还没开始玩，但一直很感兴趣！希望大佬带带）

在这里插入图片描述

【深度学习 | 核心概念】那些深度学习路上必经的核心概念，确定不来看看？（一）作者：计算机魔术师版本： 1.0 （ 2023.8.27 ）

摘要：本系列旨在普及那些深度学习路上必经的核心概念，文章内容都是博主用心学习收集所写，欢迎大家三联支持！本系列会一直更新，核心概念系列会一直更新！欢迎大家订阅

该文章收录专栏
[✨— 《深入解析机器学习：从原理到应用的全面指南》 —✨]

@toc

置信区域概念

置信区域（Confidence Interval）是统计学中的一个概念，用于估计总体参数的取值范围。它是对样本统计量的点估计结果进行区间估计的一种方法。

在统计推断中，我们通常只能通过抽样得到一部分数据，然后利用这部分数据对总体参数进行估计。然而，由于抽样误差等因素的存在，样本估计值往往不会完全等于总体参数的真实值。因此，为了提供关于总体参数的估计范围，我们使用置信区域来表示参数可能的取值范围。

置信区域由估计值的下限和上限组成，表示我们对总体参数的估计具有一定的置信水平（confidence level）。常见的置信水平包括95%、90%等。例如，一个95%的置信区域表示，在大量重复抽样的情况下，有95%的置信区间会包含总体参数的真实值。

置信区域的计算通常依赖于抽样分布的性质和统计理论。常见的计算方法包括基于正态分布的方法、基于t分布的方法等。计算得到的置信区域可以帮助我们对估计结果的可靠性进行评估，并提供了关于总体参数的不确定性信息。

需要注意的是，置信区域并不直接提供关于总体参数真实值的准确区间，而是提供了一个统计上的估计范围。置信区域的宽度与置信水平有关，较宽的置信区域表示对估计结果的不确定性较大，较窄的置信区域表示对估计结果的不确定性较小。

独立同分布概念

独立同分布（independent and identically distributed，简称i.i.d.）是概率统计学中的一个重要概念。

独立（independent）指的是随机变量之间的关系，即一个随机变量的取值不受其他随机变量的取值影响。换句话说，给定一个随机变量的取值，不能提供有关其他随机变量取值的任何信息。例如，抛一枚硬币两次，第一次出现正面和第二次出现正面这两个事件是独立的，因为第一次出现正面的结果不会影响第二次出现正面的概率。

同分布（identically distributed）指的是多个随机变量具有相同的概率分布。换句话说，多个随机变量的取值遵循相同的概率规律。例如，从同一批产品中随机选取多个产品的重量，这些随机变量的取值遵循相同的概率分布。

因此，独立同分布（i.i.d.）的含义是指多个随机变量之间相互独立且具有相同的概率分布。在统计学和机器学习中，独立同分布假设常常被用来简化问题和建立模型。它是许多概率模型和统计推断方法的基础假设之一，使得问题可以更容易地建模和求解。

P-value假设检验

在统计学中，p-value中的"P"代表"probability"，即概率。p-value表示观察到的样本数据或更极端情况出现的概率。

在假设检验中，p-value是用于衡量观察到的样本数据对于原假设的支持程度的指标。它表示在原假设为真的情况下，观察到的样本数据或更极端情况出现的概率。

假设检验的一般步骤如下：

建立原假设（H0）和备择假设（H1）。
选择适当的统计量，根据样本数据计算统计量的观察值。
基于原假设，确定统计量在原假设下的分布。
计算p-value，即在原假设为真的情况下，观察到的统计量值或更极端情况出现的概率。
根据p-value与事先设定的显著性水平进行比较。
- 如果p-value小于显著性水平（通常为0.05），则拒绝原假设，认为观察到的数据提供了足够的证据支持备择假设。
- 如果p-value大于等于显著性水平，则无法拒绝原假设，认为观察到的数据不足以提供足够的证据支持备择假设。

p-value的计算方法与具体的假设检验方法和统计量有关。对于一些常见的假设检验方法，例如t检验和F检验，p-value可以通过查表或使用概率分布函数来计算。对于更复杂的假设检验方法，可能需要使用模拟方法（如蒙特卡洛模拟）或基于抽样分布的方法来估计p-value。

需要注意的是，p-value并不提供关于备择假设的真实性或效应大小的信息。它仅仅是一种衡量观察到数据与原假设的一致性的指标。因此，在解释p-value时，应该谨慎考虑其他因素，如实际背景知识、样本大小和效应大小等。

显著性水平（0.05）

显著性水平通常被设定为0.05（或5%）的原因是出于统计学上的传统和惯例。在假设检验中，显著性水平表示在原假设为真的情况下，我们拒绝原假设的错误概率。换句话说，它是我们犯第一类错误（拒绝一个实际上为真的假设）的概率。

将显著性水平设置为0.05有以下几个原因：

常用的标准：0.05的显著性水平是在许多学科和领域中被广泛接受的标准，包括经济学、社会科学、医学研究等。这种一致性有助于结果的可比性和解释的一致性。
平衡类型I和类型II错误：在假设检验中，存在两种类型的错误，即类型I错误（拒绝一个实际上为真的假设）和类型II错误（接受一个实际上为假的假设）。将显著性水平设置为0.05可以在一定程度上平衡这两种错误的风险。
统计学的权衡：选择显著性水平时需要进行统计学权衡。较低的显著性水平（例如0.01）可以降低犯类型I错误的概率，但可能增加类型II错误的概率。相反，较高的显著性水平（例如0.10）可以增加类型I错误的概率，但可能降低类型II错误的概率。0.05的显著性水平在权衡这两种错误之间提供了一种较为平衡的选择。

需要注意的是，显著性水平的选择并不是绝对的，而是依赖于具体的研究领域、问题的重要性以及研究者自身的偏好。在某些情况下，可能会选择更为保守或更为宽松的显著性水平。

将显著性水平设置为0.05是出于统计学的传统和平衡类型I和类型II错误的考虑。然而，根据具体的研究需求和背景，研究者可以根据自己的判断和需要选择不同的显著性水平。
在这里插入图片描述

						  🤞到这里，如果还有什么疑问🤞🎩欢迎私信博主问题哦，博主会尽自己能力为你解答疑惑的！🎩🥳如果对你有帮助，你的赞是对博主最大的支持！！🥳

【深度学习 | 核心概念】那些深度学习路上必经的核心概念，确定不来看看？（六）

置信区域概念

独立同分布概念

P-value假设检验

显著性水平（0.05）

相关文章：

【深度学习 | 核心概念】那些深度学习路上必经的核心概念，确定不来看看？（六）

景联文科技：驾驭数据浪潮，赋能AI产业——全球领先的数据标注解决方案供应商

OpenCV+特征检测

Excel-lookup函数核对两个表格的数据匹配

Vue 简单的语法

华为ensp：vrrp双机热备负载均衡

postswigger 靶场(CSRF)攻略-- 1.没有防御措施的 CSRF 漏洞

Langchain知识点（下）

百度飞浆环境安装

云效流水线docker部署：node.js镜像部署VUE项目

软件工程理论与实践 (吕云翔) 第五章面向对象方法与UML课后习题及其答案解析

三层架构java _web

微信小程序项目——基本目录构成

python 基础语法（常常容易漏掉）

servlet 的XML Schema从哪边获取

CPU vs GPU：谁更适合进行图像处理？

基于flask+bootstrap4实现的注重创作的轻博客系统项目源码

手把手教你实现贪吃蛇

存储服务器和普通服务器有哪些区别

python数据处理作业4：使用numpy数组对象，随机创建4*4的矩阵，并提取其对角元素

Sentinel-3B OLCI 3 级全球分箱地球观测降分辨率（ERR）叶绿素（CHL）数据，版本 2022.0

服务器日志分析实战：用Python追踪HTTP 404错误并可视化异常频率

如何快速掌握开源UE资产编辑器：UAssetGUI完整配置与实战指南

内网环境下Win7系统批量离线补丁部署实战指南

新能源车轻量化为什么开始盯上高强镁合金？

基于ATtiny84的智能冰箱监控器：低功耗温度与门状态监测方案

基于ESP8266与MQTT的家庭水压自动控制系统设计与实现

车载诊断系统（OBD）的原理、演进与未来

榨干Codex！OpenAI工程师亲授Codex真正用法

告别DLL缺失烦恼！Visual C++运行库合集一键搞定Windows应用依赖问题