AI小白的第七天:必要的数学知识(概率)
概率 Probability
1. 概率的定义
概率是一个介于 0 和 1 之间的数,表示某个事件发生的可能性:
- 0:事件不可能发生。
- 1:事件必然发生。
- 0 到 1 之间:事件发生的可能性大小。
例如,掷一枚公平的硬币,正面朝上的概率是 0.5。
2. 概率的计算
(1)频率学派
抛一万次硬币,看硬币正面向上的概率。
P n ( x ) = n x n P_n(x)=\frac{n_x}{n} Pn(x)=nnx
- x x x代表证明朝上;
- n n n为实验总数;
- n x n_x nx为实验过程中发生x的次数。
这种方式,实验成本高,且误差不可控,概率始终是个近似值。
(2)古典学派
样本空间中,每个结果发生的可能性相等,则事件A的概率为:
P ( A ) = ∣ A ∣ ∣ S ∣ P(A)=\frac{|A|}{|S|} P(A)=∣S∣∣A∣
- 其中|A|是事件A的结果数
- |S|是样本空间的结果数
(3)贝叶斯学派
P ( A ∣ B ) = P ( B ∣ A ) ⋅ P ( A ) P ( B ) P(A|B)=\frac{P(B|A) \cdot P(A)}{P(B)} P(A∣B)=P(B)P(B∣A)⋅P(A)
- P(A)表示事件A发生的概率,称为先验(prior)概率;
- P(B)表示事件B发生的概率,称为标准化常量或者证据(evidence);
- P(B|A)表示在事件A发生的条件下,事件B发生的概率,通常称之为可能性或者似然(likelihood);
- P(A|B)表示在事件B发生的条件下,事件A发生的概率,也称为后验(posterior),也就是表示了事件发生了,并且它属于某一类别的概率;



最大似然估计 Maximum Likelihood Estimation, MLE
1. 基本概念
- 参数估计:在统计学中,我们通常假设数据服从某个概率分布(如正态分布、泊松分布等),而分布的参数(如均值、方差)需要通过数据来估计。
- 似然函数:给定一组参数,似然函数描述了观测数据在该参数下出现的概率。
- 最大似然估计:通过最大化似然函数,找到最可能生成观测数据的参数值。
θ ^ = a r g m a x P ( X ∣ θ ) \hat \theta =argmaxP(X|\theta) θ^=argmaxP(X∣θ)
- θ ^ \hat \theta θ^ 是最优参数
- a r g m a x argmax argmax表示求使得 P ( X ∣ θ ) P(X|\theta) P(X∣θ)最大化的参数值。
2. 似然函数的定义
假设观测数据为 X = x 1 , x 2 , . . . , x 3 X={x_1,x_2,...,x_3} X=x1,x2,...,x3,且数据服从某个概率分布 P ( X ∣ θ ) P(X|\theta) P(X∣θ),其中 θ \theta θ是分布的参数。似然函数定义为
L ( θ ) = P ( X ∣ θ ) = ∏ i = 1 n P ( x i ∣ θ ) L(\theta)=P(X|\theta)=\prod_{i=1}^n P(x_i|\theta) L(θ)=P(X∣θ)=i=1∏nP(xi∣θ)
3. 最大似然估计的步骤
(1)写出似然函数
根据数据分布假设,写出似然函数 L ( θ ) L(θ) L(θ)。
(2)取对数似然函数
为了简化计算,通常对似然函数取对数,得到对数似然函数:
ln L ( θ ) = ∑ i = 1 n ln P ( x i ∣ θ ) \ln L(\theta) = \sum_{i=1}^n \ln P(x_i|\theta) lnL(θ)=i=1∑nlnP(xi∣θ)
(3)取对数似然函数
对对数似然函数关于参数 θ θ θ 求导,并令导数为零,求解使似然函数最大的参数值:
d d θ ln L ( θ ) = 0 \frac{d}{d\theta}\ln L(\theta) =0 dθdlnL(θ)=0
(4)求解参数
解上述方程,得到参数的估计值 θ ^ \hat \theta θ^。
关于“最大似然值估计”,我明白它干的事情了,但是过程现在实在是没搞懂,暂时先放一放,后面想通了以后专门出一篇理解的过程。
概率分布
在计算最大似然值的时候,要选对概率分布的类型。
a.伯努利分布(Bernoulli Distribution)**
- 定义:只有两个可能结果的单次试验的概率分布,即成功和失败。
- 参数:成功的概率 $p$(0 ≤ p ≤ 1)。
- 概率质量函数(PMF):P(X=1) = p, P(X=0) = 1-p。
b. 二项分布(Binomial Distribution)
- 定义:在固定次数的独立试验中,每次试验只有两种可能结果(成功或失败),且每次试验成功的概率相同的概率分布。
- 参数:试验次数 $n$ 和成功的概率 $p$。
- 概率质量函数(PMF):P(X=k) = C(n, k) × p^k × (1-p)^(n-k),其中 C(n, k) 是组合数,即从 n 个不同元素中取出 k 个元素的组合方式数量。
c. 泊松分布(Poisson Distribution)
- 定义:用于预测在固定时间间隔内某事件平均发生 $λ$ 次的条件下,该事件实际发生 $k$ 次的概率。
- 参数:事件发生的平均率 $λ$(λ > 0)。
- 概率质量函数(PMF):P(X=k) = (λ^k / k!) × e^(-λ)。
2. 连续型概率分布
a. 均匀分布(Uniform Distribution)
- 定义:在某一区间 [a, b] 内所有值出现的概率相等的概率分布。
- 参数:区间的下限 $a$ 和上限 $b$(a < b)。
- 概率密度函数(PDF):f(x) = 1 / (b - a)(当 a ≤ x ≤ b 时);否则 f(x) = 0。
b. 正态分布(Normal Distribution)/高斯分布(Gaussian Distribution)
- 定义:最常见的连续概率分布之一,许多自然现象都近似服从正态分布。
- 参数:均值 $μ$ 和标准差 $σ$(σ > 0)。
- 概率密度函数(PDF):f(x) = (1 / (√(2π)σ)) × e[-(x-μ)2 / (2σ^2)]。
c. 指数分布(Exponential Distribution)
- 定义:描述两个相继发生的事件之间的时间间隔的概率分布,常用于可靠性理论和排队论。
- 参数:率参数 $λ$(λ > 0),与泊松分布的 $λ$ 相关,但意义不同。
- 概率密度函数(PDF):f(x) = λe^(-λx)(当 x ≥ 0 时);否则 f(x) = 0。
3. 其他重要分布
a. 卡方分布(Chi-Squared Distribution)
- 定义:与正态分布的样本方差有关的概率分布,常用于假设检验。
- 参数:自由度 $ν$(ν 为正整数)。
b. t分布(Student’s t-Distribution)
- 定义:在小样本情况下估计总体均值的统计量的分布,常用于假设检验。
- 参数:自由度 $ν$(ν 为正整数)。
c. F分布(F-Distribution)
- 定义:两个独立的卡方分布变量的比率的分布,常用于方差分析。
- 参数:分子自由度 $ν_1$ 和分母自由度 $ν_2$(两者均为正整数)。
相关文章:
AI小白的第七天:必要的数学知识(概率)
概率 Probability 1. 概率的定义 概率是一个介于 0 和 1 之间的数,表示某个事件发生的可能性: 0:事件不可能发生。1:事件必然发生。0 到 1 之间:事件发生的可能性大小。 例如,掷一枚公平的硬币…...
[Windows] 图吧工具箱
[Windows] 图吧工具箱 链接:https://pan.xunlei.com/s/VOMCXYDix3pvwdkU7w7bfVsDA1?pwdk8v5# DIY爱好者的必备工具...
Docker镜像迁移方案
Docker镜像迁移方案 文章目录 Docker镜像迁移方案一:背景二:操作方式三:异常原因参考: 一:背景 比如机器上已经有先有的容器,但是docker pull的时候是失败的二:操作方式 1、停止正在运行的容器…...
1264. 动态求连续区间和-acwing -树状数组
原题链接:1264. 动态求连续区间和 - AcWing题库 给定 n 个数组成的一个数列,规定有两种操作,一是修改某个元素,二是求子数列 [a,b] 的连续和。 输入格式 第一行包含两个整数 n 和m,分别表示数的个数和操作次数。 第…...
三分钟读懂微服务
一、什么是微服务 微服务,简单来说,就是把一个庞大复杂的软件系统,拆分成一个个小型的、独立的服务模块。打个比方,一个大型商场就如同传统的单体架构软件系统,里面所有的店铺、设施都紧密关联在一起。而微服务架构下…...
【AIGC】图片变视频 - SD ComfyUI视频生成
效果图 完整过程 SD ComfyUI 下载 下载 https://pan.quark.cn/s/64b808baa960 解压密码:bilibili-秋葉aaaki 完整 https://www.bilibili.com/video/BV1Ew411776J/ SD ComfyUI 安装 1.解压 2.将controlnet内部文件复制到 ComfyUI-aki-v1.6\ComfyUI\models\control…...
JVM详解(包括JVM内存模型与GC垃圾回收)
📖前言: 学会使用Java对于一个程序员是远远不够的。Java语法的掌握只是一部分,另一部分就是需要掌握Java内部的工作原理,从编译到运行,到底是谁在帮我们完成工作的? 接下来着重对Java虚拟机,也就…...
cocos creator 笔记-路边花草
版本:3.8.5 实现目标:给3d道路生成路边景观花草 在场景下创建一个节点,我这里种植两种花草模型,兰花和菊花,所以分别在节点下另创建两个节点,为了静态合批。 1.将花草模型分别拖入场景中,制作…...
在shell脚本内部获取该脚本所在目录的绝对路径
目录 需求描述 方法一:使用 dirname 和 readlink 命令 方法二:使用 BASH_SOURCE 变量 方法三:仅使用纯 Bash 实现 需求描述 工作中经常有这样情况,需要在脚本内部获取该脚本自己所在目录的绝对路径。 假如有一个脚本/a/b/c/…...
Qt 线程类
线程类 这些类与线程应用程序相关。 Concurrent Filter and Filter-Reduce 并行地从序列中选择值并组合它们 Concurrent Map and Map-Reduce 并行地从序列中转换值并组合它们 Concurrent Run 在单独线程中运行任务的简单方法 Concurrent Task 在独立线程中运行任务的可…...
Langchain中的表格解析:RAG 和表格的爱恨情仇
实现 RAG(Retrieval-Augmented Generation)是一个挑战,尤其是在有效解析和理解非结构化文档中的表格时。这在处理扫描文档或图像格式的文档时尤为困难。这些挑战至少包括以下三个方面: 1.表格的“叛逆期”:不准确的解析可能会破坏表格结构: 表格在文档里就像个叛逆的青少…...
神奇的闹钟(算法题)
神奇的闹钟 题目 原题 小蓝发现了一个神奇的闹钟,从纪元时间(19701970 年 11 月 11 日 00:00:0000:00:00)开始,每经过 xx 分钟,这个闹钟便会触发一次闹铃 (纪元时间也会…...
CAT1模块 EC800M HTTP 使用后续记录
记录一下 CAT1 模块EC800 HTTP 使用后续遇到的问题 by 矜辰所致目录 前言一、一些功能的完善1.1 新的交互指令添加1.2 连不上网络处理 二、问题出现三、分析及解决3.1 定位问题3.2 问题分析与解决3.2.1 查看变量在内存中的位置 3.3 数据类型说明3.3.1 常用格式化输出符号…...
Python 标准库与数据结构
Python的标准库提供了丰富的内置数据结构和函数,使用这些工具能为我们提供一套强有力的工具。 需要注意的是,相比C与Java,Python的一些特点: Python不需要显式声明变量类型Python没有模板(Template)的概念,因为Pytho…...
NIO入门
IO和NIO的区别: IO:通过流处理数据,仅支持阻塞IO。 核心组件:InputStream /OutputStream用于字节的读写,Reader / Writer:用于字符流的读写。读取过程中无法被中断,是阻塞式IO。 NIO:通过管道处…...
leetcode 用队列模拟栈
这个其实只需要一个队列就可以的,但是我这里用的是2个队列进行替换, 先转n-1个到空的队列, 然后在此基础上进行队列的互换,把剩下的那一个元素所在的队列进行poleft操作就可以了。 class MyStack:def __init__(self):self.q1_i…...
spring security 使用的过滤器还是拦截器
spring security 使用的过滤器还是拦截器 Spring Security 是一个强大的安全框架,用于保护 Java 应用程序。它主要使用过滤器(Filters)来实现安全功能,而不是拦截器(Interceptors)。不过,它也提…...
大疆上云api介绍
概述 目前对于 DJI 无人机接入第三方云平台,主要是基于 MSDK 开发定制 App,然后自己定义私有上云通信协议连接到云平台中。这样对于核心业务是开发云平台,无人机只是其中一个接入硬件设备的开发者来说,重新基于 MSDK 开发 App 工作量大、成本高,同时还需要花很多精力在无人…...
2025-03-25 Unity 网络基础4——TCP同步通信
文章目录 1 Socket1.1 Socket 类型1.2 构造 Socket1.3 常用属性1.4 常用方法 2 TCP 通信2.1 服务端配置2.2 客户端配置2.3 进行通信2.4 多设备通信 3 区分消息 1 Socket Socket 是 C# 提供的网络通信类(其它语言也有对应的 Socket 类),是…...
C++进阶(一)
个人主页:PingdiGuo_guo 收录专栏:C干货专栏 前言 本篇博客是讲解函数的重载以及引用的知识点的。 文章目录 前言 1.函数重载 1.1何为函数重载 1.2函数重载的作用 1.3函数重载的实现 2.引用 2.1何为引用 2.2定义引用 2.3引用特性 2.4常引用 2…...
深度解读DeepSeek:开源周(Open Source Week)技术解读
深度解读DeepSeek:开源周(Open Source Week)技术解读 深度解读DeepSeek:源码解读 DeepSeek-V3 深度解读DeepSeek:技术原理 深度解读DeepSeek:发展历程 文章目录 一、开源内容概览Day1:FlashMLAD…...
AI Agent开发与应用
AI Agent开发与应用:本地化智能体实践——本地化智能体开发进展与主流框架分析 我要说的都在ppt里面了,相关复现工作请参考ai agent开发实例 OpenManus Dify Owl 第二个版本更新了对话的框架,通过gradio做了一个全新的界面 只测试了阿里云…...
石斛基因组-文献精读122
A chromosome-level Dendrobium moniliforme genome assembly reveals the regulatory mechanisms of flavonoid and carotenoid biosynthesis pathways 《染色体水平的石斛基因组组装揭示了黄酮类和胡萝卜素生物合成途径的调控机制》 摘要 石斛(Dendrobium monil…...
javaSE.多维数组
1 final 引用类型 final int[] arr 继承Object 的引用类型,不能改变引用的对象 存的其实是引用 数组类型数组,其实存的是引用 int [][] arr new int[][] { {1,2,3}, {4,5,6} };int [] a arr[0]; int [] b arr[1];...
Spring IOC容器详解:深入理解控制反转与依赖注入
一、什么是IOC? 在java当中一个类想要使用另一个类的方法,就必须在这个类当中创建这个类的对象,那么可能会出现如下情况, 比如A类当中创建着B对象,B类当中有C对象,C类当中有A对象,这个如果一个类…...
Python条件处理,新手入门到精通
Python条件处理,新手入门到精通 对话实录 **小白**:(崩溃)我写了if x 1:,为什么Python会报错? **专家**:(推眼镜)**是赋值,才是比较**!想判断相…...
JPA实体类注解缺失异常全解:从报错到防御!!!
🚨 JPA实体类注解缺失异常全解:从报错到防御 🛡️ 一、💥 问题现象速览 // 经典报错示例 Caused by: java.lang.IllegalArgumentException: Not a managed type: class com.example.entity.Product典型症状: &…...
Spring 源码硬核解析系列专题(三十二):Spring Cloud LoadBalancer 的负载均衡源码解析
在前几期中,我们从 Spring 核心到 Spring Boot 的多个模块,再到 Spring Cloud Alibaba,逐步揭示了 Spring 生态在微服务领域的广泛应用。Spring Cloud LoadBalancer 是 Spring Cloud 提供的客户端负载均衡组件,替代 Ribbon,支持服务发现和负载均衡策略。本篇将深入 Spring…...
生成式媒介革命已至,搜索如何借力DeepSeek破局?
作为前沿AI技术的代表,DeepSeek不仅突破了传统大模型的算力瓶颈,更以“高性能低成本开源生态”的特性,重塑传播生态。对于搜索行业从业者而言,这场技术变革既是机遇,也是挑战。 DeepSeek的三大“杀手锏”,…...
【Vue3入门1】02- Vue3的基本操作(上)
本文介绍vue3中的一些方法的操作。 目录 1. 绑定事件 v-on 2. 按键修饰符 3. 显示和隐藏 v-show 4. 条件渲染 v-if 5. 条件渲染if-else 1. 绑定事件 v-on 点击事件 v-on:click" 发生事件 " <body><div id"app">{{ msg }} <h2&g…...
