当前位置: 首页 > article >正文

【深度学习与大模型基础】第11章-Bernoulli分布,Multinoulli分布

一、Bernoulli分布

1. 基本概念

想象你抛一枚硬币:

  • 正面朝上(记为 1)概率是 p(比如 0.6)。

  • 反面朝上(记为 0)概率是 1-p(比如 0.4)。

这就是一个Bernoulli分布:只有两种可能结果的事件(成功/失败、是/否、开/关等),且概率固定。


2. 数学表示

Bernoulli分布的概率公式:

  • P(X=1) = p (比如“硬币正面”概率)

  • P(X=0) = 1-p (比如“硬币反面”概率)


3. 机器语言例子(Python)

假设你写代码模拟一个故障的灯泡(有60%概率亮,40%概率灭):

import numpy as np# 生成一个Bernoulli分布的样本(p=0.6)
result = np.random.binomial(n=1, p=0.6)  # n=1表示单次试验
print("灯泡状态:", "亮" if result == 1 else "灭")

运行结果可能是 (1)或 (0),多次运行会看到大约60%的情况是“亮”。


4. 为什么叫“Bernoulli”?

这是以数学家雅各布·伯努利命名的,专门用来描述这种“非黑即白”的随机事件。


5. 实际应用场景

  • 扔硬币、赌博输赢

  • 二分类问题(如邮件是垃圾邮件/非垃圾邮件)

  • 设备故障检测(正常/故障)

简单总结:Bernoulli分布就是描述一个只有两种结果的事件,且你知道每种结果的概率


二、Multinoulli分布


1. 生活场景比喻

想象你有一个 骰子(不是普通的6面骰子,而是一个各面概率可能不同的骰子):

  • 可能的结果:A面B面C面(比如分别代表“猫、狗、鸟”)

  • 每个面的概率:P(A)=0.5P(B)=0.3P(C)=0.2(总和为1)

这就是Multinoulli分布:一个事件有多个(≥2)离散结果,每个结果有固定概率


2. 和Bernoulli分布的区别

  • Bernoulli:只有两种结果(如硬币正反面)。

  • Multinoulli:多种结果(如骰子、分类任务中的类别)。


3. 数学表示

Multinoulli分布的概率公式:

  • 结果有 K 种,记为 {1, 2, ..., K}

  • 每个结果的概率为 p_{1},p_{2}...p_{k}(满足 p_{1} + p_{2} + ...p_{k} = 1)。


4. 机器学习的例子(Python)

假设你有一个图片分类模型,预测一张图片是 猫、狗、鸟 的概率分别为 [0.5, 0.3, 0.2]。用代码模拟这个分布:

import numpy as np# 定义类别和概率
categories = ["猫", "狗", "鸟"]
probs = [0.5, 0.3, 0.2]# 从Multinoulli分布采样一次
result = np.random.choice(categories, p=probs)
print("模型预测结果:", result)
 

运行结果可能是  或 ,多次运行会接近设定的概率比例。


5. 实际应用场景

  • 多分类问题(如手写数字识别、垃圾邮件分类)

  • 生成模型(如生成文本或图像时选择下一个词/像素)

  • 强化学习(如选择动作“左、右、跳”)


6. 和Multinomial分布的区别

  • Multinoulli:单次试验的多类别结果(如掷一次骰子)。

  • Multinomial:多次独立的Multinoulli试验(如掷多次骰子,统计各面次数)。

相关文章:

【深度学习与大模型基础】第11章-Bernoulli分布,Multinoulli分布

一、Bernoulli分布 1. 基本概念 想象你抛一枚硬币: 正面朝上(记为 1)概率是 p(比如 0.6)。 反面朝上(记为 0)概率是 1-p(比如 0.4)。 这就是一个Bernoulli分布&…...

基于Windows通过nginx代理访问Oracle数据库

基于Windows通过nginx代理访问Oracle数据库 环境说明: 生产环境是一套一主一备的ADG架构服务器,用户需要访问生产数据,基于安全考虑,生产IP地址不能直接对外服务,所以需要在DMZ部署一个前置机,并在该前置机…...

北斗和GPS信号频率重叠-兼容与互操作

越来越多的同学们发现北斗三代信号的B1C,B2a信号居然和美国GPS L1,L5处在同样频率上? 为什么美国会允许这样的事情发生?同频率难道不干扰彼此的信号吗? 思博伦卫星导航技术支持文章TED 这事得从2006年联合国成立全球卫星导航系统…...

python爬虫:喜马拉雅案例(破解sign值)

声明: 本文章中所有内容仅供学习交流使用,不用于其他任何目的,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 根据上一篇文章,我们破解了本网站的,手机号和密码验证&#x…...

如何高效查询订单销售情况与售罄率:从SQL到架构优化的全流程设计

在电商平台、SaaS多租户系统中,订单数据作为核心数据之一,承载了关键的运营指标,如销售额、商品售罄率、订单转化等。随着数据量的持续增长,如何在大数据量条件下快速、稳定地获取统计信息,成为系统设计的重点之一。 本文将从查询目标分析入手,结合数据库设计优化与典型…...

机器学习:让数据开口说话的科技魔法

在人工智能飞速发展的今天,「机器学习」已成为推动数字化转型的核心引擎。无论是手机的人脸解锁、网购平台的推荐系统,还是自动驾驶汽车的决策能力,背后都离不开机器学习的技术支撑。那么,机器学习究竟是什么?它又有哪…...

51单片机波特率与溢出率的关系

1. 波特率与溢出率的基本关系 波特率(Baud Rate)表示串口通信中每秒传输的位数(bps),而溢出率是定时器每秒溢出的次数。在51单片机中,波特率通常通过定时器的溢出率来生成。 公式关系: 波特率=溢出率/​分频系数 其中,分频系数与定时器的工作模…...

Java 8 CompletableFuture:异步编程的利器与最佳实践

目录 1. 创建异步任务 1.1 使用默认线程池 1.2 使用自定义线程池 2. 异步回调处理 2.1 thenApply 和 thenApplyAsync 2.2 thenAccept 和 thenAcceptAsync 2.3 thenRun 和 thenRunAsync 3. 异常处理 3.1 whenComplete 和 whenCompleteAsync 3.2 handle 和 handleAsync…...

Podman与行业趋势分析 ——兼论与Docker的对比及未来发展方向

1. Podman核心概念与架构解析 1.1 定义与定位 Podman(Pod Manager)是由Red Hat主导开发的开源容器引擎,遵循OCI(Open Container Initiative)标准,专注于提供无守护进程(Daemonless&#xff09…...

摄影测量——单像空间后方交会

空间后方交会的求解是一个非线性问题,通常采用最小二乘法进行迭代解算。下面我将详细介绍具体的求解步骤: 1. 基本公式(共线条件方程) 共线条件方程是后方交会的基础: 复制 x - x₀ -f * [m₁₁(X-Xₛ) m₁₂(Y-…...

ros2_01

note01 ROS2和ROS最大的区别中间件 中间件: 介于某两个或者多个节点中间的组件;提供多个节点中间通信; ROS1:中间件是ROS组织自己基于TCP机制建立的,随着现在传感器的升级,数据量越来越大,原…...

C++中的高阶函数

C中的高阶函数 高阶函数是指可以接受其他函数作为参数或返回函数作为结果的函数。在C中&#xff0c;有几种方式可以实现高阶函数的功能&#xff1a; 1. 函数指针 #include <iostream>int add(int a, int b) { return a b; } int subtract(int a, int b) { return a -…...

计算机视觉与深度学习 | 钢筋捆数识别

===================================================== github:https://github.com/MichaelBeechan CSDN:https://blog.csdn.net/u011344545 ===================================================== 钢筋捆数 1、初始结果2、处理效果不佳时的改进方法‌1、预处理增强2、后…...

L3-027 可怜的复杂度(纯暴力)

暴力解答&#xff0c;肯定超时&#xff0c;因为我刚开始把所有答案&#xff0c;存到了ans这个vector里面了&#xff0c;然后进行枚举情况&#xff0c;后面发现因为这个阶数很高的时候&#xff0c;就会直接炸内存&#xff0c;所以我直接选择了在dfs里面进行统计答案&#xff0c;…...

基于RV1126开发板的人脸姿态估计算法开发

1. 人脸姿态估计简介 人脸姿态估计是通过对一张人脸图像进行分析&#xff0c;获得脸部朝向的角度信息。姿态估计是多姿态问题中较为关键的步骤。一般可以用旋转矩阵、旋转向量、四元数或欧拉角表示。人脸的姿态变化通常包括上下俯仰(pitch)、左右旋转(yaw)以及平面内角度旋转(r…...

鲲鹏+昇腾部署集群管理软件GPUStack,两台服务器搭建双节点集群【实战详细踩坑篇】

前期说明 配置&#xff1a;2台鲲鹏32C2 2Atlas300I duo&#xff0c;之前看网上文档&#xff0c;目前GPUstack只支持910B芯片&#xff0c;想尝试一下能不能310P也部署试试&#xff0c;毕竟华为的集群软件要收费。 系统&#xff1a;openEuler22.03-LTS 驱动&#xff1a;24.1.rc…...

【C#】CAN通信的使用

在C#中实现CAN通信通常需要借助第三方库或硬件设备的驱动程序&#xff0c;因为C#本身并没有直接内置支持CAN通信的功能。以下是一个关于如何使用C#实现CAN通信的基本指南&#xff0c;包括所需的步骤和常用工具。 1. 硬件准备 要进行CAN通信&#xff0c;首先需要一个支持CAN协…...

火山引擎旗下的产品

用户问的是火山引擎旗下的产品&#xff0c;我需要详细列出各个类别下的产品。首先&#xff0c;我得确认火山引擎有哪些主要业务领域&#xff0c;比如云计算、大数据、人工智能这些。然后&#xff0c;每个领域下具体有哪些产品呢&#xff1f;比如云计算方面可能有云服务器、容器…...

Elasticsearch 故障转移及水平扩容

一、故障转移 Elasticsearch 的故障转移&#xff08;Failover&#xff09;机制是其高可用性的核心&#xff0c;通过分布式设计、自动检测和恢复策略确保集群在节点故障时持续服务。 1.1 故障转移的核心组件 组件作用Master 节点管理集群状态&#xff08;分片分配、索引创建&…...

机器学习中 提到的张量是什么?

在机器学习中, 张量(Tensor) 是一个核心数学概念,用于表示和操作多维数据。以下是关于张量的详细解析: 一、数学定义与本质 张量在数学和物理学中的定义具有多重视角: 多维数组视角 传统数学和物理学中,张量被定义为多维数组,其分量在坐标变换时遵循协变或逆变规则。例…...

edge 更新到135后,Clash 打开后,正常网页也会自动跳转

发现了一个有意思的问题&#xff1a;edge 更新135后&#xff0c;以前正常使用的clash出现了打开deepseek也会自动跳转&#xff1a; Search Resultshttps://zurefy.com/zu1.php#gsc.tab0&gsc.qdeepseek &#xff0c;也就是不需要梯子的网站打不开了&#xff0c;需要的一直正…...

prime 1 靶场笔记(渗透测试)

环境说明&#xff1a; 靶机prime1和kali都使用的是NAT模式&#xff0c;网段在192.168.144.0/24。 Download (Mirror): https://download.vulnhub.com/prime/Prime_Series_Level-1.rar 一.信息收集 1.主机探测&#xff1a; 使用nmap进行全面扫描扫描&#xff0c;找到目标地址及…...

实验一 字符串匹配实验

一、实验目的 1&#xff0e;熟悉汇编语言编程环境和DEBUG调试程序的使用。 2&#xff0e;掌握键盘输入字符串的方法和分支程序的设计。 二、实验内容 编程实现&#xff1a;从键盘分别输入两个字符串&#xff0c;然后进行比较&#xff0c;若两个字符串的长度…...

跨境电商中的几种支付方式——T/T、L/C、D/P、D/A、O/A

在进行跨境电商的B端系统设计时&#xff0c;需要考虑的关键方面之一是支付流程。它为交易的成功奠定了基础&#xff0c;并确保涉及的双方都受到保护。 在本文中&#xff0c;我们将深入探讨各种常见支付方式的复杂性&#xff0c;包括电汇 (T/T)、信用证 (L/C)、付款交单 (D/P)、…...

第16届蓝桥杯单片机模拟试题Ⅲ

试题 代码 sys.h #ifndef __SYS_H__ #define __SYS_H__#include <STC15F2K60S2.H> //sys.c extern unsigned char UI; //界面标志(0湿度界面、1参数界面、2时间界面) extern unsigned char time; //时间间隔(1s~10S) extern bit ssflag; //启动/停止标志…...

打造现代数据基础架构:MinIO对象存储完全指南

目录 打造现代数据基础架构&#xff1a;MinIO对象存储完全指南1. MinIO介绍1.1 什么是对象存储&#xff1f;1.2 MinIO核心特点1.3 MinIO使用场景 2. MinIO部署方案对比2.1 单节点单驱动器(SNSD/Standalone)2.2 单节点多驱动器(SNMD/Standalone Multi-Drive)2.3 多节点多驱动器(…...

OOM问题排查和解决

问题 java.lang.OutOfMemoryError: Java heap space 排查 排查手段 jmap命令 jmap -dump,formatb,file<file-path> <pid> 比如 jmap -dump:formatb,file./heap.hprof 44532 使用JVisualVM工具&#xff1a; JVisualVM是一个图形界面工具&#xff0c;它可以帮…...

OSI 七层模型与 TCP/IP 协议栈详解

OSI 七层模型与 TCP/IP 协议栈详解 网络协议模型是理解计算机网络和通信的基础&#xff0c;而 OSI 七层模型和 TCP/IP 协议栈是最常见的两种网络通信模型。虽然这两者有些不同&#xff0c;但它们都提供了一种分层的结构&#xff0c;帮助我们理解和设计网络通信。本文将详细介绍…...

「出海匠」借助CloudPilot AI实现AWS降本60%,支撑AI电商高速增长

&#x1f50e;公司简介 「出海匠」&#xff08;chuhaijiang.com&#xff09;是「数绘星云」公司打造的社交内容电商服务平台&#xff0c;专注于为跨境生态参与者提供数据支持与智能化工作流。平台基于大数据与 AI 技术&#xff0c;帮助商家精准分析市场趋势、优化运营策略&…...

LeetCode[541]反转字符串Ⅱ

思路&#xff1a; 题目给我们加了几个规则&#xff0c;剩余长度小于2k&#xff0c;大于等于k就反转k个&#xff0c;小于k就全部反转&#xff0c;我们按照这个逻辑来就行。 第一就是大于等于k就反转k个&#xff0c;我们for循环肯定是i2k了&#xff0c;接下来就是判断是否大于等于…...