当前位置: 首页 > news >正文

蒙特卡罗方法 - 采样和蒙特卡罗方法篇

序言

蒙特卡罗( Monte Carlo \text{Monte Carlo} Monte Carlo)方法,也被称为计算机随机模拟方法,是一种基于“随机数”的计算方法。这一方法源于美国在第二次世界大战期间研制原子弹的“曼哈顿计划”。其核心思想是使用随机数(或伪随机数)来解决一些复杂的计算问题,通过对概率模型进行随机模拟或统计抽样,用所得样本得到这些特征量的估计值,从而得到问题的近似解。

蒙特卡罗方法广泛应用于各个领域。在金融领域,它用于期权定价、风险评估等,可以估算金融资产的未来价格分布。在物理学和工程学领域,它用于模拟粒子运动、热传导、辐射传输等复杂物理过程。此外,在求解复杂的优化问题、计算高维度积分以及进行不确定性分析、敏感性分析或风险评估等方面,蒙特卡罗方法也发挥着重要作用。

采样和蒙特卡罗方法

  • 机器学习中的许多重要工具是基于从某种分布中采样以及用这些样本对目标量做一个蒙特卡罗估计。

为什么需要采样?

  • 我们希望从某个分布中采样存在许多理由。
    • 当我们需要以较小的代价近似许多项的和或某个积分时采样是一种很灵活的选择。
    • 有时候,我们使用它加速一些很费时却易于处理的和的估计,就像我们使用 minibatch \text{minibatch} minibatch对整个训练代价进行子采样一样。
    • 在其他情况下,我们需要近似一个难以处理的和或积分,例如估计一个无向模型中配分函数对数的梯度时。
    • 在许多其他情况下,抽样实际上是我们的目标,就像我们想训练一个可以从训练分布采样的模型。

蒙特卡罗采样的基础

  • 当无法精确计算和或积分(例如,和具有指数数量个项,且无法被精确简化)时,通常可以使用蒙特卡罗采样来近似它。这种想法把和或者积分视作某分布下的期望,然后通过估计对应的平均值来近似这个期望。令:
    s = ∑ x p ( x ) f ( x ) = E p [ f ( x ) ] s=\sum\limits_x p(\boldsymbol{x})f(\boldsymbol{x})=E_p[f(\text{x})] s=xp(x)f(x)=Ep[f(x)]
    — 公式1 \quad\textbf{---\footnotesize{公式1}} 公式1
    或者
    s = ∫ p ( x ) f ( x ) d x = E p [ f ( x ) ] s=\displaystyle \int p(\boldsymbol{x})f(\boldsymbol{x})d\boldsymbol{x}=E_p[f(\text{x})] s=p(x)f(x)dx=Ep[f(x)] — 公式2 \quad\textbf{---\footnotesize{公式2}} 公式2
  • 为我们所需要估计的和或者积分,写成期望的形式, p p p 是一个关于随机变量 x \textbf{x} x 的概率分布(求和时)或者概率密度函数(求积分时)。
  • 我们可以通过从 p p p 中采集 n n n 个样本 x ( 1 ) , … , x ( n ) \boldsymbol{x}^{(1)},\dots,\boldsymbol{x}^{(n)} x(1),,x(n) 来近似 s s s 并得到一个经验平均值: s ^ n = 1 n ∑ i = 1 n f ( x ( i ) ) \hat{s}_n=\displaystyle\frac{1}{n}\sum\limits_{i=1}^n f(\boldsymbol{x}^{(i)}) s^n=n1i=1nf(x(i)) — 公式3 \quad\textbf{---\footnotesize{公式3}} 公式3
  • 这种近似可以被证明拥有如下几个性质。首先很容易观察到 s ^ \hat{s} s^ 这个估计是无偏的,由于
    E [ s ^ n ] = 1 n ∑ i = 1 n E [ f ( x ( i ) ) ] = 1 n ∑ i = 1 n s = s \mathbb{E}[\hat{s}_n]=\displaystyle\frac{1}{n}\sum\limits_{i=1}^n\mathbb{E}[f(\boldsymbol{x}^{(i)})]=\frac{1}{n}\sum\limits_{i=1}^n s = s E[s^n]=n1i=1nE[f(x(i))]=n1i=1ns=s — 公式4 \quad\textbf{---\footnotesize{公式4}} 公式4
  • 此外,根据大数定理 ( Law of large number \text{Law of large number} Law of large number),如果样本 x ( i ) \boldsymbol{x}^{(i)} x(i) 独立且服从同一分布,那么其平均值几乎必然收敛到期望值,即: lim ⁡ n → ∞ s ^ n = s \lim\limits_{n\to\infty} \hat{s}_n=s nlims^n=s — 公式5 \quad\textbf{---\footnotesize{公式5}} 公式5
  • 只需要满足各个单项的方差,即 Var [ f ( x ( i ) ) ] \text{Var}[f(\boldsymbol{x}^{(i)})] Var[f(x(i))]有界。
    • 详细地说,我们考虑当 n n n增大时 s ^ n \hat{s}_n s^n的方差。
    • 只要满足 Var [ f ( x ( i ) ) ] < ∞ \text{Var}[f(\boldsymbol{x}^{(i)})]\lt\infty Var[f(x(i))]<,方差 Var [ s ^ n ] \text{Var}[\hat{s}_n] Var[s^n]就会减小并收敛到0:
      { Var [ s ^ n ] = 1 n 2 ∑ i = 1 n Var [ f ( x ) ] — 公式6 = Var [ f ( x ) ] n — 公式7 \begin{cases} \begin{aligned} \text{Var}[\hat{s}_n]&=\frac{1}{n^2}\sum\limits_{i=1}^n\text{Var}[f(\text{x})] &\quad\textbf{---\footnotesize{公式6}}\\ &=\frac{\text{Var}[f(\text{x})]}{n} &\quad\textbf{---\footnotesize{公式7}} \end{aligned} \end{cases} Var[s^n]=n21i=1nVar[f(x)]=nVar[f(x)]公式6公式7
  • 这个简单有用的结果启迪我们如何估计蒙特卡罗均值中的不确定性或者等价地说是蒙特卡罗估计的期望误差。我们计算了 f ( x ( i ) ) f(\boldsymbol{x}^{(i)}) f(x(i)) 的经验均值和方差,然后将估计的方差除以样本数 n n n 来得到 Var [ s ^ n ] \text{Var}[\hat{s}_n] Var[s^n] 的估计。 中心极限定理 ( central limit theorem \text{central limit theorem} central limit theorem)告诉我们 s ^ n \hat{s}_n s^n 的分布收敛到以 s s s 为均值以 Var [ f ( x ) ] n \frac{\text{Var}[f(\textbf{x})]}{n} nVar[f(x)]为方差的正态分布。这使得我们可以利用正态分布的累积密度函数来估计 s ^ n \hat{s}_n s^n 的置信区间。
  • 以上的所有结论都依赖于我们可以从基准分布 p ( x ) p(\textbf{x}) p(x) 中轻易的采样,但是这个假设并不是一直成立的。
    • 当我们无法从 p p p 中采样时,一个备选方案是用重要采样。
    • 一种更加通用的方式是使用一个趋近于目标分布估计的序列。这就是马尔可夫链蒙特卡罗方法。

总结

  • 蒙特卡罗方法是一种强大且灵活的数值计算方法,它基于随机数或伪随机数进行模拟和抽样,以逼近复杂的数学或物理问题的解。该方法具有处理高维度问题、对模型假设较少以及简单易实现等优点。然而,其收敛速度较慢,需要大量样本才能得到精确结果,计算成本较高。
  • 蒙特卡罗方法不仅在数学和物理领域有广泛应用,还渗透到金融、工程等多个学科。通过合理的模型构建和大量的随机样本生成,蒙特卡罗方法能够为我们提供问题近似解的可靠估计,为科学研究和技术应用提供了有力的支持。

往期内容回顾

蒙特卡罗方法 -引言篇

相关文章:

蒙特卡罗方法 - 采样和蒙特卡罗方法篇

序言 蒙特卡罗&#xff08; Monte Carlo \text{Monte Carlo} Monte Carlo&#xff09;方法&#xff0c;也被称为计算机随机模拟方法&#xff0c;是一种基于“随机数”的计算方法。这一方法源于美国在第二次世界大战期间研制原子弹的“曼哈顿计划”。其核心思想是使用随机数&am…...

论文阅读:InternVL v1.5| How Far Are We to GPT-4V? 通过开源模型缩小与商业多模式模型的差距

论文地址&#xff1a;https://arxiv.org/abs/2404.16821 Demo&#xff1a; https://internvl.opengvlab.com Model&#xff1a;https://huggingface.co/OpenGVLab/InternVL-Chat-V1-5 公开时间&#xff1a;2024年4月29日 InternVL1.5&#xff0c;是一个开源的多模态大型语言模…...

什么是电能表PTB认证

电能表PTB认证是指电能表产品经过德国国家计量研究所&#xff08;Physikalisch-Technische Bundesanstalt&#xff0c;简称PTB&#xff09;的认证和审核过程。PTB是德国联邦政府在计量、物理、材料和测试领域的技术专家和合作伙伴&#xff0c;拥有世界领先的技术水平和专业知识…...

C# 单例模式继承

简介&#xff1a;单例模式是软件工程中最著名的模式之一。从本质上讲&#xff0c;singleton 是一个只允许创建自身的单个实例的类&#xff0c;并且通常提供对该实例的简单访问。最常见的是&#xff0c;单例不允许在创建实例时指定任何参数 - 否则&#xff0c;对实例进行第二次请…...

ESP8266模块(WIFI STM32)

目录 一、介绍 二、传感器原理 1.原理图 2.引脚描述 3.ESP8266基础AT指令介绍 4.ESP8266基础工作模式 三、程序设计 main.c文件 esp8266.h文件 esp8266.c文件 四、实验效果 五、资料获取 项目分享 一、介绍 ESP8266是一款嵌入式系统级芯片&#xff0c;它集成了Wi…...

微信小程序学习实录9:掌握wx.chooseMedia实现多图片文件上传功能(选择图片、预览图片、上传图片)

要实现多图片上传到服务器&#xff0c;需要在小程序前端和PHP后端分别进行相应的设置。 基本流程 微信小程序提供了丰富的API来支持多图片上传功能。在微信小程序中实现多图片的选择、预览以及上传到服务器的功能&#xff1a; 1. 选择图片 使用 wx.chooseImage API 可以让用…...

助动词的分类及其缩略形式

助动词的分类及其缩略形式 1. 助动词 (auxiliary verb)2. 基本助动词 (primary auxiliary)2.1. 基本助动词 be、do 和 have2.2. 实义动词 be、do 和 have 3. 情态助动词 (modal auxiliary)3.1. 情态助动词取代情态动词 4. 半助动词 (semi-auxiliary)4.1. 不能与 it ... that-cl…...

Redis——分布式锁

在一个分布式系统中&#xff0c;只要涉及到多个节点访问同一个公共资源的时候&#xff0c;就需要加锁来实现互斥&#xff0c;从而达到线程安全的问题。 但是呢&#xff0c;分布式系统不同一些&#xff0c;因为分布式系统部署在不同的服务器上&#xff0c;很可能大量的请求打到…...

C++面试速通宝典——13

208. class里面定义int a&#xff0c;如果不实现构造函数&#xff0c;实例化这个类&#xff0c;a的值是&#xff1f; ‌‌‌‌  答&#xff1a;a的值是未定义的&#xff08;在C标准中成为“未初始化”&#xff09;。 解释&#xff1a; ‌‌‌‌  在C中&#xff0c;如果一…...

数据结构(二叉树)

1. 树相关术语 父结点/双亲结点&#xff1a;如果一个结点有子结点那么它就是父结点或者双亲结点&#xff1b;例如A是BCDEFG的父结点&#xff0c;J是PQ的父结点等等&#xff1b;子结点&#xff1a;一个结点含有的子树的根节点称为该结点的子结点&#xff1b;如上图的H是D的子结点…...

Windows 通过 Docker 安装 GitLab

1. 安装 Docker Desktop 下载网站&#xff1a;Windows | Docker Docs 2. 拉取 GitLab Docker 镜像 打开 PowerShell 或 命令提示符&#xff0c;拉取 GitLab 镜像&#xff1a; docker pull gitlab/gitlab-ee:latest或则使用社区版&#xff1a; docker pull gitlab/gitlab-ce…...

SQL专项练习第六天

Hive 在处理不同数据需求时的灵活性和强大功能&#xff0c;包括间隔连续问题的处理、行列转换、交易数据查询、用户登录统计以及专利数据分析等方面。本文将介绍五个 Hive 数据处理问题的解决方案&#xff0c;并通过实际案例进行演示。 先在home文件夹下建一个hivedata文件夹&a…...

CSS——属性值计算

CSS——属性值计算 今天来详细讲解一下 CSS的属性值计算过程&#xff0c;这是 CSS 的核心之一&#xff08;另一个是视觉可视化模型&#xff0c;个人理解&#xff0c;这个相对复杂&#xff0c;以后再讲&#xff09;。 基本概念 层叠样式表&#xff1a;Cascade Style Sheet&am…...

408算法题leetcode--第26天

496. 下一个更大元素 I 题目地址&#xff1a;496. 下一个更大元素 I - 力扣&#xff08;LeetCode&#xff09; 题解思路&#xff1a;单调栈&#xff0c;如注释 时间复杂度&#xff1a;O(n m) 空间复杂度&#xff1a;O(n) 代码: class Solution { public:vector<int&g…...

JavaScript 与浏览器存储

JavaScript提供了两种存储数据的方式&#xff1a;LocalStorage和SessionStorage。这两种方式都是浏览器提供的客户端存储解决方案&#xff0c;可以将数据保存在用户的浏览器中&#xff0c;供网站使用。 LocalStorage和SessionStorage的区别在于数据的作用域和生命周期。 Loca…...

Chromium 如何查找已经定义好的mojom函数实现c++

进程通信定义通常都是用.mojom文件或者idl文件格式 以content\common\frame.mojom里面的BeginNavigation函数为例。 一、如何查找BeginNavigation函数定义&#xff0c;在vscode里面直接搜索BeginNavigation&#xff0c;过滤条件 *.idl,*.mojom,*.cc 效果&#xff1a; 这样…...

图文深入理解Oracle DB Scheduler(续)-调度的创建

List item 今天是国庆假期最后一天。窗外&#xff0c;秋雨淅淅沥沥淅淅下个不停。继续深宅家中&#xff0c;闲来无事&#xff0c;就多写几篇博文。 本篇承接前一篇&#xff0c;继续图文深入介绍Oracle DB Scheduler。本篇主要介绍调度的创建。 1. 创建基于时间的作业 • 可以…...

基于Springboot的宠物咖啡馆平台的设计与实现(源码+定制+参考)

博主介绍&#xff1a; ✌我是阿龙&#xff0c;一名专注于Java技术领域的程序员&#xff0c;全网拥有10W粉丝。作为CSDN特邀作者、博客专家、新星计划导师&#xff0c;我在计算机毕业设计开发方面积累了丰富的经验。同时&#xff0c;我也是掘金、华为云、阿里云、InfoQ等平台…...

Conda答疑

文章目录 优雅的使用Conda管理python环境1. conda info -e 和conda env list区别2.conda创建环境 创建的新环境在哪个文件夹下3. 自定义路径4. anaconda 新建环境 包是来自哪里4.1. 默认 Anaconda 仓库4.2. Conda-Forge4.3. 镜像源4.4. 自定义频道4.5. 总结 5. conda config --…...

Python 工具库每日推荐【PyPDF2】

文章目录 引言Python PDF 处理库的重要性今日推荐:PyPDF2 工具库主要功能:使用场景:安装与配置快速上手示例代码代码解释实际应用案例案例:PDF文件合并案例分析高级特性加密和解密PDF添加水印扩展阅读与资源优缺点分析优点:缺点:总结【 已更新完 TypeScript 设计模式 专栏…...

AI-调查研究-01-正念冥想有用吗?对健康的影响及科学指南

点一下关注吧&#xff01;&#xff01;&#xff01;非常感谢&#xff01;&#xff01;持续更新&#xff01;&#xff01;&#xff01; &#x1f680; AI篇持续更新中&#xff01;&#xff08;长期更新&#xff09; 目前2025年06月05日更新到&#xff1a; AI炼丹日志-28 - Aud…...

label-studio的使用教程(导入本地路径)

文章目录 1. 准备环境2. 脚本启动2.1 Windows2.2 Linux 3. 安装label-studio机器学习后端3.1 pip安装(推荐)3.2 GitHub仓库安装 4. 后端配置4.1 yolo环境4.2 引入后端模型4.3 修改脚本4.4 启动后端 5. 标注工程5.1 创建工程5.2 配置图片路径5.3 配置工程类型标签5.4 配置模型5.…...

<6>-MySQL表的增删查改

目录 一&#xff0c;create&#xff08;创建表&#xff09; 二&#xff0c;retrieve&#xff08;查询表&#xff09; 1&#xff0c;select列 2&#xff0c;where条件 三&#xff0c;update&#xff08;更新表&#xff09; 四&#xff0c;delete&#xff08;删除表&#xf…...

【力扣数据库知识手册笔记】索引

索引 索引的优缺点 优点1. 通过创建唯一性索引&#xff0c;可以保证数据库表中每一行数据的唯一性。2. 可以加快数据的检索速度&#xff08;创建索引的主要原因&#xff09;。3. 可以加速表和表之间的连接&#xff0c;实现数据的参考完整性。4. 可以在查询过程中&#xff0c;…...

抖音增长新引擎:品融电商,一站式全案代运营领跑者

抖音增长新引擎&#xff1a;品融电商&#xff0c;一站式全案代运营领跑者 在抖音这个日活超7亿的流量汪洋中&#xff0c;品牌如何破浪前行&#xff1f;自建团队成本高、效果难控&#xff1b;碎片化运营又难成合力——这正是许多企业面临的增长困局。品融电商以「抖音全案代运营…...

高等数学(下)题型笔记(八)空间解析几何与向量代数

目录 0 前言 1 向量的点乘 1.1 基本公式 1.2 例题 2 向量的叉乘 2.1 基础知识 2.2 例题 3 空间平面方程 3.1 基础知识 3.2 例题 4 空间直线方程 4.1 基础知识 4.2 例题 5 旋转曲面及其方程 5.1 基础知识 5.2 例题 6 空间曲面的法线与切平面 6.1 基础知识 6.2…...

数据链路层的主要功能是什么

数据链路层&#xff08;OSI模型第2层&#xff09;的核心功能是在相邻网络节点&#xff08;如交换机、主机&#xff09;间提供可靠的数据帧传输服务&#xff0c;主要职责包括&#xff1a; &#x1f511; 核心功能详解&#xff1a; 帧封装与解封装 封装&#xff1a; 将网络层下发…...

Linux-07 ubuntu 的 chrome 启动不了

文章目录 问题原因解决步骤一、卸载旧版chrome二、重新安装chorme三、启动不了&#xff0c;报错如下四、启动不了&#xff0c;解决如下 总结 问题原因 在应用中可以看到chrome&#xff0c;但是打不开(说明&#xff1a;原来的ubuntu系统出问题了&#xff0c;这个是备用的硬盘&a…...

IT供电系统绝缘监测及故障定位解决方案

随着新能源的快速发展&#xff0c;光伏电站、储能系统及充电设备已广泛应用于现代能源网络。在光伏领域&#xff0c;IT供电系统凭借其持续供电性好、安全性高等优势成为光伏首选&#xff0c;但在长期运行中&#xff0c;例如老化、潮湿、隐裂、机械损伤等问题会影响光伏板绝缘层…...

Linux C语言网络编程详细入门教程:如何一步步实现TCP服务端与客户端通信

文章目录 Linux C语言网络编程详细入门教程&#xff1a;如何一步步实现TCP服务端与客户端通信前言一、网络通信基础概念二、服务端与客户端的完整流程图解三、每一步的详细讲解和代码示例1. 创建Socket&#xff08;服务端和客户端都要&#xff09;2. 绑定本地地址和端口&#x…...