当前位置：首页 > news >正文

专业学习｜马尔可夫链（概念、变体以及例题）

news 2026/2/10 23:23:28

一、马尔可夫链的概念及组成

（一）学习资料分享

来源：024-一张图，但讲懂马尔可夫决策过程_哔哩哔哩_bilibili

马尔可夫链提供了一种建模随机过程的方法，具有广泛的应用。在实际问题中，通过转移概率矩阵及初始状态分布，我们可以推导出未来的状态概率。这使得马尔可夫链成为许多复杂系统分析中的重要工具。

其余学习文章：马尔可夫链 ▏小白都能看懂的马尔可夫链详解-CSDN博客马尔可夫链 ▏小白都能看懂的马尔可夫链详解-CSDN博客

基础知识：如何理解马尔可夫链？

（二）概念

马尔可夫链是一种随机过程，其特点是未来的状态只依赖于当前状态，而与过去的状态无关。这一特性称为“无记忆性”或“马尔可夫性质”。马尔可夫链广泛应用于各个领域，包括物理学、经济学、计算机科学等。

（三）基本组成

状态空间：马尔可夫链的所有可能状态的集合，通常用集合 ( S ) 表示。
转移概率：从一个状态转移到另一个状态的概率，通常用转移概率矩阵 ( P ) 表示，其中 ( P(i,j) ) 表示从状态 ( i ) 转移到状态 ( j ) 的概率。
初始状态分布：描述系统在起始时刻处于各状态的概率分布，通常用向量 ( \pi_0 ) 表示。

（四）相关扩展变体

1. 隐马尔可夫模型（HMM）：在观察数据和隐藏状态之间建立联系的模型，常用于语音识别、自然语言处理等领域。

改进点：

隐藏状态：在HMM中，系统的状态是不可直接观察的，而只能通过与之相关的观测数据来推断。这与基本马尔可夫模型中的状态是可以直接观察到的情况不同。
输出概率分布：HMM引入了从每个隐藏状态生成观测数据的概率分布，使得可以建模更复杂的现象。例如，一个隐藏状态可能对应于多个观测结果，这使得HMM能够处理更加复杂和不确定的情况。
序列建模能力：HMM特别适合处理时序数据，比如语音信号或文本序列，通过学习隐藏状态序列与观测数据之间的关系，可以进行预测、分类等任务。

2. 时间非齐次马尔可夫链：转移概率随时间变化的马尔可夫链。

改进点：

动态转移概率：在时间非齐次马尔可夫链中，转移概率不仅依赖于当前状态，还依赖于时间。这意味着模型可以捕捉到时间变化带来的影响，能够更精确地描述某些过程，如经济周期的变化。
灵活性：这种模型允许在不同时间点使用不同的转移概率矩阵，从而增强了模型的表达能力，可以更好地适应具有时间依赖性的实际应用场景。

3. 连续时间马尔可夫链：状态转移发生在连续时间上的马尔可夫链。

改进点：

时间参数化：在连续时间马尔可夫链中，状态转移发生在连续时间上，而不是离散的步骤。这种模型能够更真实地描述一些现实世界中的随机过程，例如排队系统、药物在体内的浓度变化等。
指数分布的使用：状态转移间隔时间通常遵循指数分布，使得模型能够自然地处理事件发生的时间间隔，这是在离散时间马尔可夫链中无法实现的。
更广泛的应用：连续时间马尔可夫链适用于许多需要实时监控和分析的领域，如生物统计学、金融工程和通信网络等。

（五）例题

（1）例题 0: 马尔可夫链例题

1）例题描述

假设有一个简单的天气模型，天气状态可以是“晴天”、“阴天”或“雨天”。状态空间 ( S = {晴天, 阴天, 雨天} )。已知转移概率矩阵如下：

	晴天	阴天	雨天
晴天	0.8	0.1	0.1
阴天	0.4	0.4	0.2
雨天	0.2	0.5	0.3

假设今天是晴天，问明天天气为阴天的概率是多少？

2）解题讲解

确定初始状态：根据题意，今天是晴天，因此初始状态分布可以表示为：
利用转移概率矩阵：我们需要找出从“晴天”到“阴天”的转移概率。根据转移概率矩阵，我们可以看到：
最终结果：因此，如果今天是晴天，则明天天气为阴天的概率为 ( 0.1 )。

（2）例题 1：隐马尔可夫模型（HMM）

1）问题描述

假设有一个隐马尔可夫模型用于识别天气状态与观察到的气象。隐藏状态为“晴天”、“阴天”、“雨天”，观察状态为“户外活动”、“在家”。已知转移概率矩阵和发射概率矩阵如下：

转移概率矩阵 ( P )：

	晴天	阴天	雨天
晴天	0.7	0.2	0.1
阴天	0.3	0.4	0.3
雨天	0.2	0.5	0.3

发射概率矩阵 ( B )：

	户外活动	在家
晴天	0.9	0.1
阴天	0.5	0.5
雨天	0.1	0.9

如果今天观察到的是“户外活动”，求出最可能的天气状态序列。

2）解题讲解

为了求解这个问题，我们可以使用维特比算法，该算法用于寻找最有可能的状态序列。

1.初始化：

根据初始状态分布假设，假设初始状态均匀分布。
计算每个状态的初始概率乘以观测概率：

2.递推计算：对于后续的观测进行递推计算，每个状态计算最大概率路径：

对于第二个观测（假设为“在家”），需要考虑前一步的转移概率和当前的观测概率。
重复此过程直到最后一步，选择最大概率路径。

3.回溯找到最优路径：在获得所有状态的最大概率后，回溯找到最优状态序列。

（3）例题 2：时间非齐次马尔可夫链

1）问题描述

考虑一个市场状态模型，有两种状态：“上涨”和“下跌”。它们的转移概率不是固定不变的，而是随时间变化，如下表所示：

时间	上涨转上涨	上涨转下跌	下跌转上涨	下跌转下跌
t=1	0.6	0.4	0.3	0.7
t=2	0.8	0.2	0.4	0.6

假设在时刻 ( t=0 ) 的状态为“上涨”，计算在时刻 ( t=2 ) 时状态为“下跌”的概率。

2）解题讲解

确定初始状态：在时间 ( t=0 )，状态为“上涨”，即初始状态分布为：
计算转移概率：
- 从 ( t=0 ) 到 ( t=1 )：
计算从 ( t=1 ) 到 ( t=2 )：
- 已知在 ( t=1 ) 时状态分布为：
- 接下来使用 ( t=2 ) 的转移概率矩阵进行计算：
时间上涨转上涨上涨转下跌下跌转上涨下跌转下跌
t=2 0.8 0.2 0.4 0.6
- 计算在 ( t=2 ) 时状态分布：
对于状态“上涨”和“下跌”，计算如下：
- 状态“上涨”在时刻 ( t=2 ) 的概率：
- 状态“下跌”在时刻 ( t=2 ) 的概率：
结果：因此，在时刻 ( t=2 ) 状态为“下跌”的概率为 ( 0.36 )。

时间	上涨转上涨	上涨转下跌	下跌转上涨	下跌转下跌
t=2	0.8	0.2	0.4	0.6

（4）例题 3：吸收马尔可夫链

1）问题描述

考虑一个抽奖游戏，参与者可以处于以下三种状态：

状态 0: 未中奖
状态 1: 中了一等奖
状态 2: 中了二等奖

如果在状态 0，参与者以 50% 的概率中一等奖，以 30% 的概率中二等奖，以 20% 的概率继续保持在状态 0。

已知奖金不再返回到状态 0，因此这是一个吸收马尔可夫链。求在多次抽奖后最终进入状态 1 或状态 2 的概率。

2）解题讲解

建立转移概率矩阵 ( P ):
这里的第一行表示从状态 0 转移到其他状态的概率，第二、第三行分别表示状态 1 和状态 2 是吸收状态。
求解吸收概率：
- 定义 ( R ) 为吸收状态的概率矩阵，即只有状态 1 和状态 2 的转移概率。即:
- 计算 ( B ) 为从未中奖状态（状态 0）转入各吸收状态的概率。
- 首先，计算 ( Q ) 矩阵（非吸收状态间的转移概率）：

求解吸收概率（续）：

第一个方程表示，从状态 0 转移到状态 1 的概率包括直接转移到状态 1 的概率 ( 0.5 ) 和保持在状态 0 后再次转移到状态 1 的概率 ( 0.2p_1 )。

第二个方程同理，表示从状态 0 转移到状态 2 的概率。
- 我们已经建立了状态转移矩阵 ( P ) 和吸收概率矩阵 ( R )。现在，我们需要找到从未中奖状态（状态 0）进入状态 1 和状态 2 的最终概率。
- 对于这个问题，我们可以通过计算期望吸收时间和对应的吸收概率来解决。首先，定义：
  - ( p_1 ): 从状态 0 进入状态 1 的概率
  - ( p_2 ): 从状态 0 进入状态 2 的概率
- 因为状态 1 和状态 2 是吸收状态，所以在状态 0 下的转移可以写作：
解方程：
- 将第一个方程重组为：
- 第二个方程同样重组为：
结果：
- 最后，我们得到了从状态 0 开始进入各个吸收状态的概率：
  - 从状态 0 进入状态 1 的概率 ( p_1 = 0.625 )
  - 从状态 0 进入状态 2 的概率 ( p_2 = 0.375 )
- 验证：这两个概率的总和为 ( p_1 + p_2 = 0.625 + 0.375 = 1 )，符合概率性质。

二、马尔可夫链与动态规划的联系和区别

马尔可夫链和动态规划虽然在某些方面有交集，但它们的核心理念、应用目标和具体实现方法有所不同。理解这两者的关系和区别，有助于在实际问题中选择合适的工具和方法。

（一）联系

马尔可夫链和动态规划都是处理状态转移和决策过程的重要工具，它们之间存在如下联系：

状态：二者都涉及状态的概念。在马尔可夫链中，状态是系统在某一时刻可能处于的情况；而在动态规划中，状态通常表示某个子问题的解决方案。
转移：马尔可夫链关注状态之间的转移概率，而动态规划则关注从一个状态到下一个状态的决策过程。两者都利用先前的状态信息来推导后续状态。
优化：动态规划常用于求解具有最优子结构性质的问题，而马尔可夫决策过程（MDP）是一种将动态规划应用于随机环境的方法。这使得动态规划可以处理带有不确定性的决策问题。
递归关系：动态规划依赖于递归关系来定义状态间的转移；马尔可夫链也通过转移概率定义了状态之间的关系。

（二）区别

尽管马尔可夫链和动态规划有相似之处，但它们在目的、方法和应用等方面存在显著区别：

目的：
- 马尔可夫链：主要用于建模和分析随机过程，关注的是状态转移的概率分布。
- 动态规划：主要用于寻找最优解，关注的是如何在给定条件下做出最佳决策。
决策 vs. 预测：
- 马尔可夫链：通常是被动的，描述现象的演化，可以用于预测未来状态的概率。
- 动态规划：是主动的，制定决策以达到目标，通常涉及优化某个目标函数。
模型类型：
- 马尔可夫链：是一种随机模型，强调无记忆性和状态转移的随机性。
- 动态规划：可以是确定性的，也可以是随机的，但其核心是通过分解问题并逐步构建解决方案。
应用领域：
- 马尔可夫链：广泛应用于统计学、金融、物理、计算机科学等领域，尤其是在序列数据和随机过程的分析中。
- 动态规划：常用在运筹学、算法设计、计算机程序优化等领域，适用于背包问题、最长公共子序列等经典问题。

专业学习｜马尔可夫链（概念、变体以及例题）

一、马尔可夫链的概念及组成 （一）学习资料分享来源：024-一张图，但讲懂马尔可夫决策过程_哔哩哔哩_bilibili 马尔可夫链提供了一种建模随机过程的方法，具有广泛的应用。在实际问题中，通过转移概率矩阵及初…...

编程日记 2024/10/19 7:01:03

编译 Android14 对机器的配置要求较高：建议预留500G存储多分配CPU和内存建议使用 Ubuntu 20.04 操作系统或更高版本 sudo apt-get updatesudo apt-get install make gcc sudo apt-get install g++ patchelf gawk texinfo chrpath diffstat binfmt-support sudo apt-get …...

编程日记 2024/10/19 6:59:01

Renesas R7FA8D1BH (Cortex®-M85) 上光电编码器测速功能

目录概述 1 软硬件 1.1 软硬件环境信息 1.2 开发板信息 1.3 调试器信息 2 硬件架构 2.1 硬件框架结构 2.2 测速功能原理介绍 2.2.1 理论描述 2.2.2 实现原理 2.2.3 系统硬件结构 3 软件实现 3.1 FSP配置项目 3.2 代码实现 3.2.1 初始化函数 3.2.2 功能函数 3.…...

编程日记 2024/10/19 6:56:59

软件测试学习笔记丨Linux三剑客-sed

本文转自测试人社区，原文链接：https://ceshiren.com/t/topic/32521 一、简介 sed（Stream editor）是一个功能强大的文本流编辑器，主要用于对文本进行处理和转换。它适用于自动化处理大量的文本数据，能够支持…...

编程日记 2024/10/19 6:53:57

Vue脚手架学习 vue脚手架配置代理、插槽、Vuex使用、路由、ElementUi插件库的使用

目录 1.vue脚手架配置代理 1.1 方法一 1.2 方法二 2.插槽 2.1 默认插槽 2.2 具名插槽 2.3 作用域插槽 3.Vuex 3.1 概念 3.2 何时使用？ 3.3 搭建vuex环境 3.4 基本使用 3.5 getters的使用 3.6 四个map方法的使用 3.6.1 mapState方法 3.6.2 mapGetter…...

编程日记 2024/10/19 6:49:53

使用yml文件安装环境时，如何添加conda和pip的镜像源

博客参考添加conda镜像源 name: NAME channels:- conda-forge- pytorch- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r- https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2- defaults depende…...

编程日记 2024/10/19 6:47:47

c语言经典100例

1.字符串转为数字 #include <stdio.h>int strToInt(char *s) {int num0;int sign1;int step1;if (*s -){sign -1;s;}while (*s > 0&&*s < 9){num num*10(*s-0);step 10;s;}return num*sign; }int main() {char a[10] "-1234";char *s a ;pr…...

编程日记 2024/10/19 6:46:43

百易云资产管理运营系统 ufile.api.php SQL注入漏洞复现

0x01 产品描述： 百易云资产管理运营系统，是专门针对企业不动产资产管理和运营需求而设计的一套综合解决方案。该系统能够覆盖资产的全生命周期管理，包括资产的登记、盘点、评估、处置等多个环节，同时提供强大的运营分析功能&#…...

编程日记 2024/10/19 6:45:43

【分布式微服务云原生】《Redis RedLock 算法全解析：应对时钟漂移与网络分区挑战》

《Redis RedLock 算法全解析：应对时钟漂移与网络分区挑战》摘要： 本文深入探讨 Redis 的 RedLock 算法，详细阐述其步骤及工作原理，同时重点分析该算法如何处理时钟漂移和网络分区这两个常见的分布式系统问题。读者将通过本文深入…...

编程日记 2024/10/19 6:44:42

OceanBase 的写盘与传统数据库有什么不同？

背景在数据库开发过程中，“写盘”是一项核心操作，即将内存中暂存的数据安全地转储到磁盘上。在诸如MySQL这样的传统数据库管理系统中，写盘主要有以下几步：首先将数据写入缓存池；其次，为了确保数据的完整性…...

编程日记 2024/10/19 6:42:40

用Java爬虫API，轻松获取taobao商品SKU信息

在电子商务的世界里，SKU（Stock Keeping Unit，库存单位）是商品管理的基础。对于商家来说，SKU的详细信息对于库存管理、价格策略制定、市场分析等都有着重要作用。taobao作为中国最大的电子商务平台之一，提供…...

编程日记 2024/10/19 6:41:39

OpenHarmony 入门——ArkUI 自定义组件内同步的装饰器@State小结（二）

文章大纲引言一、组件内状态装饰器State1、初始化2、使用规则3、变量的传递/访问规则说明4、支持的观察变化的场景5、State 变量的值初始化和更新机制6、State支持联合类型实例引言前一篇文章OpenHarmony 入门——ArkUI 自定义组件之间的状态装饰器小结（一&…...

编程日记 2024/10/19 6:40:38

【Linux驱动开发】嵌入式Linux驱动开发基本步骤，字符设备开发入门，点亮LED

【Linux驱动开发】嵌入式Linux驱动开发基本步骤，字符设备开发入门，点亮LED 文章目录开发环境驱动文件编译驱动安装驱动自动创建设备节点文件驱动开发驱动设备号地址映射，虚拟内存和硬件内存地址字符驱动旧字符驱动新字符驱动应用程序开发…...

编程日记 2024/10/19 6:39:37

搬砖14、Python网络编程入门

网络编程入门计算机网络基础计算机网络是独立自主的计算机互联而成的系统的总称，组建计算机网络最主要的目的是实现多台计算机之间的通信和资源共享。今天计算机网络中的设备和计算机网络的用户已经多得不可计数，而计算机网络也可以称得上是一个“复…...

编程日记 2024/10/19 6:34:33

Transformer: Attention is All you need

Transformer Transformer是基于Encoder-Decoder结构的，将Seq2Seq中的RNN/GRU部分更换为Self-Attention部分位置编码 Positional Encoding Self-attention丢失了位置信息 CNN 卷积神经网络可以保存相邻的位置信息 RNN 是顺序输入的，是包含了位置信息…...

编程日记 2024/10/19 6:32:31

C++：排序算法

目录一、插入排序 1.直接插入排序 2.希尔排序二、交换排序 1.冒泡排序 2.快速排序三、选择排序 1.简单选择排序 2.堆排序四、归并排序 1.二路归并排序的递归实现 2.二路归并排序的非递归实现一、插入排序 1.直接插入排序直接插入排序的基本思想是&#xff…...

编程日记 2024/10/19 6:31:30

期货日内稳赢策略：双15交易法详解

Eagle Trader的考试不仅涵盖了CFD交易，期货交易的考生人数也颇为可观。与外汇市场相比，期货在国内市场的普及程度更高，参与的群体也更为广泛。这得益于期货市场在国内相对成熟的监管体系，使得交易员对期货有了更深入的了解和信任。…...

编程日记 2024/10/19 6:30:28

2024年10月第2个交易周收盘总结：怎样卖出！

计划自己的交易，交易自己的计划。跟随市场而情绪波动，最终一定会导向失败！ 连续、平稳、冷静地惯彻交易计划，比什么都重要！ 交易本身是极其简单和清楚的，让事情变复杂的原因不是行情走势和交易本身&…...

编程日记 2024/10/19 6:29:26

mysql 不支持utf8mb4_0900_ai_ci

Unknowncollation:‘utf8mb4_0900_ai_ci’ 解决方案： 1. 升级mysql为8.0以上（不包含8.0） 2. 修改编码类型： utf8mb4_0900_ai_ci/utf8mb4_0900_ci 修改为utf8_general_ci utf8mb4修改为utf8 utf8mb4_0900_ai_ci 是一种 MySQL 数…...

编程日记 2024/10/19 6:28:25

第10篇：防火墙与入侵检测系统

目录引言 10.1 防火墙的基本概念 10.2 防火墙的分类 10.3 防火墙策略的配置与实现 10.4 入侵检测系统（IDS） 10.5 防火墙与IDS的结合 10.6 总结第10篇：防火墙与入侵检测系统引言在当今的数字世界中，网络安全已经成为企…...

编程日记 2024/10/19 6:27:24

XML Group端口详解

在XML数据映射过程中，经常需要对数据进行分组聚合操作。例如，当处理包含多个物料明细的XML文件时，可能需要将相同物料号的明细归为一组，或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码，增加了开…...

编程新知 2026/2/9 13:51:46

[2025CVPR]DeepVideo-R1：基于难度感知回归GRPO的视频强化微调框架详解

突破视频大语言模型推理瓶颈，在多个视频基准上实现SOTA性能一、核心问题与创新亮点 1.1 GRPO在视频任务中的两大挑战安全措施依赖问题 GRPO使用min和clip函数限制策略更新幅度，导致：梯度抑制：当新旧策略差异过大时梯度消失收敛困难：策略无法充分优化# 传统GRPO的梯…...

编程新知 2025/8/19 23:46:57

Android Wi-Fi 连接失败日志分析

1. Android wifi 关键日志总结 (1) Wi-Fi 断开 (CTRL-EVENT-DISCONNECTED reason3) 日志相关部分： 06-05 10:48:40.987 943 943 I wpa_supplicant: wlan0: CTRL-EVENT-DISCONNECTED bssid44:9b:c1:57:a8:90 reason3 locally_generated1解析： CTR…...

编程新知 2025/9/14 19:44:52

手游刚开服就被攻击怎么办？如何防御DDoS？

开服初期是手游最脆弱的阶段，极易成为DDoS攻击的目标。一旦遭遇攻击，可能导致服务器瘫痪、玩家流失，甚至造成巨大经济损失。本文为开发者提供一套简洁有效的应急与防御方案，帮助快速应对并构建长期防护体系。一、遭遇攻击的紧急应…...

编程新知 2026/2/8 4:37:03

零门槛NAS搭建：WinNAS如何让普通电脑秒变私有云？

一、核心优势：专为Windows用户设计的极简NAS WinNAS由深圳耘想存储科技开发，是一款收费低廉但功能全面的Windows NAS工具，主打“无学习成本部署” 。与其他NAS软件相比，其优势在于： 无需硬件改造：将任意W…...

编程新知 2026/1/2 23:01:24

Lombok 的 @Data 注解失效，未生成 getter/setter 方法引发的HTTP 406 错误

HTTP 状态码 406 (Not Acceptable) 和 500 (Internal Server Error) 是两类完全不同的错误，它们的含义、原因和解决方法都有显著区别。以下是详细对比： 1. HTTP 406 (Not Acceptable) 含义： 客户端请求的内容类型与服务器支持的内容类型不匹…...

编程新知 2026/2/1 20:49:03

日语学习-日语知识点小记-构建基础-JLPT-N4阶段（33）：にする

日语学习-日语知识点小记-构建基础-JLPT-N4阶段（33）：にする 1、前言（1）情况说明（2）工程师的信仰2、知识点（1）　にする1，接续：名词＋にする2，接续：疑问词＋にする3，（A）は（B）にする。（2）復習：（1）复习句子（2）ために　＆　ように（３）そう（４）にする3、…...

编程新知 2025/11/20 7:52:01

通过Wrangler CLI在worker中创建数据库和表

官方使用文档：Getting started Cloudflare D1 docs 创建数据库在命令行中执行完成之后，会在本地和远程创建数据库： npx wranglerlatest d1 create prod-d1-tutorial 在cf中就可以看到数据库： 现在，您的Cloudfla…...

编程新知 2026/1/31 6:18:08

聊聊 Pulsar：Producer 源码解析

一、前言 Apache Pulsar 是一个企业级的开源分布式消息传递平台，以其高性能、可扩展性和存储计算分离架构在消息队列和流处理领域独树一帜。在 Pulsar 的核心架构中，Producer（生产者） 是连接客户端应用与消息队列的第一步。生产者…...

编程新知 2026/2/5 21:34:41

为什么需要建设工程项目管理？工程项目管理有哪些亮点功能？

在建筑行业，项目管理的重要性不言而喻。随着工程规模的扩大、技术复杂度的提升，传统的管理模式已经难以满足现代工程的需求。过去，许多企业依赖手工记录、口头沟通和分散的信息管理，导致效率低下、成本失控、风险频发。例如&#…...

编程新知 2026/2/4 12:35:34

一、马尔可夫链的概念及组成

（一）学习资料分享

（二）概念

（三）基本组成

（四）相关扩展变体

1. 隐马尔可夫模型（HMM）：在观察数据和隐藏状态之间建立联系的模型，常用于语音识别、自然语言处理等领域。

改进点：

2. 时间非齐次马尔可夫链：转移概率随时间变化的马尔可夫链。

改进点：

3. 连续时间马尔可夫链：状态转移发生在连续时间上的马尔可夫链。

改进点：

（五）例题

（1）例题 0: 马尔可夫链例题

1）例题描述

2）解题讲解

（2）例题 1：隐马尔可夫模型（HMM）

1）问题描述

2）解题讲解

（3）例题 2：时间非齐次马尔可夫链

1）问题描述

2）解题讲解

（4）例题 3：吸收马尔可夫链

1）问题描述

2）解题讲解

二、马尔可夫链与动态规划的联系和区别

（一）联系

（二）区别

相关文章：