当前位置：首页 > news >正文

机器学习---概率图模型（隐马尔可夫模型、马尔可夫随机场、条件随机场）

news 2026/2/11 0:01:13

1. 隐马尔可夫模型

机器学习最重要的任务是根据已观察到的证据（例如训练样本）对感兴趣的未知变量（例如类别标

记）进行估计和推测。概率模型（probabilistic model）提供了一种描述框架，将描述任务归结为

计算变量的概率分布，在概率模型中，利用已知的变量推测未知变量的分布称为“推断

（inference）”，其核心在于基于可观测的变量推测出未知变量的条件分布。

生成式：计算联合分布𝑃(𝑌, 𝑅, 𝑂)，判别式：计算条件分布𝑃(𝑌, 𝑅|𝑂)

符号约定：𝑌为关心的变量的集合，O为可观测变量集合，R为其他变量集合

概率模型直接利用概率求和规则消去变量R的时间和空间复杂度为指数级别𝑂(2^(𝑌 +|𝑅|))，需要一

种能够简洁紧凑表达变量间关系的工具。

概率图模型(probabilistic graphical model)是一类用图来表达变量相关关系的概率模型。

图模型提供了一种描述框架，结点：随机变量（集合）；边：变量之间的依赖关系

分类：有向图：贝叶斯网，使用有向无环图表示变量之间的依赖关系

无向图：马尔可夫网，使用无向图表示变量间的相关关系

概率图模型分类：有向图：贝叶斯网，无向图：马尔可夫网

隐马尔可夫模型（Hidden Markov Model，HMM）组成：状态变量：，通常假定是

隐藏的，不可被观测的。取值范围为𝑦，通常有𝑁个可能取值的离散空间

观测变量：表示第𝑖 时刻的观测值集合，观测变量可以为离散或连续型，本章中只

讨论离散型观测变量，取值范围X为

隐马尔可夫模型（Hidden Markov Model，HMM）：时刻的状态 𝑥𝑡 仅依赖于𝑥(𝑡 − 1)，与其余

𝑛 − 2个状态无关。马尔可夫链：系统下一时刻状态仅由当前状态决定，不依赖于以往的任何状态

HMM 的生成过程：

确定一个HMM需要三组参数𝜆 = [𝐴, 𝐵, 𝜋] 。状态转移概率：模型在各个状态间转换的概率表示在任

意时刻t，若状态为si，下一状态为sj的概率

输出观测概率：模型根据当前状态获得各个观测值的概率。在任意时刻t，若状态为Si，则在下一

时刻状态为Sj的概率

初始状态慨率：模型在初始时刻各个状态出现的慨率

通过指定状态空间𝑌，观测空间𝑋和上述三组参数，就能确定一个隐马尔可夫模型。给定𝜆 = [𝐴, 𝐵,

𝜋] ，它按如下过程生成观察序列：

①设置𝑡 = 1, 并根据初始状态𝜋选择初始状态𝑦1

②根据 𝑦𝑡 和输出观测概率𝐵 选择观测变量取值 𝑥𝑡

③根据状态 𝑦𝑡 和状态转移矩阵 𝐴 转移模型状态，即确定𝑦𝑡+1

④若 𝑡 < 𝑛, 设置 𝑡 = 𝑡 + 1，并转到②步，否则停止

HMM的基本问题：对于模型𝜆 = [𝐴, 𝐵, 𝜋] ，给出具体应用定观测序列评估模型

和观测序列之间的匹配程度：有效计算观测序列其产生的概率

根据观测序列“推测”隐藏的模型状态y=

参数学习：如何调整模型参数𝜆 = [𝐴, 𝐵, 𝜋] ，以使得该序列出现的概率最大

具体应用：根据以往的观测序列x=预测当前时刻最有可能的观测值；语音识别：根据观测的语音信

号推测最有可能的状态序列（即：对应的文字）；通过数据学习参数（模型训练)

隐马尔可夫模型是关于时序的概率模型，描述由一个隐藏的马尔可夫链随机生成不可观测的状态随

机序列，再由各个状态生成一个观测而产生观测随机序列的过程。隐藏的马尔可夫链随机生成的状

态的序列，称为状态序列(state sequence)：每个状态生成一个观测，而由此产生的观测的随机序

列，称为观测序列(observation sequence)。序列的每一个位置又可以看作是一个时刻。

隐马尔可夫模型由初始概率分布、状态转移概率分布以及观测概率分布确定。隐马尔可夫模型的形

式定义如下：设Q是所有可能的状态的集合，V是所有可能的观测的集合，

其中，N是可能的状态数，M是可能的观测数，I是长度为T的状态序列，O是对应的观测序列。

A是状态转移概率矩阵：

其中，是在时刻t处于状态qi的条件下在时刻t+1

转移到状态qj的概率。

B是观测概率矩阵：

其中，是在时刻t处于状态qj的条件下生成

观测vk的概率。π是初始状态概率向量：π=（πi），其中，是时刻t=1

处于状态qi的概率。

隐马尔可夫模型由初始状态概率向量π、状态转移概率矩阵A和观测概率矩阵B决定。π和A决定状

态序列，B决定观测序列。因此，隐马尔可夫模型入可以用三元符号表示，即𝜆 = [𝐴, 𝐵, 𝜋] ，𝐴, 𝐵,

𝜋称为隐马尔可夫模型的三要素。

齐次马尔可夫性假设，即假设隐藏的马尔可夫链在任意时刻t的状态只依赖于其前一时刻的状态，

与其他时刻的状态及观测无关，也与时刻t无关。

观测独立性假设，即假设任意时刻的观测只依赖于该时刻的马尔可夫链的状态，与其他观测及状态

无关。

例如，一段文字中名词、动词、形容词三类词出现的情况可由三个状态的马尔可夫模型描述：

状态S1：名词，S2：动词，S3：形容词

假设状态转移矩阵：

如果其中某一句话第一个词为名词，那么该句子中这三类词出现的顺序为0=“名动形名”的概率为：

系统初始化时可以定义一个初始状态的概率向量

隐马尔可夫链示意图：

2. 马尔可夫随机场

马尔可夫随机场（Markov Random Field，MRF）是典型的马尔可夫网，著名的无向图模型

图模型表示：结点表示变量（集），边表示依赖关系。有一组势函数（Potential Functions)，亦称

“因子”(factor)，这是定义在变量子集上的非负实函数，主要用于定义概率分布函数

马尔可夫随机场（Markov Random Field，MRF）分布形式化：使用基于极大团的势函数（因子）

对于图中结点的一个子集，若其中任意两结点间都有边连接，则称该结点子集为一个“团”

（clique）。若一个团中加入另外任何一个结点都不再形成团，则称该团为“极大团”（maximal

clique)，图中 𝑥1, 𝑥2 , {𝑥2, 𝑥6} , {𝑥2, 𝑥5, 𝑥6}等为团，图中{𝑥2, 𝑥6}不是极大团，每个结点至少出现

在一个极大团中，多个变量之间的连续分布可基于团分解为多个因子的乘积。

基于极大团的势函数（因子）多个变量之间的连续分布可基于团分解为多个因子的乘积，每个因子

只与一个团相关。对于n个变量x={x1,x2,...xn}，所有团构成的集合为C，与团Q∈C对应的变量集合

记为XQ，则联合概率定义为：。

其中，是基于团Q对应的势函数，Z为概率的规范化因子，在实际应用中，Z往往很难精确计

算，但很多任务中，不需要对Z进行精确计算若变量问题较多，则团的数目过多，上式的乘积项过

多，会给计算带来负担，所以需要考虑极大团。

基于极大团的势函数：通过极大团构造势函数。若团Q不是一个极大团，则必然被一个极大团Q*包

含，这意味着变量的关系不仅体现在势函数中，还体现在*中联合概率分布可以使用极大

团定义假设所有极大团构成的集合为其中，Z*是规范化因子

。

基于极大团的势函数：联合概率分布可以使用极大团定义，假设所有极大团构成的集合为𝐶∗。

联合概率分布

马尔可夫随机场中的分离集：马尔可夫随机场中得到“ 条件独立性”。借助“分离”的概念，若从结点

集 𝐴 中的结点到 𝐵 中的结点都必须经过结点集 𝐶 中的结点，则称结点集 𝐴，𝐵 被结点集 𝐶 分离，

称 𝐶 为分离集（separating set）。

全局马尔可夫性：马尔可夫随机场中得到“条件独立性”，借助“分离”的概念，可以得到：全局马尔

可夫性（global Markov property）：在给定分离集的条件下，两个变量子集条件独立。

图模型简化：

得到图模型的联合概率为：

全局马尔可夫性的验证：

条件概率：

验证：

马尔可夫随机场中的条件独立性：

由全局马尔可夫性可以导出：局部马尔可夫性(local Markov property):在给定邻接变量的情况下，

一个变量条件独立于其它所有变量令V为图的结点集，n(v)为结点v在图上的邻接节点，

成对马尔可夫性(pairwise Markov property)：在给定所有其它变量的情况下，两个非邻接变量条件

独立令V为图的结点集，边集为E，对图中的两个结点u,v,若<u,v>不属于E，有

势函数的作用是定量刻画变量集XQ中变量的相关关系，应为非负函数，且在所偏好的变

量取值上有较大的函数值

上图中，假定变量均为二值变量，定义势函数：

说明模型偏好xA与xc有相同的取值，xB与xc有不同的取值，换言xA与xc正相关，xB与xc负相关。

所以令xA与xc相同且xB与xc不同的变量值指派將有较高的联合慨率。

势函数的作用是定量刻画变量集xQ中变量的相关关系，应为非负函数，且在所偏好的变

量取值上有较大的函数值口为了满足非负性，指数函数常被用于定义势函数，即：

，其中，是一个定义在变量xQ上的实值函数，常见形式为：

，其中，是参数，上式第一项考虑每一对

结点的关系，第二项考虑单结点。

3. 条件随机场

条件随机场(Conditional Random Field，(CRF)是一种判别式无向图模型（可看作给定观测值的

MRF)，条件随机场对多个变量给定相应观测值后的条件概率进行建模，若令x={x1,X2,…,X}为观测

序列，y={y1,y2,,y}为对应的标记序列，CRF的目标是构建条件概率模型P(y|x)

标记变量y可以是结构型变量，它各个分量之间具有某种相关性。

自然语言处理的词性标注任务中，观测数据为语句（单词序列），标记为相应的词性序列，具有线

性序列结构在语法分析任务中，输出标记是语法树，具有树形结构

令G=(V,E)表示结点与标记变量y中元素一一对应的无向图。无向图中，yv表示与节点v对应的标记

变量，n(v)表示结点v的邻接结点，若图中的每个结点都满足马尔可夫性，

则(y,x)构成条件随机场。

CRF使用势函数和图结构上的团来定义P(y|x)。本章仅考虑链式条件随机场(chain-structured

CRF)，如下所亦：

链式条件随机场(chain-structured CRF)包含两种关于标记变量的团：相邻的标记变量，

单个标记变量；条件概率可被定义为：

是定义在观测序列的两个

相邻标记位置上的转移特征函数(transition feature function)，用于刻画相令邻标记变量之间的相关

关系以及观测序列对它们的影响，是定义在观测序列的标记位置i上的状态特征函数

(statusfeature function)，用于刻画观测序列对标记变量的影响，为参数，Z为规范化因子

特征函数通常是实值函数，以刻画数据的一些很可能成立或者期望成立的经验特性，以词性标注任

务为例：

采用特征函数：

表示第个观测值xi为单词'knock'时，相应的标记yi，yi+1很可能分别为[V]，[P]。

MRF 与CRF的对比：

MRF：使用团上的势函数定义概率，对联合概率建模

CRF：使用团上的势函数定义概率，有观测变量，对条件概率建模

机器学习---概率图模型（隐马尔可夫模型、马尔可夫随机场、条件随机场）

1. 隐马尔可夫模型机器学习最重要的任务是根据已观察到的证据（例如训练样本）对感兴趣的未知变量（例如类别标记）进行估计和推测。概率模型（probabilistic model）提供了一种描述框架，将描述任…...

编程日记 2024/2/11 3:11:53

cool 框架 node 后端封装三方Api post请求函数

1.需求现在一些数据源 ，需要从三方地址拿到一些数据比如说电影列表信息了影院列表信息了等一些展示的数据，但是人家这种东西害需要使用 appkey appserect 这种验签这种需求你前端调用接口是直接调用不了的因为需要用到验签需要后端接口转接一…...

编程日记 2024/2/11 3:10:52

awd总结

总结： 由于是第一次参加AWD比赛，各方面经验都不足，在参赛的前几天也是疯狂搜集各种脚本、框架、工具等，同时也参考b站的视频进行学习，我发现就是还是实操才能更快的学习我觉得就是我前期的准备工作不足，…...

编程日记 2024/2/11 3:06:49

【react】react+es6+antd5.13.2+ts,antd表格的操作如何在父组件写？

reactes6antd5.13.2ts,antd表格的操作如何在父组件写？ 我的子组件columns.tsx，只加表头，操作放在父组件。 columns.tsx的代码： export const dataColumns [{title: 项目成员,dataIndex: name,key: name,},{title: 可选账号,alig…...

编程日记 2024/2/11 3:01:43

virtio笔记

最近在看虚拟化相关的东西，以virtio-console为例，记录下。此文只是学习笔记，文中肯定有不少错误，不要参考 devicemd侧： virtio_console.c中，初始化会对port->cb赋值为 viritio_console_control_tx&am…...

编程日记 2024/2/11 2:58:40

初始web服务器（并基于idea来实现无需下载的tomcat）

前言前面学习了对应的http协议，我们知道了他是在网络层进行数据传输的协议，负责相应数据以及接收数据的规则，但是在人员开发后端的时候不仅仅需要你写io流进行数据传输，还需要你进行对应的tcp协议来进行数据打包发送http协议-CSD…...

编程日记 2024/2/11 2:53:33

软件文档测试

1 文档测试的范围软件产品由可运行的程序、数据和文档组成。文档是软件的一个重要组成部分。在软件的整人生命周期中，会用到许多文档，在各个阶段中以文档作为前阶段工作成果的体现和后阶段工作的依据。软件文档的分类结构图如下图所示： …...

编程日记 2024/2/11 2:40:22

从零开始手写mmo游戏从框架到爆炸（七）— 消息封装

导航：从零开始手写mmo游戏从框架到爆炸（零）—— 导航-CSDN博客上一篇，我们初步把消息handler 注册到了服务中，在进行后续工作之前我们需要再做一些准备工作。第一：把之前自己管理的bean放到spring中…...

编程日记 2024/2/11 2:37:19

从Unity到Three.js（画线组件line）

JavaScript 0基础，只是照着官方文档临摹了下，之后有时间再进行细节学习和功能封装。 import * as THREE from three; //引入threejsconst renderer new THREE.WebGLRenderer();//创建渲染器 //设置渲染范围，当前撑满全屏,屏幕左上角是&…...

编程日记 2024/2/11 2:34:16

LCP 30. 魔塔游戏 - 力扣（LeetCode）

题目描述小扣当前位于魔塔游戏第一层，共有 N 个房间，编号为 0 ~ N-1。每个房间的补血道具/怪物对于血量影响记于数组 nums，其中正数表示道具补血数值，即血量增加对应数值；负数表示怪物造成伤害值，即血量减…...

编程日记 2024/2/11 2:33:14

数据结构——单向链表和双向链表的实现（C语言版）

目录前言 1. 链表 1.1 链表的概念及结构 1.2 链表的分类 2. 单链表接口实现 2.1 数据结构设计与接口函数声明 2.2 创建结点，打印，查找 2.3 尾插，头插，尾删，头删 2.4 插入或删除 2.4.1在指定位置后 2.4.2在…...

编程日记 2024/2/11 2:30:11

TCP和UDP相关问题(重点)(4)——4.使用TCP的协议有哪些？使用UDP的协议有哪些？

4.使用TCP的协议有哪些？使用UDP的协议有哪些？ 使用TCP的协议有：HTTP3.0之前的HTTP协议、HTTPS、FTP、SMTP、SSH... 使用UDP的协议有：HTTP3.0、DNS、DHCP......

编程日记 2024/2/11 2:29:10

Python进阶--爬取美女图片壁纸(基于回车桌面网的爬虫程序)

目录一、前言二、爬取下载美女图片 1、抓包分析 a、分析页面 b、明确需求 c、抓包搜寻 d、总结特点 2、编写爬虫代码 a、获取图片页网页源代码 b、提取所有图片的链接和标题 c、下载并保存这组图片 d、爬取目录页的各种类型美女图片的链接 e、实现翻页三、各…...

编程日记 2024/2/11 2:26:07

[office] excel如何计算毛重和皮重的时间间隔 excel计算毛重和皮重时间间隔方法 #笔记#学习方法

excel如何计算毛重和皮重的时间间隔 excel计算毛重和皮重时间间隔方法在日常工作中经常会到用excel，有时需要计算毛重和皮重的时间间隔，具体的计算方式是什么，一起来了解一下吧在日常工作中经常会到用excel，在整理编辑过磅数据…...

编程日记 2024/2/11 2:25:05

Pandas 对带有 Multi-column（多列名称）的数据排序并写入 Excel 中

Pandas 从Excel 中读取带有 Multi-column的数据正文正文我们使用如下方式写入数据： import pandas as pd import numpy as npdf pd.DataFrame(np.array([[10, 2, 0], [6, 1, 3], [8, 10, 7], [1, 3, 7]]), columns[[Number, Name, Name, ], [col 1, col 2, co…...

编程日记 2024/2/11 2:24:05

如何为Kafka加上账号密码（一）

Kafka认证基本概念一直以来，我们公司内网的Kafka集群都是在裸奔，只要知道端口号，任何人都能连上集群操作一番。直到有个主题莫名消失，才引起我们的警觉，是时候该考虑为它添加一套认证策略了。认证和授权就是一对孪生…...

编程日记 2024/2/11 2:11:55

Elasticsearch的Index Lifecycle Management（ILM）

Elasticsearch的Index Lifecycle Management（ILM）功能提供了一种自动化管理索引生命周期的方式。ILM使得用户可以基于特定的条件（如索引的年龄、大小等）来自动执行如回滚、删除等操作，进而优化存储和提高查询性能。ILM…...

编程日记 2024/2/11 2:09:53

2、学习 Nacos 注册中心

学习 Nacos 注册中心一、使用Nacos作为注册中心1、父pom.xml文件配置SpringCloudAlibaba的dependency-management依赖2、在微服务中添加Nacos客户端依赖3、配置Nacos服务地址二、服务的分级存储模型1、配置实例的集群属性2、权重配置三、命名空间一、使用Nacos作为注册中心…...

编程日记 2024/2/11 2:07:51

Java 如何操作 nginx 服务器上的文件？

随着Java技术的不断发展，越来越多的开发人员开始使用Java来操作服务器上的文件。其中，如何操作nginx服务器上的文件也是许多Java开发人员所关注的重点之一。本文将介绍Java操作nginx服务器上文件的基本方法。一、使用Java的File类 Java的File类可以用…...

编程日记 2024/2/11 2:05:49

时序预测 | MATLAB实现基于CNN-GRU-AdaBoost卷积门控循环单元结合AdaBoost时间序列预测

时序预测 | MATLAB实现基于CNN-GRU-AdaBoost卷积门控循环单元结合AdaBoost时间序列预测目录时序预测 | MATLAB实现基于CNN-GRU-AdaBoost卷积门控循环单元结合AdaBoost时间序列预测预测效果基本介绍模型描述程序设计参考资料预测效果基本介绍 1.MATLAB实现基于CNN-GRU-AdaBo…...

编程日记 2024/2/11 2:04:47

装饰模式（Decorator Pattern）重构java邮件发奖系统实战

前言现在我们有个如下的需求，设计一个邮件发奖的小系统， 需求 1.数据验证 → 2. 敏感信息加密 → 3. 日志记录 → 4. 实际发送邮件装饰器模式（Decorator Pattern）允许向一个现有的对象添加新的功能，同时又不改变其…...

编程新知 2026/2/8 4:37:00

突破不可导策略的训练难题：零阶优化与强化学习的深度嵌合

强化学习（Reinforcement Learning, RL）是工业领域智能控制的重要方法。它的基本原理是将最优控制问题建模为马尔可夫决策过程，然后使用强化学习的Actor-Critic机制（中文译作“知行互动”机制），逐步迭代求解…...

编程新知 2026/2/5 4:17:42

React Native 开发环境搭建（全平台详解）

React Native 开发环境搭建（全平台详解） 在开始使用 React Native 开发移动应用之前，正确设置开发环境是至关重要的一步。本文将为你提供一份全面的指南，涵盖 macOS 和 Windows 平台的配置步骤，如何在 Android 和 iOS…...

编程新知 2025/10/7 2:47:54

python/java环境配置

环境变量放一起 python： 1.首先下载Python Python下载地址：Download Python | Python.org downloads ---windows -- 64 2.安装Python 下面两个，然后自定义，全选可以把前4个选上 3.环境配置 1）搜高级系统设置 2…...

编程新知 2026/2/9 15:41:39

leetcodeSQL解题：3564. 季节性销售分析

leetcodeSQL解题：3564. 季节性销售分析题目： 表：sales ---------------------- | Column Name | Type | ---------------------- | sale_id | int | | product_id | int | | sale_date | date | | quantity | int | | price | decimal | -…...

编程新知 2026/2/10 3:44:54

Mobile ALOHA全身模仿学习

一、题目 Mobile ALOHA：通过低成本全身远程操作学习双手移动操作传统模仿学习（Imitation Learning）缺点：聚焦与桌面操作，缺乏通用任务所需的移动性和灵活性本论文优点：（1）在ALOHA…...

编程新知 2026/1/27 14:18:20

Unsafe Fileupload篇补充-木马的详细教程与木马分享（中国蚁剑方式）

在之前的皮卡丘靶场第九期Unsafe Fileupload篇中我们学习了木马的原理并且学了一个简单的木马文件本期内容是为了更好的为大家解释木马（服务器方面的）的原理，连接，以及各种木马及连接工具的分享文件木马：https://w…...

编程新知 2026/1/25 10:13:29

技术栈RabbitMq的介绍和使用

目录 1. 什么是消息队列？2. 消息队列的优点3. RabbitMQ 消息队列概述4. RabbitMQ 安装5. Exchange 四种类型5.1 direct 精准匹配5.2 fanout 广播5.3 topic 正则匹配 6. RabbitMQ 队列模式6.1 简单队列模式6.2 工作队列模式6.3 发布/订阅模式6.4 路由模式6.5 主题模式…...

编程新知 2026/2/10 6:20:58

Webpack性能优化：构建速度与体积优化策略

一、构建速度优化 1、升级Webpack和Node.js 优化效果：Webpack 4比Webpack 3构建时间降低60%-98%。原因： V8引擎优化（for of替代forEach、Map/Set替代Object）。默认使用更快的md4哈希算法。AST直接从Loa…...

编程新知 2025/12/26 15:05:09

[ACTF2020 新生赛]Include 1(php://filter伪协议)

题目做法启动靶机，点进去点进去查看URL，有 ?fileflag.php说明存在文件包含，原理是php://filter 协议当它与包含函数结合时，php://filter流会被当作php文件执行。用php://filter加编码，能让PHP把文件内容…...

编程新知 2026/1/30 2:28:32

1. 隐马尔可夫模型

2. 马尔可夫随机场

3. 条件随机场

相关文章：