运筹说 第134期 | 矩阵对策的解法
上一期我们了解了矩阵对策的基本理论,包含矩阵对策的纯策略、矩阵对策的混合策略和矩阵对策的基本定理。
接下来小编将为大家介绍矩阵对策的解法,包括图解法、方程组法和线性规划法三种经典方法。

01 图解法
本节首先介绍矩阵对策的图解法,在学习矩阵对策的基本理论时,我们掌握了如何构造线性规划问题来解决矩阵对策的混合策略问题,相应地,可以将求解线性规划问题的图解法迁移到矩阵对策的求解之中。
图解法是通过图示局中人的期望收益,寻找期望收益的最小或最大,最后求出纳什均衡的方法,其思想是最大最小定理6的图形应用。这种方法不仅为赢得矩阵为2×n 或m×2阶的对策问题提供了一个简单直观的解法,而且通过这种方法可以使我们从几何上理解对策论的思想,总结如下:
图解法的适用范围为
(1)赢得矩阵为2×n 或m×2阶的对策问题
(2)混合策略(至少有一人策略只为2个策略)
图解法的决策原则为在最不利的情形下选择最有利的策略。
局中人1的最有利策略表示为:

局中人2的最有利策略表示为:

定理六
设(x*,y*)是矩阵对策G的解,v=VG则根据互补松弛性,有
(1)xi*>0,则![]()
(2)若yj*>0,则![]()
(3)若
,则xi*=0
(4)若
,则yj*=0
结合第132期学过的定理6,通过两个例题来详细说明如何使用图解法进行求解。
例题展示
例1:用图解法求解矩阵对策G={S1,S2;A},其中

解:设局中人I的混合策略为(x,1-x)T,x∈[0,1]。如下图所示,过数轴上坐标为0和1的两点分别作两条垂线I-I和II-II。垂线上的纵坐标分别表示局中人I采取纯策略α1和α2时,局中人II采取各纯策略时的赢得值。

当局中人I选择每一策略(x,1-x)T后,他的最少可能的收入为由β1,β2,β3所确定的3条直线在x处的纵坐标中之最小者决定。所以,对局中人I来说,他的最优选择是确定x,使3个纵坐标中的最小者尽可能的大。从图上来看,就是使得x=OA,这时,B点的纵坐标即为对策的值。为求x和对策的值VG,可联立过B点的两条由β2和β3确定的直线的方程:

解得x=3/11,VG=49/11。所以,局中人I的最优策略为x*=(3/11,8/11)T。从图上还可看出,局中人II的最优混合策略只由β2和β3组成。
事实上,若设y*=(y1*,y2*,y3*)T为局中人II的最优混合策略,则由

(注:此处“1” 并不是一个数字,而是局中人 II 所有可选策略的集合的代表。 它的作用是确保局中人 II 在任何策略组合下,局中人 I 在最优策略下的收益都不会被破坏。 这符合极小极大原理,确保了均衡点的收益计算是对所有可能策略均成立的)
根据定理6,必有y1*=0。又因x1*=3/11>0,x2*=8/11>0,再根据定理6,可由

求得y2*=9/11,y3*=2/11。所以,局中人II的最优混合策略为y*=[0,9/11,2/11]T。
例题展示
例2:用图解法求解矩阵对策G={S1,S2;A},其中

解:设局中人II的混合策略为(y,1-y)T,y∈[0,1]。由下图可知,对任一y∈[0,1],直线α1,α2,α3的纵坐标是局中人II采取混合策略(y,1-y)T时的支付。

根据从最不利当中选择最有利的原则,局中人II的最优策略就是确定y,使得三个纵坐标中的最大者尽可能的小,从图上看,就是要选择y,使得A1≤y≤A2,这时,对策的值为6。由方程组

解A1=1/5,A2=4/9,故局中人II的最优混合策略是y*=(y,1-y)T,其中1/5≤y≤4/9,局中人I的最优策略显然只能是(0,1,0)T,即取纯策略α2。
02 方程组法
方程组法主要是通过构造并化简求解的方法来解决矩阵对策问题,由定理4(见132期)可知,求矩阵对策解(x*,y*)的问题等价于求解如下两个不等式组1和不等式组2;
不等式组1:

不等式组2:

又由定理5(见132期)和定理6可知,如果最优策略中的xi*和yj*均不为零,则可将上述两不等式组的求解问题转化为下面的两个方程组的求解问题。
方程组1:

方程组2:

(1)如果上述方程组1和方程组2存在非负解x*和y*,便求得了对策的一个解;
(2)如果这两个方程不存在非负解,可视具体情况,将上式中的某些等式改成不等式,继续尝试求解,直至求得对策的解。(注意,这种情况可用线性规划法进行求解)。
例题展示
例3:A、B玩游戏:有3张牌,分别为高、中、低,由A任抽一张,由B猜。
B只能猜高或低,若所抽牌恰好是高或低,B猜对,A输3元,否则B输2元。
若A所抽牌为中,则当B猜低时,B赢2元,猜高时,由A再从剩下的两张牌中任抽一张让B猜,若B猜对时,B赢1元,猜错时B输3元。
将此问题归结成对策问题,列出A的赢得矩阵,并求出各自的最优解和对策值。
解:A有4个策略:①抽高;②抽中,需再次抽牌时抽高;③抽中,需再次抽牌时抽低;④抽低。
B有3个策略:①猜高,需再次猜时猜高;②猜高,再次猜时猜低;③猜低。
列出对A的赢得矩阵如下表所示

事先假定均不为零,列出方程


解得x*=(1/2,0,0,1/2),y*=(1/4,1/4,1/2),v=-1/2
方程组法由于事先假定xi*和yj*均不为零,故当最优策略的某些分量实际为零时,方程组1和方程组2可能无解,因此,这种方法在实际应用中有一定的局限性。但对于2×2的矩阵,当局中人I的赢得矩阵

不存在鞍点时,容易证明:各局中人的最优混合策略中的xi*和yj*均大于零。于是,由定理6,得到下述方程组


一定有严格的非负解(也就是两个局中人的最优策略):





通过上述推理,我们可以得到求解矩阵对策的公式,针对一些2×2的矩阵对策问题可以直接套用公式进行快速求解。
面对矩阵对策题目,首先要判断是否有纯策略意义下的最优解,其次是要根据优超原则去化简。(优超原则是指在矩阵对策中,若某策略在所有情况下收益都不低于另一策略,即矩阵A中第i 行元素均不小于第j 行对应元素,则称局中人II的纯策略αi超优于αj,则可删除被优超的策略以简化分析。)
例题展示
例4:用图解法求解矩阵对策G={S1,S2;A},其中

解:首先可利用矩阵对策的优超原则对矩阵A进行化简。为此,应用优超原则依次简化得到矩阵A1,A2和A3:



易知A3没有鞍点,由定理6,可以求出两个方程组


非负解为:

于是,以矩阵A为赢得矩阵的对策的一个解就是

03 线性规划法
上面学习了两个特殊的求解方法,下面我们一起来学习一个具有一般性的求解矩阵对策的方法——线性规划法,用这种方法可以求解任一矩阵对策。
由定理5可知,求解矩阵对策可等价地转化为求解互为对偶的线性规划问题(P)和(D),(P)和(D)表示如下:


又由定理7可以假设
,此处我们做归一化处理,将(P)和(D)进一步简化,将原问题中的策略变量xi 和yj 缩放到与对策值w和v无关的比例,使新变量 xi′ 和yj' 满足线性规划的标准形式,变为新的问题 (P′)和 (D′)。

根据上式,对原问题(P)和(D)约束两边同时除以w和v(w>0,v>0),则问题(P)和(D)等价于线性规划问题(P')和(D'):


(P')和(D')是互为对偶的线性规划,这样就可以利用单纯形法或对偶单纯形方法求解,由最优混合策略下w=v=VG的结论,得原对策问题的值为

对策的解为
![]()
求解步骤可总结如下:
(1)确定问题无鞍点,是混合策略;
(2)为了使
,基于定理7构造,A+T→A'(≥0);
(3)由A'构造(P')和(D');
(4)求解(D'),得
,由互补松弛定理求解(P'),得![]()
(5)求原对策问题的解和值。
下面通过例5来进一步实践线性规划求解方法。
例题展示
例5:利用线性规划方法求解下述矩阵对策,其赢得矩阵为

如此,求解问题可化成两个互为对偶的线性规划问题:


将(D)转换为如下标准形式:

我们可以使用单纯性表法来求解这个线性规划问题,最终单纯形表如下表所示:

最后得到上述线性规划的解为



则最优对策的值为

最优对策的解为


以上就是矩阵对策的解法的全部内容了,通过本期学习,大家是否学会了这三种矩阵对策的经典求解方法呢?下一期小编将带大家学习其他类型的对策,敬请关注!
相关文章:
运筹说 第134期 | 矩阵对策的解法
上一期我们了解了矩阵对策的基本理论,包含矩阵对策的纯策略、矩阵对策的混合策略和矩阵对策的基本定理。 接下来小编将为大家介绍矩阵对策的解法,包括图解法、方程组法和线性规划法三种经典方法。 01 图解法 本节首先介绍矩阵对策的图解法,…...
3. 轴指令(omron 机器自动化控制器)——>MC_CamOut
机器自动化控制器——第三章 轴指令 15 MC_CamOut变量▶输入变量▶输出变量▶输入输出变量 功能说明▶时序图▶指令的中止▶重启运动指令▶多重启动运动指令▶异常 MC_CamOut 结束通过输入参数指定的轴的凸轮动作 指令名称FB/FUN图形表现ST表现MC_CamOut解除凸轮动作FBMC_Cam…...
TF32 与 FP32 的区别
TF32(Tensor Float 32)与FP32(单精度浮点数)是两种用于深度学习和高性能计算的浮点格式,其核心区别体现在精度、性能优化和应用场景上。以下是两者的详细对比分析: 一、位宽与结构差异 FP32的位宽结构 FP32…...
【大模型】视觉语言模型:Qwen2.5-VL的使用
官方github地址:https://github.com/QwenLM/Qwen2.5-VL 目录 Qwen家族的最新成员:Qwen2.5-VL 主要增强功能 模型架构更新 快速开始 使用Transformers聊天 Docker Qwen家族的最新成员:Qwen2.5-VL 主要增强功能 强大的文档解析功能&am…...
Web前端之UniApp、Taro、ReactNative和Flutter的区别
MENU 前言介绍及公司技术差异使用方法使用场景差异注意事项打包与部署差异框架应用实例结语 前言 在移动应用开发领域,跨平台框架已成为开发者的得力工具。UniApp、Taro、ReactNative和Flutter它们在Android(安卓)或iOS(苹果&…...
测试用例与需求脱节的修复方案
测试用例与需求脱节的问题可通过明确需求定义、加强需求追踪、建立有效沟通机制进行修复。其中,加强需求追踪尤为关键,能确保测试用例与实际需求的精确匹配,避免资源浪费和测试效果不佳。据行业研究,约70%的软件缺陷源于需求管理不…...
【Unity】 鼠标拖动物体移动速度跟不上鼠标,会掉落
错误示范: 一开始把移动的代码写到update里去了,发现物体老是掉(总之移动非常不流畅,体验感很差) void Update(){Ray ray Camera.main.ScreenPointToRay(Input.mousePosition);if (Physics.Raycast(ray, out RaycastHit hit, M…...
Ollama及HuggingFace路径环境变量设置
日常经常用到这俩的一些环境变量,特记录下来,如有错误,还请指正。 1. Ollama路径环境变量设置 Ollama 模型路径变量名为OLLAMA_MODELS,设置示例: 变量名示例OLLAMA_MODELS C:\Users\Administrator\.ollama\models D…...
VLAN 高级特性
VLAN Access 类型端口:只能属于 1 个 VLAN,发出数据时只能根据 PVID 剥离一个 VLAN Tag 入方向:针对没有 tag 的数据包打上 PVID 的 tag出方向:将 tag 为本接口 PVID 的数据包去掉 tag,发出数据。(只有在与…...
学习中学习的小tips(主要是学习苍穹外卖的一些学习)
目录 架构的细分 使用实体类来接收配置文件中的值 webMvcConfig类: jwt令牌 管理端的拦截器: JwtProperties: JwtTokenAdminInterceptor : 对密码加密操作 Redis: 分页查询 整体思想 为什么动态 SQL 推荐传实体…...
【极速版 -- 大模型入门到进阶】LORA:大模型轻量级微调
文章目录 🌊 有没有低成本的方法微调大模型?🌊 LoRA 的核心思想🌊 LoRA 的初始化和 r r r 的值设定🌊 LoRA 实战:LoraConfig参数详解 论文指路:LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE M…...
3d pose 指标和数据集
目录 3D姿态估计、3维重建指标: 数据集 EHF数据集 SMPL-X 3D姿态估计、3维重建指标: MVE、PMVE 和 p-MPJPE 都是用于评估3D姿态估计、三维重建等任务中预测结果与真实数据之间误差的指标。 MVE (Mean Vertex Error):是指模型重建过程中每个顶点的预测位置与真实位置之间…...
gogs私服详细配置
一.永久挂载方法 通过 /etc/fstab 实现绑定挂载(推荐) 绑定挂载(Bind Mount)允许将一个目录挂载到另一个目录,类似于软链接但更底层。 例如:将 /mnt/data 绑定到 /var/www/html,使两者内容同…...
1688商品详情接口:深度解析与应用实践
在电商领域,1688作为中国领先的B2B平台,拥有海量的商品信息。对于开发者、商家和数据分析师来说,获取1688商品的详细信息是实现数据分析、竞品研究、自动化管理和精准营销的重要手段。本文将详细介绍1688商品详情接口的使用方法、技术细节以及…...
线程同步——读写锁
Linux——线程同步 读写锁 目录 一、基本概念 1.1 读写锁的基本概念 1.2 读写锁的优点 1.3 读写锁的实现 1.4 代码实现 一、基本概念 线程同步中的读写锁(Read-Write Lock),也常被称为共享-独占锁(Shared-Exclusive Lock&a…...
邪性!Anaconda安装避坑细节Windows11
#工作记录 最近不断重置系统和重装Anaconda,配置的要累死,经几十次意料之外的配置状况打击之后,最后发现是要在在Anaconda安装时,一定要选“仅为我安装”这个选项,而不要选“为所有用户安装”这个选项。 选“仅为我安…...
【大模型】激活函数之SwiGLU详解
文章目录 1. Swish基本定义主要特点代码实现 2. GLU (Gated Linear Unit)基本定义主要特点代码实现 3. SwiGLU基本定义主要特点代码实现 参考资料 SWiGLU是大模型常用的激活函数,是2020年谷歌提出的激活函数,它结合了Swish和GLU两者的特点。SwiGLU激活函…...
AOA与TOA混合定位,MATLAB例程,三维空间下的运动轨迹,滤波使用EKF,附下载链接
本文介绍一个MATLAB代码,实现基于 到达角(AOA) 和 到达时间(TOA) 的混合定位算法,结合 扩展卡尔曼滤波(EKF) 对三维运动目标的轨迹进行滤波优化。代码通过模拟动态目标与基站网络&am…...
【动态编译】Roslyn中 SyntaxKind 枚举类型
在 Roslyn(.NET 的编译器平台)中,SyntaxKind 是一个枚举类型,定义了 C# 语言中所有可能的语法节点类型。它是 Roslyn 抽象语法树(AST)的基础,用于标识每个 SyntaxNode 的具体种类。SyntaxKind 的…...
getID3获取本地或远程视频时长
音频文件也可使用,使用ffmeg安装太复杂了 附ffmpeg方式:centos下安装ffmpeg_yum安装ffmpeg-CSDN博客 使用composer先安装 composer require james-heinrich/getid3 获取本地视频 //获取本地视频$video_path $_SERVER[DOCUMENT_ROOT].$params[video];…...
【211】线上教学系统
--基于SSM线上教学平添 主要实现的功能有: 管理员 : 首页、个人中心、学员管理、资料类型管理、学习资料管理、交流论坛、我的收藏管理、试卷管理、留言板管理、试题管理、系统管理、考试管理。 学员 : 首页、个人中心、我的收藏管理、留言板管理、考试管理。 前台…...
从混乱思绪到清晰表达:记录想法如何改变你的学习人生
关键要点 • 记录想法似乎是发现自己想法并将其组织成可传播形式的最佳理由,研究表明写作和教学能增强学习和理解。 • 证据倾向于支持写作有助于澄清思想,而教学通过“教授效应”深化知识。 • 教学和分享被认为是最有效的学习方法,这与记录…...
uvm sequence
UVM Sequence 是验证环境中生成和控制事务(Transaction)流的核心机制,它通过动态生成、随机化和调度事务,实现灵活多样的测试场景。以下是Sequence的详细解析: Sequence 的核心作用 事务流生成:通过 uvm_s…...
CMake ERROR: arm-none-eabi-gcc is not able to compile a simple test program.
用 cmake 构建 STM32 工程问题【已解决】 环境信息 os: ubuntu22.04gcc: arm-none-eabi-gcc (Arm GNU Toolchain 13.2.rel1 (Build arm-13.7)) 13.2.1 20231009cmake: cmake version 3.22.1ninja: 1.10.1 问题 log [main] 正在配置项目: Olidy [driver] 删除 /home/pomegr…...
地图项目入手学习
如果你目前对自己的地图项目实现原理不太了解,周末可以通过以下方法进行高效学习: ⸻ 第一步:梳理项目相关代码(3 小时) 目标:先大致了解你的地图项目代码,找到核心实现逻辑。 具体做法&…...
电机控制常见面试问题(二十)
文章目录 一.整流电路绕组接法二.电机为什么需要转速器三.电机转矩产生原理四.电机控制中载波频率大小的确定五.开关周期 Tpwm 一.整流电路绕组接法 为了引出直流的输出,一定要在整流变压器的二次侧引出零线,所以二次侧绕组必须接成星形 一次绕组必须要…...
小爱控制via电视浏览器搜索图片-Homeassistant重制上一个自动化
制作自动化详情 为了完成图片搜,暂定指令找找{描述} 在执行脚本的adb地方输入以下指令,百度 因安全不让在图片地址直接搜转用bing >- >am start -n mark.via.gp/mark.via.Shell -a android.intent.action.VIEW -d https://cn.bing.com/images/…...
unity一个图片的物体,会有透明的效果
如图 想要去掉这个透明效果 选择一个高层级的layer即可。...
docker网桥问题导致ldap组件安装失败分析解决
使用pass_install_x86_64_0124版部署k8s底座、kem; 问题:一台kem节点部署ldap组件失败 解决:恢复问题主机的docker0网卡,重新部署kem相关组件 二、问题详情 现象描述 ansible部署kem组件 TASK [kem : start ldap] **********…...
面试的时候问到了HTML5的新特性有哪些
HTML5 是对 HTML 的重要更新,它引入了许多新特性和改进,使 Web 开发变得更加灵活和强大。以下是一些 HTML5 的关键新特性: 1. 新的文档结构元素 HTML5 引入了一些新的语义化元素,帮助开发者更清晰地结构化网页内容,改…...
