博弈论中的均衡精炼:完美贝叶斯均衡、序贯均衡与颤抖手均衡详解
博弈论中的均衡精炼:完美贝叶斯均衡、序贯均衡与颤抖手均衡详解
1. 引言:为什么需要均衡精炼?
在博弈论中,纳什均衡是分析策略互动的核心工具,但其存在一个显著缺陷:无法排除不合理的均衡。例如,某些均衡依赖于“不可置信的威胁”(incredible threats)。为此,学者提出了均衡精炼(Equilibrium Refinements)的概念,旨在通过附加约束条件筛选出更合理的均衡。本章将重点探讨三种经典精炼方法:完美贝叶斯均衡(PBE)、序贯均衡(Sequential Equilibrium)和颤抖手均衡(Trembling Hand Perfect Equilibrium),并结合公式与案例分析其应用。
2. 完美贝叶斯均衡(PBE)
2.1 定义与公式
完美贝叶斯均衡适用于多阶段不完全信息博弈,要求玩家在每一个信息集上的策略是最优的,且信念通过贝叶斯规则更新。其核心公式包括:
- 策略最优性:
对于玩家 i i i,在信息集 h h h 上的策略 σ i \sigma_i σi 满足:
σ i ( h ) ∈ arg max a i E μ ( ⋅ ∣ h ) [ u i ( a i , a − i ) ∣ h ] \sigma_i(h) \in \arg\max_{a_i} \mathbb{E}_{\mu(\cdot|h)}[u_i(a_i, a_{-i}) | h] σi(h)∈argaimaxEμ(⋅∣h)[ui(ai,a−i)∣h] - 贝叶斯更新:
信念 μ ( θ ∣ h ) \mu(\theta|h) μ(θ∣h) 表示在信息集 h h h 上对类型 θ \theta θ 的后验概率,更新公式为:
μ ( h ) ( θ ) = P ( θ ) ⋅ σ ( θ ) ( h ) ∑ θ ′ P ( θ ′ ) ⋅ σ ( θ ′ ) ( h ) \mu(h)(\theta) = \frac{P(\theta) \cdot \sigma(\theta)(h)}{\sum_{\theta'} P(\theta') \cdot \sigma(\theta')(h)} μ(h)(θ)=∑θ′P(θ′)⋅σ(θ′)(h)P(θ)⋅σ(θ)(h) 其中 P ( θ ) P(\theta) P(θ) 是先验概率, σ ( θ ) ( h ) \sigma(\theta)(h) σ(θ)(h) 是类型 θ \theta θ 选择路径 h h h 的概率。
2.2 案例分析:劳动力市场信号博弈
场景:
- 员工有两种类型:高能力( θ H \theta_H θH)和低能力( θ L \theta_L θL),先验概率分别为 P ( θ H ) = 0.2 P(\theta_H)=0.2 P(θH)=0.2 和 P ( θ L ) = 0.8 P(\theta_L)=0.8 P(θL)=0.8。
- 员工通过选择教育水平 e e e 发送信号,成本为 c ( θ , e ) c(\theta, e) c(θ,e)(高能力者成本更低)。
- 雇主根据 e e e 推断员工类型,并给出工资 w ( e ) w(e) w(e)。
PBE 求解:
- 高能力员工选择 e H e_H eH,低能力选择 e L e_L eL,满足分离均衡条件:
w ( e H ) − c ( θ H , e H ) > w ( e L ) − c ( θ H , e L ) w ( e L ) − c ( θ L , e L ) > w ( e H ) − c ( θ L , e H ) w(e_H) - c(\theta_H, e_H) > w(e_L) - c(\theta_H, e_L) \\ w(e_L) - c(\theta_L, e_L) > w(e_H) - c(\theta_L, e_H) w(eH)−c(θH,eH)>w(eL)−c(θH,eL)w(eL)−c(θL,eL)>w(eH)−c(θL,eH)2. 雇主根据观测到的 e e e 更新信念,并支付与边际产出匹配的工资。
3. 序贯均衡(Sequential Equilibrium)
3.1 定义与公式
序贯均衡比PBE更严格,要求策略和信念序列 { ( σ k , μ k ) } \{(\sigma^k, \mu^k)\} {(σk,μk)} 满足:
- 一致性:存在完全混合策略序列 σ k → σ \sigma^k \to \sigma σk→σ,且信念 μ k \mu^k μk 由贝叶斯规则生成。
- 序贯理性:在每一个信息集上,策略是最优的。
数学上,一致性条件可表示为:
lim k → ∞ ( σ k , μ k ) = ( σ , μ ) \lim_{k \to \infty} (\sigma^k, \mu^k) = (\sigma, \mu) k→∞lim(σk,μk)=(σ,μ)且对于所有信息集 h h h, μ k ( h ) \mu^k(h) μk(h) 必须与 σ k \sigma^k σk 兼容。
3.2 案例分析:连锁店博弈
场景:
- 在位者(Incumbent)在多个市场运营,潜在进入者(Entrant)决定是否进入某一市场。
- 在位者可能通过“掠夺性定价”威胁阻止进入。
序贯均衡分析:
- 若进入者认为在位者会强硬反击(即使短期亏损),则选择不进入。
- 一致性要求:即使反击概率极低,信念也需通过完全混合策略的极限得到支持(例如在位者偶尔“失误”表现出强硬)。
4. 颤抖手均衡(Trembling Hand Perfect Equilibrium)
4.1 定义与公式
颤抖手均衡要求策略对微小扰动(玩家以概率 ϵ \epsilon ϵ 随机犯错)具有稳健性。其核心思想是:
- 每个策略必须是极限点,当其他玩家以 ϵ → 0 \epsilon \to 0 ϵ→0 的概率颤抖时,该策略仍为最优。
数学表达为:
σ i ∈ arg max σ i ′ E σ − i ϵ [ u i ( σ i ′ , σ − i ϵ ) ] \sigma_i \in \arg\max_{\sigma_i'} \mathbb{E}_{\sigma_{-i}^\epsilon}[u_i(\sigma_i', \sigma_{-i}^\epsilon)] σi∈argσi′maxEσ−iϵ[ui(σi′,σ−iϵ)]其中 σ − i ϵ = ( 1 − ϵ ) σ − i + ϵ ⋅ 均匀分布 \sigma_{-i}^\epsilon = (1-\epsilon)\sigma_{-i} + \epsilon \cdot \text{均匀分布} σ−iϵ=(1−ϵ)σ−i+ϵ⋅均匀分布。
4.2 案例分析:协调博弈
场景:
- 两个玩家选择“左”或“右”,若一致则各得1,否则得0。
- 纳什均衡为(左,左)和(右,右),但后者可能因颤抖手失效。
颤抖手检验:
- 假设玩家1以 ϵ \epsilon ϵ 概率选“右”,玩家2的最优反应是选“右”。
- 当 ϵ → 0 \epsilon \to 0 ϵ→0 时,(右,右)是颤抖手均衡,而(左,左)可能因信念不一致被排除。
5. 综合比较与应用
| 均衡类型 | 核心要求 | 适用场景 |
|---|---|---|
| 完美贝叶斯均衡 | 贝叶斯更新 + 子博弈完美 | 多阶段不完全信息博弈 |
| 序贯均衡 | 一致性 + 序贯理性 | 复杂动态博弈 |
| 颤抖手均衡 | 策略对微小扰动稳健 | 排除非稳健纳什均衡 |
应用场景:
- PBE:信号博弈、拍卖设计。
- 序贯均衡:重复博弈中的声誉机制。
- 颤抖手均衡:机制设计中的稳定性验证。
6. 结论
均衡精炼通过附加理性约束,显著提升了博弈分析的精确性。完美贝叶斯均衡、序贯均衡和颤抖手均衡分别从信念更新、一致性和稳健性角度排除了不合理的纳什均衡。在实际应用中(如拍卖设计或市场竞争策略),需根据信息结构和动态特性选择合适的精炼方法。
参考文献:
朱·弗登博格, 让·梯若尔. 博弈论[M]. 北京: 中国人民大学出版社, 2010.
相关文章:
博弈论中的均衡精炼:完美贝叶斯均衡、序贯均衡与颤抖手均衡详解
博弈论中的均衡精炼:完美贝叶斯均衡、序贯均衡与颤抖手均衡详解 1. 引言:为什么需要均衡精炼? 在博弈论中,纳什均衡是分析策略互动的核心工具,但其存在一个显著缺陷:无法排除不合理的均衡。例如࿰…...
在线教育网站项目第四步:deepseek骗我, WSL2不能创建两个独立的Ubuntu,但我们能实现实例互访及外部访问
一、说明 上一章折腾了半天,搞出不少问题,今天我们在deepseek的帮助下,完成多个独立ubuntu24.04实例的安装,并完成固定ip,实践证明,deepseek不靠谱,浪费我2个小时时间,我们将在下面实…...
在刀刃上发力:如何精准把握计划关键节点
关键路径分析是项目管理中的一种重要方法,它通过在甘特图中识别出项目中最长、最关键的路径,来确定项目的最短完成时间。 关键路径上的任务都是项目成功的关键因素,任何延误都可能导致整个项目的延期。关键路径分析对于项目管理者来说至关重要…...
组合总和||
1.给定一个数组 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合。 candidates 中的每个数字在每个组合中只能使用一次。 #include <bits/stdc.h> using namespace std; vector<vector<int>> result; vec…...
OpenCV图像拼接(2)基于羽化(feathering)技术的图像融合算法拼接类cv::detail::FeatherBlender
操作系统:ubuntu22.04 OpenCV版本:OpenCV4.9 IDE:Visual Studio Code 编程语言:C11 算法描述 cv::detail::FeatherBlender 是 OpenCV 中用于图像拼接的一个类,它属于 stitching 模块的一部分。这个类实现了基于羽化(…...
MediaPipe软件包如何构建和安装
MediaPipe 是一个由 Google 开发的多媒体机器学习框架,支持多种平台(如 Android、iOS、桌面等)。以下是构建和安装 MediaPipe 的步骤: 1. 环境准备 确保系统满足以下要求: 操作系统: Ubuntu (推荐 18.04 或 20.04)、…...
分享下web3j 常见用法
转账 fun sendEthTransaction(privateKey: String,toAddress: String,amount: BigDecimal) {//chainIdval chainId:Long 1//url 可以从https://chainlist.org/里面获取可用节点//eth转账,bnb同理,但需发送到bnb对应节点val url "https://xxx"…...
连接chatgpt的桌面语音助手
要创建一个连接到 ChatGPT 的桌面语音助手,可以使用 Python 编写一个程序来实现语音识别、与 ChatGPT API 交互以及语音合成的功能。以下是一个完整的解决方案和技术实现步骤: 所需工具和库 语音识别 使用 speech_recognition 库捕获用户的语音输入。需要…...
systemctl restart 和 systemctl reload 和 systemctl daemon-reload 对比 笔记250322
systemctl restart 和 systemctl reload 和 systemctl daemon-reload 对比 以下是 systemctl restart、systemctl reload 和 systemctl daemon-reload 的对比总结: 命令作用对象行为适用场景对服务的影响systemctl restart 服务名具体服务强制停止服务,…...
DeepSeek 助力 Vue3 开发:打造丝滑的表格(Table)之添加导出数据功能示例9,TableView15_09带排序的导出表格示例
前言:哈喽,大家好,今天给大家分享一篇文章!并提供具体代码帮助大家深入理解,彻底掌握!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 💕 目录 Deep…...
spring boot 登入权限RBAC模式
首先准备好5张表 user_info表,用户的信息表 role表,角色表(比如超级管理员、管理员、审核员、采购......) 创建user_role表,user_info表,role表的中间表 注意了,role_id和user_id是 u…...
调用API拿到的值——存储方式
1.响应结果示例: "purposeTagList":["稳中向好及进中提质"] 2.数据库中定义的 3.值的获取: F1 JsonNode purposeTagListNode dataNode.path("purposeTagList");if (purposeTagListNode.isArray()) {StringBuilder purp…...
【用 Trace读源码】PlanAgent 执行流程
前提条件 在 Trae 中打开 OpenManus 工程,使用 build 模式,模型选择 claude-sonnet-3.7 提示词 分析 agent/planning.py 中 main 方法及相关类的执行流程,以流程图的方式展示PlanningAgent 执行流程图 以下流程图展示了 PlanningAgent 类…...
第一讲 | 解锁C++编程能力:基础语法解析
C入门基础 一、C的第一个程序二、命名空间三、C输入&输出四、缺省参数/默认参数五、函数重载六、引用1.引用的特性2.引用的使用引用做返回值场景 3.const引用只有指针和引用涉及权限放大、缩小的问题,普通变量没有 4.指针和引用的关系 七、inline八、nullptr 一…...
LeetCode 热题 100_划分字母区间(80_763_中等_C++)(贪心算法(求并集))
LeetCode 热题 100_划分字母区间(80_763) 题目描述:输入输出样例:题解:解题思路:思路一(贪心算法(求交集)): 代码实现代码实现(思路一(贪心算法(求…...
C++ --- 多态
1 多态的概念 多态(polymorphism)的概念:通俗来说,就是多种形态。多态分为编译时多态(静态多态)和运⾏时多 态(动态多态),这⾥我们重点讲运⾏时多态,编译时多态(静态多态)和运⾏时多态(动态多态)。编译时 多态(静态多态)主要就是我…...
HAL库中使用空闲中断+DMA接收数据,接收失败的问题
问题: 串口屏与单片机通过串口(USART1)进行通信,调试时发现问题,现象如下: 手动页面的几个文本,输入的数字不会显示出来,比如初始值为0,输入200,200会一闪而…...
【STM32实物】基于STM32的扫地机器人/小车控制系统设计
基于STM32的扫地机器人/小车控制系统设计 演示视频: 基于STM32的扫地机器人小车控制系统设计 简介:扫地机器人系统采用分层结构设计,主要包括底层硬件控制层、中间数据处理层和上层用户交互层。底层硬件控制层负责对各个硬件模块进行控制和数据采集,中间数据处理层负责对采…...
【Scrapy】Scrapy教程8——处理子链接
通过前面几篇文章,已经了解了如何去爬取网页内容并存储到数据库,但是目前只是存储了一个页面的内容,现在想要获取每篇文章链接内的文章内容,我们来看看怎么获取。 生成新请求 首先我们肯定要先拿到链接,所以第一步都获取文章标题和链接肯定少不了,然后再爬取获取到到子…...
使用pycel将Excel移植到Python
1.适用需求 有些工作可能长期适用excel来进行公式计算,当需要把工作流程转换为可视化界面时,开发人员不懂专业逻辑,手动摸索公式很大可能出错,而且费时费力 2.可用工具及缺点 pandas 方便进行数据处理,支持各种格…...
学习应用层
应用层概述 客户/服务器方式(C/S)和对等方式(P2P) 动态主机配置协议DHCP 客户/服务器方式 DHCP报文会被封装成为UDP用户数据报,DHCP服务器端口号是UDP67,用户是UDP68。 广播发送,是因为并不知道…...
Doris官网上没有的一些Fe参数了,都在源码中
一、FE配置源码 apache-doris-src\fe\fe-common\src\main\java\org\apache\doris\common\Config.java 二、BE配置源码 apache-doris-src\be\src\common\config.cpp 三、FE源码 package org.apache.doris.common;public class Config extends ConfigBase {ConfField(descri…...
蓝桥杯算法精讲:二分查找实战与变种解析
适合人群:蓝桥杯备考生 | 算法竞赛入门者 | 二分查找进阶学习者 目录 一、二分查找核心要点 1. 算法思想 2. 适用条件 3. 算法模板 二、蓝桥杯真题实战 例题1:分巧克力(蓝桥杯2017省赛) 例题2:砍竹子࿰…...
C++脚本化方案调研
1 什么是脚本化 脚本化(Scripting)是指将脚本语言嵌入到主程序(C等编译型语言)中,通过以下方式扩展程序能力: 动态逻辑控制:通过脚本实现运行时逻辑调整,无需重新编译主程序&#x…...
蓝桥杯(N皇后问题)------回溯法
题目描述 在 NN 的方格棋盘放置了 N 个皇后,使得它们不相互攻击(即任意 2 个皇后不允许处在同一排,同一列,也不允许处在与棋盘边框成 45 角的斜线上。你的任务是,对于给定的 N,求出有多少种合法的放置方法…...
再探C语言(1)
温馨提示: 学C语言就像玩《掘地求升》——你以为懂了语法就能通关? 不!编译器会用铁锤教你做人!(╯‵□′)╯︵┻━┻ 🐱Part 1:sizeofの跨平台迷惑行为 Q1. 不同环境下sizeof(int)的结果 运行环境结果&a…...
高项第十三章——项目资源管理
什么是资源管理?项目资源管理包括识别、获取和管理所需资源以成功完成项目的各个过程。 本过程关注两类资源:实物资源包括设备、材料、设施和基础设施 团队资源或人员指的是团队的人力资源 13_1 项目资源管理基础 项目团队是执行项目工作,…...
C/C++转换为字符串宏和字符串拼接宏的综合使用
本文内容参考: C/C++ 宏拼接和宏展开为字符串 - DoubleLi - 博客园 特此致谢! 1. 转换为字符串宏与字符串拼接宏 (1)转换为字符串宏 转换为字符串的宏为: #define STR(x) #x //转字符串 (2)字符串拼接宏 字符串拼接的宏为: #define CONCAT(x,y) x##y //拼接 2…...
Linux:xxx is not in the sudoers file. This incident will be reported.
报错 xxx is not in the sudoers file. This incident will be reported.解决方式 切换到root用户下操作 # 1、修改/etc/sudoers文件为可修改,默认是只读的 ls -lh /etc/sudoers -r--r----- 1 root root 4.3K Dec 1 01:45 /etc/sudoerschmod uw /etc/sudoersls…...
掌握新编程语言的秘诀:利用 AI 快速上手 Python、Go、Java 和 Rust
网罗开发 (小红书、快手、视频号同名) 大家好,我是 展菲,目前在上市企业从事人工智能项目研发管理工作,平时热衷于分享各种编程领域的软硬技能知识以及前沿技术,包括iOS、前端、Harmony OS、Java、Python等…...
