当前位置: 首页 > article >正文

从零开始理解博弈论:用Python模拟囚徒困境与智猪博弈

从零开始理解博弈论用Python模拟囚徒困境与智猪博弈博弈论作为一门研究策略互动的学科近年来在经济学、计算机科学甚至日常决策中展现出越来越重要的价值。但对于许多初学者来说纯理论的学习往往让人望而生畏——那些抽象的概念和数学公式总让人感觉隔着一层朦胧的纱。本文将采用一种全新的学习路径通过Python代码实现经典博弈模型让读者在动手实践中直观感受博弈论的核心思想。1. 环境准备与基础概念在开始编码前我们需要搭建Python环境并理解几个关键术语。推荐使用Anaconda创建独立环境conda create -n game_theory python3.8 conda activate game_theory pip install numpy matplotlib博弈论中最基础的三个要素是参与者(Players)做决策的主体可以是个人、企业或国家策略(Strategies)每个参与者可选的行动方案收益(Payoffs)不同策略组合下参与者获得的回报提示在代码实现中我们通常用矩阵表示收益结构行代表一个玩家的策略选择列代表另一个玩家的策略选择。以著名的囚徒困境为例其收益矩阵可以表示为对方合作对方背叛我方合作(-1,-1)(-3,0)我方背叛(0,-3)(-2,-2)这种表示方法称为标准型(Normal Form)是静态博弈(参与者同时行动)的典型表达方式。2. 囚徒困境的Python实现让我们用代码完整实现囚徒困境模型。首先定义收益矩阵import numpy as np # 定义收益矩阵 # 每个单元格格式为 (玩家A收益, 玩家B收益) prisoners_dilemma { (合作, 合作): (-1, -1), (合作, 背叛): (-3, 0), (背叛, 合作): (0, -3), (背叛, 背叛): (-2, -2) }接下来我们实现一个函数来寻找纳什均衡——即在这种策略组合下任何一方单方面改变策略都无法获得更高收益def find_nash_equilibrium(game_matrix): nash_equilibria [] strategies list(set([k[0] for k in game_matrix.keys()])) for s1 in strategies: for s2 in strategies: current_payoff game_matrix[(s1, s2)] is_equilibrium True # 检查玩家1是否有动力单方面改变策略 for alt_s1 in strategies: if alt_s1 ! s1 and game_matrix[(alt_s1, s2)][0] current_payoff[0]: is_equilibrium False break # 检查玩家2是否有动力单方面改变策略 for alt_s2 in strategies: if alt_s2 ! s2 and game_matrix[(s1, alt_s2)][1] current_payoff[1]: is_equilibrium False break if is_equilibrium: nash_equilibria.append((s1, s2)) return nash_equilibria # 寻找囚徒困境的纳什均衡 print(find_nash_equilibrium(prisoners_dilemma)) # 输出[(背叛, 背叛)]这个简单的实现揭示了一个深刻洞见个体理性选择导致了集体非最优结果。虽然双方合作(-1,-1)比相互背叛(-2,-2)更好但背叛却是每个玩家的优势策略。3. 智猪博弈的建模与分析智猪博弈(Pigs Payoff)是另一个经典案例描述了实力不对等参与者之间的策略互动。假设大猪和小猪在猪圈两端按按钮需要消耗2单位能量但会释放10单位食物大猪先到可吃9单位小猪先到吃4单位同时到则大猪7小猪3我们可以用以下收益矩阵表示pigs_game { (按, 按): (5, 1), # 大猪:7-25, 小猪:3-21 (按, 等): (4, 4), # 大猪:6-24, 小猪:4 (等, 按): (9, -1), # 大猪:9, 小猪:4-2-3-1(因为小猪按但大猪先吃) (等, 等): (0, 0) # 没有食物 }运行我们的纳什均衡查找函数print(find_nash_equilibrium(pigs_game)) # 输出[(按, 等)]这个结果揭示了现实世界中常见的现象强者承担更多责任。在代码中我们可以清晰地看到无论大猪选择什么策略小猪选择等总是更有利这迫使大猪不得不选择按。4. 博弈可视化与重复博弈为了更直观地理解这些博弈我们可以用matplotlib进行可视化。以下代码绘制囚徒困境的收益空间import matplotlib.pyplot as plt # 提取所有可能的收益组合 payoffs list(prisoners_dilemma.values()) a_payoffs [p[0] for p in payoffs] b_payoffs [p[1] for p in payoffs] plt.figure(figsize(8, 6)) plt.scatter(a_payoffs, b_payoffs, colorred, s100) plt.xlabel(玩家A收益) plt.ylabel(玩家B收益) plt.title(囚徒困境收益空间) plt.grid(True) # 标注帕累托最优边界 plt.plot([-3, -1], [0, -1], b--, label帕累托边界) plt.legend() plt.show()更有趣的是研究重复博弈——当同一博弈多次进行时策略会如何演化。我们可以模拟著名的以牙还牙(Tit-for-Tat)策略def tit_for_tat(opponent_previous_move): return 合作 if opponent_previous_move is None else opponent_previous_move def simulate_repeated_game(strategy_a, strategy_b, rounds10): history [] a_previous, b_previous None, None for _ in range(rounds): a_move strategy_a(b_previous) b_move strategy_b(a_previous) payoff prisoners_dilemma[(a_move, b_move)] history.append((a_move, b_move, payoff)) a_previous, b_previous a_move, b_move return history # 模拟两个以牙还牙策略玩家对战 results simulate_repeated_game(tit_for_tat, tit_for_tat) for i, (a, b, (pa, pb)) in enumerate(results): print(f回合{i1}: A选择{a}, B选择{b} → A得分{pa}, B得分{pb})这种模拟展示了合作如何在重复互动中自发产生——这是单次囚徒困境中看不到的现象。5. 进阶应用博弈论在AI中的使用现代人工智能系统经常需要处理多智能体互动博弈论提供了重要工具。例如我们可以用博弈论框架实现一个简单的价格竞争模型def duopoly_game(price_a, price_b, market_size100): if price_a price_b: return (market_size * price_a, 0) elif price_a price_b: return (0, market_size * price_b) else: return (market_size/2 * price_a, market_size/2 * price_b) # 寻找纳什均衡 def find_duopoly_equilibrium(max_price10): best_response_a {} best_response_b {} for pb in range(1, max_price1): best_payoff -1 best_price 1 for pa in range(1, max_price1): payoff duopoly_game(pa, pb)[0] if payoff best_payoff: best_payoff payoff best_price pa best_response_a[pb] best_price for pa in range(1, max_price1): best_payoff -1 best_price 1 for pb in range(1, max_price1): payoff duopoly_game(pa, pb)[1] if payoff best_payoff: best_payoff payoff best_price pb best_response_b[pa] best_price # 寻找双方最佳应对相同的点 equilibria [] for p in range(1, max_price1): if best_response_a[p] p and best_response_b[p] p: equilibria.append((p, p)) return equilibria print(find_duopoly_equilibrium()) # 输出[(1, 1)]这个模型预测了伯川德悖论(Bertrand Paradox)在价格竞争中均衡结果是价格降至边际成本(本例中简化为1)。在实际项目中我曾用类似模型分析电商平台的定价策略发现理论预测与真实数据存在有趣偏差——这通常源于产品差异化和用户忠诚度等现实因素。

相关文章:

从零开始理解博弈论:用Python模拟囚徒困境与智猪博弈

从零开始理解博弈论:用Python模拟囚徒困境与智猪博弈 博弈论作为一门研究策略互动的学科,近年来在经济学、计算机科学甚至日常决策中展现出越来越重要的价值。但对于许多初学者来说,纯理论的学习往往让人望而生畏——那些抽象的概念和数学公式…...

实战解析:基于FPGA的数码管动态扫描驱动设计

1. 数码管驱动基础与FPGA优势 第一次接触数码管驱动时,我被它简单直接的显示方式吸引。八段数码管本质上就是八个LED的排列组合,通过控制不同段的亮灭来显示数字和字母。但真正动手实现多位数码管驱动时,才发现事情没那么简单——如果每位数码…...

RTX5内核调度探秘:当你的线程调用osDelay时,CPU到底偷偷去干了啥?

RTX5内核调度探秘:当你的线程调用osDelay时,CPU到底偷偷去干了啥? 在嵌入式实时操作系统中,时间管理是核心功能之一。RTX5作为一款轻量级RTOS,其延时机制的设计直接影响着系统的实时性和稳定性。今天,我们…...

VS2019和虚幻引擎多版本共存?保姆级配置Airsim 1.3.1编译环境(避坑指南)

多版本开发环境下的AirSim编译实战:精准控制VS2019与虚幻引擎工具链 当你的开发机上同时安装了Visual Studio 2015/2017/2019和多个虚幻引擎版本时,编译AirSim 1.3.1就像在雷区跳舞——稍有不慎就会引发连锁错误。这不是简单的版本兼容问题,…...

C语言新手必练:10个高频面试题代码实现(附详细注释)

C语言面试突围:10道必刷题的深度解析与实战 最近帮几位学弟学妹review面试代码时,发现很多人在基础题上翻车——不是写不出实现,而是代码风格和边界处理暴露出新手常见的"学生思维"。本文精选了10道高频出现的C语言面试题&#xf…...

SITS2026独家披露:AI聊天陪伴应用的5层伦理审查机制、7类用户依恋风险预警及实时干预SOP

第一章:SITS2026独家披露:AI聊天陪伴应用的5层伦理审查机制、7类用户依恋风险预警及实时干预SOP 2026奇点智能技术大会(https://ml-summit.org) SITS2026框架首次系统性解耦AI陪伴产品的伦理治理动线,将被动合规升级为主动韧性防护。其核心由…...

基于TR-FRET技术的BCL-xL/VHL PROTAC降解剂在抗肿瘤治疗中的研究

一、BCL-xL靶向治疗面临的挑战BCL-xL是BCL-2家族的重要抗凋亡蛋白,在多种癌细胞中过度表达,是一个具有明确效果的抗肿瘤治疗靶点。然而,BCL-xL也是血小板赖以生存的蛋白,靶向该蛋白的抑制剂往往对血小板产生较大的毒副作用。ABT26…...

知识库响应延迟超800ms?3步精准定位LLM上下文注入瓶颈,72小时内完成低延迟集成

第一章:生成式AI应用知识库集成 2026奇点智能技术大会(https://ml-summit.org) 生成式AI应用与企业知识库的深度集成,正成为构建可解释、可审计、可演进智能系统的核心实践。该集成并非简单地将文档喂给大模型,而是通过语义分块、向量化对齐…...

麒麟V10SP1上装Oracle 11gR2,我踩过的那些依赖包的坑(附离线包下载)

麒麟V10SP1部署Oracle 11gR2的深度避坑指南 在国产操作系统替代浪潮中,麒麟V10SP1作为主流国产Linux发行版,其与Oracle 11gR2的兼容性问题成为许多DBA的痛点。不同于CentOS/RedHat等Oracle官方支持的系统,麒麟系统的软件包版本差异、库文件缺…...

Xray 安全扫描工具详解

介绍 Xray 是由长亭科技推出的免费白帽子工具平台的核心产品,是一款功能强大的安全评估工具,由多名经验丰富的一线安全从业者打造。 🔗 官网: https://xray.cool/ 📦 下载: https://stack.chaitin.com/…...

告别复杂编译!用Docker容器5分钟在Linux上部署KataGo围棋AI引擎和q5go图形界面

5分钟容器化部署KataGo围棋AI:告别Linux环境配置噩梦 围棋爱好者们终于可以在Linux系统上快速体验顶级AI对弈了!传统部署KataGo需要经历CUDA环境配置、依赖库安装、源码编译等复杂流程,往往耗费数小时还可能失败。现在通过Docker容器技术&…...

5分钟掌握终极Redis可视化工具:AnotherRedisDesktopManager完整使用指南

5分钟掌握终极Redis可视化工具:AnotherRedisDesktopManager完整使用指南 【免费下载链接】AnotherRedisDesktopManager 🚀🚀🚀A faster, better and more stable Redis desktop manager [GUI client], compatible with Linux, Win…...

从ETOPO1到精美地形图:一套完整的Matlab + M_Map可视化工作流分享

从ETOPO1到出版级地形图:Matlab与M_Map全流程可视化实战 当我们需要在学术论文或研究报告中展示地形数据时,粗糙的原始数据可视化往往难以达到专业出版要求。ETOPO1作为全球高分辨率地形数据集,配合Matlab强大的M_Map工具箱,可以创…...

【花雕学编程】Arduino BLDC 之机器人栅格地图构建与局部避障

在移动机器人领域,环境感知与导航是其智能化的核心体现。"Arduino BLDC之机器人栅格地图构建与局部避障"方案,是指机器人通过传感器(如LiDAR、超声波、红外等)感知周围环境,将环境信息抽象成一种网格化的地图…...

Electron应用如何优雅地跳转外部链接?最新shell.openExternal避坑指南

Electron应用外部链接跳转实战:从废弃API迁移到shell.openExternal的最佳实践 在桌面应用开发中,处理外部链接跳转是个看似简单却暗藏玄机的功能点。想象一下:当用户点击你应用中的一个帮助文档链接时,是应该在内置浏览器中打开&…...

CycloneDDS在ROS2中的隐式工作原理:从环境配置到API调用的完整解析

CycloneDDS在ROS2中的隐式工作原理:从环境配置到API调用的完整解析 在机器人操作系统ROS2的架构设计中,数据分发服务(DDS)作为通信中间件扮演着核心角色。CycloneDDS作为一款轻量级、高性能的开源DDS实现,因其出色的实…...

实战解析:.NET Framework多版本环境下的兼容性策略与配置

1. 理解.NET Framework多版本兼容性问题 第一次遇到.NET Framework版本兼容问题是在2015年开发游戏微端下载器时。当时我们团队用.NET 4.0开发了一个下载器,测试时在Win10上运行完美,但发给部分Win7用户后却收到大量报错反馈。更让人头疼的是&#xff0c…...

推荐系统必看:当BCELoss遇上负采样,如何避免模型预测全为0?

推荐系统实战:破解BCELoss全零预测陷阱的负采样策略 在电商推荐系统的深夜办公室里,算法工程师小李盯着训练日志皱起了眉头——模型对所有商品的预测概率都趋近于0。这不是他第一次遇到BCELoss在隐式反馈数据上"躺平"的情况。当正样本占比不足…...

ESP-SR语音识别终极指南:15分钟搭建嵌入式AI语音交互系统

ESP-SR语音识别终极指南:15分钟搭建嵌入式AI语音交互系统 【免费下载链接】esp-sr Speech recognition 项目地址: https://gitcode.com/gh_mirrors/es/esp-sr ESP-SR是乐鑫为ESP32系列芯片打造的高效语音识别框架,专为嵌入式设备提供完整的语音交…...

从‘烧录’到‘运行’:图解ARM Cortex-M芯片上电后代码的‘搬家’之旅

从‘烧录’到‘运行’:图解ARM Cortex-M芯片上电后代码的‘搬家’之旅 当一块搭载Cortex-M内核的微控制器开发板被按下复位键时,看似简单的动作背后隐藏着一场精密的"数据迁徙"。这场迁徙发生在毫秒级时间内,却决定了整个嵌入式系统…...

华硕ROG品牌机Ubuntu双系统安装避坑指南

1. 华硕ROG品牌机双系统安装前的认知准备 第一次在华硕ROG品牌机上折腾Ubuntu双系统时,我就被它独特的BIOS设计来了个下马威。和普通组装机不同,ROG这类品牌机的BIOS界面就像个精心设计的密室逃脱游戏——每个选项背后都可能藏着意想不到的"惊喜&qu…...

告别黑白世界:用QGIS的GDAL工具,5分钟搞定单波段灰度图转彩色RGB

告别黑白世界:用QGIS的GDAL工具,5分钟搞定单波段灰度图转彩色RGB 当我们面对一张单调的灰度图时,往往难以直观地捕捉数据中的关键信息。无论是地形高程、温度分布还是人口密度,单波段数据在视觉表现上总是显得力不从心。幸运的是&…...

CTF新手必看:用010 Editor和TweakPNG搞定PNG图片隐写,从CRC报错到找到Flag的完整实战

CTF新手通关指南:PNG隐写术从CRC校验到Flag提取全解析 第一次参加CTF比赛时,我盯着那张看似普通的PNG图片整整半小时毫无头绪。直到发现010 Editor底部那个小小的CRC报错提示,才意识到原来Flag就藏在图片高度值里。这种"明明就在眼前却看…...

RK3308实现UAC1与ADB功能共存配置指南

1. RK3308平台UAC1与ADB共存问题解析 第一次在RK3308上折腾UAC1音频功能时,我遇到了一个典型问题:当开启ADB调试功能后,UAC1音频设备就消失了。这个问题困扰了我整整两天,直到发现问题的根源在于Rockchip原厂配置的互斥机制。简单…...

手机ECM麦克风差分电路设计:从原理到PCB抗干扰实战

1. ECM麦克风基础原理与手机应用场景 驻极体电容式麦克风(ECM)在手机耳机中的应用远比我们想象的复杂。这种看似简单的声电转换器件,内部其实藏着精妙的物理结构。想象一下,ECM内部就像一个微型电容器,其中一片极板是固…...

Cursor Pro免费激活终极指南:三步解锁AI编程无限功能

Cursor Pro免费激活终极指南:三步解锁AI编程无限功能 【免费下载链接】cursor-free-vip [Support 0.45](Multi Language 多语言)自动注册 Cursor Ai ,自动重置机器ID , 免费升级使用Pro 功能: Youve reached your tria…...

【生成式AI服务弹性扩缩容黄金法则】:20年SRE专家亲授K8s+LLM推理负载自适应调度的5大核心指标与3个避坑指南

第一章:生成式AI应用自动化扩缩容 2026奇点智能技术大会(https://ml-summit.org) 生成式AI应用(如大语言模型API服务、文生图推理端点)具有显著的负载非线性特征:请求可能在秒级内激增数倍,同时单次推理耗时长、GPU显…...

Gradio权限管控:雯雯的后宫-造相Z-Image-瑜伽女孩企业内网访问安全配置

Gradio权限管控:雯雯的后宫-造相Z-Image-瑜伽女孩企业内网访问安全配置 1. 企业内网部署的安全挑战 在企业内部部署AI模型服务时,安全管控是首要考虑的问题。雯雯的后宫-造相Z-Image-瑜伽女孩作为一个文生图模型服务,虽然为企业内部创意设计…...

别再手动调参了!用MATLAB的PSO工具箱自动优化滑模控制器(附完整代码)

告别手动调参:MATLAB PSO工具箱在滑模控制优化中的实战指南 每次看到实验室的师弟们对着滑模控制器参数反复调试到深夜,我都想起自己当年被c和ε折磨的日子。传统试错法不仅效率低下,更难以找到全局最优解——直到我发现MATLAB自带的PSO工具箱…...

Navicate远程连接CentOS-Oracle19c:ORA-12541错误排查与监听配置实战

1. 问题现象与初步分析 最近在CentOS 7上部署了Oracle 19c数据库,用Navicat连接时突然报错ORA-12541: TNS无监听程序。这个错误特别诡异,因为明明半个月前安装完Oracle后Navicat还能正常连接,数据库服务也一直正常运行着。更奇怪的是&#xf…...