当前位置: 首页 > article >正文

从“石头剪刀布”到商业竞争:用Python实战模拟完全信息静态博弈(附代码)

从“石头剪刀布”到商业竞争用Python实战模拟完全信息静态博弈博弈论常被视为经济学中的数学武器库但它的魅力远不止于学术论文。当我们在电商平台比价时当两家外卖App同时发放优惠券时甚至当你在会议室与同事讨论项目分工时博弈论的无形之手都在悄然运作。本文将用Python代码为显微镜带你观察这些日常决策背后的博弈逻辑。1. 博弈论基础与Python建模准备完全信息静态博弈的核心特征可以概括为三点所有玩家同时行动、彼此清楚对方的收益矩阵、且无法结成有约束力的联盟。这种看似简单的设定却能解释从儿童游戏到跨国并购的各类竞争行为。1.1 必备工具栈配置推荐使用Anaconda环境管理以下库# 安装核心库 import numpy as np import matplotlib.pyplot as plt from itertools import product from scipy.optimize import minimize支付矩阵是博弈的DNA用NumPy数组表示囚徒困境prisoners_dilemma { A: np.array([[ -1, -10], # A选择坦白/抵赖时 [ 0, -3]]), # B选择坦白/抵赖时的A收益 B: np.array([[ -1, 0], # 转置视角 [-10, -3]]) }1.2 博弈可视化技巧用热力图直观展示收益分布def plot_payoff(matrix, title): fig, ax plt.subplots(figsize(8,6)) im ax.imshow(matrix, cmapRdYlGn) plt.colorbar(im) ax.set_xticks([0,1]) ax.set_yticks([0,1]) ax.set_xticklabels([合作,背叛]) ax.set_yticklabels([合作,背叛]) plt.title(title) plt.show() plot_payoff(prisoners_dilemma[A], 囚徒A的收益矩阵)2. 经典博弈模型的Python实现2.1 纳什均衡求解算法采用最佳响应函数法寻找纯策略均衡def find_pure_nash(payoff_a, payoff_b): nash_equilibria [] rows, cols payoff_a.shape for i in range(rows): for j in range(cols): is_nash True # 检查玩家A是否有动机偏离 for k in range(rows): if payoff_a[k,j] payoff_a[i,j]: is_nash False break # 检查玩家B是否有动机偏离 for l in range(cols): if payoff_b[i,l] payoff_b[i,j]: is_nash False break if is_nash: nash_equilibria.append((i,j)) return nash_equilibria测试囚徒困境nash_pd find_pure_nash(prisoners_dilemma[A], prisoners_dilemma[B]) print(f纳什均衡策略组合索引: {nash_pd}) # 输出 (1,1) 即(背叛,背叛)2.2 混合策略均衡计算以足球点球博弈为例计算最优混合策略# 守门员和射门者的收益矩阵 penalty_kick { Kicker: np.array([[ 1, -1], [-1, 1]]), Goalie: np.array([[-1, 1], [ 1, -1]]) } def solve_mixed_nash(payoff_a, payoff_b): # 玩家A的最佳响应 def obj_a(x): p x[0] # 玩家B选择策略1的概率 return -np.max(p*payoff_a[:,0] (1-p)*payoff_a[:,1]) # 最小化负收益 # 玩家B的最佳响应 def obj_b(x): q x[0] # 玩家A选择策略1的概率 return -np.max(q*payoff_b[0,:] (1-q)*payoff_b[1,:]) res_a minimize(obj_a, [0.5], bounds[(0,1)]) res_b minimize(obj_b, [0.5], bounds[(0,1)]) return {Player1: res_b.x[0], Player2: res_a.x[0]} mixed_nash solve_mixed_nash(penalty_kick[Kicker], penalty_kick[Goalie]) print(f混合策略纳什均衡: {mixed_nash}) # 双方各50%概率3. 商业场景中的博弈论应用3.1 价格战模拟伯川德模型两家公司的价格竞争可以建模为def bertrand_game(c1, c2, market_size): # 简化假设消费者总是选择价格更低的商家 def profit(p1, p2): if p1 p2: return (p1 - c1) * market_size, 0 elif p1 p2: return 0, (p2 - c2) * market_size else: return (p1 - c1) * market_size / 2, (p2 - c2) * market_size / 2 # 寻找均衡价格 def best_response(p_other, cost): if p_other cost: return min(p_other - 0.01, cost 0.01) # 略低于对手但高于成本 else: return cost # 无法盈利时按成本定价 p1, p2 c1 1, c2 1 # 初始价格 for _ in range(1000): # 迭代收敛 new_p1 best_response(p2, c1) new_p2 best_response(p1, c2) if abs(new_p1 - p1) 1e-5 and abs(new_p2 - p2) 1e-5: break p1, p2 new_p1, new_p2 return p1, p2, *profit(p1, p2) # 假设两家公司成本相同 equilibrium_price bertrand_game(10, 10, 1000) print(f均衡价格: {equilibrium_price[0]:.2f}, 利润: {equilibrium_price[2]:.2f})3.2 产品差异化博弈Hotelling线性城市模型的Python实现def hotelling_model(position_a, position_b, price_a, price_b, transport_cost1): 假设消费者均匀分布在[0,1]区间 transport_cost: 单位距离的运输成本 # 寻找无差异消费者位置 if position_a position_b: if price_a price_b: return 1.0, 0.0 elif price_a price_b: return 0.0, 1.0 else: return 0.5, 0.5 x (price_b - price_a transport_cost*(position_b**2 - position_a**2)) \ / (2 * transport_cost * (position_b - position_a)) x np.clip(x, 0, 1) share_a x share_b 1 - x return share_a, share_b # 模拟两家公司位于1/4和3/4处 market_shares hotelling_model(0.25, 0.75, 1.0, 1.0) print(f市场份额 - A: {market_shares[0]:.1%}, B: {market_shares[1]:.1%})4. 进阶应用与策略优化4.1 多智能体博弈模拟用博弈论分析推荐系统的冷启动问题class RecommenderGame: def __init__(self, n_users, n_items): self.user_prefs np.random.rand(n_users, n_items) self.item_qualities np.random.rand(n_items) def play_round(self, recommendations): # recommendations是字典 {用户索引: 推荐物品索引} rewards {} for user, item in recommendations.items(): engagement self.user_prefs[user, item] * self.item_qualities[item] rewards[user] engagement # 平台更新物品质量 (模拟用户反馈) for item in set(recommendations.values()): rec_count sum(1 for v in recommendations.values() if v item) self.item_qualities[item] * (1 0.1 * rec_count) return rewards # 模拟两个推荐系统的竞争 game RecommenderGame(1000, 10) strategies { A: lambda: np.random.choice(10), # 随机推荐 B: lambda: np.argmax(game.item_qualities) # 热门推荐 } results {A: [], B: []} for _ in range(100): recs {i: strategies[A]() for i in range(500)} # 前500用户用策略A recs.update({i: strategies[B]() for i in range(500,1000)}) # 后500用策略B rewards game.play_round(recs) results[A].append(sum(rewards[i] for i in range(500)) / 500) results[B].append(sum(rewards[i] for i in range(500,1000)) / 500) plt.plot(results[A], label随机策略) plt.plot(results[B], label热门策略) plt.title(推荐策略效果对比) plt.xlabel(迭代轮次) plt.ylabel(平均用户参与度) plt.legend()4.2 博弈论与强化学习结合Q-learning在重复博弈中的应用示例class QLearningPlayer: def __init__(self, n_actions, alpha0.1, gamma0.9, epsilon0.1): self.q_table np.zeros(n_actions) self.alpha alpha self.gamma gamma self.epsilon epsilon def choose_action(self): if np.random.random() self.epsilon: return np.random.randint(len(self.q_table)) else: return np.argmax(self.q_table) def learn(self, action, reward): self.q_table[action] self.alpha * (reward - self.q_table[action]) # 重复囚徒困境模拟 player1 QLearningPlayer(2) # 0合作, 1背叛 player2 QLearningPlayer(2) payoff [[(3,3), (0,5)], [(5,0), (1,1)]] # (R,S,T,P)标准参数 cooperation_rates [] for episode in range(1000): a1 player1.choose_action() a2 player2.choose_action() r1, r2 payoff[a1][a2] player1.learn(a1, r1) player2.learn(a2, r2) # 记录合作频率 if episode % 10 0: cr ((player1.q_table[0] player1.q_table[1]).astype(int) (player2.q_table[0] player2.q_table[1]).astype(int)) / 2 cooperation_rates.append(cr) plt.plot(np.arange(len(cooperation_rates))*10, cooperation_rates) plt.title(Q-learning智能体在重复囚徒困境中的合作演化) plt.xlabel(训练轮次) plt.ylabel(合作概率)

相关文章:

从“石头剪刀布”到商业竞争:用Python实战模拟完全信息静态博弈(附代码)

从“石头剪刀布”到商业竞争:用Python实战模拟完全信息静态博弈 博弈论常被视为经济学中的"数学武器库",但它的魅力远不止于学术论文。当我们在电商平台比价时,当两家外卖App同时发放优惠券时,甚至当你在会议室与同事讨…...

别再死记硬背了!用一张图+实战代码,带你吃透USB PD协议里的24种控制消息

图解USB PD协议:24种控制消息的实战解码手册 在嵌入式开发领域,USB Power Delivery(PD)协议堪称电源管理的"瑞士军刀",但协议文档中晦涩的状态机和抽象术语常常让开发者陷入"每个字都认识,连…...

深入解析系统级光标定制:从原理到实践打造个性化交互体验

1. 项目概述:从“换个鼠标指针”到打造个性化交互体验 “换个鼠标指针”听起来像是个微不足道的小把戏,对吧?我最初也是这么想的。但当我真正开始深入使用和定制 ashutoshbhole1/custom_cursor 这个项目时,我才意识到&#xff0…...

泰山派3M-RK3576-Linux内核驱动教程-Linux驱动基础-字符驱动设备-应用程序访问字符设备

06.应用程序访问字符设备 在上一个章节中,我们编写了一个驱动程序,这里我们要编写一个APP应用程序,实现在应用层调用驱动底层的 open 和 write 函数。 一、APP和驱动程序的区别与分工 1. 驱动程序(Driver) 工作在内核空…...

SPI 在 以太网 PHY、CAN 控制器 中的通信应用(原理 + 场景 + 接线 + 时序全覆盖)

一、核心总览SPI 在这两类器件里不是做业务数据总线,核心作用是:MCU 通过 SPI 对 PHY / CAN 控制器 做:配置初始化、寄存器读写、状态读取、故障诊断以太网 PHY:SPI 管理 PHY 寄存器、速率 / 双工、链路状态CAN 控制器&#xff08…...

泰山派3M-RK3576-Linux内核驱动教程-Linux驱动基础-字符驱动设备-实现一个字符设备

接下来我们自己来实现一个字符设备,进行一个实操演示。 一、字符设备驱动的基本结构 驱动程序主要包括以下几个关键部分: 注册设备号和 cdev实现 file_operations 结构体(包含 read/write 等操作)创建设备类和设备节点资源释放和模…...

运维养龙虾--MongoDB 官方 Agent Skills 深度解析:为编码智能体注入专家级最佳实践

前言 软件工程正在经历一场深刻的变革。智能体工程(Agent Engineering) 时代已经到来。 根据 Stack Overflow 2025 年开发者调查显示: 84% 的受访者已在开发中使用或计划使用 AI 工具这一比例高于 2024 年的 76% 在这个背景下&#xff0c…...

泰山派3M-RK3576-Linux内核驱动教程-Linux驱动基础-字符驱动设备-字符设备框架

03.字符设备框架 一、什么是字符设备? 字符设备(Character Device)是一类能像“一个字节一个字节”那样进行数据流式读写的设备,常见例子有串口、键盘、鼠标等。用户和程序通过文件操作(open、read、write、close 等&a…...

泰山派3M-RK3576-系统功能-Android14-mSATA硬盘使用

Android14系统mSATA使用 说明 mSATA 是一种小型化的 SATA 接口,常用于笔记本电脑和嵌入式设备中。泰山派3m开发板上集成了MINI-PCIe接口,MINI-PCIe 和 mSATA 物理接口兼容,可以方便地连接 mSATA 固态硬盘,以扩展存储容量和提升数…...

Ruler:统一管理AI编程助手指令,提升团队协作与代码质量

1. 项目概述:为什么你需要一个AI助手指令的“中央集权”系统?如果你和我一样,每天要和GitHub Copilot、Cursor、Claude Code、Aider等好几个AI编程助手打交道,那你一定遇到过这种烦恼:每个工具都有自己的配置文件&…...

【2026实测】论文AI率居高不下?3大高阶指令+4款工具快速通关指南

撰写文章的那段日子,我之前也像无头苍蝇一样试过不少免费降ai率工具。结果往往是耗费了大量时间和精力,却没有看到明显降低ai率的效果,有时反而打乱了原本顺畅的逻辑,甚至改得前言不搭后语。 其实,只要掌握对的方法和…...

一个 C++ 程序从磁盘到内存要经历多少次变形?——从 ELF section 到 segment,拆解 execve 加载器的 6 步地址空间构建

在你的终端里敲下 readelf -S a.out,屏幕会吐出将近 30 行——.text、.rodata、.data、.bss、.symtab、.strtab、.rela.dyn、.rela.plt、.init_array、.fini_array……一个看似简单的 C++ 程序,编译器和链接器在它体内塞了三十个形状各异的"隔间",每个隔间有自己的…...

基于RAG的智能论文管理工具paperbanana:从本地部署到高级应用全解析

1. 项目概述与核心价值最近在开源社区里,一个名为paperbanana的项目引起了我的注意。乍一看这个名字,你可能会觉得有点无厘头——“论文香蕉”?但当你深入了解后,会发现它精准地戳中了每一个从事大语言模型(LLM&#x…...

日期格式化接收和格式化接收

SpringBoot 日期接收和输出格式化 全套 4 种方法(最全总结,记下来够用整个开发生涯)分两大场景:接收前端日期字符串 → 转 Java Date/LocalDateTime(入参)后端 Java 日期对象 → 返给前端标准字符串&#x…...

差分进化算法(DE)原理与Python实现

【智能优化】差分进化算法(DE)原理与Python实现📅 2026-05-08 | 🏷️ 智能优化 | 🏷️ 进化算法 | 🏷️ 差分进化一、引言 差分进化算法(Differential Evolution, DE)是由Storn和Price于1997年提出的基于群体的随机优化算法。DE以…...

黏菌算法(SMA)原理详解与Python实现

【智能优化】黏菌算法(SMA)原理详解与Python实现 📅 2026-05-08 | 🏷️ 智能优化 | 🏷️ 元启发式算法 | 🏷️ 黏菌算法 一、引言 黏菌优化算法(Slime Mould Algorithm, SMA)是2020年由Li等人提出的一种新型元启发式算法。该算法…...

粒子群优化算法(PSO)原理与Python高级实现

【智能优化】粒子群优化算法(PSO)原理与Python高级实现📅 2026-05-08 | 🏷️ 智能优化 | 🏷️ 群智能 | 🏷️ PSO一、引言 粒子群优化算法(Particle Swarm Optimization, PSO)是由Kennedy和Eberhart于1995年提出的群智能优化算法。…...

哈里斯鹰优化算法(HHO)原理与Python实现

【智能优化】哈里斯鹰优化算法(HHO)原理与Python实现 📅 2026-05-08 | 🏷️ 智能优化 | 🏷️ 元启发式算法 | 🏷️ HHO 一、引言 哈里斯鹰优化算法(Harris Hawk Optimization, HHO)是2019年由Heidari等人提出的一种新型元启发式算…...

【Fedora 44 GRUB 菜单每次开机都显示问题】

Fedora 44 GRUB 菜单每次开机都显示问题 Fedora 44 GRUB 菜单每次开机都显示问题问题现象环境信息走过的弯路弯路一:方案 B「直接隐藏」诱惑很大但要拒绝弯路二:方案 A「自动隐藏」按教程做了不生效弯路三:以为是 grub.cfg 没重新生成 真正的…...

Java 8+ 时间类型 :从 LocalDateTime 到 Instant

一、核心前置知识 1. 核心包 所有新时间类型都位于 java.time 包下,无需引入第三方依赖,JDK 8 原生支持。 2. 核心设计理念 领域驱动设计:将「日期、时间、时区、时间戳、时间间隔」严格拆分,每个类型只负责一件事&#xff0c…...

有哪些降重软件能保住论文原意,不会改得逻辑不通?

论文降重最怕啥?改完重复率达标了,核心意思却跑偏,逻辑漏洞百出,专业术语乱改一通,导师一看就知道是 AI 瞎改的。其实选对工具,既能把重复率压到合格线,又能100% 保住论文原意、逻辑连贯、术语精…...

Arm Neoverse V2处理器勘误分类与规避方案详解

## 1. Neoverse V2处理器勘误深度解析作为Arm最新一代基础设施级处理器核心,Neoverse V2(代号MP158)在数据中心和边缘计算领域展现出强劲性能。但在实际部署中,硬件设计层面的勘误(Errata)可能引发系统性风…...

【汽车芯片功能安全分析与故障注入实践 03】从 Base FIT Rate 开始:为什么安全分析要先做 BFR?

作者: Darren H. Chen 方向: 汽车芯片功能安全分析与故障注入实践 Demo: D03_base_fit_rate 标签: 汽车芯片 功能安全 FIT BFR 随机硬件故障 可靠性建模Demo 说明 D03_base_fit_rate 用来实现一个简化的 Base FIT Rate 计算 Demo。…...

为OpenClaw构建基于时间线的知识图谱大脑:Graphiti插件实战指南

1. 项目概述:为OpenClaw构建一个基于时间线的知识大脑 如果你和我一样,长期使用OpenClaw这类AI助手进行项目协作、知识整理和深度对话,你可能会遇到一个核心痛点:对话是线性的、易逝的。一次长达数小时的头脑风暴,一旦…...

从iPhone备份提取Apple Watch健康数据的开源工具WatchClaw详解

1. 项目概述:一个能“抓取”Apple Watch数据的开源利器如果你是一名iOS或watchOS开发者,或者对可穿戴设备的数据分析感兴趣,那你很可能遇到过这样的困境:想深入研究Apple Watch采集到的那些丰富数据——心率、步数、活动能量、睡眠…...

三星全线退出中国家电市场:真被国货打跑?还是战略大转移?

一、三星真的被国货「打跑」了?近期三星官宣全线停止在中国大陆销售电视、冰箱、洗衣机等全品类家电,消息一出立刻引发热议。不少人高呼「解气」,认为这是国产家电崛起的标志性事件 —— 外资巨头终于被中国品牌打跑了。但事实真的是「兵败撤…...

de4dot:免费开源的.NET反混淆神器,轻松解密被保护的代码

de4dot:免费开源的.NET反混淆神器,轻松解密被保护的代码 【免费下载链接】de4dot .NET deobfuscator and unpacker. 项目地址: https://gitcode.com/gh_mirrors/de/de4dot 你是否曾经遇到过这样的情况:拿到一个.NET程序集,…...

开源像素光标主题制作指南:从sheep-realms-avatar到全平台个性化方案

1. 项目概述与核心价值如果你和我一样,是个对桌面美学有点“偏执”的创作者或玩家,那你肯定也折腾过鼠标指针。默认的白色箭头看久了实在乏味,而网上那些炫酷的指针包,要么风格不搭,要么安装复杂,要么就是版…...

全卷积扩散模型FCDM:高效图像生成新方案

1. 项目概述 在计算机视觉领域,卷积神经网络(ConvNets)曾长期占据主导地位。然而近年来,Transformer架构在生成模型中的应用逐渐增多,但其高计算复杂度和资源消耗问题也日益凸显。本文介绍了一种基于ConvNeXt架构改进的…...

形式化方法

形式化方法是基于数学、逻辑、符号化语言,对软件系统进行合格建模、规范描述、逻辑推理和正确验证的一套开发与分析方法。不依靠人工测试猜测bug,而是用数学方式证明程序和系统是否正确。形式化方法的核心作用在于,它可以用严格的逻辑写清系统…...