当前位置：首页 > news >正文

多阶段报童问题动态规划求解，Python 实现

news 2026/2/8 17:15:16

使用 python 编写了多阶段报童模型的动态规划算法。

使用了 python 的装饰器 @dataclass ，方便定义类
尝试使用并行计算，没有成功，极易出错。动态规划中使用并行计算，还是挺有挑战的；而且并行计算不一定总是比非并行运算速度快。

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Thu Nov 28 00:00:35 2024@author: zhenchen@Python version: 3.10@disp:  stochastic dynamic programming to compute multi-period newsvendor problems;use @dataclass for ease of defining classes;parallel computing unsucessful, highly prone to make mistakes;
"""import scipy.stats as sp
from dataclasses import dataclass
from functools import lru_cache
import time@dataclass(frozen=True) 
class State:"""state in  a period: initial inventory """t: intiniInventory: float@dataclass
class Pmf:"""probability mass function for the demand distribution in each period"""truncQuantile: floatdistribution_type: str def get_pmf(self, distribution_parameters):"""Parameters----------distribution_parameters: list, may be multi dimensionalDESCRIPTION. parameter values of the distributionReturns-------pmf : 3-D listDESCRIPTION. probability mass function for the demand in each period"""if (self.distribution_type == 'poisson'):  mean_demands = distribution_parametersmax_demands = [sp.poisson.ppf(self.truncQuantile, d).astype(int) for d in mean_demands]T = len(mean_demands)pmf = [[[k, sp.poisson.pmf(k, mean_demands[t])/self.truncQuantile] for k in range(max_demands[t])] for t in range(T)]return pmf@dataclass(eq = False) 
class StochasticInventory:"""multi period stochastic inventory model class"""    T: int          capacity: float # maximum ordering quantityfixOrderCost: floatvariOrderCost: floatholdCost: floatpenaCost: floattruncationQ: floatmax_inventory: floatmin_inventory: floatpmf: [[[]]]cache_actions = {}def get_feasible_action(self, state:State):"""feasible actions for a certain state"""      return range(self.capacity + 1)def state_tran(self, state:State, action, demand):"""state transition function"""       nextInventory = state.iniInventory + action - demandnextInventory = self.max_inventory if self.max_inventory < nextInventory else nextInventorynextInventory = self.min_inventory if self.min_inventory > nextInventory else nextInventoryreturn State(state.t + 1, nextInventory)def imme_value(self, state:State, action, demand):"""immediate value function"""fixCost = self.fixOrderCost if action > 0 else 0variCost = self.variOrderCost * actionnextInventory = state.iniInventory + action - demandnextInventory = self.max_inventory if nextInventory > self.max_inventory else nextInventorynextInventory = self.min_inventory if nextInventory < self.min_inventory else nextInventoryholdingCost = self.holdCost * max(0, nextInventory)penaltyCost = self.penaCost * max(0, -nextInventory)return fixCost + variCost + holdingCost + penaltyCost# recursion@ lru_cache(maxsize = None)def f(self, state:State):"""recursive function"""bestQValue = float('inf')bestQ = 0for action in self.get_feasible_action(state):thisQValue = 0for randDandP in self.pmf[state.t - 1]:thisQValue += randDandP[1] * self.imme_value(state, action, randDandP[0])if state.t < T:thisQValue += randDandP[1] * self.f(self.state_tran(state, action, randDandP[0]))if thisQValue < bestQValue:bestQValue = thisQValuebestQ = actionself.cache_actions[str(state)] = bestQreturn bestQValuedemands = [10, 20, 10, 20]
distribution_type = 'poisson'
capacity = 100 # maximum ordering quantity
fixOrderCost = 0
variOderCost = 1
holdCost = 2
penaCost = 10
truncQuantile = 0.9999 # trancated quantile for the demand distribution
maxI = 500 # maximum possible inventory
minI = -300 # minimum possible inventorypmf = Pmf(truncQuantile, distribution_type).get_pmf(demands)
T = len(demands)if __name__ == '__main__': start = time.process_time()model = StochasticInventory(T,capacity, fixOrderCost, variOderCost,holdCost, penaCost, truncQuantile,maxI, minI,pmf)ini_state = State(1, 0)expect_total_cost = model.f(ini_state)print('****************************************')print('final expected total cost is %.2f' % expect_total_cost)optQ = model.cache_actions[str(State(1, 0))]print('optimal Q_1 is %.2f' % optQ)end = time.process_time()cpu_time = end - startprint('cpu time is %.4f s' % cpu_time)

多阶段报童问题动态规划求解，Python 实现

使用 python 编写了多阶段报童模型的动态规划算法。使用了 python 的装饰器 dataclass ，方便定义类尝试使用并行计算，没有成功，极易出错。动态规划中使用并行计算，还是挺有挑战的；而且并行计算不一定总是比非并行运算…...

编程日记 2024/11/29 12:29:26

【C++进阶篇】像传承家族宝藏一样理解C++继承

文章目录须知 💬 欢迎讨论：如果你在学习过程中有任何问题或想法，欢迎在评论区留言，我们一起交流学习。你的支持是我继续创作的动力！ 👍 点赞、收藏与分享：觉得这篇文章对你有帮助吗&#xff1…...

编程日记 2024/11/29 12:24:18

Java基础面试题09：Java异常处理完成以后，Exception对象会发生什么变化？

一、Java异常（Exception）基本概念什么是异常？ 简单来说，异常就是程序运行时发生了意外的“错误”或者“不正常现象”，导致程序中断。异常处理的目标是让程序在出现问题时能稳住，不会直接崩溃。 1.1 异常…...

编程日记 2024/11/29 12:16:07

mysql sql语句 between and 是否边界值

在 MySQL 中，使用 BETWEEN 运算符时，边界值是包括在内的。这意味着 BETWEEN A AND B 查询会返回 A 和 B 之间的所有值，包括 A 和 B 自身。示例假设有一个表 employees，其中有一个 salary 列，您可以使用以下查询&am…...

编程日记 2024/11/29 12:15:05

Java接收LocalDateTime、LocalDatee参数

文章目录引言I java服务端的实现1.1 基于注解规范日期格式1.2 json序列化和反序列化全局配置自动处理日期格式化II 知识扩展：枚举的转换和序列化III 签名注意事项引言应用场景举例：根据时间段进行分页查询数据前后端交互日期字符串统一是yyyy-MM-dd HH:mm:ss 或者yyyy-M…...

编程日记 2024/11/29 12:13:03

方差分析、相关分析、回归分析

第一章：方差分析 1.1 方差分析概述作用: 找出关键影响因素，并进行对比分析，选择最佳组合方案。影响因素: 控制因素（人为可控）和随机因素（人为难控）。控制变量的不同水平: 控制变量的不同取值…...

编程日记 2024/11/29 12:11:01

SQLModel入门

SQLModel 系统性指南目录简介什么是 SQLModel？为什么使用 SQLModel？ 安装快速入门定义模型创建数据库和表基本 CRUD 操作创建（Create）读取（Read）更新（Update）删除&#xff0…...

编程日记 2024/11/29 12:10:00

单片机蓝牙手机 APP

目录一、引言二、单片机连接蓝牙手机 APP 的方法 1. 所需工具 2. 具体步骤三、单片机蓝牙手机 APP 的应用案例 1. STM32 蓝牙遥控小车 2. 手机 APP 控制 stm32 单片机待机与唤醒 3. 智能家居系统 4. 智能记忆汽车按摩座椅四、单片机蓝牙手机 APP 的功能 1. 多种控…...

编程日记 2024/11/29 12:04:55

PostgreSQL在Linux环境下的常用命令总结

标题登录PgSQL库表基本操作命令新建库表修改库表修改数据库名称：修改表名称修改表字段信息删除库表pgsql删除正在使用的数据库须知： 以下所有命令我都在Linux环境中执行验证过，大家放心食用，其中的实际名称换成自己的实际名称即…...

编程日记 2024/11/29 12:03:53

Unity shaderlab 实现LineSDF

实现效果： 实现代码： Shader "Custom/LineSDF" {Properties{}SubShader{Tags { "RenderType""Opaque" }Pass{CGPROGRAM#pragma vertex vert#pragma fragment frag#include "UnityCG.cginc"struct appdata{floa…...

编程日记 2024/11/29 12:01:51

Ubuntu中的apt update 和 apt upgrade

apt update 和 apt upgrade 是 Debian 及其衍生发行版（如 Ubuntu）中常用的两个 APT 包管理命令，它们各自执行不同的任务： apt update: 这个命令用于更新本地软件包列表。当你运行 apt update 时，APT 会从配置的源&…...

编程日记 2024/11/29 11:59:48

Android 中 Swipe、Scroll 和 Fling 的区别

Android 中 Swipe、Scroll 和 Fling 的区别 Swipe（滑动）Scroll（滚动）Fling（甩动）三者之间的区别代码示例 (Fling)总结在 Android 应用中，Swipe、Scroll 和 Fling 都是用户在触摸屏幕上进行的滑…...

编程日记 2024/11/29 11:58:46

linux基础2

声明！ 学习视频来自B站up主泷羽sec 有兴趣的师傅可以关注一下，如涉及侵权马上删除文章，笔记只是方便各位师傅的学习和探讨，文章所提到的网站以及内容，只做学习交流，其他均与本人以及泷羽sec团队无关&#…...

编程日记 2024/11/29 11:56:44

如何通过智能生成PPT，让演示文稿更高效、更精彩？

在快节奏的工作和生活中，我们总是追求更高效、更精准的解决方案。而在准备演示文稿时，PPT的制作往往成为许多人头疼的问题。如何让这项工作变得轻松且富有创意？答案或许就在于“AI生成PPT”这一智能工具的广泛应用。我们就来聊聊如何通过这些…...

编程日记 2024/11/29 11:54:42

执法记录仪数据自动备份光盘刻录归档系统

派美雅按需研发的执法记录仪数据自动备份光盘刻录归档系统，为用户提供数据自动上传到刻录服务端、数据上传后自动归类，全自动对刻录端视频文件大小进行实时监测，满盘触发刻录，无需人工干预。告别传统刻录存在的痛点，实…...

编程日记 2024/11/29 11:53:40

启动SpringBoot

前言：大家好我是小帅，今天我们来学习SpringBoot 文章目录 1. 环境准备2. Maven2.1 什么是Maven2.2 创建⼀个Maven项⽬2.3 依赖管理2.3.1 依赖配置2.3.2 依赖传递2.3.4 依赖排除2.3.5 Maven Help插件（plugin） 2.4 Maven 仓库2.6 中…...

编程日记 2024/11/29 11:50:36

重定向操作和不同脚本的互相调用

文章目录前言重定向操作和不同脚本的互相调用前言声明学习视频来自B站UP主泷羽sec,如涉及侵权马上删除文章笔记的只是方便各位师傅学习知识,以下网站只涉及学习内容,其他的都与本人无关,切莫逾越法律红线,否则后果自负重定向操作和不同脚本的互相调用 1.不同脚本的互相…...

编程日记 2024/11/29 11:49:35

51单片机教程（九）- 数码管的动态显示

1、项目分析通过演示数码管动态显示的操作过程。 2、技术准备 1、数码管动态显示 4个1位数码管和单片机如何连接 a、静态显示的连接方式优点：不需要动态刷新；缺点：占用IO口线多。 b、动态显示的连接方式连接：所有位数码…...

编程日记 2024/11/29 11:44:29

golang支持线程安全和自动过期map

在 Golang 中，原生的 map 类型并不支持并发安全，也没有内置的键过期机制。不过，有一些社区提供的库和方案可以满足这两个需求：线程安全和键过期。 1. 使用 sync.Map（线程安全，但不支持过期） Go…...

编程日记 2024/11/29 11:43:27

机器学习之RLHF（人类反馈强化学习）

RLHF（Reinforcement Learning with Human Feedback，基于人类反馈的强化学习）是一种结合人类反馈和强化学习（RL）技术的算法，旨在通过人类的评价和偏好优化智能体的行为，使其更符合人类期望。这种方法近年来在大规模语言模型（如 OpenAI 的 GPT 系列）训练中取得了显著成…...

编程日记 2024/11/29 11:42:25

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…...

编程新知 2026/2/7 23:18:39

鸿蒙中用HarmonyOS SDK应用服务 HarmonyOS5开发一个医院挂号小程序

一、开发准备环境搭建： 安装DevEco Studio 3.0或更高版本配置HarmonyOS SDK申请开发者账号项目创建： File > New > Create Project > Application (选择"Empty Ability") 二、核心功能实现 1. 医院科室展示 /…...

编程新知 2025/9/5 12:16:40

高危文件识别的常用算法：原理、应用与企业场景

高危文件识别的常用算法：原理、应用与企业场景高危文件识别旨在检测可能导致安全威胁的文件，如包含恶意代码、敏感数据或欺诈内容的文档，在企业协同办公环境中（如Teams、Google Workspace）尤为重要。结合大模型技术&…...

编程新知 2026/2/8 10:51:42

在WSL2的Ubuntu镜像中安装Docker

Docker官网链接: https://docs.docker.com/engine/install/ubuntu/ 1、运行以下命令卸载所有冲突的软件包： for pkg in docker.io docker-doc docker-compose docker-compose-v2 podman-docker containerd runc; do sudo apt-get remove $pkg; done2、设置Docker…...

编程新知 2026/2/4 16:23:56

Ubuntu Cursor升级成v1.0

0. 当前版本低使用当前 Cursor v0.50时 GitHub Copilot Chat 打不开，快捷键也不好用，当看到 Cursor 升级后，还是蛮高兴的 1. 下载 Cursor 下载地址：https://www.cursor.com/cn/downloads 点击下载 Linux (x64) ，…...

编程新知 2026/2/4 16:04:11

wpf在image控件上快速显示内存图像

wpf在image控件上快速显示内存图像https://www.cnblogs.com/haodafeng/p/10431387.html 如果你在寻找能够快速在image控件刷新大图像（比如分辨率3000*3000的图像）的办法，尤其是想把内存中的裸数据（只有图像的数据，不包…...

编程新知 2026/1/31 9:25:11

【threejs】每天一个小案例讲解：创建基本的3D场景

代码仓 GitHub - TiffanyHoo/three_practices: Learning three.js together! 可自行clone，无需安装依赖，直接liver-server运行/直接打开chapter01中的html文件运行效果图知识要点核心三要素场景（Scene） 使用 THREE.Scene(…...

编程新知 2026/1/30 15:16:28

LeetCode 0386.字典序排数：细心总结条件

【LetMeFly】386.字典序排数：细心总结条件力扣题目链接：https://leetcode.cn/problems/lexicographical-numbers/ 给你一个整数 n ，按字典序返回范围 [1, n] 内所有整数。你必须设计一个时间复杂度为 O(n) 且使用 O(1) 额外空间的算法。…...

编程新知 2026/2/1 1:07:06

IP选择注意事项

IP选择注意事项 MTP、FTP、EFUSE、EMEMORY选择时，需要考虑以下参数，然后确定后选择IP。容量工作电压范围温度范围擦除、烧写速度/耗时读取所有bit的时间待机功耗擦写、烧写功耗面积所需要的mask layer...

编程新知 2025/10/26 7:24:53

[10-1]I2C通信协议江协科技学习笔记（17个知识点）

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17...

编程新知 2026/1/28 9:33:25

相关文章：