当前位置: 首页 > news >正文

论文导读|八月下旬Operations Research文章精选:定价问题专题

在这里插入图片描述

编者按:


​在“ Operations Research论文精选”中,我们有主题、有针对性地选择了Operations Research中一些有趣的文章,不仅对文章的内容进行了概括与点评,而且也对文章的结构进行了梳理,旨在激发广大读者的阅读兴趣与探索热情。在本期“论文精选”中,我们以“定价问题”为主题,涉及动态定价问题、马尔可夫均衡,未知非参数模型、机器学习、迭代贪心等诸多知识。

推荐文章1

● 题目:Strategic Pricing in Volatile Markets
波动市场中的策略定价
● 期刊:Operations Research
● 原文链接:https://doi.org/10.1287/opre.2021.0550
● 作者:Sebastian Gryglewicz, Aaron Kolb
● 关键词:limit pricing(限制定价) • market entry(市场进入)• signaling (信号)• optimal stopping (最优停止)• stochastic games(随机游戏)
● 摘要:
We study dynamic entry deterrence through limit pricing in markets subject to persistent demand shocks. An incumbent is privately informed about its costs, high or low, and can deter a Bayesian potential entrant by setting its prices strategically. The entrant can irreversibly enter the market at any time for a fixed cost, earning a payoff that depends on the market conditions and the incumbent’s unobserved type. Market demand evolves as a geometric Brownian motion. When market demand is low, entry becomes a distant threat, so there is little benefit to further deterrence, and, in equilibrium, a weak incumbent becomes tempted to reveal itself by raising its prices. We characterize a unique equilibrium in which the entrant enters when market demand is sufficiently high (relative to the incumbent’s current reputation), and the weak incumbent mixes over revealing itself when market demand is sufficiently low. In this equilibrium, pricing and entry decisions exhibit path dependence, depending not only on the market’s current size, but also its historical minimum.
我们通过持续需求冲击下的市场限制定价来研究动态进入者威慑(dynamic entry deterrence)。在位者私下知道自己的成本是高是低,并可以通过战略性地设定价格来阻止贝叶斯理论的潜在进入者。进入者可以在任何时间以固定成本不可逆转地进入市场,获得的回报取决于市场条件和在位者的未观察类型。市场需求演变为一个几何布朗运动。当市场需求较低时,潜在进入者基本不构成威胁,因此进一步的威慑几乎没有什么好处,而且,在均衡状态下,弱势的在位者会试图通过提高价格来暴露自己。我们描述了一种独特的均衡,在这种均衡中,当市场需求足够高时(相对于在位者目前的声誉),进入者进入,而当市场需求足够低时,弱势在位者混合在一起,过度暴露自己。在这个均衡中,定价和进入决策表现出路径依赖,不仅取决于市场当前的规模,还取决于其历史最小值。
● 文章结构:
在这里插入图片描述

● 点评:
本文对于市场在位者和潜在进入者的动态均衡问题进行了研究。提出了一个基于马尔可夫均衡的(U,L)模型,也对该模型其他功能的拓展进行了简要概述。本文研究结果表明,经济衰退后进入延迟,导致经济复苏缓慢,在位者在经济衰退中幸存下来的可能性更大。为市场进入威慑提出了新的研究思路。

推荐文章2

● 题目:Dynamic Pricing with Unknown Nonparametric Demand and Limited Price Changes
未知非参数需求和有限价格变动的动态定价
● 期刊:Operations Research
● 原文链接:https://doi.org/10.1287/opre.2020.0445
● 作者:Georgia Perakis, Divya Singhvi
● 关键词:learning(学习 )• dynamic pricing(动态定价) • nonparametric models(非参数模型) • limited price changes(有限价格变化)
● 摘要:
We consider the dynamic pricing problem of a retailer who does not have any information on the underlying demand for a product. The retailer aims to maximize cumulative revenue collected over a finite time horizon by balancing two objectives: learning demand and maximizing revenue. The retailer also seeks to reduce the amount of price experimentation because of the potential costs associated with price changes. Existing literature solves this problem in cases where the unknown demand is parametric. We consider the pricing problem when demand is nonparametric. We construct a pricing algorithm that uses second order approximations of the unknown demand function and establish when the proposed policy achieves near-optimal rate of regret, O ~ ( T ) \widetilde{O}(\sqrt T) O (T )while making O ( l o g l o g T ) O(log\ logT) O(log logT)price changes. Hence, we show considerable reduction in price changes from the previously known o ( l o g T ) o(log\ T) o(log T) rate of price change guarantee in the literature. We also perform extensive numerical experiments to show that the algorithm substantially improves over existing methods in terms of the total price changes, with comparable performance on the cumulative regret metric.
我们研究了不知道产品任何潜在需求信息的零售商动态定价问题。零售商的目标是通过平衡两个目标:了解需求和最大化收入,在有限的时间范围内最大化累积收入。零售商还力求减少价格试验的数量,因为价格变化具有潜在成本。现有文献在未知需求为参数的情况下解决了这一问题。考虑需求是非参数时的定价问题。我们构建了一个定价算法,该算法使用未知需求函数的二阶近似,并确定所提出的策略何时达到接近最优的后悔率 O ~ ( T ) \widetilde{O}(\sqrt T) O (T )同时进行 O ( l o g l o g T ) O(log\ logT) O(log logT)价格变化。因此,与之前文献显示的 o ( l o g T ) o(log\ T) o(log T)价格变化了相比,我们在价格试验次数上展现了相当大的减少,我们还进行了大量的数值实验,以表明该算法在总价格变化方面大大改进了现有方法,在累积遗憾度量上具有相当好的性能。
● 文章结构:
在这里插入图片描述

● 点评:
本文研究了当潜在需求未知且非参数,以实现价格设置恰当的同时减少定价试验次数为目的,零售商销售单一产品的动态定价问题。文章构建了一个动态定价策略,该策略使用非参数需求的二阶近似来生成未来价格。提出的政策在分析和数值上都表现良好。为零售商在新产品定价问题上提出了切实有效的办法,达到减少成本、收入最大化的目的。

推荐文章3

● 题目:Dynamic Pricing and Learning with Discounting
动态定价与折扣学习
● 期刊:Operations Research
● 原文链接:https://doi.org/10.1287/opre.2023.2477
● 作者:Zhichao Feng, Milind Dawande, Ganesh Janakiraman, Anyan Qi
● 关键词:dynamic pricing(动态定价) • learning(学习) • discounting (折扣)• regret minimization(遗憾最小化)
● 摘要:
In many practical settings, learning algorithms can take a substantial amount of time to converge, thereby raising the need to understand the role of discounting in learning. We illustrate the impact of discounting on the performance of learning algorithms by examining two classic and representative dynamic-pricing and learning problems studied in Broder and Rusmevichientong (BR) [Broder J, Rusmevichientong P (2012) Dynamic pricing under a general parametric choice model. Oper. Res. 60(4):965–980] and Keskin and Zeevi (KZ) [Keskin NB, Zeevi A (2014) Dynamic pricing with an unknown demand model: Asymptotically optimal semi-myopic policies. Oper. Res. 62(5):1142–1167]. In both settings, a seller sells a product with unlimited inventory over T periods. The seller initially does not know the parameters of the general choice model in BR (respectively, the linear demand curve in KZ). Given a discount factor ρ, the retailer’s objective is to determine a pricing policy to maximize the expected discounted revenue over T periods. In both settings, we establish lower bounds on the regret under any policy and show limiting bounds of Ω ( 1 / ( 1 − ρ ) ) Ω(\sqrt {1/(1 - \rho )} ) Ω1/(1ρ) and Ω ( T ) Ω(\sqrt T) Ω(T )and when T →∞ and $\rho $→1, respectively. In the model of BR with discounting, we propose an asymptotically tight learning policy and show that the regret under our policy as well that under the MLE-CYCLE policy in BR is O ( 1 / ( 1 − ρ ) ) O(\sqrt {1/(1 - \rho )} ) O(1/(1ρ) )(respectively, O ( T ) O(\sqrt T) O(T ))when T →∞ (respectively, $\rho $→1).In the model of KZ with discounting, we present sufficient conditions for a learning policy to guarantee asymptotic optimality and show that the regret under any policy satisfying these conditions is O ( l o g ( 1 / 1 − ρ ) 1 / ( 1 − ρ ) ) O(log(1/1-\rho)\sqrt {1/(1 - \rho )}) O(log(1/1ρ)1/(1ρ) )(respectively, O ( l o g T T ) O(logT\sqrt T) O(logTT )when T →∞(respectively, $\rho $→1).We show that three different policies—namely, the two variants of the greedy iterated least squares policy in KZ and a different policy that we propose—achieve this upper bound on the regret. We numerically examine the behavior of the regret under our policies as well as those in BR and KZ in the presence of discounting. We also analyze a setting in which the discount factor per period is a function of the number of decision periods in the planning horizon.

在许多实际设置中,学习算法可能需要大量的时间来收敛,因此需要了解贴现在学习中的作用。我们通过考察Broder和Rusmevichientong (BR) 研究的两个经典且具有代表性的动态定价和学习问题来说明折扣对学习算法性能的影响[Broder J, Rusmevichientong P (2012) Dynamic pricing under a general parametric choice model. Oper. Res. 60(4):965–980] ,还有 Keskin and Zeevi (KZ) [Keskin NB, Zeevi A (2014) Dynamic pricing with an unknown demand model: Asymptotically optimal semi-myopic policies. Oper. Res. 62(5):1142–1167]. 在这两种情况下,卖家在T个周期内销售具有无限库存的产品。卖方最初不知道BR中一般选择模型的参数(或KZ中的线性需求曲线)。给定折扣系数ρ,零售商的目标是确定一种定价策略,使T期间的预期折扣收入最大化。在这两种情况下,我们建立了任何策略下的后悔下界,并分别给出了当T→∞和ρ→1时, Ω ( 1 / ( 1 − ρ ) ) Ω(\sqrt {1/(1 - \rho )} ) Ω1/(1ρ) Ω ( T ) Ω(\sqrt T) Ω(T )的极限界。在有折扣的BR模型中,我们提出了一种渐近紧密学习策略,并证明了在我们的策略下以及在BR的MLE-CYCLE策略下的遗憾是 O ( 1 / ( 1 − ρ ) ) O(\sqrt {1/(1 - \rho )} ) O(1/(1ρ) )(或 O ( T ) O(\sqrt T) O(T ))当T→∞(或ρ→1)时。我们给出了一个学习策略保证渐近最优性的充分条件,并证明了在满足这些条件的任何策略下的后悔是 O ( l o g ( 1 / 1 − ρ ) 1 / ( 1 − ρ ) ) O(log(1/1-\rho)\sqrt {1/(1 - \rho )}) O(log(1/1ρ)1/(1ρ) )(或 O ( l o g T T ) O(logT\sqrt T) O(logTT )),当T→∞(或ρ→1)时。我们证明了三种不同的策略-即,KZ中贪婪迭代最小二乘策略的两个变体和我们提出的另一个策略实现了遗憾的上界。我们在数字上检验了我们的政策下的后悔行为,以及BR和KZ中存在折扣的行为。我们还分析了一种设定,其中每个周期的贴现因子是规划范围内决策周期数量的函数。

● 文章结构:

● 点评:
本文通过研究BR和KZ研究的两个经典和代表性的动态定价和学习问题,研究了折扣对学习算法性能的影响。并研究了如何将折扣纳入CILS等算法中,同时进行探索和利用。本文中的分析在理解非平稳需求如何影响动态定价和存在折扣的需求学习做出了很大的贡献。

相关文章:

论文导读|八月下旬Operations Research文章精选:定价问题专题

编者按: ​ ​在“ Operations Research论文精选”中,我们有主题、有针对性地选择了Operations Research中一些有趣的文章,不仅对文章的内容进行了概括与点评,而且也对文章的结构进行了梳理,旨在激发广大读者的阅读兴…...

(三)Apache log4net™ 手册 -演示

0、引言 在开始本文之前,推荐您首先阅读 Apache log4net™ 手册中有关 介绍 与 配置 的相关内容。本文将通过实践分别为您演示如何使用 Visual Studio 2022 在 .NET Framework 项目和 .NET 项目下配置并使用 Log4Net。 1、为 .NET Framework 项目配置 Log4Net 1.1…...

VScode远程root权限调试

尝试诸多办法无法解决的情况下,允许远程登陆用户直接以root身份登录 编辑sshd_config文件 sudo vim /etc/ssh/sshd_config 激活配置 注释掉PermitRootLogin without-password,即#PermitRootLogin without-password 增加一行:PermitRootLo…...

【ARM CoreLink 系列 7 -- TZC-400控制器简介】

文章目录 背景介绍1.1 TZC-400 简介1.2 TZC-400 使用示例1.3 TZC-400 interfaces1.3.1 FPID1.3.2 NSAID Regionregion 检查规则 1.4 Features1.5 Register summary1.6 TZC-400和TZPC和TZASC区别 背景介绍 为了确保内存能够正确识别总线的信号控制位,新增一个TrustZ…...

【C++】-c++11的知识点(中)--lambda表达式,可变模板参数以及包装类(bind绑定)

💖作者:小树苗渴望变成参天大树🎈 🎉作者宣言:认真写好每一篇博客💤 🎊作者gitee:gitee✨ 💞作者专栏:C语言,数据结构初阶,Linux,C 动态规划算法🎄 如 果 你 …...

浅析倾斜摄影三维模型(3D)几何坐标精度偏差的几个因素

浅析倾斜摄影三维模型(3D)几何坐标精度偏差的几个因素 倾斜摄影是一种通过倾斜角度较大的相机拍摄建筑物、地形等场景,从而生成高精度的三维模型的技术。然而,在进行倾斜摄影操作时,由于多种因素的影响,导致…...

【广州华锐互动】智轨列车AR互动教学系统

智轨列车,也被称为路面电车或拖电车,是一种公共交通工具,它在城市的街头巷尾提供了一种有效、环保的出行方式。智轨列车的概念已经存在了很长时间,但是随着科技的发展,我们现在可以更好地理解和欣赏它。通过使用增强现…...

驾驶数字未来:汽车业界数字孪生技术的崭新前景

随着数字化时代的到来,汽车行业正经历着前所未有的变革。数字孪生技术,作为一种前沿的数字化工具,正在为汽车行业带来革命性的影响,不仅改变着汽车制造和维护的方式,也为消费者带来了前所未有的体验。让我们一起探讨&a…...

JVM 性能调优参数

JVM分为堆内存和非堆内存 堆的内存分配用-Xms和-Xmx -Xms分配堆最小内存,默认为物理内存的1/64; -Xmx分配最大内存,默认为物理内存的1/4。 非堆内存分配用-XX:PermSize和-XX:MaxPermSize -XX:PermSize分配非堆最小内存,默认为物理…...

11在SpringMVC中响应到浏览器的数据格式,@ResponseBody注解和@RestController复合注解的功能详解

响应数据/转发或重定向页面 参考文章数据交换的常见格式,如JSON格式和XML格式 服务器将接收到请求处理完以后需要将处理结果告知给浏览器即响应,通常有响应要转发/重定向到的页面和响应数据(文本数据/json数据)两种方式 如果控制器方法返回值类型为void并且没有通过response…...

go 流程控制之switch 语句介绍

go 流程控制之switch 语句介绍 文章目录 go 流程控制之switch 语句介绍一、switch语句介绍1.1 认识 switch 语句1.2 基本语法 二、Go语言switch语句中case表达式求值顺序2.1 switch语句中case表达式求值次序介绍2.2 switch语句中case表达式的求值次序特点 三、switch 语句的灵活…...

sql 时间有偏差的解决方法

测试功能的时候发现记录的创建时间不对,死活对不上,下意识的以为是服务器时间有偏差,后来排查发现存入表中的时间是正常的,但是查询展示出来的时间是不对的,就去排查可能是查询sql格式化时间有问题,果不其然…...

Apache Lucene 7.0 - 索引文件格式

Apache Lucene 7.0 - 索引文件格式 文章目录 Apache Lucene 7.0 - 索引文件格式介绍定义反向索引字段类型段文档数量索引结构概述文件命名文件扩展名摘要锁文件 原文地址 介绍 这个文档定义了在这个版本的Lucene中使用的索引文件格式。如果您使用的是不同版本的Lucene&#xf…...

GEE:使用中文做变量和函数名写GEE代码

作者:CSDN _养乐多_ 啊?最近在编写GEE代码的时候,无意中发现 JavaScript 已经能够支持中文字符作为变量名和函数名,这个发现让我感到非常兴奋。这意味着以后在编程过程中,我可以更自由地融入中文元素,不再…...

针对量化交易SDK的XTP的初步摸索

这东西只要是调用API实现自动交易股票的,就不可能免费的接口。 并且用这些接口实现自动交易还得 归证券公司监管。比如 xtp出自 中泰证券,那么如果用xtp实现自动交易股票的软件,具体操作实盘的时候 不能跑再自己的电脑上,必须跑在…...

Unity编辑器从PC平台切换到Android平台下 Addressable 加载模型出现粉红色,类似于材质丢失的问题

Unity编辑器在PC平台下使用Addressable加载打包好的Cube,运行发现能正常显示。 而在切换到Android平台下,使用Addressable时加载AB包,生成Cube对象时,Cube模型呈现粉红色,出现类似材质丢失的问题。如下图所示。 这是…...

CSS 边框

CSS 边框属性 CSS边框属性允许你指定一个元素边框的样式和颜色。 在四边都有边框 红色底部边框 圆角边框 左侧边框带宽度,颜色为蓝色 边框样式 边框样式属性指定要显示什么样的边界。 border-style属性用来定义边框的样式 border-style 值: none: 默认无边框…...

Docker逃逸---CVE-2020-15257浅析

一、产生原因 在版本1.3.9之前和1.4.0~1.4.2的Containerd中,由于在网络模式为host的情况下,容器与宿主机共享一套Network namespace ,此时containerd-shim API暴露给了用户,而且访问控制仅仅验证了连接进程的有效UID为0&#xff…...

Python学习 day03(注意事项)

数据容器 列表...

vue中的生命周期有什么,怎么用

Vue.js 的生命周期(lifecycle)是指 Vue 实例从创建到销毁的整个过程。Vue.js 常用的生命周期包括: beforeCreate:在实例被创建之前调用,此时组件的数据观测和事件机制都未被初始化。created:在实例创建完成…...

RestClient

什么是RestClient RestClient 是 Elasticsearch 官方提供的 Java 低级 REST 客户端,它允许HTTP与Elasticsearch 集群通信,而无需处理 JSON 序列化/反序列化等底层细节。它是 Elasticsearch Java API 客户端的基础。 RestClient 主要特点 轻量级&#xff…...

深入浅出Asp.Net Core MVC应用开发系列-AspNetCore中的日志记录

ASP.NET Core 是一个跨平台的开源框架,用于在 Windows、macOS 或 Linux 上生成基于云的新式 Web 应用。 ASP.NET Core 中的日志记录 .NET 通过 ILogger API 支持高性能结构化日志记录,以帮助监视应用程序行为和诊断问题。 可以通过配置不同的记录提供程…...

云计算——弹性云计算器(ECS)

弹性云服务器:ECS 概述 云计算重构了ICT系统,云计算平台厂商推出使得厂家能够主要关注应用管理而非平台管理的云平台,包含如下主要概念。 ECS(Elastic Cloud Server):即弹性云服务器,是云计算…...

golang循环变量捕获问题​​

在 Go 语言中,当在循环中启动协程(goroutine)时,如果在协程闭包中直接引用循环变量,可能会遇到一个常见的陷阱 - ​​循环变量捕获问题​​。让我详细解释一下: 问题背景 看这个代码片段: fo…...

(二)TensorRT-LLM | 模型导出(v0.20.0rc3)

0. 概述 上一节 对安装和使用有个基本介绍。根据这个 issue 的描述,后续 TensorRT-LLM 团队可能更专注于更新和维护 pytorch backend。但 tensorrt backend 作为先前一直开发的工作,其中包含了大量可以学习的地方。本文主要看看它导出模型的部分&#x…...

1.3 VSCode安装与环境配置

进入网址Visual Studio Code - Code Editing. Redefined下载.deb文件,然后打开终端,进入下载文件夹,键入命令 sudo dpkg -i code_1.100.3-1748872405_amd64.deb 在终端键入命令code即启动vscode 需要安装插件列表 1.Chinese简化 2.ros …...

04-初识css

一、css样式引入 1.1.内部样式 <div style"width: 100px;"></div>1.2.外部样式 1.2.1.外部样式1 <style>.aa {width: 100px;} </style> <div class"aa"></div>1.2.2.外部样式2 <!-- rel内表面引入的是style样…...

涂鸦T5AI手搓语音、emoji、otto机器人从入门到实战

“&#x1f916;手搓TuyaAI语音指令 &#x1f60d;秒变表情包大师&#xff0c;让萌系Otto机器人&#x1f525;玩出智能新花样&#xff01;开整&#xff01;” &#x1f916; Otto机器人 → 直接点明主体 手搓TuyaAI语音 → 强调 自主编程/自定义 语音控制&#xff08;TuyaAI…...

使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台

🎯 使用 Streamlit 构建支持主流大模型与 Ollama 的轻量级统一平台 📌 项目背景 随着大语言模型(LLM)的广泛应用,开发者常面临多个挑战: 各大模型(OpenAI、Claude、Gemini、Ollama)接口风格不统一;缺乏一个统一平台进行模型调用与测试;本地模型 Ollama 的集成与前…...

rnn判断string中第一次出现a的下标

# coding:utf8 import torch import torch.nn as nn import numpy as np import random import json""" 基于pytorch的网络编写 实现一个RNN网络完成多分类任务 判断字符 a 第一次出现在字符串中的位置 """class TorchModel(nn.Module):def __in…...