Jiarui Gan and Bo An, Nanyang Technological University

将博弈论的解决方案概念与现有的出租车市场模型相结合，可以将模型驾驶员的策略制定过程转化为博弈，将优化出租车系统效率的问题转化为寻找市场政策，以达到期望的均衡。
北京有6万多辆有牌照的出租车，这些出租车为近百万市民提供服务。然而，尽管高峰时段的顾客需求不断增长，大多数出租车司机的行为却与直觉相悖，他们故意避免在高峰时段工作。因此，乘客在叫车上花费了大量不合理的时间。一些人甚至改乘无证出租车，这类出租车的收费通常更高，且对道路安全构成了巨大威胁。结果表明，不合理的基于距离的定价方案是造成这种情况的主要原因，也被称为高峰时段困境。由于交通繁忙，出租车司机在高峰时间的行车速度较慢，导致收入减少，甚至出现负增长，因此他们只能追求唯一能让他们赚钱的选择：在高峰时间不工作。
我们提出了一个解决方案：在高峰期提高票价，以激励出租车司机工作，具体来说，使用动态时间相关的票价结构，区分高峰期和非高峰期。关键是计算出使出租车系统效率最大化的最优票价。我们把这个问题称为出租车系统效率最优化（TASEO）问题。

人工智能和博弈论

有关出租车市场经济的研究可以追溯到1969年，奥尔指出了传统成本-需求理论应用的不足。1972年,乔治·道格拉斯引入了一个总需求和总供给模型，该模型假设客户对出租车服务的需求取决于预期的货币和时间成本，而预期的顾客等待时间则取决于总的空闲出租车小时数。基于该模型，杨海和同事从服务强度方面研究了交通拥堵的外部关系和时间变化。其他研究调查了纽约等不同地方的出租车票价。Kim Young-Joo and Hark Hwang 研究了以最大化平均利润为目标的出租车价格增量折扣政策。杨海和他的同事研究了一种非线性的票价结构，并展示了它相对于香港现有选择的优势。然而，这些工作都没有调查出租车司机的战略行为的影响。为了解决我们的问题，我们需要知道出租车司机对票价变化的反应。
幸运的是，人工智能领域为研究人类行为提供了许多技术，将人工智能技术应用于交通领域的问题，如交通控制、交叉口管理和交通系统仿真，是一个日益增长的趋势。最近，我们看到博弈论在中国的成功应用AI社区，如在安全资源分配。博弈论为研究理性决策者之间的冲突与合作提供了丰富的数学基础和概念。现有的应用已经证明了博弈论在解决复杂的现实世界问题方面的潜力，激励我们沿着这个方向寻找解决方案。

出租车系统效率最优化

通过票价调整来提高系统效率，首先要了解票价对系统效率的影响。现有的研究表明，出租车市场是由两个关键因素决定的，即票价价格和出租车供应(即正常运营的出租车的数量)。由于出租车系统的分散管理，出租车的供应是由司机的经营策略决定的，而不是由市场监管者直接控制的。因此，我们有一个间接的依赖关系:对于给定的票价，出租车司机用最好的策略化。如图1所示，我们可以将博弈论的行为模型与现有的出租车市场模型相结合。

现有的出租车市场模型

出租车市场是一个动态的时变系统。为了对其方差进行建模，我们对优化范围进行了离散化
(如一整天)分成一组n个等长的时间段，这样当每个时间段的持续时间足够短时，市场就可以在每个时间段内被视为均匀。在一个时间段iii中，整个出租车系统服务的乘客数量取决于一次旅行的平均货币和时间成本，即，
Di(Fi,Li,Wi)=Die−β(Fiγ+φ1Li+φ2Wi)(1)D^i(F^i,L^i,W^i)=D^ie^{-\beta(\frac{F^i}{\gamma}+\varphi_1L^i+\varphi_2W^i)} \tag{1} Di(Fi,Li,Wi)=Die−β(γFi+φ1Li+φ2Wi)(1)
其中，eee是自然数；FiF^iFi是平均票价；LiL^iLi是平均乘车时间；WiW^iWi是顾客平均等待时间；β\betaβ>0，是一个敏感性参数；φ1\varphi_1φ1和φ2\varphi_2φ2是用于将时间成本转换为货币成本的参数；γ\gammaγ是平均每次载客人数；DiD^iDi是潜在顾客数量，当总成本为零时，达到理想值。等待时间WiW^iWi取决于DiD^iDi，即
Wi(Di,Li,pi)=ωpi⋅NT−DiLi/(γ⋅τ)(2)W^i(D^i,L^i,p^i)=\frac{\omega}{p^i \cdot N_T-D^iL^i/(\gamma \cdot \tau)}\tag{2} Wi(Di,Li,pi)=pi⋅NT−DiLi/(γ⋅τ)ω(2)
其中， ω\omegaω >0，是取决于出租车停靠站密度的参数；pip^ipi是正在运营的出租车数量占出租车总数的比例（PoWPoWPoW）；NTN_TNT是出租车总数；pi⋅NT−DiLi/(γ⋅τ)p^i \cdot N_T-D^iL^i/(\gamma \cdot \tau)pi⋅NT−DiLi/(γ⋅τ)代表在时段iii的空车。可以证明，当FiF^iFi，LiL^iLi和pip^ipi固定时，DiD^iDi和WiW^iWi由方程(1)(1)(1)和方程(2)(2)(2)唯一确定。事实上，DiD^iDi和WiW^iWi是FiF^iFi，LiL^iLi和pip^ipi的隐函数。我们把他们表示为Di=Di(Fi,Li,pi)D^i=D^i(F^i,L^i,p^i)Di=Di(Fi,Li,pi)和Wi=Wi(Fi,Li,pi)W^i=W^i(F^i,L^i,p^i)Wi=Wi(Fi,Li,pi)。
考虑到平均行程距离did^idi，行程时间可以由行程速度ViV^iVi表示为Li=di/ViL^i=d^i/V^iLi=di/Vi。路网中的行驶速度可以近似为道路车辆数的线性函数，该函数与pi(PoW)p^i(PoW)pi(PoW)是线性的，因为我们假设网络中非出租车车辆NviN^i_vNvi的数目是一个基于特定时期的常数。因此，ViV^iVi是pip^ipi的线性函数，即：
Vi(pi)=μ(pi⋅NT+Nvi)+λV^i(p^i)=\mu(p^i \cdot N_T +N^i_v)+\lambda Vi(pi)=μ(pi⋅NT+Nvi)+λ
其中，μ\muμ和λ\lambdaλ是取决于道路状态的参数。我们把LiL^iLi，DiD^iDi，WiW^iWi分别记为Li(pi)L^i(p^i)Li(pi)，Di(Fi,pi)D^i(F^i,p^i)Di(Fi,pi)，Wi(Fi,pi)W^i(F^i,p^i)Wi(Fi,pi)。
接下来，我们采用基于距离的票价结构
Fi=f0+fi⋅(di−d0)F^i=f_0+f^i\cdot(d^i-d_0)Fi=f0+fi⋅(di−d0)
其中，f0f_0f0是起步价，d0d_0d0是起步里程数；fif^ifi是iii时段的每公里单价，也就是单位距离的收费。我们通过调整每公里单价fif^ifi，进而将FiF^iFi看作函数Fi(fi)F^i(f^i)Fi(fi)，从而优化票价结构。因此，所有的市场因素，尤其是被服务的客户数量DiD^iDi，现在取决于fif^ifi和pip^ipi，也就是Di=Di(fi,pi)D^i=D^i(f^i,p^i)Di=Di(fi,pi)。为了便于理解，我们将所有时期的市场因素表示为列向量，其中每个成分对应一个时期。例如，我们把每公里单价表示为f=(fi)f =(f^i)f=(fi)。图222总结了这些因素之间的相互依赖关系。

出租车司机的策略

出租车司机通过考虑潜在的利润来决定什么时间工作。换句话说，出租车司机的策略是制定一个时间表，明确规定(一天中的)几个工作时间段。我们把随机因素考虑到策略中，让司机制定一个混合的策略，这是一个罗列可能出现的时间表的任务。我们用向量s∈{0,1}ns\in\{0,1\}^ns∈{0,1}n表示单一策略，其中，si=1(否则，si=0)s^i=1(否则，s^i=0 )si=1(否则，si=0)表示在iii时段正在营业（否则，不营业）。设单一策略集合为SSS，即出租车司机可选择的单一策略集合。然后，我们把混合策略表示为x∈Rx\in Rx∈R。考虑到出租车司机在实际情况下的能力，我们对纯策略集中的每个调度施加以下条件：

条件1（C1）：出租车司机工作时间不会超过nwn_wnw小时。
条件2（C2）：出租车司机连续工作时间不会超过ncn_cnc小时。

也就是，S={s∈{0,1}n∣s满足C1和C2}S=\{s\in\{0,1\}^n | s 满足C1和C2 \}S={s∈{0,1}n∣s满足C1和C2}。
我们的框架适用于出租车司机行为的不同模型。我们用两个模型来说明：对称策略，即假设所有出租车司机都是相同的，每个出租车司机都假设所有其他司机都采用相同的策略(同车型、运营成本、充电方案)；利己主义战略，其中经典的解决概念——纳什均衡(NE)被采用，我们假设司机偏离了他或她的策略 (而其他人则不会)除非他或她无法从中受益。

对称战略。 这个假设与焦点理论是一致的，这个战略指出，人们倾向于根据简单的社会信念来使用解决方案(其他司机也采用相同的策略)，尤其是在缺乏沟通的情况下。给定对称策略xxx，则PoWPoWPoW由
p(x)=∑s∈Sxs⋅s(3)p(x)= \sum_{s\in S} x_s \cdot s\tag{3}p(x)=s∈S∑xs⋅s(3)
这与出租车司机在每个时段工作的概率相同，可以看作是出租车司机策略的一个有代表性意义的表示。出租车司机是利益驱动的，他们总是选择最好的策略去最优化他们效用，也就是
x∗∈argmaxx:x≥0,1Tx=1U(f,p(x))(4)x^* \in argmax_{x:x \geq 0,1^Tx=1}U(f,p(x))\tag{4} x∗∈argmaxx:x≥0,1Tx=1U(f,p(x))(4)
在定义效用函数U(f,p)U(f,p)U(f,p)之前，注意上述优化，虽然定义在单一策略上，但在假设所有驱动都相同的情况下，捕获所有司机的行为(正如我们所看到的，在一个时间段工作的利润也取决于有多少其他出租车在同一时间段工作)。在这种情况下，每个玩司机都要解决相同的优化问题，即司机的效用取决于使用相同混合策略的其他玩家的策略。
U(f,p)U(f,p)U(f,p)被定义为在所有时间段的效用的总和，也就是
U(f,p)=∑i=1npi⋅Gi(fi,pi)，U(f,p)=\sum_{i=1}^n p^i \cdot G^i (f^i ,p^i)， U(f,p)=i=1∑npi⋅Gi(fi,pi)，
其中Gi(fi,pi)G^i (f^i ,p^i)Gi(fi,pi)是在时间段iii内的工作利润定义为
Gi(fi,pi)=Di(pi)γ⋅NT⋅pi⋅Fi(fi)−ci⋅τ，(5)G^i (f^i ,p^i)=\frac{D^i(p^i)}{\gamma \cdot N_T \cdot p^i} \cdot F ^i(f^i)-c^i \cdot \tau\tag{5}， Gi(fi,pi)=γ⋅NT⋅piDi(pi)⋅Fi(fi)−ci⋅τ，(5)
其中，Di/γ⋅NTD^i/ \gamma \cdot N_TDi/γ⋅NT代表每辆的士的平均行程次数，cgc_gcg是单位时间内汽油消耗的成本。
由式(4)(4)(4)可知，车费价格通过优化决定出租车司机的策略，而策略又通过公式(3)(3)(3)决定PoWPoWPoW。 U(f,p)U(f,p)U(f,p)对于ppp是严格凹的，所以只有一个ppp最大化UUU，已知ppp的可行集是凸的。这意味着即使方程444有不止一个解，所有的解都必须产生相同PoWPoWPoW，并且保证fff到 ppp是一一对应的。

策略战略。 为了分析在那什均衡概念下出租车司机的行为，我们定义策略组合为(x1,...,xNT)(x_1,...,x_{N_T})(x1,...,xNT)。然后通过
pi(x1,...,xNT)=1NT∑j=1NT∑s∈Sxj,s⋅si(6)p^i(x_1,...,x_{N_T})=\frac{1}{N_T}\sum_{j=1}^{N_T}\sum_{s\in S}x_{j,s}\cdot s^i \tag{6} pi(x1,...,xNT)=NT1j=1∑NTs∈S∑xj,s⋅si(6)
给出PoWPoWPoW。每辆出租车的效用是
Uj(f,x1,...,xNT)=∑i=1npi(xj)⋅Gi(fi,pi(x1,...,xNT))(7)U_ j(f,x_1,...,x_{N_T})=\sum_{i=1}^np^i(x^j) \cdot G^i(f^i, p^i(x_1,...,x_{N_T}) ) \tag{7} Uj(f,x1,...,xNT)=i=1∑npi(xj)⋅Gi(fi,pi(x1,...,xNT))(7)
在NE模式下，假设其他玩家坚持自己的策略，那么没有玩家能够从改变自己的策略中获益。即(x1，…，xNT)(x_1，…，x_{N_T})(x1，…，xNT)在NE中，对于每辆出租车jjj，
Uj(f,x1,...,xNT)≥Uj(f,x1,...,xj−1,x′,xj+1,...,xNT),∀x′≥0,x′=1(8)U_j(f,x_1,...,x_{N_T})\geq U_j(f,x1,...,x_{j-1},x',x_{j+1},...,x_{N_T}),\\ \forall x' \geq 0,x'=1 \tag{8} Uj(f,x1,...,xNT)≥Uj(f,x1,...,xj−1,x′,xj+1,...,xNT),∀x′≥0,x′=1(8)
因为有大量的出租车，所以游戏不是非原子的，这意味着一辆出租车的影响微乎其微。当一辆出租车偏离，它不会改变整体的PoWPoWPoW，也就是
p(f,x1,...,xNT)=p(f,x1,...,xj−1,x′,xj+1,...,xNT),∀x′≥0,x′=1p(f,x_1,...,x_{N_T})=p(f,x1,...,x_{j-1},x',x_{j+1},...,x_{N_T}),\\ \forall x' \geq 0 , x'=1 p(f,x1,...,xNT)=p(f,x1,...,xj−1,x′,xj+1,...,xNT),∀x′≥0,x′=1
将式(8)(8)(8)中的判据改写为
∑i=1npi(xj)⋅Gi(fi,pi(x1,...,xNT))≥∑i=1npi(x′)⋅Gi(fi,pi(x1,...,xNT)),∀x′(9)\sum_{i=1}^np^i(x_j)\cdot G^i(f^i,p^i(x_1,...,x_{N_T}))\geq \sum_{i=1}^np^i(x')\cdot G^i(f^i,p^i(x_1,...,x_{N_T})),\forall x'\tag{9} i=1∑npi(xj)⋅Gi(fi,pi(x1,...,xNT))≥i=1∑npi(x′)⋅Gi(fi,pi(x1,...,xNT)),∀x′(9)
另外，因为效用函数(方程777)与所有出租车相同，所以博弈是对称的。对于对称博弈，总是存在一种对称均衡，在这种均衡下，所有参与者都采用相同的策略。在这种情况下，策略组合可以被简化为一个通用的策略，用xxx表示。我们在方程333把PoWPoWPoW写成p(x)=∑s∈Sxs⋅sp(x)= \sum_{s\in S} x_s \cdot sp(x)=∑s∈Sxs⋅s，于是，式999中的平衡判据变为
∑i=1npi(xj)⋅Gi(fi,pi(x))≥∑i=1npi(x′)⋅Gi(fi,pi(x)),∀x′(10)\sum_{i=1}^np^i(x_j)\cdot G^i(f^i,p^i(x))\geq \sum_{i=1}^np^i(x')\cdot G^i(f^i,p^i(x)),\forall x'\tag{10} i=1∑npi(xj)⋅Gi(fi,pi(x))≥i=1∑npi(x′)⋅Gi(fi,pi(x)),∀x′(10)
为了分析均衡策略，我们构造如下函数：
G(f,p)=∑i=1n∫0piGi(fi,pi)dp.(11)\mathcal{G}(\mathbf{f}, \mathbf{p})=\sum_{i=1}^n\int_0^{p^i}G^i(f^i,p^i)dp.\tag{11} G(f,p)=i=1∑n∫0piGi(fi,pi)dp.(11)
让x∗x^*x∗进入平衡状态。我们认为，被推导出来的PoWPoWPoW p∗=p(x∗)p^∗= p(x^∗)p∗=p(x∗)在给定的fff上使g(f,p)g(f, p)g(f,p)最大化，这意味着，与方程444一样，被如下优化所捕获：
x∗∈argmaxx:x≥0,x=1g(f,p(x)).(12)x^* \in argmax_{x:x\geq 0,x=1}g(f,p(x)).\tag{12} x∗∈argmaxx:x≥0,x=1g(f,p(x)).(12)
注意，我们可以发现maxx:x≥0,x=1g(f,p(x))max_{x:x\geq 0,x=1}g(f,p(x))maxx:x≥0,x=1g(f,p(x))是一个凸优化：ppp的可行空间显然是凸的，而对于自变量ppp来说g(f,p)g(f,p)g(f,p)是凹的（接下来我们将会展示）。根据凸优化的最优性准则，对于所有可行的p′p'p′来说，当且仅当∇g(p∗)(p∗−p′)≥0\nabla g(p^*)(p^*-p')\geq 0∇g(p∗)(p∗−p′)≥0时，p∗p^*p∗是最优的。这与方程101010中的平衡判据完全相同。
正如别处指出的那样（从UiU^iUi的极简性看出），为了观察出g(F,G)g(F,G)g(F,G)的凹度，我们注意到Di(fi,pi)D^i(f^i,p^i)Di(fi,pi)对于pip^ipi是严格凹的。我们通过检验g(f,p)g(f,p)g(f,p)海森矩阵来验证凹性：我们让pi⋅(∂Di(fi,pi)/∂pi)−Di(fi,pi)<0p^i \cdot (\partial D^i(f^i,p^i)/\partial p^i)-D^i(f^i,p^i)<0pi⋅(∂Di(fi,pi)/∂pi)−Di(fi,pi)<0，因为
limpi→0(pi∂Di(fi,pi)∂pi−Di(fi,pi))=0lim_{p^i \rightarrow 0} (p^i \frac{\partial D^i(f^i,p^i)}{\partial p^i}-D^i(f^i,p^i))=0 limpi→0(pi∂pi∂Di(fi,pi)−Di(fi,pi))=0
让
∂Di(fi,pi)∂pi−Di(fi,pi)\frac{\partial D^i(f^i,p^i)}{\partial p^i}-D^i(f^i,p^i) ∂pi∂Di(fi,pi)−Di(fi,pi)
对pip^ipi求偏导得
pi⋅∂2Di(fi,pi)(∂pi)2p^i \cdot \frac{\partial ^2D^i(f^i,p^i)}{(\partial p^i)^2} pi⋅(∂pi)2∂2Di(fi,pi)
其中，最后一个不等式成立，理由如下：由于DiD^iDi的极简性，∂2Di(fi,pi)/(∂pi)2<0\partial ^2D^i(f^i,p^i)/(\partial p^i)^2<0∂2Di(fi,pi)/(∂pi)2<0。因此，海森矩阵是正定的。这也意味着只有一个ppp使G(f,p)\mathcal{G}(\mathbf{f}, \mathbf{p})G(f,p)最大化，这与U(f,p)U(f, p)U(f,p)相似，保证了fff到ppp的一对一对应。

求解算法

我们使用服务客户的总数D(f,p)∑iD(fi,pi)D(f,p)\sum_iD(f^i,p^i)D(f,p)∑iD(fi,pi)去测量系统效率以及制定一个TASEO作为以下两层优化方案：
maxf,x∗D(f,p(x∗))(13)max_{f,x^*}D(f,p(x^*)) \tag{13} maxf,x∗D(f,p(x∗))(13)
使得
x∗∈argmaxx:x≥0,x=1U(f,p(x)),(14)x^* \in argmax_{x:x \geq 0,x=1}U(f,p(x)),\tag{14} x∗∈argmaxx:x≥0,x=1U(f,p(x)),(14)

∂2G(f,p)∂pi∂pj={0,if i≠jFi(fi)γ⋅NT⋅1(pi)2⋅(pi⋅∂Di(fi,pi)∂pi−Di(fi,pi)),if i=j\begin{aligned} &\frac{\partial^{2} \mathcal{G}(\mathbf{f}, \mathbf{p})}{\partial p^{i} \partial p^{j}}\\ &=\left\{\begin{array}{cc} {0,} & {\text { if } i \neq j} \\ {\frac{F^{i}\left(f^{i}\right)}{\gamma \cdot N_{T}} \cdot \frac{1}{\left(p^{i}\right)^{2}} \cdot\left(p^{i} \cdot \frac{\partial D^{i}\left(f^{i}, p^{i}\right)}{\partial p^{i}}-D^{i}\left(f^{i}, p^{i}\right)\right),} & {\text { if } i=j} \end{array}\right. \end{aligned}∂pi∂pj∂2G(f,p)=⎩⎨⎧0,γ⋅NTFi(fi)⋅(pi)21⋅(pi⋅∂pi∂Di(fi,pi)−Di(fi,pi)), if i=j if i=j
通过这个例子中，我们在方程中141414用G(f,p)\mathcal{G}(\mathbf{f}, \mathbf{p})G(f,p)代替U(f,p)U(\mathbf{f}, \mathbf{p})U(f,p)。只要优化目标是fff和ppp的函数，该模型也可以用相同形式的优化程序处理其他系统效率的度量。
为了解决这个双层优化问题，我们可以将连续票价离散化为一个小的候选价格集合，比如说{¥1.00,¥1.20,\{¥ 1.00, ¥ 1.20,{¥1.00,¥1.20, …,¥5.00},\ldots, ¥ 5.00\},…,¥5.00}, 并求解各候选价格下的下一级方案(方程141414)，得到最优票价。因此，问题简化为较简单的程序。不幸的是，由于驱动程序的纯策略集的指数增长，底层程序遇到了可伸缩性问题。例如，当n=18n = 18n=18时，纯策略集包含大于1.7×1051.7×10^51.7×105的策略。因此，如何设计有效的算法来解决可伸缩性问题是我们的方法的关键。
简单地表示策略的一种方法是将司机的工作日程分成具有较少模式的部分。每一节都是出租车司机连续工作的连续时段(见图111)。我们将这些工作部分称为atom调度(或简称atom)，并将这种方法称为atom调度方法(ASM)。显然，给定一个nnn周期模型，我们只需要O(n2)O(n^2)O(n2)原子调度来表示任何原始调度(即通过指定起始和结束周期)。这与原始策略空间的指数大小形成了对比。

图1：atom调度方法

我们把原子表示为一个元组o(J,k)o(J, k)o(J,k)，其中JJJ和KKK分别表示开始和结束阶段。为了重新制定较低层次的原子进度表，我们给每个原子ooo分配一个加权w0w _0w0来表示使用该原子的出租车的百分比。因此，PoWPoWPoW 可以计算为
pi=∑o∈Owo⋅δ(o,i),∀i=1,…,np^{i}=\sum_{o \in \mathcal{O}} w_{o} \cdot \delta(o, i), \quad \forall i=1, \ldots, npi=o∈O∑wo⋅δ(o,i),∀i=1,…,n
其中，δ(o,i)\delta(o,i)δ(o,i)表示原子ooo是否在阶段iii工作，也就是，如果j≤i≤kj\leq i \leq kj≤i≤k则δ(o,⟨j,k⟩,i)=1\delta(o,\langle j, k\rangle, i)=1δ(o,⟨j,k⟩,i)=1，否则δ(o,⟨j,k⟩,i)=0\delta(o,\langle j, k\rangle, i)=0δ(o,⟨j,k⟩,i)=0。OOO是我们需要的所有原子的集合。显然，现在，ppp被定义为一个函数p=p(w)p = p(w)p=p(w)，因此较低级别的程序可以被重新表述为一个紧凑的程序，它接受www(而不是xxx)作为变量。特别地，当C2C2C2作用于S\mathcal{S}S时，我们只需要在大多数ncn_cnc周期内的原子，因此
O⊆{o⟨j,k⟩∣1≤j≤k≤n,0≤k−j<nc}O \subseteq\left\{o\langle j, k\rangle | 1 \leq j \leq k \leq n, 0 \leq k-j<n_{c}\right\}O⊆{o⟨j,k⟩∣1≤j≤k≤n,0≤k−j<nc}
并且在OOO中原子数小于nc×nn_c×nnc×n，许多变量在紧凑的公式。新公式的结构是这样的：
max⁡f,w∗D(f,p(w∗))\max _{\mathbf{f}, \mathbf{w}^{*}} D\left(\mathbf{f}, \mathbf{p}\left(\mathbf{w}^{*}\right)\right) f,w∗maxD(f,p(w∗))
使得
w∗∈argmaxw∈WU(f,p(w))\mathbf{w}^{*} \in argmax_{\mathbf{w} \in \mathcal{W} }U (\mathbf{f,p(w))} w∗∈argmaxw∈WU(f,p(w))
其中
W={w∈R∣O∣∣0≤wo≤1,∀o∈Opi(w)+qi(w)≤1,∀i=1,…,n∑i=1npi(w)≤nw}\begin{aligned} &\mathcal{W}=\\ &\left\{\mathbf{w} \in \mathbb{R}^{|O|} | \begin{array}{rl} {0 \leq w_{o} \leq 1,} & {\forall o \in \mathcal{O}} \\ {p^{i}(\mathbf{w})+q^{i}(\mathbf{w}) \leq 1,} & {\forall i=1, \ldots, n} \\ {\sum_{i=1}^{n} p^{i}(\mathbf{w}) \leq n_{w}} \end{array}\right\} \end{aligned} W=⎩⎨⎧w∈R∣O∣∣0≤wo≤1,pi(w)+qi(w)≤1,∑i=1npi(w)≤nw∀o∈O∀i=1,…,n⎭⎬⎫
与POW\mathrm{P}_{\mathrm{O}} \mathrm{W}POW，qi(w)q^i(\mathbf{w})qi(w)是在i−1i-1i−1由工作状态转向休息状态的出租车百分比，也就是qi(w)=∑o∈Owo⋅δ′(o,i)q^i(\mathbf{w})=\sum_{o\in \mathcal{O}}w_o \cdot \delta'(o,i)qi(w)=∑o∈Owo⋅δ′(o,i)，其中，如果k=i−1k=i-1k=i−1（假设ooo在阶段i−1i-1i−1结束）并且δ′(o,⟨j,k⟩,i)=0\delta'(o,\langle j,k \rangle,i)=0δ′(o,⟨j,k⟩,i)=0，那么δ(o,⟨j,k⟩,i)=1\delta(o,\langle j,k \rangle,i)=1δ(o,⟨j,k⟩,i)=1，否则δ(o,⟨j,k⟩,i)=0\delta(o,\langle j,k \rangle,i)=0δ(o,⟨j,k⟩,i)=0。可以证明，W\mathcal{W}W保证了简化公式与原公式的等价性。若没有W\mathcal{W}W，所得到的解可能找不到与之对应的简洁的混合策略。

实证评估

我们从北京交通研究中心获得真实数据进行了实证研究。我们计算出真实出租车市场的最优票价，检查调度约束的影响，并评估了ASM\mathrm{ASM}ASM的性能。以对称策略为前提，建立了出租车司机行为模型。

最优票价

每隔￥0.20，我们检查了从￥1.00到￥5.00的价格。对于每个价格，我们计算了司机的最优运营策略，并根据现有的出租车市场模型，用计算出的司机策略检查了系统效率（流程在图2）。图4(a)4(a)4(a)显示了系统效率方差。由蓝色曲线可知，考虑约束C1\mathrm{C}1C1和C2\mathrm{C}2C2时，系统效率峰值为￥2.60。

图2：出租车司机决策流程

图3：出租车司机决策流程

图4

调度约束的影响。 我们通过从模型中删除C1\mathrm{C}1C1和C2\mathrm{C}2C2，从而评估影响驱动程序行为(进而影响系统效率)。正如图4a4a4a展示，当我们忽略约束时，系统效率仍然在提高，导致了一个不准确的结果：￥5.00（甚至更高）。使系统效率的提高额外增加实际上是不切实际的，因为司机的过度工作。这可以在图4b4b4b中看到，PoW\mathrm{PoW}PoW的方差表明由于调度约束，出租车司机在高峰阶段不愿意工作。在这种情况下，系统不会从更高的票价中受益，因为当更高的价格不能通过激励更多的出租车工作来提高服务质量时，它只会导致客户数量的减少和效率的降低。
ASMASMASM的性能。 最后，我们评估了解决方案算法ASMASMASM的可伸缩性。首先，我们将时间范围离散成不同的周期数来扩展问题。与简单的公式（公式131313和141414）相比，图5a5a5a和5b5b5b描述了ASMASMASM在不同规模问题上的运行和内存使用情况。简单的公式在第15个时期内存不足，但是ASMASMASM可以很轻松地处理多大100个时期的问题。当数据可用时，扩展到更多周期的能力使得我们使用更细粒度的模型来实现更高的准确性。它也让我们考虑更长的市场周期（例如，在一周内，考虑周末和工作日客户需求的差异）。

图5：ASM的运行和内存使用情况

展望

尽管目前的模型和算法能够处理特定设置的TASEOsTASEOsTASEOs，但是它们仍然不能满足更广泛和复杂的现实场景。我们为今后的研究指明了以下方向：
具有更好可扩展性的算法。 在实践中，客户需求和路况在不同的日子可能不一样。出租车市场的周期更有可能是一周，而不是一天，因此要以相同的粒度覆盖整个星期，还需要投入更多的时间。类似地，当模型需要更细粒度以获得更高的准确性时，需要更短的时间段，如半小时甚至10分钟，并且周期的数量也相应增加。虽然在其他地方提出了一种基于多边形表示转换的可扩展算法，但是当考虑其他现实约束和不确定性时，该算法可能无法很好地扩展。
异构出租车和出租车司机。 我们目前的模型是建立在假设所有出租车和司机都是同质的基础上的。虽然这在许多城市的出租车系统中是普遍存在的，但是一些特殊的情况就需要特殊处理。例如，在一些城市，出租车可以由多个司机操作，以最大限度地提高使用率。在这种情况下，出租车可以运行更长的时间，实际上可能违反了约束C1C1C1和C2C2C2。汽车类型和出租车公司的差异也值得我们考虑。
人类行为的不确定性。 不确定性一直是智能行为建模的问题。在出租车系统中，司机在实施策略时面临不确定性。他们不能决定下一位顾客什么时候会来，也不能决定服务下一位顾客需要多长时间。在实践中，出租车司机会根据他们所面临的市场情况来选择他们的行为。如何在不确定性下模拟他们的行为是另一个需要关注的问题。
基于应用程序的服务的影响。 近些年智能手机的快速发展提供了大量的新应用程序和服务。拼车应用和顾客对司机的打车应用正在重塑传统的出租车市场，如优步和滴滴打车将出租车司机与寻求搭车服务的顾客联系起来。值得注意的是，这些服务不仅仅是一个简单的调度系统——它们还提供了客户和司机之间的谈判，并为双方提供了更广泛的选择。这些新服务的使用越来越多，表明在出租车系统研究中考虑这些服务的必要性。
空间差异 虽然我们的模型只考虑了出租车系统的时间方差，但空间方差是出租车系统的一个共同特征，尤其是在大城市中。不同地点的乘客需求密度和交通挤塞程度可能有所不同，对的士系统的表现有重大影响。我们将在今后的工作中加以考虑。

基于博弈论的出租车系统效率优化相关推荐

SAP License：合理的机制才能让系统效率最大
对于系统的应用我们一直要站在也业务的角度来设计,但是业务的顺利完成是需要有一个合理的机制的.只有在这种机制下才能打破利益的主体,下面我简单的讲讲机制的设计思路以及机制的实现,后面会讲到基于机制下的系统 ...
SAP License：雾里看花系列——合理的机制才能让系统效率最大
"SAP权限管理"小伙伴你们好.又是几天没见,很是想念你们,2021年已过半年,最近一直忙着计划和预算的事情,总算是忙完了.结果还要设计出绩效责任书便于对各个部门的考核,不过还好总 ...
c语言风光互补运行模式,基于风光互补特性的风电光热电站联合系统容量优化方法与流程...
本发明属于风电光热电站联合发电系统技术领域,特别涉及到一种基于风光互补特性的风电光热电站联合系统容量优化方法. 背景技术: 光热发电技术是一种利用集热器将太阳能聚集起来.加热工质,由此驱动汽轮发电机发 ...
java出租车计价系统,基于STM32的出租车计价器系统
[实例简介] 基于STM32的出租车计价器系统,里面有PPT,实验报告 [实例截图] [核心代码] rj4s6l └── 出租车计价器 └── 单片机课程设计---出租车计价器 ├── IMG2013 ...
文献：《基于博弈论的多微电网系统交易模式研究》Matlab完全复现
文献:<基于博弈论的多微电网系统交易模式研究>Matlab完全复现关键词:微电网:多微电网:博弈论:电力交易:分布式发电描述:提出了采用非合作博弈研究多微电网交易模式的一般模型及分析方 ...
【微电网优化】基于粒子群算法求解混合储能系统容量优化问题含Matlab源码
1 简介为了提高供电的稳定性.可靠性,实现日夜发电,在太阳能.风能资源比较丰富的区域,建立风能.太阳能互补发电系统.但是由于系统投入成本过高,风.光又存在间歇性和不稳定性等问题,需要配置储能系统来平 ...
混合储能系统容量优化MATLAB程序基于粒子群算法
混合储能系统容量优化MATLAB程序基于粒子群算法 (1)该程序为基于粒子群算法的混合储能系统容量优化程序,中文核心期刊论文源程序,配有该论文,再给一篇类似的参考论文. (2)该程序中混合储能系统为蓄 ...
《基于改进粒子群算法的混合储能系统容量优化》完全复现
<基于改进粒子群算法的混合储能系统容量优化>完全复现 matlab. 以全生命周期费用最低为目标函数,负荷缺电率作为风光互补发电系统的运行指标,得到蓄电池储能和超级电容个数,缺电率和系统最 ...
基于MATLAB GUI汉字识别系统开发与优化
基于MATLAB GUI汉字识别系统开发与优化前言汉字识别在现代信息技术中扮演着至关重要的角色.随着人工智能技术的不断进步,汉字识别算法也得到了迅速发展,同时,图形用户界面(GUI)也成为了现代计 ...

基于博弈论的出租车系统效率优化