孫麗君, 李方方, 王新月, 胡祥培
(大連理工大學(xué) 經(jīng)濟(jì)管理學(xué)院,遼寧 大連 116024)
移動充電車由于其靈活移動性[1]緩解了固定充電樁站點(diǎn)分布不均衡導(dǎo)致的電動汽車車主的續(xù)航焦慮問題,有效地補(bǔ)充了電動汽車充電網(wǎng)絡(luò)。然而,目前移動充電車充電方式大多借助e充電等網(wǎng)上預(yù)約充電app,由電動汽車車主根據(jù)app中披露的移動充電車狀態(tài)自主預(yù)約充電。這種預(yù)約充電模式對移動充電車運(yùn)營商而言是一種被動的需求響應(yīng),沒有從整體上高效智能地響應(yīng)預(yù)約需求,導(dǎo)致物流成本高、客戶滿意度低。比如,當(dāng)充電需求的位置偏僻且充電時(shí)段在需求高峰時(shí)段時(shí),系統(tǒng)若響應(yīng)該需求,則未來可能無法響應(yīng)其它高盈利性的充電需求。因此,本文提出了新的預(yù)約模式:首先,電動汽車車主基于預(yù)約充電app披露充電需求,包含服務(wù)時(shí)間窗、充電的位置及電量;然后,移動充電車運(yùn)營商綜合考慮該需求屬性、已接受訂單、未來需求、移動充電車的當(dāng)前位置及剩余電量等,實(shí)時(shí)評估該需求對整體收益的影響以實(shí)時(shí)判斷是否響應(yīng)該需求,即,如果該需求不能增加整體收益,則不響應(yīng);否則,響應(yīng)該需求并將其轉(zhuǎn)換為訂單進(jìn)行服務(wù)。本文基于該模式,從移動充電車運(yùn)營商的角度,研究考慮整體收益的實(shí)時(shí)需求響應(yīng)策略,這對于企業(yè)整體收益的提高及移動充電行業(yè)的發(fā)展意義重大。
本文所提實(shí)時(shí)需求響應(yīng)策略需要主動、實(shí)時(shí)地判斷是否響應(yīng)動態(tài)到達(dá)的預(yù)約需求(Late Customers, LCs),該過程會受到已經(jīng)接受的預(yù)約需求(Early Customers, ECs)的影響,需要決策以下內(nèi)容:1)考慮整體收益,實(shí)時(shí)決策是否響應(yīng)LCs及響應(yīng)LCs后如何服務(wù);2)考慮充電時(shí)間窗,為ECs制定具有動態(tài)可調(diào)整性的充電服務(wù)方案。因此,與本研究密切相關(guān)的研究有兩大類。一類是實(shí)時(shí)需求響應(yīng)策略(Real-time Demand Response Strategy, RDRS)研究,其主要聚焦于需求被響應(yīng)后,如何制定分配策略,如,Chen[2]等人在響應(yīng)需求后使用基于規(guī)則的分配策略,首先將服務(wù)區(qū)域劃分為子區(qū)域,其次將需求分配給其子區(qū)域內(nèi)最近的空閑車輛,如果其子區(qū)域內(nèi)沒有空閑車輛,則尋找周圍的子區(qū)域;Hyland[3]等人提出并比較了六種分配策略。一類是考慮未來隨機(jī)需求信息的帶時(shí)間窗約束的動態(tài)車輛路徑問題(Dynamic vehicle routing problem with time windows and stochastic service requests, DVRPTWSSR)[4]。該類研究主要基于未來隨機(jī)需求研究車輛的等待策略,比如,Mohamed[5]研究考慮未來客戶需求的動態(tài)車輛問題,提出基于共同進(jìn)化的等待策略生成方法以最大化可以服務(wù)的需求數(shù)量。該類研究的求解主要基于特定的需求概率分布,采用Sampling方法、隨機(jī)規(guī)劃方法等。Sampling[6]方法一般基于隨機(jī)分布生成場景集;隨機(jī)規(guī)劃方法主要包括近似動態(tài)規(guī)劃(Approximate Dynamic Programming, ADP)[7]與馬爾可夫決策過程[8]等。由于本研究面臨高維的決策變量與狀態(tài)變量,基于狀態(tài)空間搜索求解時(shí)會出現(xiàn)“維數(shù)災(zāi)”,且需要確定趨于收斂的決策后狀態(tài)的未來價(jià)值。而ADP能有效避免“維數(shù)災(zāi)”,也能基于仿真不斷迭代確定近似最優(yōu)的決策后狀態(tài)的未來價(jià)值,以在決策中考慮未來的隨機(jī)信息。因此,本文采用ADP綜合未來隨機(jī)需求信息,以基于決策后狀態(tài)的未來價(jià)值進(jìn)行決策。
綜上所述,現(xiàn)有兩類研究可為本研究提供思路,但不能被直接應(yīng)用于本研究,原因如下:1)實(shí)時(shí)需求響應(yīng)策略的研究主要針對希望盡快被服務(wù)的即時(shí)需求,研究需求響應(yīng)后的分配策略,這些需求往往沒有時(shí)間窗約束;而本文針對具有充電服務(wù)時(shí)間窗的預(yù)約需求,且需要實(shí)時(shí)判斷是否響應(yīng)LCs。2)DVRPTWSSR的相關(guān)研究一般基于未來隨機(jī)需求研究的等待策略;而本文在基于未來隨機(jī)需求的同時(shí),研究ECs的充電服務(wù)路徑方案的動態(tài)更新與LCs的實(shí)時(shí)響應(yīng)決策。3)在ADP的相關(guān)研究[9]中,動態(tài)需求的時(shí)間窗約束要求較松,可寬延至下一天被服務(wù);而本文的充電需求不僅有明確的充電服務(wù)時(shí)間窗,而且LCs的實(shí)時(shí)響應(yīng)決策與ECs的充電服務(wù)方案存在著動態(tài)交替影響。
本研究同時(shí)具有DVRPTWSSR問題和RDRS問題的特征,且LCs和ECs要考慮未來的隨機(jī)需求進(jìn)行決策,以上三類問題特征的融合產(chǎn)生如下難點(diǎn):1)LCs的動態(tài)到達(dá)性和實(shí)時(shí)響應(yīng)性導(dǎo)致不能基于已知的需求信息確定需求響應(yīng)策略;2)預(yù)約模式下,LCs的實(shí)時(shí)響應(yīng)決策與ECs的充電服務(wù)方案L存在動態(tài)交替影響,即L將約束可響應(yīng)的LCs,響應(yīng)LCs后將觸發(fā)L的更新;3)ECs和LCs都有嚴(yán)格的充電服務(wù)時(shí)間窗約束;4)未來需求的不確定性增強(qiáng)了系統(tǒng)的動態(tài)性,也增加了LCs和ECs聯(lián)動決策的難度。
因此,為滿足LCs和ECs的要求的同時(shí)考慮其動態(tài)交替影響,本文提出了考慮未來需求的兩階段實(shí)時(shí)需求響應(yīng)策略:第一階段為ECs滾動決策出可動態(tài)調(diào)整的服務(wù)路徑方案,并輸入到第二階段;第二階段則實(shí)時(shí)決策是否響應(yīng)LCs,如果響應(yīng),則納入到ECs序列;其中,決策的未來價(jià)值采用基于ADP思想的近似值迭代(AVI)算法求解,以衡量未來需求對決策的影響。最后,數(shù)值實(shí)驗(yàn)比較了本文策略與其他策略的整體收益,明確了本文策略的適用場景,并給出了管理啟示。
結(jié)合實(shí)踐調(diào)研結(jié)果及相關(guān)文獻(xiàn),本研究的前提如下:1)移動充電車的類型相同且數(shù)量固定不變;2)車輛勻速行駛,其行駛時(shí)間和行駛距離成正比;3)每個(gè)預(yù)約訂單由且僅由一輛移動充電車服務(wù);4)充電服務(wù)時(shí)長與充電量成正比;5)已響應(yīng)的LCs必須服務(wù);6)有可以滿足ECs的充電服務(wù)路徑方案;7)移動充電車基于訂單的服務(wù)時(shí)間窗為其充電,若早到則須等待;8)移動充電車服務(wù)完某訂單后若無后續(xù)任務(wù),則在該點(diǎn)等待;9)不考慮未被響應(yīng)的預(yù)約需求的懲罰,因?yàn)樵擃A(yù)約模式是基于移動充電車運(yùn)營商的視角,最大化運(yùn)營商在一個(gè)工作周期內(nèi)的整體收益,可以不響應(yīng)不利于提高整體收益的預(yù)約需求,其不響應(yīng)機(jī)制對于客戶而言是不透明的,因此不會影響本次未被響應(yīng)客戶的下次下單;同時(shí),不響應(yīng)該需求不是拒絕其進(jìn)入預(yù)約系統(tǒng)尋求服務(wù),而是激發(fā)其改變預(yù)約屬性[10],如,充電的服務(wù)時(shí)間、地點(diǎn)等,以系統(tǒng)能接受的屬性重新進(jìn)入系統(tǒng)以獲得響應(yīng)。
由于ECs會隨時(shí)間的推移不斷更新,此時(shí)ECs的訂單組的結(jié)構(gòu)對后續(xù)LC的響應(yīng)存在較大影響。因此,本研究將工作周期劃分為K+1個(gè)時(shí)段,K為正整數(shù),每個(gè)時(shí)段的時(shí)間長度t固定,在各時(shí)段滾動實(shí)現(xiàn)本文策略,如圖1所示,包含以下方法和步驟:1)第一階段是為ECs,滾動決策出可以動態(tài)更新的充電服務(wù)路徑方案(1.2.1節(jié));2)第二階段是針對LCs進(jìn)行實(shí)時(shí)響應(yīng)判定決策(1.2.2節(jié));3)采用基于ADP思想的近似值迭代(AVI)算法決策出趨于收斂的決策的未來價(jià)值,并將其融于兩階段響應(yīng)策略中(1.2.3節(jié))。
圖1 實(shí)時(shí)需求響應(yīng)策略流程圖
1.2.1 第一階段需求響應(yīng)策略
本節(jié)為最大化ECs的充電服務(wù)路徑方案的整體收益,提出多階段隨機(jī)動態(tài)決策模型。該模型在每個(gè)階段初選擇可以最大化當(dāng)期收益和未來價(jià)值之和的決策X*(Sk)及其對應(yīng)的服務(wù)路徑方案L*。為保證ECs可以滿足時(shí)間窗約束,每個(gè)決策點(diǎn)可采取的決策X(Sk)是基于VRPTW模型與禁忌搜索算法確定的。其中,多階段隨機(jī)動態(tài)決策模型、X(Sk)的確定流程的具體描述如下。
(1)多階段隨機(jī)動態(tài)決策模型
(2)確定每個(gè)決策點(diǎn)可采取決策的流程
每個(gè)決策點(diǎn)可采取決策的確定步驟如下:
Step1基于Sk構(gòu)建靜態(tài)VRPTW模型
本文構(gòu)建以下靜態(tài)VRPTW模型:
max∑m∈M∑(i,j)∈R(qj×qc-cij)xijm
(1)
∑m∈M∑j∈Nxijm=1,?i∈N*,i≠j
(2)
∑j∈Nx0jm≤1,?m∈M
(3)
ej≤sjm≤lj,?j∈N*,?m∈M
(4)
sim+tij-sjm≤(1-xijm)Fijm,?(i,j)∈R,?m∈M
(5)
xijm∈{0,1},?(i,j)∈N,?m∈M
(6)
其中,式(1)表示最大化總收益(訂單總收益減服務(wù)訂單的總行駛成本);式(2)表示每個(gè)已經(jīng)接受的充電訂單能且僅能被服務(wù)一次;式(3)表示移動充電車一天最多從充電站出發(fā)一次進(jìn)行充電服務(wù);式(4)表示移動充電車m開始服務(wù)客戶j的時(shí)刻在[ej,lj]內(nèi);式(5)表示移動充電車基于預(yù)約訂單充電時(shí)間窗的時(shí)間順序進(jìn)行充電;式(6)表示決策變量的取值約束,移動充電車m通過弧(i,j)并服務(wù)訂單j時(shí),xijm=1,否則xijm=0。
Step2基于禁忌搜索(Tabu Search, TS)算法求解靜態(tài)VRPTW模型。
根據(jù)VRPTW求解算法文獻(xiàn)[11],TS算法搜索范圍和產(chǎn)生可行解的空間廣,已用于求解靜態(tài)VRPTW、DVRPTWSSR問題等[12],是目前較有效的VRPTW模型求解算法。因此,本文基于TS算法求解靜態(tài)VRPTW模型:首先,基于插入式算法生成初始路徑方案L0;其次,L0分別執(zhí)行u次TS算法,得到u個(gè)服務(wù)路徑方案Lr(r=1, 2, …,u),其中每次算法執(zhí)行時(shí)的最大迭代次數(shù)不同。
Step3基于Lr提取每個(gè)決策點(diǎn)可采取的行動。
1.2.2 第二階段需求響應(yīng)策略
(1)響應(yīng)LCs的可行性判斷
判斷響應(yīng)LCs是否可行,要判斷該需求插入L*后能否同時(shí)滿足移動充電車的載電量約束和需求的服務(wù)時(shí)間窗約束[13]。設(shè)L*中某條服務(wù)路線rm={m1,…,md,…,mp}。則如果rm的第d個(gè)訂單之后能夠插入需求h,需要同時(shí)滿足如下約束:
(7)
(8)
(9)
(10)
(11)
Tmh+Wmh-(sdm+Tmd+Wmd+tmd,md+1)
=tmd,mh+Tmh+Wmh+tmh,md+1-tmd,md+1
(12)
(13)
(2)響應(yīng)LCs的價(jià)值性判斷
判斷響應(yīng)LCs是否有價(jià)值,主要判斷不插入新需求的當(dāng)前收益與決策后狀態(tài)對應(yīng)條目的價(jià)值之和是否比插入該需求時(shí)大;如果大,則不響應(yīng)該需求;否則,響應(yīng)該需求。
1.2.3 AVI算法
(14)
其中,α表示近似過程的步長。為了快速有效的近似,本研究利用動態(tài)查表算法(DLT)[9]設(shè)計(jì)近似值函數(shù),將決策后狀態(tài)的價(jià)值存儲在表格中。該算法將狀態(tài)空間分割為不同分區(qū)并用條目表示,并根據(jù)分區(qū)的重要程度進(jìn)行不同粒度的劃分。本研究中LCs的響應(yīng)決策和ECs的最優(yōu)服務(wù)路徑?jīng)Q策受可用服務(wù)資源和待服務(wù)訂單數(shù)影響,因此本文的狀態(tài)空間由剩余工作時(shí)間、剩余載電量、剩余訂單數(shù)組成。該狀態(tài)空間涉及三維DLT,演化實(shí)例見圖2,從左到右,狀態(tài)空間的不同分區(qū)進(jìn)行了不同程度的裂變,最終右上角區(qū)域未發(fā)生裂變,左下角區(qū)域高度分裂,是重點(diǎn)區(qū)域。
圖2 DLT的動態(tài)演化示例圖
仿真流程包含兩步:1)離線仿真過程,仿真本文策略,采用AVI算法求得趨于收斂的決策后狀態(tài)的未來價(jià)值Vπ*;2)預(yù)約需求的在線響應(yīng)過程,基于Vπ*確定期初ECs的最優(yōu)充電服務(wù)路徑方案L*,并實(shí)時(shí)決策是否響應(yīng)LCs。
該過程的具體步驟如下:
步驟1初始化迭代次數(shù):n←1。
步驟2初始化以下參數(shù):時(shí)段k←0,累計(jì)收益R-1←0,基于系統(tǒng)當(dāng)前狀態(tài)S0與插入式算法確定車輛路徑方案L0,條目的價(jià)值V(ω0)。
步驟3第k個(gè)時(shí)段初,根據(jù)每個(gè)決策點(diǎn)可采取決策的流程,獲得L*、時(shí)段(k×t,(k+1)×t](Tk)內(nèi)采取的具體行動SAk(*)、SAk(*)的當(dāng)前收益R(SAk(*))、決策后狀態(tài)及其對應(yīng)的條目ωk,并更新累計(jì)收益Rk=Rk-1+R(SAk(*))。
步驟4基于L*以及LCs的可行性與價(jià)值性判斷,實(shí)時(shí)判斷時(shí)段Tk內(nèi)是否要響應(yīng)LCs(注:離線階段還沒有得到Vπ*,且,LCs的響應(yīng)數(shù)量可在一定程度上反映狀態(tài)價(jià)值,因此,LCs的價(jià)值判斷環(huán)節(jié)只要能夠響應(yīng)新需求就響應(yīng))。
步驟5判斷時(shí)刻是否到(k+1)×t,如果是,則令k=k+1、L0=L*,進(jìn)入步驟6;否則,回到步驟4。
步驟6判斷k是否等于K,如果是,進(jìn)入步驟7;否則,回到步驟3。
步驟9令n=n+1,判斷n是否大于Mn,如果是,則輸出全部條目及其價(jià)值;否則,回到步驟2。
ECs的充電服務(wù)路徑方案按以下步驟生成:
步驟1令決策點(diǎn)k=-1,生成初始方案L0。
步驟2判斷k是否小于K,若是,轉(zhuǎn)入步驟3;否則,結(jié)束。
步驟3令k=k+1,基于X(Sk)的確定流程與Vπ*,確定L*、Tk內(nèi)的行動集合SAk(*)。
步驟1基于LCs的可行性判斷,判斷LCs能否插入到L*,若不能,則不響應(yīng)該需求;否則,轉(zhuǎn)到步驟2。
步驟2基于響應(yīng)LCs的價(jià)值判斷與Vπ*,判斷不插入LCs的整體收益是否比插入時(shí)大,如果是,則不響應(yīng)該需求;否則,響應(yīng)該需求并將其納入ECs訂單集合中,更新L*。
步驟3判斷是否到(k+1)×t,如果是,則執(zhí)行針對ECs的步驟2~3;否則,回到步驟1。
本文參數(shù)根據(jù)調(diào)研實(shí)際設(shè)置為:仿真時(shí)長為8h,移動充電車行駛速率為25km/h,條目初始價(jià)值為1000。本算法基于python3.6實(shí)現(xiàn),測試環(huán)境為Intel Core i7,16GB內(nèi)存的Windows平臺。
本文為驗(yàn)證所提策略的有效性,將其與經(jīng)典響應(yīng)策略[3]進(jìn)行對比實(shí)驗(yàn)。為保證策略的一致性,本文對經(jīng)典策略進(jìn)行以下改造:①構(gòu)造符合本研究充電需求特點(diǎn)的需求;②基于靜態(tài)局部優(yōu)化算法確定車輛服務(wù)路徑方案后,判斷能不能響應(yīng)LCs。兩種策略的區(qū)別為:針對ECs,比較策略是基于即時(shí)收益確定最優(yōu)車輛路徑方案L1*,本文策略則基于即時(shí)收益與決策未來價(jià)值確定;針對LCs,比較策略是只要需求能插入L1*就響應(yīng)它,本文策略還要判定響應(yīng)該需求的未來價(jià)值。
本文以表示研究目標(biāo)的期望整體收益AR和反映動態(tài)需求響應(yīng)質(zhì)量的期望響應(yīng)時(shí)間AT為評價(jià)指標(biāo),進(jìn)行了100次對比實(shí)驗(yàn)。其中,AR和AT的單位分別為元和秒。針對ECs和LCs的特點(diǎn),本文比較兩種策略在動態(tài)度dd和客戶規(guī)模nd不同取值下的效果,并得出管理啟示。同時(shí)更新時(shí)段長度Δt、移動充電車車輛規(guī)模nc也會影響實(shí)驗(yàn)結(jié)果,為確定其取值,本文以RC101為例,進(jìn)行不同Δt、nc的對比實(shí)驗(yàn),結(jié)果分別如表1、表2所示:1)Δt=20min時(shí),兩種策略的AR最大且更新頻次適中,因此,后續(xù)實(shí)驗(yàn)中Δt取為20min;2)nc=5時(shí),本文策略的AR增加百分比(PIAR=(本策略AR-對比策略AR)/對比策略AR×100%)最高,但是本文策略及對比策略的AR最低;nc=15時(shí),兩種策略的AR、PIAR表現(xiàn)均不錯(cuò),因此,后續(xù)實(shí)驗(yàn)中nc取為15。
表1 不同Δt下的整體收益期望值實(shí)驗(yàn)結(jié)果
表2 不同車輛規(guī)模下的整體收益期望值實(shí)驗(yàn)結(jié)果
(1)動態(tài)度
為驗(yàn)證dd對策略效果的影響,令dd取不同值進(jìn)行策略對比實(shí)驗(yàn),AT的比較結(jié)果如表3。為清楚地展示三種算例在不同dd、不同響應(yīng)策略下的AR及本文策略的PIAR變化情況,本文繪制圖3。
表3 各策略不同動態(tài)度的實(shí)驗(yàn)結(jié)果
圖3顯示,本文策略及對比策略的AR隨dd的變大而下降。這是由于兩種策略是按時(shí)段滾動更新ECs的服務(wù)方案,dd越高,可響應(yīng)的LCs的數(shù)量可能越少,AR就越低。圖3中本文策略PIAR的變化趨勢圖顯示,dd越高,本文策略的PIAR也越高,這說明相同條件下,LCs占比較多時(shí),本文策略具有更好的實(shí)時(shí)決策能力。同時(shí)表3顯示,兩種策略的AT隨dd的增加卻下降。這是由于對LCs的實(shí)時(shí)響應(yīng)需要判斷其能否插入期初生成的L*,而dd越高,ECs數(shù)量占比越小,L*的規(guī)模越小、復(fù)雜度越低,遍歷L*耗費(fèi)的時(shí)間越短,因此AT呈明顯下降趨勢。同時(shí),本文策略的AT均在0.01s內(nèi),可以滿足需求響應(yīng)的實(shí)時(shí)性要求。
(2)客戶規(guī)模
為分析客戶規(guī)模nd對策略目標(biāo)的影響,本節(jié)將算例RC101、R101、C101的nd增加一倍,分別命名為RC1_2_1、R1_2_1、C1_2_1,并維持其他實(shí)驗(yàn)條件不變。三種算例在不同響應(yīng)策略、不同dd下的AR、AT的結(jié)果見表4,在不同dd下PIAR的表現(xiàn)見圖4。為了直觀地反映不同nd對本文策略PIAR的影響,本文繪制本策略在不同nd中PIAR的絕對差值隨dd變化的趨勢圖,見圖5。
圖3 動態(tài)度對本策略與對比策略期望收益大小的影響
表4 各策略不同動態(tài)度下的實(shí)驗(yàn)結(jié)果(nc=15)
圖4 動態(tài)度對本策略整體期望收益增加百分比的影響
圖5 動態(tài)度對本策略在不同客戶規(guī)模下整體期望收益增加百分比絕對差值的影響
首先,觀察同一客戶規(guī)模下兩種策略的表現(xiàn)。表4、圖4顯示,兩種客戶規(guī)模下的結(jié)果類似:1)兩種策略的AT和AR均隨著dd的增大而減少,且本文策略的AT均在0.01s內(nèi),因此本文策略符合決策的實(shí)時(shí)性要求;2)本文策略的PIAR隨著dd的增大而增大。然后,觀察各算例在不同規(guī)模中本策略相較于對比策略的PIAR的趨勢。圖5顯示,PIAR的絕對差值(大規(guī)模算例下PIAR-小規(guī)模算例下PIAR)均大于0,且隨dd的提高逐漸增高,說明本策略在大規(guī)模、動態(tài)度較高的需求響應(yīng)問題中更有優(yōu)勢。且圖4顯示,本文策略在動態(tài)度為0.95的C1_2_1中,PIAR最大。為進(jìn)一步驗(yàn)證本文策略在動態(tài)度為0.95的C1_2_1中的效果,本文做了不同nc下的對比實(shí)驗(yàn),結(jié)果見表5:1)本文策略相較于對比策略的PIAR在不同nc下的提升幅度均較明顯,進(jìn)一步驗(yàn)證了前文所述nc對本文策略的影響;2)nc為30時(shí),本文策略具有最高的AR與PIAR。為進(jìn)一步探討nc為30時(shí),表4中三個(gè)算例在不同dd下AR、AT的效果,本文做了對比實(shí)驗(yàn),結(jié)果如表6所示,進(jìn)一步驗(yàn)證了本文策略的AR均高于對比策略,且在C1_2_1中有較高的提升幅度。
表5 不同車輛規(guī)模下的整體收益期望值實(shí)驗(yàn)結(jié)果
表6 各策略不同動態(tài)度下的實(shí)驗(yàn)結(jié)果(nc=30)
(3)管理啟示
上述對比實(shí)驗(yàn)可得出以下結(jié)論:1)在不同的更新時(shí)段長度、車輛規(guī)模、動態(tài)度以及客戶規(guī)模下,本文策略的系統(tǒng)整體收益相對于經(jīng)典策略都有了提升;同時(shí),本文策略在大規(guī)模算例C1_2_1中,在高動態(tài)度0.95、不同車輛規(guī)模下,期望總收益相較于經(jīng)典策略增加的百分比提升幅度均較明顯;2)雖然本文策略在某些情況下的整體收益較經(jīng)典策略提升的絕對值幅度不是很大,但是該提升收益僅是一天期望總收益的提升,實(shí)踐中任何一點(diǎn)收益的每日提升,在長期上都有很大的價(jià)值,這是企業(yè)孜孜不倦追求的目標(biāo)。特別地,企業(yè)規(guī)模越大,長期累計(jì)的價(jià)值將越高。因此,基于本文策略的長期累積價(jià)值是不可估量的。
數(shù)值實(shí)驗(yàn)結(jié)果可以得出以下管理啟示:(1)與經(jīng)典響應(yīng)策略相比,本文所提策略隨著動態(tài)度的增大對整體收益增加的優(yōu)勢越來越突出,且在客戶規(guī)模較大時(shí)對整體收益的優(yōu)化空間更大;(2)本文提出的預(yù)約模式下考慮未來需求的實(shí)時(shí)需求響應(yīng)策略,既可以動態(tài)更新已接收未服務(wù)的訂單的服務(wù)方案,也可以實(shí)時(shí)響應(yīng)動態(tài)的需求,且與對比策略的響應(yīng)時(shí)間差較小。因此,本文所提策略更適用于隨機(jī)到達(dá)的客戶規(guī)模較大、資源較短缺的場景,如,供小于求的繁忙時(shí)段、應(yīng)急情景。
考慮整體收益的實(shí)時(shí)需求響應(yīng)策略是移動充電行業(yè)發(fā)展過程中面臨的新問題,有新的特點(diǎn)和難點(diǎn)。本文定義了預(yù)約模式下的實(shí)時(shí)需求響應(yīng)問題并為此提出了聯(lián)動的兩階段實(shí)時(shí)需求響應(yīng)策略,使得預(yù)約模式下的實(shí)時(shí)需求響應(yīng)決策更加智能,為類似具有靜、動態(tài)相結(jié)合特征,且考慮未來需求的實(shí)時(shí)需求響應(yīng)問題提供了新思路,拓展了DVRPTWSSR的問題域,豐富了DVRPTWSSR和實(shí)時(shí)需求響應(yīng)策略交叉領(lǐng)域的應(yīng)用研究,具體的貢獻(xiàn)在于:
(1)提出了以最大化整體收益為目標(biāo)的兩階段實(shí)時(shí)需求響應(yīng)策略,滿足了ECs和LCs的要求的同時(shí)考慮了兩者的動態(tài)交替影響關(guān)系:第一階段基于多階段隨機(jī)動態(tài)決策模型與禁忌搜索算法生成了可以動態(tài)調(diào)整的充電服務(wù)方案,既滿足了ECs的充電服務(wù)時(shí)間窗要求,也考慮了決策的未來價(jià)值;第二階段基于第一階段,提出了LCs的實(shí)時(shí)響應(yīng)決策流程,保證了LCs的響應(yīng)可以提高企業(yè)的整體收益。(2)采用基于ADP思想的AVI算法確定決策的未來價(jià)值,并應(yīng)用于需求響應(yīng)決策的兩個(gè)階段,提高了企業(yè)的整體收益。(3)數(shù)值實(shí)驗(yàn)結(jié)果驗(yàn)證了本文策略在不同客戶規(guī)模和不同動態(tài)度下的有效性,本文策略適用于客戶規(guī)模較大、動態(tài)度較高的實(shí)時(shí)需求響應(yīng)問題,對提高服務(wù)運(yùn)營商收益的效果更明顯。
后續(xù)研究將根據(jù)移動充電車的運(yùn)營實(shí)際,修正決策后狀態(tài)未來價(jià)值的近似模型,增強(qiáng)響應(yīng)決策的科學(xué)性。另外,實(shí)時(shí)需求響應(yīng)策略優(yōu)化研究可以同時(shí)考慮企業(yè)收益和客戶滿意度,以促進(jìn)移動充電行業(yè)的持續(xù)穩(wěn)定發(fā)展。