□羅琴鳳 賈坤澤 殷允強
[電子科技大學(xué) 成都 611731]
21世紀(jì)以來,世界各地頻繁突發(fā)公共事件(包括自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生事件和社會安全事件),給人類生命財產(chǎn)安全和社會穩(wěn)定發(fā)展帶來了巨大的威脅。例如,自2019年底持續(xù)爆發(fā)的COVID-19公共衛(wèi)生事件,導(dǎo)致嚴(yán)重的全球性人員傷亡和經(jīng)濟(jì)財產(chǎn)損失。我國是世界上遭受自然災(zāi)害最嚴(yán)重的國家之一,1990~2019年的近30年,自然災(zāi)害平均每年造成我國經(jīng)濟(jì)損失2 928.5億元,死亡人數(shù)6 310.5人,受災(zāi)人口數(shù)為348 441.6萬人[1]。
黨和國家對于災(zāi)后的救援工作給予高度的重視。中共中央總書記習(xí)近平在中央政治局第十九次集體學(xué)習(xí)時強調(diào):應(yīng)急管理是國家治理體系和治理能力的重要組成部分,擔(dān)負(fù)保護(hù)人民群眾生命財產(chǎn)安全和維護(hù)社會穩(wěn)定的重要使命。黨的十九屆四中全會提出“優(yōu)化國家應(yīng)急管理能力體系建設(shè),提高防災(zāi)減災(zāi)救災(zāi)能力”的努力方向[2],應(yīng)急物流是應(yīng)急管理的重要組成部分,對救援行動的執(zhí)行至關(guān)重要。學(xué)者Trunick[3]指出物流工作占救援行動80%,“人道主義物流領(lǐng)域先驅(qū)”Van Wassenhove[4]也認(rèn)為物流工作是決定救援行動成功與否的關(guān)鍵。與一般商業(yè)物流不同,災(zāi)后應(yīng)急物流的首要任務(wù)是減輕災(zāi)民痛苦,故應(yīng)在保障災(zāi)民存活率、救援時效性和公平性等社會效益的前提下考慮經(jīng)濟(jì)成本,在救援中體現(xiàn)博愛(Humanity)、中立(Neutrality)和公正(Impartiality)的人道行動三原則[5]。因此,“應(yīng)急物流”正逐漸向更重視救援本質(zhì)和人道精神的“人道主義物流”轉(zhuǎn)變。
人道主義物流是一項科學(xué)性、專業(yè)性、綜合性非常強的工作,需要來自政府部門、非政府組織、私人企業(yè)、捐贈者和受災(zāi)群眾等眾多不同類型參與方的協(xié)調(diào)合作。加之災(zāi)害的難預(yù)測性、響應(yīng)時間的緊迫性、需求的突發(fā)性、物資的匱乏性等,人道主義物流的運作環(huán)境極其復(fù)雜,而管理科學(xué)是有效解決此類復(fù)雜決策/優(yōu)化問題的一門學(xué)科。
本文從運營管理視角梳理現(xiàn)有的災(zāi)后人道主義物流研究,首先按照資源調(diào)配、現(xiàn)場分診救治、醫(yī)院綜合治療等運營管理任務(wù)對相關(guān)文獻(xiàn)進(jìn)行梳理,然后將問題的求解方法總結(jié)為精確方法、啟發(fā)式方法、強化學(xué)習(xí)方法以及混合方法并分別展開綜述,最后分別從問題和求解方法角度對未來研究進(jìn)行展望,以期促進(jìn)災(zāi)后人道主義物流的發(fā)展。本文關(guān)于災(zāi)后人道主義物流運營管理研究的綜述框架見圖1。
圖 1 關(guān)于災(zāi)后人道主義物流運營管理研究的綜述框架
人道主義物流(Humanitarian Logistics,HL)的概念由美國弗里茨研究所的執(zhí)行董事Thomas于2005年首次提出,即為滿足災(zāi)民需要、減輕災(zāi)民痛苦,對物資、材料和相關(guān)信息進(jìn)行規(guī)劃、實施、控制,以實現(xiàn)從產(chǎn)出地到消費地的高效率、高效益流動和存儲的過程[6]。Thomas[6]還指出人道主義物流主要包括計劃、準(zhǔn)備、采購、運輸、倉儲、配送、追蹤回溯以及報關(guān)清關(guān)等活動。Van Wassenhove[4]將人道物流描述為:動員人力、資源、技能和知識以幫助受災(zāi)弱勢群體的過程和系統(tǒng)。通過上述定義可以看出,人道主義物流的根本任務(wù)在于減輕災(zāi)民所遭受的痛苦,這也是災(zāi)后救援行動的本質(zhì)所在。
下面通過將人道主義物流與應(yīng)急物流、商業(yè)物流進(jìn)行比較,進(jìn)一步說明人道主義物流的特征。人道主義物流和應(yīng)急物流在行動層面有重疊,但側(cè)重點不同。人道主義物流側(cè)重救援的本質(zhì),在救援行動中推崇博愛、中立和公正的人道主義原則。而應(yīng)急物流更重視救援的挑戰(zhàn),在救援行動中強調(diào)對“突發(fā)性、非常規(guī)性和不確定性”環(huán)境的應(yīng)對[6]。人道主義物流和商業(yè)物流在行動目標(biāo)、物資來源、需求特征、決策結(jié)構(gòu)、物流活動的周期性、社會網(wǎng)絡(luò)和支持系統(tǒng)等方面差異明顯[7]。商業(yè)物流是需求驅(qū)動的(拉動式系統(tǒng)),圍繞企業(yè)利益并根據(jù)業(yè)務(wù)需要制定物流規(guī)劃,目標(biāo)通常是最小化成本或最大化利潤/質(zhì)量等。而人道主義物流是供應(yīng)驅(qū)動的(推動式系統(tǒng)),圍繞社會效益并根據(jù)可調(diào)配庫存制定物流規(guī)劃,目標(biāo)主要為最大化存活率/公平性或最小化救援響應(yīng)時間等。
根據(jù)應(yīng)急管理的階段劃分,人道主義物流活動可分為減災(zāi)(Reduction)、備災(zāi)(Readiness)、響應(yīng)(Response)和恢復(fù)(Recovery)四個階段,覆蓋從確認(rèn)危機、評估風(fēng)險、建立預(yù)警系統(tǒng)、整合技能與資源直至恢復(fù)正常狀態(tài)等任務(wù),呈現(xiàn)出流程循環(huán)性及空間交叉性[8]。減災(zāi)一般指減輕災(zāi)害影響、預(yù)防災(zāi)害發(fā)生的長期行動,例如評估災(zāi)害風(fēng)險、加強基礎(chǔ)建設(shè)、執(zhí)行建筑標(biāo)準(zhǔn)等;備災(zāi)主要指為提高災(zāi)害應(yīng)對能力而在災(zāi)前準(zhǔn)備的一系列行動,例如預(yù)警系統(tǒng)選址、救災(zāi)配送中心選址、救援物資預(yù)置、疏散策略規(guī)劃、供應(yīng)合同設(shè)計等;響應(yīng)一般指災(zāi)難發(fā)生后所采取的搶救生命、確保公共安全、避免財產(chǎn)損失,并滿足災(zāi)民基本生活需求的一系列措施,例如應(yīng)急物資調(diào)度運輸與分配交付、臨時設(shè)施選址與任務(wù)指派、災(zāi)民疏散撤離與分診救治等;恢復(fù)主要指使災(zāi)民生命健康、生活環(huán)境,以及政治、經(jīng)濟(jì)、文化等復(fù)原或改善的長期行動,例如廢墟和垃圾清除、網(wǎng)絡(luò)(道路、橋梁、信息系統(tǒng)和能源等)恢復(fù)、家庭住宅和公共基礎(chǔ)設(shè)施重建等。
此外,Holguín-Veras等[7]根據(jù)人道主義物流的運作階段和環(huán)境將其劃分為“常規(guī)人道主義物流”(Regular humanitarian logistics,R-HL)和“災(zāi)后人道主義物流”(Post-disaster humanitarian logistics,PD-HL)。R-HL指長期持續(xù)性的人道主義援助,優(yōu)先考慮物流效率,類似于商業(yè)物流。例如,對于發(fā)達(dá)國家提供預(yù)防性的醫(yī)療保健,對于第三世界國家消除饑荒、援建難民營等。PD-HL側(cè)重于短期救援階段的災(zāi)害初步反應(yīng),重點是減輕人類痛苦和改善社會成效,行動層面和人道主義物流的響應(yīng)階段類似?,F(xiàn)有人道主義物流研究主要聚焦RHL相關(guān)問題,而關(guān)于PD-HL問題的研究相對較少[9],因此,本文重點針對災(zāi)后救援中的運營管理問題,梳理現(xiàn)有的災(zāi)后人道主義物流研究。
災(zāi)后人道主義物流中的運營管理任務(wù),主要可分為資源調(diào)配、現(xiàn)場分診救治、醫(yī)院綜合治療等,本文將按照上述任務(wù)分類,從分配、選址、路徑、調(diào)度、排序等方面,對相關(guān)文獻(xiàn)進(jìn)行梳理。
資源調(diào)配主要是指從配送中心向災(zāi)區(qū)調(diào)配救援物資、救援人員的過程,主要涉及人道主義物流中的資源分配與調(diào)度、設(shè)施選址、路徑規(guī)劃等問題。Rodríguez-Espíndola等[10]整合了來自多個組織的物資和人力資源,構(gòu)建了多模式、多商品動態(tài)分配模型,研究結(jié)果顯示了救援組織之間協(xié)調(diào)的重要性。不同于商業(yè)物流,災(zāi)后人道主義物流中的人力資源分配需考慮人員匹配問題。例如,Li等[11]針對不同救援人員的專業(yè)技能和主觀偏好,將相關(guān)的任務(wù)適應(yīng)度和時間適應(yīng)度進(jìn)行聚合,得到救援人員與災(zāi)害現(xiàn)場救援任務(wù)的匹配度,構(gòu)建了基于匹配概念的救援人員分配優(yōu)化模型。另外,當(dāng)突發(fā)重大公共事件時,應(yīng)急物資調(diào)配一般會涉及多級配送網(wǎng)絡(luò),王妍妍和孫佰清[12]以最小化物資短缺的延遲損失、物資分配的總成本為目標(biāo),研究了基于多集散點、多配送中心和多受災(zāi)點三級配送網(wǎng)絡(luò)的應(yīng)急物資動態(tài)多階段分配問題。資源調(diào)配中的選址決策一般包括配送中心、避難所等設(shè)施的選址。例如,劉亞杰等[13]綜合災(zāi)區(qū)地質(zhì)特點、災(zāi)區(qū)需求以及受災(zāi)程度等信息,建立了基于隨機規(guī)劃的配送中心選址模型。Mollah等[14]建立了洪災(zāi)情景下成本優(yōu)化的避難所分配模型。張玲和曾倩[15]考慮受災(zāi)點和避難所兩類物資需求點,研究了需求不確定情況下的配送中心選址及儲備問題,并建立了基于臺風(fēng)情景下的兩階段隨機規(guī)劃模型。此外,資源調(diào)配大多會涉及路徑規(guī)劃問題,王旭坪等[16]以最小化災(zāi)民損失和車輛調(diào)度成本為目標(biāo),研究了運力受限情況下的應(yīng)急物資分配及救援車輛路徑規(guī)劃問題,并基于2008年汶川地震,設(shè)計了不同運力下的物資動態(tài)調(diào)度方案和最優(yōu)運力配置量。由于自然災(zāi)害后災(zāi)區(qū)的地理限制,有時將直升機用于最后一英里的應(yīng)急物資分配,Alinaghian等[17]構(gòu)建了臨時救援中心選址模型和分配基本物資的直升機動態(tài)路徑模型,與傳統(tǒng)的靜態(tài)路徑相比,動態(tài)路徑的總分配時間更少。
現(xiàn)場分診救治是指在災(zāi)害現(xiàn)場根據(jù)傷亡程度和傷情特點,對災(zāi)民進(jìn)行分類以確定救治優(yōu)先順序,從而將有限醫(yī)療資源按照優(yōu)先級分配給災(zāi)民,最大限度地提高生存率。目前使用最廣泛的分診方法是Super等[18]的START(Simple Triage and Rapid Treatment)方法,此外還有Triage Sieve方法[19],SALT(Sort, Assess, Life-saving interventions, Treatment and/or Transport)方法[20]等?,F(xiàn)場分診的救治順序通常以紅、黃、綠、黑為標(biāo)簽[21],且因災(zāi)民健康狀況會隨著時間推移而惡化,因此分診是一個動態(tài)重復(fù)的過程。例如,Mills[22]研究了生存概率隨時間惡化的災(zāi)民救治排序問題,利用簡單有效的生存預(yù)測方法生成災(zāi)民救治優(yōu)先級。Kilic等[23]研究了在Poisson到達(dá)和健康狀況惡化的情況下,紅色和黃色等級的災(zāi)民服務(wù)率。類似地,Xiang和Zhuang[24]也設(shè)計了一個醫(yī)療服務(wù)排隊系統(tǒng),對兩類災(zāi)民的救治順序和健康狀況惡化進(jìn)行建模,分別建立了以最小化總預(yù)期死亡率、總等待時間為目標(biāo)的資源分配模型。此外,傷亡者在被送到醫(yī)院之前,一般會根據(jù)分診結(jié)果在附近的臨時醫(yī)療中心接受救護(hù),這主要涉及醫(yī)療資源的分配、臨時醫(yī)療中心的選址等決策。Rezapour等[25]研究了向各災(zāi)區(qū)以及其紅色和黃色等級的災(zāi)民,分配城市搜救人員和醫(yī)療隊等醫(yī)療資源的最佳策略。Lodree等[26]研究了一個離散時間有限水平隨機動態(tài)規(guī)劃問題,用于災(zāi)后分配異構(gòu)醫(yī)療團(tuán)隊以服務(wù)三種不同優(yōu)先級別的災(zāi)民。當(dāng)現(xiàn)有醫(yī)院的床位等醫(yī)療資源不足時,需考慮新設(shè)臨時醫(yī)療中心。李金澤和唐芃[27]基于城市設(shè)施、人口以及路網(wǎng)等基礎(chǔ)數(shù)據(jù),構(gòu)建了多目標(biāo)應(yīng)急設(shè)施選址模型,運用優(yōu)化算法生成了武漢方艙醫(yī)院選址方案。而Liu等[28]考慮了兩類醫(yī)療服務(wù)設(shè)施(救治高優(yōu)先級傷員的現(xiàn)有醫(yī)院以及服務(wù)輕傷者的臨時醫(yī)療中心),并將傷員分為即時和延遲兩類以表示災(zāi)后不同時期的生存概率,構(gòu)建了最佳臨時醫(yī)療中心選址和醫(yī)療服務(wù)分配模型。
現(xiàn)場分診救治完成后,重傷災(zāi)民必須送往醫(yī)院進(jìn)行綜合治療,其中涉及醫(yī)院、醫(yī)生、手術(shù)室、救護(hù)車的調(diào)度分配,以及救護(hù)車運輸路徑規(guī)劃等關(guān)鍵決策。Gong和Batta[29]提出了基于離散時間策略的救護(hù)車再分配問題,構(gòu)建了災(zāi)群確定型救護(hù)車分配模型。為有效降低救治等待期間的災(zāi)民死亡率,Cohen等[30]研究了災(zāi)后在醫(yī)院急診科的兩個治療站之間分配外科醫(yī)生的問題。將傷員運送到醫(yī)院也會考慮分診,Dean和Nair[31]提出了Severity-Adjusted Victim Evacuation(SAVE)構(gòu)建了資源受限情況下的SAVE模型,以便有效地將傷員按照優(yōu)先級轉(zhuǎn)移到不同地區(qū)的醫(yī)院。張晨曉等[32]綜合考慮了三類傷員的傷亡情況、心理狀況以及醫(yī)療機構(gòu)的醫(yī)療能力等,提出了以最小化傷員心理成本和最大化生存概率為目標(biāo)的醫(yī)療資源分配模型,并采用模糊規(guī)劃法求解傷員與醫(yī)療機構(gòu)的分配關(guān)系及傷員的運送順序。救護(hù)車的調(diào)度與路徑規(guī)劃是一個重要且復(fù)雜的研究問題,其路徑必須根據(jù)災(zāi)后道路網(wǎng)絡(luò)、現(xiàn)有道路損壞及擁堵等實際情況來制定,而救護(hù)車在災(zāi)區(qū)和醫(yī)院間的調(diào)度又受到醫(yī)院急診室等待時間、醫(yī)院容量和距離等因素的影響。Jotshi等[33]在收集了大量傷亡信息、道路交通狀況的基礎(chǔ)上,構(gòu)建了基于數(shù)據(jù)融合的應(yīng)急車輛調(diào)度和路徑仿真模型。Sung和Lee[34]將救護(hù)車路徑問題抽象為集合劃分模型,將傷員分為即時和延遲兩類等級,并在三種生存概率情景下確定傷員疏散的順序和目的地醫(yī)院。當(dāng)重傷災(zāi)民抵達(dá)醫(yī)院后,應(yīng)當(dāng)立即進(jìn)行醫(yī)療資源分配決策,涉及重新分診、手術(shù)室排程等問題。Chan等[35]研究了已知生存概率的兩類傷亡人員的治療優(yōu)先級排序和床位分配。Cotta[36]提出了在同一手術(shù)室治療的多層傷員優(yōu)先級排序問題。童海星等[37]考慮了突發(fā)事件下手術(shù)室排程的緊急性、醫(yī)療資源的傾斜性等因素,構(gòu)建了手術(shù)室優(yōu)化調(diào)度模型,并采用蟻群算法進(jìn)行求解,為突發(fā)情況下醫(yī)院的手術(shù)室排程提供了參考。
災(zāi)后應(yīng)急物資和傷員的運輸是人道主義物流領(lǐng)域?qū)W者關(guān)注的重點,目前已從基本的運輸路徑規(guī)劃開拓出了一些新的研究視角。例如,不少學(xué)者在災(zāi)后響應(yīng)階段考慮道路修復(fù)問題。不同于恢復(fù)階段的設(shè)施維修重建,在緊急響應(yīng)的情況下,只對部分受損路段進(jìn)行初步修復(fù)以保證路網(wǎng)連通性(災(zāi)后恢復(fù)階段則需要對整個災(zāi)區(qū)路網(wǎng)進(jìn)一步全面恢復(fù)),此時涉及維修人員調(diào)度和路徑規(guī)劃問題(Crew Scheduling and Routing Problem, CSRP),即決策維修人員修復(fù)受損路段的順序和路徑。一些學(xué)者將Duque等[38]的混合整數(shù)規(guī)劃和動態(tài)規(guī)劃模型作為CSRP的基礎(chǔ)研究。Shin等[39]對Duque等人提出的模型進(jìn)行拓展,增加了應(yīng)急物資車輛的調(diào)度和路徑規(guī)劃。Moreno等[40~41]將Duque等人提出的模型線性化,并進(jìn)行算法設(shè)計和改進(jìn)。在最近的研究中,Moreno等[42]又進(jìn)行了問題上的創(chuàng)新,探究了道路修復(fù)中的異構(gòu)多人員調(diào)度與路徑問題。另外,Li等[43]認(rèn)為,災(zāi)后道路修復(fù)依賴于一個兼具效益和效率的物流保障調(diào)度(Logistics Support Scheduling, LSS),因此將CSRP和LSS結(jié)合,案例實驗表明,修復(fù)延遲降低45.71%,黃金72小時內(nèi)的平均修復(fù)率高達(dá)99.40%。在應(yīng)急物資和傷員運輸模式方面,考慮到災(zāi)區(qū)需求量、需求優(yōu)先級以及交通網(wǎng)絡(luò)狀況等因素,多式聯(lián)運比單一的運輸模式更加適合現(xiàn)實救援情況。例如,李孟良等[44]構(gòu)建了結(jié)合公路、鐵路和航空多種運輸方式的救援物資多式聯(lián)運魯棒優(yōu)化模型。Liu等[28]基于救護(hù)車和直升機結(jié)合的傷員運輸模式,設(shè)計了臨時醫(yī)療設(shè)施的最佳選址分配方案,實現(xiàn)了期望存活人數(shù)最大化和總運營成本最小化。Najafi等[45]針對向災(zāi)區(qū)運送物資和向醫(yī)院運輸傷員的兩種震后救援場景,構(gòu)建了一個多物資種類、多傷亡類型、多運輸模式(直升機、卡車、救護(hù)車和火車)的多目標(biāo)動態(tài)模型,該模型能夠滿足物資的總交貨期需求,并縮短傷員到達(dá)醫(yī)院的總時間。
綜上,目前學(xué)界積極借鑒商業(yè)物流的研究方法,將運營管理的思想和工具引入災(zāi)后人道主義物流領(lǐng)域。在研究內(nèi)容上,基于傳統(tǒng)的分配、選址、路徑、調(diào)度、排序等商業(yè)物流問題,災(zāi)后人道主義物流分別將其考慮在資源調(diào)配、現(xiàn)場分診救治、醫(yī)院綜合治療等更細(xì)化的任務(wù)情景下,更貼合實際救災(zāi)需求,有助于實現(xiàn)高效救援;在災(zāi)后人道主義物流運營管理模式上,現(xiàn)有文獻(xiàn)一般以市場機制、社會力量等為主導(dǎo)的中國救災(zāi)模式作為研究背景,這與強勢政府主導(dǎo)的救災(zāi)模式存在較大出入[46],從中國與世界其他各國關(guān)于新冠肺炎疫情的防控措施、力度與效果上便可見一斑。因此,對于重大突發(fā)公共事件,國內(nèi)需進(jìn)一步探索和創(chuàng)新“黨委負(fù)責(zé)、政府主導(dǎo)”的中國救災(zāi)模式下的災(zāi)后人道主義物流研究;在思想與工具運用上,災(zāi)后人道主義物流運營管理研究借鑒了商業(yè)建模、供應(yīng)鏈管理等方法,但在問題設(shè)置和模型構(gòu)建上需進(jìn)一步體現(xiàn)災(zāi)后人道主義物流的特征,例如考慮響應(yīng)時間的緊迫性、物資的匱乏性、參數(shù)的動態(tài)性和不確定性問題,需積極探究實際災(zāi)害情景的表征手段和建模方法;在績效評價體系的構(gòu)建上,現(xiàn)有研究逐漸傾向于兼顧災(zāi)后人道主義物流的效率、效益和公平[47],但尚沒有統(tǒng)一的方法來衡量這三個性能指標(biāo)。其中,效率指標(biāo)較容易處理,一般和商業(yè)物流績效評價指標(biāo)類似,效益指標(biāo)主要與物資需求滿足相關(guān),而公平指標(biāo)以及其近義詞,只有少量文獻(xiàn)明確提到,更少有研究將公平納入決策模型中。雖然目前大部分研究都考慮到災(zāi)后人道主義物流的“弱經(jīng)濟(jì)性”,但主要仍是套用商業(yè)物流的優(yōu)化目標(biāo),再根據(jù)所研究的問題特征加以改進(jìn),與減輕災(zāi)民痛苦的災(zāi)后救援行動本質(zhì)目標(biāo)存在一定出入,或?qū)⒊霈F(xiàn)決策失誤,造成未知損失。
針對越來越復(fù)雜的災(zāi)后人道主義物流運營管理問題,學(xué)界提出并采用了多種運籌優(yōu)化求解方法。本節(jié)將按照精確方法、啟發(fā)式方法、強化學(xué)習(xí)方法以及混合方法,對相關(guān)求解方法進(jìn)行梳理和綜述。
精確方法是指能夠直接求出問題最優(yōu)解的方法。目前已有針對不同問題類型的特定算法,并可應(yīng)用于人道主義物流領(lǐng)域。Ma和Wu[48]使用改進(jìn)的雙向Dijkstra算法計算應(yīng)急救援車輛的最優(yōu)路徑;Chen和Chu[49]采用Bellman-Ford算法、Dijkstra算法等尋找最優(yōu)撤離出口;Yu等[50]針對應(yīng)急物資分配調(diào)度問題建立動態(tài)規(guī)劃模型,特別關(guān)注了因交付延遲而造成的災(zāi)民痛苦,并通過大量的數(shù)值實驗驗證了動態(tài)規(guī)劃方法的計算性能和求解質(zhì)量,他們的另一篇文章考慮了效率、效益和公平的應(yīng)急物資配置目標(biāo),證明了動態(tài)規(guī)劃方法在求解小規(guī)模問題時能達(dá)到最優(yōu),并針對中、大規(guī)模問題設(shè)計了近似動態(tài)規(guī)劃算法[51]。針對一些小規(guī)模的災(zāi)后人道主義物流問題,可以直接使用LINGO、CPLEX、Gurobi等商業(yè)求解器進(jìn)行求解,但當(dāng)問題規(guī)模變大時,列生成、Benders分解、拉格朗日松弛等大規(guī)模優(yōu)化算法往往更加適用。Faiz等[52]分別采用CPLEX求解器和列生成算法求解帶時間窗的開放式車輛路徑問題,結(jié)果表明當(dāng)實例規(guī)模增大時后者性能明顯更優(yōu)。Noyan等[53]針對不確定條件下救援分發(fā)點的選址和容量分配問題,設(shè)計了基于Benders分解的Branch-and-Cut算法,并通過數(shù)值研究證明了該方法的計算效果。Bayram和Yaman[54]以最小化總預(yù)期疏散時間為目標(biāo),研究了避難所選址和災(zāi)民撤離路徑問題,提出了一種基于Benders分解的精確算法求解兩階段隨機規(guī)劃模型,并使用割平面算法求解對偶子問題。
啟發(fā)式方法是指基于問題的特定知識和經(jīng)驗,以可接受的花費(如計算時間、計算空間)給出最合適的解。Xavier等[55]采用改進(jìn)的節(jié)約里程法求解了救援直升機運力和飛行路徑規(guī)劃問題。Dubois等[56]討論了洪災(zāi)后救援隊的路徑?jīng)Q策,并使用了最佳時間流插入算法得到了較優(yōu)的路徑解。Yang等[57]采用掃描算法求解了災(zāi)后救援物資分配和運輸問題。然而傳統(tǒng)啟發(fā)式算法具有一定的缺陷:在求解問題時容易陷入局部最優(yōu),且對問題描述約束性較強。元啟發(fā)式算法是一類受自然現(xiàn)象和智能方法激發(fā)的啟發(fā)式方法,可以一定程度上避免上述傳統(tǒng)啟發(fā)式的問題,且在求解復(fù)雜組合優(yōu)化問題時成效顯著。元啟發(fā)式方法主要分為兩類,第一類是由局部搜索方法改進(jìn)而來的基于軌跡策略的元啟發(fā)式算法,如模擬退火、禁忌搜索、迭代局部搜索等[58]。Sakiani等[59]設(shè)計了特殊的模擬退火算法求解災(zāi)后應(yīng)急物資分配與再分配問題,該算法能夠在合理時間內(nèi)得到高質(zhì)量的解;Balcik[60]利用禁忌搜索算法求解了災(zāi)情評估團(tuán)隊的選址和路徑?jīng)Q策問題,并以地震案例對該求解方法的效果進(jìn)行了驗證。另一類元啟發(fā)式方法是由生物學(xué)演化而來的基于群策略的元啟發(fā)式算法,如遺傳算法及文化算法等進(jìn)化算法、蟻群算法及粒子群算法等群智能算法[58]。Du和Yi[61]構(gòu)建了道路損壞情況下的救援物資交付模型,并采用遺傳算法獲得車輛路徑解。救援車輛路徑問題一般是旅行商問題(Travelling Salesman Problem, TSP)的變形,且蟻群算法在求解TSP問題時優(yōu)于其他啟發(fā)式,因此蟻群算法在救援車輛路徑規(guī)劃中有很好的應(yīng)用。Liu和Xie[62]在蟻群算法的設(shè)計中考慮車輛分配和需求動態(tài),以車輛容量、車輛到達(dá)配送中心的時間以及車輛到達(dá)災(zāi)區(qū)的時間來規(guī)劃路徑。
強化學(xué)習(xí)的基本思想是處于特定環(huán)境中的智能體(Agent)不斷地做出選擇,其每一項選擇都會得到環(huán)境不同的反饋(即獎勵)。智能體通過與環(huán)境的不斷交互和試錯,接收反饋信息來進(jìn)行優(yōu)化決策[63]。目前強化學(xué)習(xí)已應(yīng)用在路徑優(yōu)化、庫存管理、裝箱配載等經(jīng)典運籌學(xué)問題中,并逐漸有學(xué)者將其引入災(zāi)后人道主義物流領(lǐng)域。強化學(xué)習(xí)方法在求解隨機動態(tài)多階段序貫決策問題方面具備一定優(yōu)勢,可以將復(fù)雜的序貫決策問題建模為馬爾科夫決策過程,非常適用于動態(tài)、隨機的災(zāi)后人道主義物流問題求解[64]。Nadi和Edrissi[65]提出了一種以最小化總救援評估時間為目標(biāo)的隨機規(guī)劃模型,并利用強化學(xué)習(xí)對模型進(jìn)行優(yōu)化。他們的另一篇文章[66]提出了一種由馬爾可夫決策過程表示的多智能體評估和響應(yīng)系統(tǒng),通過強化學(xué)習(xí)來保障應(yīng)急響應(yīng)小組和救援評估小組之間的行動協(xié)作。Su等[67]設(shè)計了一種用于救援路徑規(guī)劃的強化學(xué)習(xí)方法,該方法能夠在動態(tài)危險的環(huán)境下找到更短、更安全的可行救援路徑。Chini等[68]分別考慮了確定情況和隨機情況下應(yīng)急救援車輛路徑選擇問題,并采用強化學(xué)習(xí)方法來優(yōu)化救護(hù)車智能體的路徑。Yu等[69]采用強化學(xué)習(xí)方法求解災(zāi)后復(fù)雜的應(yīng)急物資分配問題,并分別與精確動態(tài)規(guī)劃方法、啟發(fā)式算法的求解效果進(jìn)行了比較。實驗結(jié)果表明,該算法的效率優(yōu)于動態(tài)規(guī)劃方法,精度高于啟發(fā)式算法。雖然強化學(xué)習(xí)求解動態(tài)隨機問題具有較大的優(yōu)勢,但當(dāng)問題的求解空間變得復(fù)雜時,需消耗大量的計算時間和存儲空間,即出現(xiàn)“維數(shù)災(zāi)難”現(xiàn)象[70],因此目前強化學(xué)習(xí)方法在人道主義物流研究領(lǐng)域的應(yīng)用非常有限。
精確算法和啟發(fā)式方法各自的特點決定了二者在很大程度上可以互補,因此將二者結(jié)合起來的混合方法在災(zāi)后人道主義物流領(lǐng)域也得到了廣泛的應(yīng)用?,F(xiàn)有的精確型和啟發(fā)式混合方法可歸納為兩種主要形式:組合形式和整合形式。組合形式指精確算法/啟發(fā)式算法或依次執(zhí)行,或相互交織,或并行執(zhí)行。這種形式的特點是兩種算法自身依舊保持完整獨立性。整合形式指一種算法嵌入到另一種算法內(nèi)部并成為其組成部分,常見的形式為精確算法/啟發(fā)式算法為主并調(diào)用啟發(fā)式算法/精確算法[71]。Moreno等[40]關(guān)于CSRP的一項研究采用組合形式的混合算法,使用構(gòu)造啟發(fā)式和局部搜索啟發(fā)式,生成Branch-and-Benders-Cuts算法的初始可行解。而Moreno等[41]關(guān)于CSRP的另一項研究則采用整合形式的混合算法,在Branch-and-Cut樹中調(diào)用遺傳算法和模擬退火算法探索當(dāng)前解的鄰域,實例研究證明該混合算法減少了70%以上的計算時間。Buzón-Cantera等[72]針對應(yīng)急物資分配和路徑規(guī)劃問題,提出了一種以模擬退火算法為主、以精確算法求解子問題為輔的混合算法,數(shù)值結(jié)果表明該混合算法能夠在較短的計算時間內(nèi)獲得較好的解。此外,優(yōu)勢互補的混合啟發(fā)式方法也是解決災(zāi)后人道主義物流復(fù)雜組合優(yōu)化問題的重要方法,Zhang和Xiong[73]考慮了災(zāi)后緊急糧食運送問題,提出了一種混合的免疫蟻群算法,該算法利用免疫算法的快速全局收斂性和隨機性,同時結(jié)合蟻群算法的分布式搜索和正反饋能力,快速生成更好的解集,數(shù)值實驗表明該混合算法的性能優(yōu)于蟻群算法、免疫算法以及遺傳算法。吳新勝等[74]設(shè)計了群智能混合算法優(yōu)化應(yīng)急物資運輸路徑,充分利用粒子群算法和人工群蜂算法的群體移動規(guī)律,對螢火蟲算法的移動更新策略進(jìn)行改進(jìn),有效提高了原螢火蟲算法的尋優(yōu)精度和搜索效率。
求解方法的性能一般可從求解效率和求解精度兩個層面進(jìn)行評價。由于災(zāi)后人道主義物流研究一般都為復(fù)雜的組合優(yōu)化問題,目前并沒有哪種方法能夠在兩個層面同時保持優(yōu)勢。精確算法能夠獲得問題的最優(yōu)解,然而當(dāng)求解空間的規(guī)模無法控制時,精確方法很難在合理時間內(nèi)得到最優(yōu)解。面對災(zāi)后低質(zhì)量的數(shù)據(jù)集以及緊迫的響應(yīng)時間要求,精確算法很難發(fā)揮優(yōu)勢,在傷亡程度低、災(zāi)后運輸網(wǎng)絡(luò)較為簡單情形下可能更為適用。因此,以時間換精度的啟發(fā)式算法尤其是元啟發(fā)式方法,或?qū)⒊蔀閺?fù)雜災(zāi)害背景下快速求解組合優(yōu)化問題的首選方法。相較于精確方法,元啟發(fā)式計算效率更高,對數(shù)據(jù)的質(zhì)量要求更低,且可以獲得比傳統(tǒng)啟發(fā)式更高質(zhì)量的解。隨著研究的不斷深入,學(xué)界已經(jīng)對啟發(fā)式方法、精確算法進(jìn)行了多角度、多形式的改進(jìn)或融合,設(shè)計出了多種高性能的混合方法,并在物資調(diào)度運輸與分配交付、臨時設(shè)施選址與任務(wù)指派、災(zāi)民疏散撤離與分診救治等多種災(zāi)后應(yīng)急響應(yīng)場景發(fā)揮巨大的優(yōu)勢。此外,由于強化學(xué)習(xí)在解決隨機、動態(tài)的決策優(yōu)化問題具有一定的優(yōu)勢,已成功被應(yīng)用于多個運籌優(yōu)化領(lǐng)域,但其在災(zāi)后人道主義物流領(lǐng)域的研究仍處于起步階段,目前已有的應(yīng)用也僅側(cè)重于具體的案例研究,且大多只考慮單一隨機因素,針對多重隨機因素的災(zāi)后場景研究較少。
從PD-HL的運營管理問題和求解方法角度,歸納拓展未來的研究方向和思路,以使問題的設(shè)置和求解更加適應(yīng)災(zāi)后救援實際。
1. 任務(wù)情境的設(shè)定
現(xiàn)有災(zāi)后人道主義物流中運營管理任務(wù)的設(shè)置大多和商業(yè)物流類似,還需考慮災(zāi)后救援的特殊性,可從任務(wù)特征出發(fā),考慮更為細(xì)化和貼合救災(zāi)現(xiàn)實的情境設(shè)定。例如,在應(yīng)急物資分配上,可以考慮血液、藥品、食物、水、帳篷等,在用途、供運方式、易腐爛性、緊迫程度等方面存在差異的異質(zhì)資源組合,而現(xiàn)有研究大多只考慮單一資源。同時也可以考慮不同救治類型、技能水平和設(shè)備類型等多模式異質(zhì)醫(yī)療資源分配;在應(yīng)急資源運輸路徑和傷員運輸路徑規(guī)劃上,可以考慮不同種類、不同速度、不同容量的多式聯(lián)運,同時考慮無人機等新型運輸設(shè)備,從而可以靈活地根據(jù)災(zāi)區(qū)地理位置、人口密度等實際情況采取最優(yōu)的運輸模式。此外,在自然災(zāi)害后的運輸路徑規(guī)劃中考慮道路修復(fù),也是一個必要且復(fù)雜的研究問題,這意味著救援組織不僅需要決策同質(zhì)/異質(zhì)維修人員的調(diào)度和路徑,而且需要據(jù)此對救援人員進(jìn)行動態(tài)路徑更新和交通規(guī)劃;在分診救治上,可以進(jìn)一步探索簡單而有效的分診規(guī)則,研究分診過度或不足的影響,同時因災(zāi)害形勢和健康狀況的動態(tài)性,可以進(jìn)一步研究分診后因傷員優(yōu)先級更新而產(chǎn)生的救治重調(diào)度問題。
2. 績效評價體系的構(gòu)建
目前尚未有統(tǒng)一的災(zāi)后人道主義物流的績效評價體系,鑒于救援中參與人心理感知的重要性,未來災(zāi)后人道主義物流的績效評價體系可借鑒行為運籌管理理論,考慮決策者的不同決策偏好或有限理性、災(zāi)民的差異化心理痛苦或負(fù)面情緒等。例如,通過專家意見聯(lián)合分析法,獲取影響災(zāi)后人道主義物流行動決策的各因素及其權(quán)重指標(biāo),基于專家偏好和意見的聯(lián)合分析,構(gòu)建災(zāi)后人道主義物流分段線性效用目標(biāo)函數(shù);通過科學(xué)嚴(yán)謹(jǐn)?shù)膶嵶C研究,抽象表達(dá)救災(zāi)行動和救災(zāi)效果間的函數(shù)關(guān)系,并在救災(zāi)效果中著重考慮災(zāi)民心理感知,例如用剝奪水平表示災(zāi)民因無法獲得物資或服務(wù)而遭受的痛苦水平[9],用以自我為中心的不公平厭惡程度評估物資短缺、物資充足和物資過剩等公平感知[75]等。另外,人道主義物流的優(yōu)化目標(biāo)間存在一定的背反關(guān)系,且多目標(biāo)模型求解難度頗大,如何在保證求解效率的情況下,綜合考慮多個相互沖突的目標(biāo)并建立合理的權(quán)衡,仍有待學(xué)界探索。
3. 運營管理模式的創(chuàng)新
現(xiàn)有國際災(zāi)害運營管理研究主要基于西方發(fā)達(dá)國家社會背景,救災(zāi)模式一般以市場機制、社會力量等為主導(dǎo),這與強勢政府主導(dǎo)的中國救災(zāi)模式存在較大出入。未來國內(nèi)人道主義物流研究應(yīng)當(dāng)依據(jù)中國國情,以保障人民群眾生命安全為首要運作目標(biāo),以“黨委負(fù)責(zé),政府主導(dǎo)、社會力量和市場機制廣泛參與”為主體資源配置方式,以軍隊、武警部隊和公安消防等為主要應(yīng)急救援力量,探索和創(chuàng)新具有中國特色的人道主義物流運營管理模式,并將其應(yīng)用到國內(nèi)實際重大突發(fā)公共事件中。進(jìn)一步剖析和提煉不同管理情景和問題設(shè)置下,中國強勢政府主導(dǎo)的災(zāi)后人道主義物流的核心特征、運作效果、適用范圍和改進(jìn)方向,基于“政府—社會—市場”多方協(xié)同進(jìn)行災(zāi)害數(shù)理建模,突破以社會力量和市場機制為主導(dǎo)的國際救災(zāi)理論局限。
1. 啟發(fā)式方法的創(chuàng)新
災(zāi)后人道主義物流運作環(huán)境復(fù)雜且響應(yīng)時間緊迫,對求解算法的有效性提出了較高的要求。近年來運籌優(yōu)化領(lǐng)域涌現(xiàn)出一些新型啟發(fā)式方法, 例如松鼠搜索算法、鯨魚優(yōu)化算法、灰狼優(yōu)化算法,這些算法運行速度快、搜索能力強,適用于解決復(fù)雜的高維和多目標(biāo)優(yōu)化問題,未來可嘗試在災(zāi)后人道主義物流領(lǐng)域應(yīng)用這些新型啟發(fā)式算法。另外,可針對災(zāi)后人道主義物流領(lǐng)域的具體災(zāi)害場景或問題對現(xiàn)有啟發(fā)式方法進(jìn)行創(chuàng)新性改進(jìn),如設(shè)計更優(yōu)的擾動策略和加速策略,以提高算法在特定災(zāi)害場景下的計算性能。也可借助生產(chǎn)生活的經(jīng)驗或其他學(xué)科的知識,尋找新的擬物模型,探索并設(shè)計新的更高效的啟發(fā)式方法。
2. 精確方法的改進(jìn)
精確方法在更關(guān)注求解速度的災(zāi)后人道主義物流場景下優(yōu)勢不明顯,因此未來可在保持求解精度的同時,進(jìn)一步設(shè)計更高效快速的精確算法。例如,采用分解簡化的求解思想,運用基于列生成的分支定價算法對問題進(jìn)行分解,推導(dǎo)出定價子問題目標(biāo)函數(shù),并設(shè)計有效的標(biāo)簽算法進(jìn)行求解;針對災(zāi)害背景下的具體問題,探索新的有效不等式以降低問題。
3. 強化學(xué)習(xí)方法的運用
強化學(xué)習(xí)方法在求解隨機動態(tài)多階段序貫決策問題方面具備一定優(yōu)勢,但其在災(zāi)后人道主義物流運營管理問題中的應(yīng)用尚處于起步階段。未來可以深入探究如何利用強化學(xué)習(xí)方法對救災(zāi)倉庫選址、災(zāi)民需求預(yù)測以及災(zāi)區(qū)網(wǎng)絡(luò)布局等經(jīng)典隨機動態(tài)決策問題進(jìn)行優(yōu)化求解。此外,可以將人道主義物流領(lǐng)域?qū)<姨囟ǖ膽?yīng)急規(guī)劃經(jīng)驗、知識、數(shù)據(jù)融入強化學(xué)習(xí)框架中,提高強化學(xué)習(xí)方法的學(xué)習(xí)效率和魯棒性。同時,可在強化學(xué)習(xí)中融合深度學(xué)習(xí)的注意力機制,聚焦于救災(zāi)庫存、災(zāi)民需求、災(zāi)區(qū)路網(wǎng)等信息上,提高災(zāi)后救援效率與效益。另外,可以考慮提高強化學(xué)習(xí)在運籌優(yōu)化領(lǐng)域的泛化能力,將終生學(xué)習(xí)、遷移學(xué)習(xí)、多任務(wù)學(xué)習(xí)等引入到強化學(xué)習(xí)中,以加速強化學(xué)習(xí)對災(zāi)后復(fù)雜組合優(yōu)化問題的學(xué)習(xí)進(jìn)程,有效解決災(zāi)后人道主義物流研究中常見的多目標(biāo)動態(tài)決策問題。
4. 混合方法的集成
由于混合算法的優(yōu)勢集成以及災(zāi)后人道主義物流的效率和效益要求,探索不同啟發(fā)式結(jié)合的混合算法以及精確型和啟發(fā)式結(jié)合的混合方法是一項必要且具有挑戰(zhàn)性的工作。因此應(yīng)深入研究各種求解方法的特點以及不同混合策略的效果,設(shè)計高效且可執(zhí)行的混合算法,從而同時提高算法的求解速度和求解質(zhì)量。另外,強化學(xué)習(xí)方法的優(yōu)勢在于可通過與環(huán)境的交互獲取動態(tài)信息,但其存在收斂效率不高、穩(wěn)定性不足等問題,未來可考慮融合深度學(xué)習(xí)以自動提取復(fù)雜應(yīng)急物流問題的特征、利用其他啟發(fā)式方法指導(dǎo)強化學(xué)習(xí)方法更有效率的學(xué)習(xí),促進(jìn)強化學(xué)習(xí)和其他方法在災(zāi)后人道主義物流領(lǐng)域的混合創(chuàng)新。
電子科技大學(xué)學(xué)報(社科版)2022年1期