劉海濤, 熊浩浩, 郝傳波, 朱 騰, 王樂清
(黑龍江科技大學(xué) 黑龍江省煤礦深部開采地壓控制與瓦斯治理重點實驗室, 哈爾濱 150022)
區(qū)域內(nèi)市級地方政府集中管理調(diào)度應(yīng)急救援力量,煤礦企業(yè)與地方政府進行煤礦事故應(yīng)急救援能力協(xié)作建設(shè)對煤礦救援效率至關(guān)重要。因此,在系統(tǒng)效益最優(yōu)下實現(xiàn)煤礦事故應(yīng)急救援能力建設(shè)多主體協(xié)作,不斷提高地方政府與煤礦企業(yè)事故應(yīng)急救援水平具有重要意義。
近年來,在煤礦應(yīng)急救援領(lǐng)域,已有學(xué)者應(yīng)用灰色模糊綜合評價法[1]、熵權(quán)法[2]、網(wǎng)絡(luò)層次分析法[3]、可拓學(xué)理論[4]等方法研究煤礦應(yīng)急救援能力評價?!秶鴦?wù)院通知》[5]中指出“將地方煤礦應(yīng)急救援隊伍、設(shè)施建設(shè)等確認為地方政府財政事權(quán)”。地方政府加大對地方煤礦企業(yè)的安全投入,有利于雙方更加重視煤礦事故應(yīng)急救援能力協(xié)作建設(shè)。
目前,國內(nèi)外學(xué)者已對煤礦事故應(yīng)急能力多主體協(xié)作建設(shè)進行了深刻研究。周婷婷[6]研究了地方政府與煤礦企業(yè)安全生產(chǎn)協(xié)作的互惠關(guān)系,提出了雙方采取一致互惠協(xié)作安全防范措施時,地方煤礦企業(yè)才愿意加大投入。王金鳳[7]等人研究了不同企業(yè)在煤礦應(yīng)急救援的協(xié)作演化博弈,提出了在安全生產(chǎn)與監(jiān)督、應(yīng)急救援等多方面進行探討與交流,可加深雙方相互監(jiān)督、相互學(xué)習(xí)的協(xié)作關(guān)系。以上文獻提出了地方政府和煤礦企業(yè)雙方的互惠關(guān)系分析、煤礦企業(yè)間的演化博弈分析,并未對地方政府和煤礦企業(yè)的事故應(yīng)急力量協(xié)作建設(shè)演化過程有過多分析。演化博弈在其它領(lǐng)域中已經(jīng)有顯著成效,其相關(guān)理論在綠色環(huán)保[8]、經(jīng)濟領(lǐng)域[9]、環(huán)境治理[10]等領(lǐng)域已得到了廣泛的應(yīng)用,而在煤礦應(yīng)急救援領(lǐng)域研究文獻甚少,且主要以企業(yè)雙方為主體、協(xié)同競爭等方面進行的演化博弈研究。在煤炭生產(chǎn)領(lǐng)域,大多學(xué)者研究集中于安全投入和監(jiān)督[11]、安全生產(chǎn)群體行為[12]等方面。由于煤礦應(yīng)急救援主體行為博弈在應(yīng)急力量協(xié)作建設(shè)中是一個有限理性的動態(tài)博弈過程,政、企雙方會以自身效益最大化為期望進而不斷改變策略,最終收斂于一個穩(wěn)定狀態(tài)。因此,利用演化博弈構(gòu)建模型分析地方政府與地方煤礦企業(yè)在煤礦事故應(yīng)急救援力量協(xié)作建設(shè)的策略選擇切實可行。
分析以上結(jié)果發(fā)現(xiàn),現(xiàn)有利用演化博弈理論分析地方政府和地方煤礦企業(yè)在煤礦事故應(yīng)急救援能力協(xié)作建設(shè)的文獻尚不多見。筆者借鑒此方法,采用演化博弈理論、MATLAB數(shù)字仿真方法來分析協(xié)作收益影響參數(shù),在整體效益最優(yōu)化下,研究相關(guān)參數(shù)對政、企進行應(yīng)急救援能力協(xié)作建設(shè)行為博弈的策略導(dǎo)向的影響,再加以優(yōu)化關(guān)鍵參數(shù),實現(xiàn)最理想的ESS,促進雙方煤礦應(yīng)急協(xié)作能力和能力建設(shè)的提高。
負責(zé)煤礦事故應(yīng)急的直接責(zé)任人有地方政府和地方煤礦企業(yè)[13],雙方在事故應(yīng)急救援前的能力建設(shè)程度大小各不相同,差異可能相差懸殊,將雙方應(yīng)急能力建設(shè)看作一個系統(tǒng),則應(yīng)急能力協(xié)作建設(shè)是雙方選擇最優(yōu)方案的有效途徑,使得整體系統(tǒng)達到目標(biāo)最優(yōu)。文中設(shè)定煤礦事故應(yīng)急救援能力協(xié)作建設(shè)博弈主體為地方政府和地方煤礦企業(yè),雙方?jīng)Q策理性程度不同,在有限理性條件下進行動態(tài)行為博弈。某區(qū)域市級地方政府可視為個體參與博弈,地方政府作為地方行政管理部門,接收的信息會更全面,決策理性程度更高,但不是完全理性。地方煤礦企業(yè)數(shù)量較多,可視為一個群體,接收信息有限,決策理性程度不高。地方政府和地方煤礦企業(yè)雙方?jīng)Q策均會在煤礦事故應(yīng)急救援演化博弈中不斷學(xué)習(xí)、模仿,最終趨于穩(wěn)定。因此假設(shè)兩者在決策時依據(jù)自身的特點所作選擇是非理性,信息不對稱。
目前,國家在對煤礦事故應(yīng)急救援的強烈重視下,應(yīng)急救援能力被納入地方政府和企業(yè)發(fā)展規(guī)劃和總體工作部署,進一步加強領(lǐng)導(dǎo)煤礦安全生產(chǎn)應(yīng)急管理工作,確定地方政府在其方面的責(zé)任,來提高煤礦應(yīng)急救援能力[14]。根據(jù)《國務(wù)院通知》,地方政府一定會對煤礦事故應(yīng)急救援進行投入[5]。地方煤礦企業(yè)發(fā)生重大事故,地方政府必須進行援助,這是地方政府管轄地方企業(yè)和支援的責(zé)任。同時地方政府根據(jù)中央有關(guān)部門條例和自身責(zé)任及利益,會對地方煤礦企業(yè)進行監(jiān)督,在應(yīng)急能力建設(shè)方面也會與企業(yè)合作。但由于部分地方政府過多考慮到自身利益和對安全建設(shè)方面的思想認識不到位,對地方政府采取{嚴(yán)格監(jiān)督協(xié)作,不嚴(yán)格監(jiān)督協(xié)作}策略。地方煤礦企業(yè)常以利益為根本,在遵守煤礦安全條例的基礎(chǔ)上進行安全投入,為了實現(xiàn)事故整體損失降到最低,減少人員傷亡,地方煤礦企業(yè)會積極投入?yún)f(xié)作。但部分煤礦企業(yè)一味注重眼前利益,被利益沖昏頭腦,不積極投入,與地方政府在協(xié)作建設(shè)上難以達成共識,甚至不投入。因此,在地方政府采取策略時,地方煤礦企業(yè)會采取{積極投入?yún)f(xié)作,不積極投入?yún)f(xié)作}策略。
選取兩個有限理性博弈主體:某區(qū)域市級地方政府和地方煤礦企業(yè),地方政府采取{嚴(yán)格監(jiān)督協(xié)作,不嚴(yán)格監(jiān)督協(xié)作}策略,概率分別為x、1-x;地方煤礦企業(yè)采取對應(yīng)的{積極投入?yún)f(xié)作,不積極投入?yún)f(xié)作}策略,概率分別為y、1-y。其中x,y∈[0,1]。主體參數(shù)及意義見表1,雙方博弈支付矩陣如表2所示。
表1 主體的參數(shù)及意義
表2 政、企雙方博弈支付矩陣
根據(jù)表2的支付矩陣,地方政府采取“嚴(yán)格監(jiān)督協(xié)作”和“不嚴(yán)格監(jiān)督協(xié)作”策略的期望收益函數(shù)和平均期望函數(shù)分別為
uA1=y[(aA-CA)+(aA1-aA)-dA]+
(1-y)[(aA-CA)+L3-dA]。
(1)
uA2=y[(aA-CA)+MA-L1-L2]+
(1-y)[(aA-CA)-L1-L2]。
(2)
(1-y)[(aA-CA)+L3-dA]}+
(1-x){y[(aA-CA)+MA-L1-L2]+
(1-y)[(aA-CA)-L1-L2]}。
(3)
地方煤礦企業(yè)在采取“積極投入?yún)f(xié)作”和“不積極投入?yún)f(xié)作”策略的期望收益函數(shù)和平均期望函數(shù)分別為
uB1=x[(aB-CB)+(aB1-aB)-dB]+
(1-x)[(aB-CB)-dB]。
(4)
uB2=x[(aB-CB)+MB-L4]+
(1-x)[(aB-CB)-L4]。
(5)
(1-x)[(aB-CB)-dB]}+
(1-y){x[(aB-CB)+MB-L4]+
(1-x)[(aB-CB)-L4]}。
(6)
分析地方政府和地方煤礦企業(yè),得出兩者復(fù)制動態(tài)方程為
MA-L3]+(L3-dA+L1+L2)}。
(7)
MB]+(L4-dB)}。
(8)
令F(x)=0,F(xiàn)(y)=0,求出均衡點:O(0,0)、A(0,1)、B(1,0)、C(1,1)和D(x*,y*),其中
由于考慮到復(fù)制動態(tài)方程的解不一定是最優(yōu)解,利用Friedman方法,求出并分析出該系統(tǒng)的雅可比矩陣的局部穩(wěn)定性,進而求出最優(yōu)解。將相關(guān)參數(shù)代入到J矩陣得出:
根據(jù)公式行列式的值為detJ=ad-bc,跡為trJ=a+d,可計算出J矩陣的行列式的值和跡分別為
detJ=(1-2x){y[(aA1-aA)-MA-L3]+
(L3-dA+L1+L2)}(1-2y){x[(aB1-
aB)-MB]+(L4-dB)}-x(1-
x)[(aA1-aA)-MA-L3]y(1-
y)[(aB1-aB)-MB]。
(10)
trJ=(1-2x){y[(aA1-aA)-MA-L3]+
(L3-dA+L1+L2)}+(1-
2y){x[(aB1-aB)-MB]+
(L4-d)}。
(11)
根據(jù)Friedman方法,在detJ>0且trJ<0時,該均衡點符合最優(yōu)解。討論不同情景下,這5個均衡點是否符合上述要求。
情景1:(aA1-aA)-dA>MA-L1-L2且(aB1-aB)-dB>MB-L4時,分別將各個均衡點代入式(10)、(11)中,其局部穩(wěn)定性如表3所示。表3中A、B為局部不穩(wěn)定點,D為鞍點(以下情景分析D均為鞍點,不再代入公式計算),O、C為ESS點,系統(tǒng)最終收斂于(0,0)和(1,1)。根據(jù)表3畫出雙方博弈相位圖如圖1所示。
表3 情景1時各均衡點的局部穩(wěn)定性分析
圖1 政、企的博弈相位Fig. 1 Phase game between government and business
從圖1可以看出,策略演化主要分為區(qū)域AOBD和區(qū)域ADBC。當(dāng)雙方博弈的策略選擇意愿初始點位于區(qū)域AOBD時,演化決策路徑朝O(0,0)演化,即雙方不樂意協(xié)作;當(dāng)雙方博弈的策略選擇意愿初始點位于區(qū)域ADBC,雙方演化決策路徑趨于C(1,1),即雙方樂意協(xié)作。因此,最終雙方應(yīng)急救援的演化結(jié)果為協(xié)作或不協(xié)作。以下情景博弈相位圖分析大致類似,不再做具體分析。
情景2:當(dāng)(aA1-aA)-dA 情景3:當(dāng)(aA1-aA)-dA>MA-L1-L2且(aB1-aB)-dB 情景4:當(dāng)(aA1-aA)-dA 三個情景各均衡點分析如表4所示,僅有O點是ESS點,系統(tǒng)最終收斂于點O(0,0),即雙方不協(xié)作建設(shè)。 表4 情景2、3、4時各均衡點的局部穩(wěn)定性分析 為了進一步分析地方政、企業(yè)雙方的行為博弈決策,提出有利于雙方協(xié)作建設(shè)的有效措施,在此通過MATLAB仿真,賦初值模擬,直觀分析雙方演化路徑、演化趨勢,再進行參數(shù)優(yōu)化仿真分析。 情景1的理論結(jié)果是雙方協(xié)作,情景2、3、4的理論結(jié)果是一方協(xié)作或不協(xié)作。在國家政策形勢下,情景1中的雙方協(xié)作策略更符合實際,因此假設(shè)選定情景1,運用MATLAB軟件對復(fù)制動態(tài)方程相關(guān)參數(shù)初始賦值,只需在模型構(gòu)建時,各參數(shù)的賦值滿足約束條件(L1+L2+L3+L4 結(jié)合圖1可清楚發(fā)現(xiàn)圖2a區(qū)域AOBD面積明顯大于區(qū)域ADBC,表示雙方博弈在初始參數(shù)下,向{不嚴(yán)格監(jiān)督協(xié)作,不積極投入?yún)f(xié)作}的概率比{嚴(yán)格監(jiān)督協(xié)作,積極投入?yún)f(xié)作}更大。 圖2 政、企雙方初始狀態(tài)的策略演變仿真Fig. 2 Simulation of strategy evolution of initial state of government and business 從圖2b~d可看出,當(dāng)?shù)胤秸扇?yán)格監(jiān)督協(xié)作的概率為0.3時,部分地方煤礦企業(yè)稍有考慮不協(xié)作后就堅定選擇了與地方政府協(xié)作。當(dāng)概率為0.5時,有了更多地方煤礦企業(yè)堅定選擇了協(xié)作。當(dāng)概率為0.7時,政、企的協(xié)作意愿依然不會改變。 同理,設(shè)地方煤礦企業(yè)采取積極投入?yún)f(xié)作的概率分別為0.3、0.5、0.7,代入模型中,如圖3所示。 圖3 地方政府初始狀態(tài)的策略演變仿真Fig. 3 Simulation of strategy evolution of local government's initial state 從圖3可看出,當(dāng)?shù)胤矫旱V企業(yè)采取積極投入?yún)f(xié)作概率為0.3時,僅部分地方政府堅定選擇了與地方煤礦企業(yè)協(xié)作。當(dāng)概率為0.5時,有了地方政府更加堅定選擇了協(xié)作。當(dāng)概率為0.7時,地方煤礦政府幾乎堅定選擇了與地方煤礦企業(yè)協(xié)作。 綜上可知,x、y的增加都會提高雙方的協(xié)作幾率。由于地方煤礦企業(yè)更希望以減少效益損失來進行應(yīng)急能力建設(shè),其協(xié)作意愿較高,因而下文參數(shù)設(shè)置x為0.6,y為0.7。 (1)優(yōu)化ΔaA=aA1-aA,ΔaB=aB1-aB。當(dāng)政、企雙方止損能力增加時,止損量ΔaA、ΔaB增加,鞍點D向左下方移動,區(qū)域ADBC面積增加,演化策略趨向(1,1)的可能性更大,政、企雙方的協(xié)作意愿也越強。由于設(shè)定參數(shù)結(jié)果歸屬于情景1,要滿足(aA1-aA)-dA>MA-L1-L2且(aB1-aB)-dB>MB-L4條件,此時計算出ΔaA>dA+MA-L1-L2且ΔaB>dB+MB-L4,因此當(dāng)ΔaA、ΔaB分別增加1個單位,參數(shù)優(yōu)化后雙方博弈演化路徑如圖4所示。 圖4 ΔaA、ΔaB優(yōu)化時的主體策略演化Fig. 4 Evolution of principal strategy during optimization of ΔaA and ΔaB 從圖中可以明顯看出,ΔaA、ΔaB的增加,其曲線趨勢在t∈[0,1]斜率更加陡峭,說明其增加會加快促使政企策略選擇趨向于最優(yōu),但由于ΔaA由aA、aA1決定,ΔaB由aB、aB1決定,這些參數(shù)跟政、企的應(yīng)急救援能力協(xié)作建設(shè)有關(guān),雙方均要與時俱進,結(jié)合新設(shè)備、新方法、新理念完善應(yīng)急預(yù)案并加強能力協(xié)作建設(shè),以利于提升自身的應(yīng)急能力建設(shè)。 (2)優(yōu)化MA、MB。當(dāng)政、企雙方因僥幸心理,減少安全投入而額外獲得的收益增加時,鞍點D向C點移動,區(qū)域ADBC面積減小,演化策略趨向(0,0)的可能性更大,政、企雙方存在較大僥幸心理和較高風(fēng)險決策等均會導(dǎo)致雙方不愿意簽訂協(xié)議,不利于應(yīng)急能力建設(shè)。由于設(shè)定參數(shù)結(jié)果歸屬于情景1,此時計算出MA<ΔaA-dA+L1+L2且MB<ΔaB-dB+L4,因此當(dāng)MA、MB分別增加3.6、4.4個單位,參數(shù)優(yōu)化后雙方博弈演化路徑如圖5所示。從圖5中可以明顯看出,MA、MB的增加,曲線斜率為負,演化結(jié)果趨向于0,即政、企都擴大了自己的僥幸心理,雙方風(fēng)險提高,會互相傳達出危險信號,考慮到自身效益,導(dǎo)致政、企不樂意協(xié)作。 圖5 MA、MB優(yōu)化時的主體策略演化Fig. 5 Evolution of principal strategy during optimization of MA and MB (3)優(yōu)化L1、L2、L3、L4。當(dāng)中央有關(guān)監(jiān)管部門給予的懲罰和公眾帶來的負效益等增加時,鞍點D向O點移動,區(qū)域ADBC面積增大,演化策略趨向(1,1)的可能性更大,嚴(yán)厲的處罰、高額的罰金、較大的負效益均會約束雙方行為傾向于協(xié)作。由于設(shè)定參數(shù)結(jié)果歸屬于情景1,當(dāng)L1、L2、L3、L4分別增加0.2個單位,參數(shù)優(yōu)化后雙方博弈演化路徑如圖6所示。從圖6中可以看出,提高L1、L2、L3、L4,曲線趨勢變陡,說明L1、L2、L3、L4的提高有利于雙方合作。但從實踐中考慮,適當(dāng)提高違約金有利于促進并約束政、企向協(xié)作發(fā)展。 圖6 L1、L2、L3、L4優(yōu)化時的主體策略演化Fig. 6 Evolution of principal strategy during optimization of L1,L2,L3 and L4 (4)優(yōu)化dA、dB。當(dāng)政、企雙方計劃更加深入?yún)f(xié)作時,協(xié)作難度增加,導(dǎo)致協(xié)作成本dA、dB增加時,鞍點D向右上方演化,區(qū)域ADBC面積減少,演化策略趨向(0,0)的可能性更大,雙方為了實現(xiàn)最終效益在各方面進行協(xié)作,協(xié)作成本增加,會導(dǎo)致雙方傾向于不協(xié)作。由于設(shè)定參數(shù)結(jié)果歸屬于情景1,此時計算出dA<ΔaA-MA+L1+L2且dB<ΔaB-MB+L4,因此當(dāng)dA、dB分別增加3.2、2.8個單位,參數(shù)優(yōu)化后雙方博弈演化路徑如圖7所示。從圖中可以分析出,增加dA、dB投入,曲線趨勢趨于不協(xié)作。雙方能快速積極協(xié)作是該演化博弈模型所追求的,增加投入才能增進協(xié)作的本金,但過多增加協(xié)作成本,會導(dǎo)致雙方在經(jīng)濟上的負擔(dān),也會影響到系統(tǒng)整體的最終演化趨勢,需通過增強雙方信任度等方法來減少協(xié)作成本。 圖7 dA、dB優(yōu)化時的主體策略演化Fig. 7 Evolution of principal strategy during optimization of dA and dB 從圖4~7整體可以看出,每組參數(shù)相應(yīng)變化,政、企的行為策略也會相應(yīng)變化。雙方適當(dāng)提高罰金與負效益L1、L2、L3、L4,會利于系統(tǒng)加快向最優(yōu)狀態(tài)演化;增加僥幸收益MA、MB、協(xié)作先期成本dA、dB需要雙方考慮自身的經(jīng)濟現(xiàn)狀、決策信息是否全面、對方案的風(fēng)險態(tài)度和信任度等來促進雙方的合作。 由于煤礦事故對社會造成負面影響,據(jù)國家政策發(fā)布與約束,必須降低不良影響和提高煤礦事故應(yīng)急救援能力,政、企的協(xié)作建設(shè)是提高應(yīng)急能力的有效手段,因此建立了政、企雙方協(xié)作演化博弈模型。雙方考慮自身理性,獲得決策結(jié)果。以成本效益參數(shù)來分析系統(tǒng)協(xié)作建設(shè),在我國應(yīng)急救援領(lǐng)域,政治效益大于經(jīng)濟效益,投入各類成本遠大于救援止損。相關(guān)成本效益參數(shù)優(yōu)化前后的動態(tài)仿真可以直觀分析政、企雙方行為博弈,為提高煤礦應(yīng)急救援能力建設(shè)出謀劃策。研究發(fā)現(xiàn):情景1符合實際所求,在初始條件下,僥幸收益增加,政、企會互相傳達風(fēng)險決策信號,不利于向整體最優(yōu)演化;適當(dāng)提高雙方協(xié)作的罰金和處罰力度,會促使雙方博弈加快向最優(yōu)狀態(tài)演化,同時也會削弱政、企雙方風(fēng)險態(tài)度;投入的協(xié)作成本與系統(tǒng)趨于最優(yōu)決策成反比,增加協(xié)作投入可以提高應(yīng)急能力建設(shè),但較高的成本投入會增加經(jīng)濟負擔(dān),降低雙方協(xié)作意愿,在一定程度上,通過增加雙方信任度等方法來降低地方煤礦企業(yè)在初期的協(xié)作投入,達到應(yīng)急能力建設(shè)與協(xié)作的最優(yōu)狀態(tài)。 通過以上研究,提出兩條建議: (1)適當(dāng)提高稅收比例,建立對官員的責(zé)任終身追究制度和聲譽機制,并落實事故企業(yè)主體責(zé)任制度,來加大中央有關(guān)監(jiān)督部門對地方政府不嚴(yán)格監(jiān)督協(xié)作的懲罰力度。加強建設(shè)煤礦安全生產(chǎn)誠信制度,推出實施有效的煤炭企業(yè)安全生產(chǎn)失信懲罰機制。同時社會公眾通過實地調(diào)查、網(wǎng)絡(luò)信息平臺、專業(yè)協(xié)會對地方政府和地方煤礦企業(yè)監(jiān)督,與中央有關(guān)監(jiān)督部門共同約束政、企利益合謀行為和僥幸行為。但監(jiān)督懲罰力度不易過大,過大容易激發(fā)逆反心理,不利于長久協(xié)作發(fā)展,可以通過提高政策力度、補貼、聲譽激勵等方法,建立一套全面有效的激勵機制。激勵與懲罰并用,全面促進整個應(yīng)急救援能力建設(shè)系統(tǒng)的良性循環(huán)。 (2)縮短地方政府和地方煤礦企業(yè)的協(xié)商、信息傳遞時間,通過增強雙方的信任度等手段降低協(xié)作成本。地方煤礦企業(yè)必須加大培養(yǎng)職工安全生產(chǎn)意識、研發(fā)救援技術(shù)裝備資金和各部門聯(lián)動應(yīng)急救援演練等方面建設(shè)的投入,并遵紀(jì)守法,建立良好信譽。地方政府積極建立完善的創(chuàng)新補償機制,補償企業(yè)研發(fā)投入不足,并主動減少合作流程時間,提高社會福利保障,樹立良好的政府形象。政、企雙方必須加強政企在應(yīng)急救援培訓(xùn)中的協(xié)作聯(lián)動性,統(tǒng)一計劃管理。政、企多方面多層次相互協(xié)調(diào)與配合,從而提高雙方信任度,減少協(xié)作時間成本,有效提高雙方協(xié)作意愿,增強應(yīng)急能力建設(shè)。4 數(shù)值仿真
4.1 初始參數(shù)賦值下的策略演化
4.2 優(yōu)化參數(shù)下的策略演化
5 結(jié)束語