国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高鐵運營安全監(jiān)督系統(tǒng)獎懲機制優(yōu)化研究

2018-10-29 05:05李科宏張亞東
關鍵詞:路局獎懲鐵路局

李科宏,張亞東,郭 進

(西南交通大學信息科學與技術學院,成都610031)

0 引 言

目前,我國高速鐵路已經由大規(guī)模建設階段逐步向穩(wěn)定運營階段轉化,因此,國家鐵路局和鐵路總公司制定和出臺了各項安全規(guī)章來對高鐵運營過程進行安全管理.高鐵運營安全監(jiān)管制度是保證各項規(guī)章貫徹實施的關鍵,有必要建立完善的監(jiān)管獎懲機制以控制系統(tǒng)中各相關方的違規(guī)行為.在委托運輸管理模式[1]下,有關高鐵運營安全監(jiān)督系統(tǒng)獎懲機制存在問題的研究大多為定性分析.陳茂瑩[2]認為應該完善針對委托路局的獎懲考核機制以確保其完成經營目標.韓世通[3]認為應當修訂和完善激勵約束機制以加強高鐵委托運輸管理.姬志洲等[4]使用博弈論研究鐵路企業(yè)與監(jiān)管部門之間存在的行為以提高監(jiān)管效率.在其他領域,張弓亮等[5]使用演化博弈論對高速公路共謀逃費行為進行了分析,認為增強對監(jiān)管者的監(jiān)管和處罰力度等措施可以有效遏制共謀逃費現(xiàn)象.蔡玲如[6]使用演化博弈論對環(huán)境污染的治理問題進行了研究,認為將懲罰力度與被監(jiān)督檢查方的違規(guī)率相聯(lián)系有助于抑制博弈過程的波動.賈璐[7]使用演化博弈論對工程安全監(jiān)管過程中的相關方進行分析,提出了制定懲罰策略的建議.李振龍等[8]使用演化博弈論建立了超速駕駛行為的博弈模型,提出通過獎懲措施來規(guī)范交通管理者和超速駕駛員的行為.朱慶華等[9]使用演化博弈論分析了碳減排政策下地方政府與制造企業(yè)雙方的博弈關系,并引入政府動態(tài)補償策略,剖析政企雙方策略的互動機制.

之前的工作中[10],我們通過分析高鐵運營安全監(jiān)督系統(tǒng)現(xiàn)狀,建立了高鐵公司、國家鐵路局和委托路局三方組成的系統(tǒng)靜態(tài)演化博弈模型.通過演化博弈理論證明結合系統(tǒng)動力學(SD)仿真,得到了系統(tǒng)各方在博弈過程中產生利益沖突的長期動態(tài)波動特征并驗證了該模型不存在演化穩(wěn)定策略均衡(ESS).本文通過對靜態(tài)模型進行優(yōu)化,分別提出動態(tài)獎勵,動態(tài)獎懲和優(yōu)化動態(tài)獎懲模型,最終通過優(yōu)化動態(tài)獎懲模型使系統(tǒng)演化博弈的波動趨勢得到有效抑制并達到最優(yōu),為提高高鐵安全監(jiān)督的效果提供了理論支持.

1 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎勵演化博弈模型分析

1.1 動態(tài)獎勵模型描述及建立

假設國家鐵路局以比率X對委托路局的安全生產狀況進行監(jiān)管,X=0和1分別表示不監(jiān)管和實時監(jiān)管.假設國家鐵路局對委托路局進行監(jiān)管的支付成本為CS.如果國家鐵路局不進行監(jiān)管,則委托路局可能違反高鐵委托運輸協(xié)議及安全規(guī)章,導致事故發(fā)生率上升,其將承擔后期的資產和聲譽損失成本為Ls;如果國家鐵路局對委托路局和高鐵公司進行監(jiān)管,發(fā)現(xiàn)他們存在違規(guī)行為將分別對其進行處罰PR和PE.假設委托路局按照國家鐵路局的相關規(guī)章和與高鐵公司簽訂的委托協(xié)議進行安全投入,安全投入率為Y,其正常生產所獲得的收益為πR,而違反協(xié)議進行違規(guī)操作時,將獲得收益CR(即節(jié)約的安全投入成本),同時承擔高鐵事故率上升的期望損失成本W(wǎng)R.假設高鐵公司以比率Z對委托路局進行安全監(jiān)督,高鐵公司嚴格監(jiān)督的成本為CE,但在嚴格監(jiān)督的情況下可能由于監(jiān)督人員素質等原因出現(xiàn)監(jiān)督失誤,失誤率為RE;假定高鐵公司安全監(jiān)督獲取的正常收入為πE,而不監(jiān)督時,將承擔后期的期望損失成本LE.

由于之前建立的靜態(tài)演化博弈模型并不存在ESS,為了抑制系統(tǒng)各方在博弈過程中產生的波動性,國家鐵路局可以根據(jù)安全監(jiān)管的結果,使用動態(tài)獎勵機制對委托路局和高鐵公司進行獎勵[9].假設對委托路局的獎勵與其安全投入率成正比,對高鐵公司的獎勵與其履行監(jiān)督職責的比率成正比,即B′R=αYBR,B′E=βZBE,其中,BR,BE分別為國家鐵路局對委托路局和高鐵公司的一般性獎勵,α,β分別為獎勵系數(shù)(初始都為1).則使用動態(tài)獎勵策略,國家鐵路局,高鐵公司與委托路局博弈三方的收益矩陣如表1所示.

1.2 動態(tài)獎勵模型三方復制動態(tài)系統(tǒng)

根據(jù)演化博弈理論,結合表1可得動態(tài)獎勵場景下,高鐵運營安全監(jiān)督系統(tǒng)博弈演化的復制動態(tài)方程組為

表1 國家鐵路局、委托路局和高鐵公司的收益矩陣Table 1 Payoff matrix of the regulatory agencies,commissioned railway bureau and high-speed railway company

由式(1)可得博弈系統(tǒng)的雅可比矩陣為

其中,

由于模型的表達式比較復雜,為了方便求解分析,首先對相關變量進行賦值解得各個均衡點,然后通過理論推導和SD仿真分析博弈模型各個均衡點的穩(wěn)定性.通過文獻[9]并結合領域內專家經驗,得到模型中各參數(shù)設置如表2所示.

表2 仿真參數(shù)設置Table 2 Simulation parameter setting

1.3 動態(tài)獎勵模型求解及穩(wěn)定性證明

Friedman提出通過分析系統(tǒng)在均衡點時雅可比矩陣(Jacobian)行列式和特征值的方法來得到系統(tǒng)復制動態(tài)方程均衡點的穩(wěn)定性[11-12].根據(jù)李雅普諾夫(Lyapunov)穩(wěn)定性理論,若所有特征值均具有非正實部,則系統(tǒng)穩(wěn)定,否則系統(tǒng)不穩(wěn)定.將表2中的參數(shù)設置帶入式(1)和式(2)中計算可以得到模型各均衡點對應的特征值及其穩(wěn)定狀態(tài),如表3所示.由表3可知,該模型并不存在ESS.

1.4 基于SD的動態(tài)獎勵模型穩(wěn)定性分析

在高鐵運營安全監(jiān)督系統(tǒng)演化博弈過程中,每個博弈參與者會主動模仿同種群其他高收益參與者的行為,從而動態(tài)改變自己的策略,因此,可以使用SD方法來分析均衡解的穩(wěn)定性[6-7,13].根據(jù)上述博弈模型的假設,運用Vensim PLE 5.6a建立系統(tǒng)的動態(tài)獎勵演化博弈模型如圖1所示.該模型由3個子系統(tǒng)構成,分別為國家鐵路局子系統(tǒng)、高鐵公司子系統(tǒng)及委托路局子系統(tǒng).其中模型的所有變量賦值及變量間的關系可以參照表1和式(1)中的3個復制動態(tài)方程.

表3 動態(tài)獎勵策略模型各均衡點及其特征值Table 3 Equilibrium point and characteristic values of the game model based on dynamic rewarding scenario

圖1 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎勵演化博弈SD模型Fig.1 System dynamics model of high-speed railway operation safety supervision evolution game system based on dynamic rewarding scenario

以E10為例進行仿真,模型設定如下:INITIALTIME=0,F(xiàn)INALTIME=40,TIMESTEP=0.007 812,Units for Time=week,Integration Type:Euler.仿真結果如圖2所示.由圖2(a)可知,博弈三方表現(xiàn)出了相對穩(wěn)定的狀態(tài);但是如果其初始選擇策略發(fā)生微小改變(X=0.434 6改變?yōu)閄=0.43),則仿真結果如圖2(b)所示,說明均衡點E10的平衡狀態(tài)并不穩(wěn)定.

圖2 E10策略下系統(tǒng)演化博弈過程Fig.2 Game results under the equilibrium solutionE10 strategy and mutation

2 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎懲演化博弈模型分析

2.1 動態(tài)獎懲模型求解及穩(wěn)定性證明

在控制博弈過程波動性的研究中,文獻[6-7]提出將違規(guī)處罰與其違規(guī)概率相聯(lián)系來控制模型策略的波動.因此在動態(tài)獎勵模型的基礎上,本文提出動態(tài)獎懲模型,在動態(tài)獎勵的同時國家鐵路局對委托路局和高鐵公司進行動態(tài)處罰,即對委托路局的處罰與其違法行為的比率成正比,對高鐵公司的處罰與其忽視監(jiān)督職責的比率成正比,分別為,其中γ,δ和PR,PE分別為對委托路局和高鐵公司的處罰系數(shù)和一般性處罰.令處罰系數(shù)γ,δ都等于1,則將帶入式(1)和式(2)中,可以解得8個純策略均衡解和2個混合策略解,分別求其相應的特征值,可以得到每個均衡解的穩(wěn)定狀態(tài)如表4所示.

表4 動態(tài)獎懲策略模型各均衡點及其特征值Table 4 Equilibrium point and characteristic values of the dynamic rewarding and punishment game model

2.2 基于SD的動態(tài)獎懲模型穩(wěn)定性分析

通過SD仿真對動態(tài)獎懲模型的各均衡點進行驗證,系統(tǒng)演化博弈SD模型如圖3所示.

在動態(tài)獎懲場景下,當隨機選取系統(tǒng)博弈三方的初始策略分別為X=0.1,Y=0.1,Z=0.1時,系統(tǒng)演化博弈模型的仿真結果如圖4所示.

從圖4可以看出,動態(tài)獎懲場景下,系統(tǒng)博弈三方的博弈演化過程都大概收斂于

說明存在ESS使博弈過程最終趨于穩(wěn)定狀態(tài),這同表4顯示的結果一致.同時,動態(tài)獎懲場景下的系統(tǒng)演化博弈過程在前期仍然有比較大幅的波動,雖然最終國家鐵路局的安全監(jiān)管率和高鐵公司的監(jiān)督檢查率穩(wěn)定值都比較高,但委托路局的安全投入率穩(wěn)定值卻剛剛過半.由于在實際當中,國家鐵路局的安全監(jiān)管應該比較有限,高鐵運營安全生產更多依靠高鐵公司的實時監(jiān)督,說明最終模型仿真的穩(wěn)定效果并不理想.

圖3 高鐵運營安全監(jiān)督系統(tǒng)動態(tài)獎懲演化博弈SD模型Fig.3 SD model of high-speed railway operation safety supervision evolution game system based on dynamic rewarding and punishment scenario

圖4 動態(tài)獎懲場景下的系統(tǒng)演化博弈過程Fig.4 Game results based on dynamic rewarding and punishment scenario

3 高鐵運營安全監(jiān)督系統(tǒng)優(yōu)化動態(tài)獎懲演化博弈模型分析

3.1 優(yōu)化動態(tài)獎懲模型求解及穩(wěn)定性證明

為了使系統(tǒng)各方的博弈過程達到最優(yōu),在動態(tài)獎懲模型的基礎上提出優(yōu)化動態(tài)獎懲模型繼續(xù)進行追加處罰和獎勵,即國家鐵路局對委托路局和高鐵公司的處罰和獎勵,分別為

式中:γ1,γ2,δ1,δ2和α1,α2,β1,β2分別為國家鐵路局對委托路局和高鐵公司的處罰和獎勵系數(shù),且都設為1.

同樣,通過式(1)和式(2),可以解得8個純策略均衡解和1個混合策略均衡解,然后得到每個均衡解的穩(wěn)定狀態(tài).特別地,對于,由于復制動態(tài)方程組中包含X為分母的情況,所以其不能為零.因此,使用占位符R代替X.對于,其對應的特征值為 :λ1=-R2-2R-1/2,λ2=-R2/4-3R-1,λ3=15R2/4+19R/2-6,由于R接近于0,可以得到λ1,λ2,λ3都小于0,所以該均衡解是ESS.同理可以證明其他均衡解E2′-E9′都不是ESS.9個均衡解的特征值及其均衡狀態(tài)如表5所示.

3.2 基于SD的優(yōu)化動態(tài)獎懲模型穩(wěn)定性分析

使用SD仿真對模型的各均衡點進行驗證,則優(yōu)化后的系統(tǒng)演化博弈SD模型,如圖5所示.

在優(yōu)化動態(tài)獎懲模型下,當隨機選取系統(tǒng)博弈三方的初始策略分別為X=0.5,Y=0.5,Z=0.5時,系統(tǒng)演化博弈模型的仿真結果如圖6所示.

表5 優(yōu)化動態(tài)獎懲模型各均衡點及其特征值Table 5 Equilibrium point and characteristic values of the optimized dynamic rewarding and punishment game model

圖5 高鐵運營安全監(jiān)督系統(tǒng)優(yōu)化動態(tài)獎懲策略演化博弈SD模型Fig.5 System dynamics model of high-speed railway operation safety supervision evolution game system based on optimized dynamic rewarding and punishment scenario

圖6 優(yōu)化動態(tài)獎懲場景下的系統(tǒng)演化博弈過程Fig.6 Game results based on optimized dynamic rewarding and punishment scenario

綜上,通過理論證明,結合SD對高鐵運營安全監(jiān)督系統(tǒng)演化博弈進行仿真是解決演化博弈均衡解穩(wěn)定性分析的有效方法.通過仿真發(fā)現(xiàn),動態(tài)獎勵場景下委托路局選擇進行安全投入的比率存在波動增大的現(xiàn)象;動態(tài)獎懲場景下,其波動狀態(tài)得到有效抑制,安全投入率的演化過程存在ESS,但并未達到最優(yōu);優(yōu)化動態(tài)獎懲場景下,委托路局違反協(xié)議的行為得到有效控制,安全投入率在短期內達到最優(yōu).

4 結論

本文通過對高鐵運營安全監(jiān)督系統(tǒng)靜態(tài)演化博弈模型進行優(yōu)化,分別建立了基于動態(tài)獎勵,動態(tài)獎懲和優(yōu)化動態(tài)獎懲場景下的,包括國家鐵路局、高鐵公司和委托路局三方在高鐵運營安全監(jiān)督過程中的系統(tǒng)演化博弈模型,并通過演化博弈理論結合SD仿真,分析了3種場景下博弈三方策略的動態(tài)選擇博弈過程.通過使用動態(tài)獎懲和優(yōu)化動態(tài)獎懲模型,可以有效控制博弈三方策略選擇的波動性,獲得ESS.特別的,通過優(yōu)化動態(tài)獎懲模型,國家鐵路局的安全監(jiān)管率下降的同時,高鐵公司的安全監(jiān)督檢查率和委托路局的安全投入率都得到了有效提高,使三方在長期博弈過程中達到最優(yōu)狀態(tài).以上結果為委托運輸管理模式下,高鐵運營安全監(jiān)管機制的設計和應用提供了思路,具有重大的理論和實踐意義.

本文中模型參數(shù)的賦值是基于參考文獻[7]并結合本領域專家經驗的基礎上得到的,與實際情況可能存在差異,在未來的工作中,將進一步結合現(xiàn)場實際數(shù)據(jù)對模型進行仿真研究,以得到更具說服力的結果.

猜你喜歡
路局獎懲鐵路局
基于模糊馬爾可夫鏈的獎懲系統(tǒng)*
UIC和歐盟鐵路局簽署一項協(xié)調框架協(xié)議
參考資料
既有災害監(jiān)測系統(tǒng)接入鐵路局中心系統(tǒng)方案研究
呼和浩特鐵路局GSM-R系統(tǒng)現(xiàn)場應用故障分析與處理
論如何正確對待高校學生獎懲工作
我國納稅信用體系建設研究
路局至總公司視頻會議網(wǎng)絡補強方案研究
掛職女段長
昆明鐵路局完成IP會議及語音系統(tǒng)建設