寧 靜,聶方超
(1.中國礦業(yè)大學(xué)(北京)能源與礦業(yè)學(xué)院,北京 100083;2.中煤科工金融租賃股份有限公司,北京 100031;3.中國礦業(yè)大學(xué)(北京)應(yīng)急管理與安全工程學(xué)院,北京 100083)
礦工脫崗對于煤礦事故發(fā)生有直接影響,且一旦引發(fā)事故后果嚴(yán)重,因此降低礦工脫崗概率的研究十分有必要[1](本文所指“脫崗”還包括雖堅(jiān)守崗位但并未盡到相應(yīng)的職責(zé))。安宇[2]通過統(tǒng)計(jì)分析某礦業(yè)公司違章記錄,得出在該公司出現(xiàn)次數(shù)最多的不安全行為中,脫崗排在第6位。魏京天等[3]設(shè)計(jì)了一種脫崗檢測系統(tǒng),能夠及時準(zhǔn)確發(fā)現(xiàn)離開工作崗位的不安全行為,但是無法監(jiān)測堅(jiān)守工作崗位但并未盡到相應(yīng)職責(zé)的脫崗。對于不安全行為,我國學(xué)者常用模糊聚類[4-5]、因子分析[6-7]、結(jié)構(gòu)方程模型[8-9]等宏觀方法展開研究,而對具體行為研究較少。
博弈論是研究具有競爭現(xiàn)象的數(shù)學(xué)理論和方法,近年來在不安全行為研究中有著廣泛應(yīng)用。如蓋麗麗[10]通過構(gòu)建礦工和檢查人員的動態(tài)博弈模型,得出獎勵約束機(jī)制具有一定的延續(xù)積累特性,為煤礦企業(yè)以獎代罰的管理方式提供理論基礎(chǔ)。楊雪等[11]以進(jìn)化博弈論為基礎(chǔ),得出礦工情緒監(jiān)管與不安全行為的關(guān)系。礦工脫崗行為符合博弈論的基本特征,可以將演化博弈理論應(yīng)用到礦工與煤礦企業(yè)的策略選擇中去,因此,本文基于演化博弈理論尋找礦工脫崗行為的原因,進(jìn)而分析從根本上降低礦工脫崗概率的方法。
礦工在崗的穩(wěn)定狀態(tài)即礦工與煤礦企業(yè)在一定約束條件下的有限理性均衡博弈。因此做出如下假設(shè):①博弈雙方(煤礦企業(yè),礦工);②博弈雙方行為集合,A1={礦工脫崗,礦工在崗},A2={煤礦企業(yè)檢查,煤礦企業(yè)不檢查};③礦工收入W;④礦工脫崗行為導(dǎo)致事故的可能性為q,發(fā)生事故后脫崗礦工和企業(yè)的損失分別為L、B;⑤煤礦企業(yè)對脫崗礦工的處罰為H;⑥在崗礦工因脫崗礦工的影響,外部損失為K;⑦煤礦企業(yè)正常收入為S,檢查礦工脫崗的成本為F。綜合以上因素,建立兩博弈方的收益矩陣(圖1)。
圖1 雙方收益Fig.1 Benefit of two parts of game
假設(shè)礦工在崗概率為x,煤礦企業(yè)檢查脫崗概率為y,則礦工脫崗與否的效用、平均期望、在崗的復(fù)制動態(tài)方程見式(1)。
τ在崗=y(W-K)+(1-y)(W-K)=W-K
τ脫崗=y(W-H-qL)+(1-y)(W-qL)=
W-yH-qL
τ平均=τ在崗x+τ脫崗(1-x)=
(1-x)(W-yH-qL)+x(W-K)
x(x-1)(K-qL-yH)
(1)
同理煤礦企業(yè)檢查與否的效用、平均期望、檢查的復(fù)制動態(tài)方程見式(2)。
π不檢查=xS+(1-x)(S-qB)
π檢查=x(S-F)+(1-x)(H+S-F-qB)
π平均=yπ檢查+(1-y)π不檢查
(2)
命題1:當(dāng)K=qL+yH,即礦工外部損失與礦工脫崗損失期望、礦工被檢查處罰的期望之和相等時,無論礦工是否脫崗獲得的收益都是一樣的,所以礦工無論脫崗與否均為穩(wěn)定狀態(tài)。當(dāng)K>qL+yH,即礦工外部損失大于礦工損失期望與礦工被檢查處罰的期望之和時,x=0即礦工為獲取最大的收益而采取脫崗行為,而后達(dá)到穩(wěn)定狀態(tài);當(dāng)K 命題2:當(dāng)F=(1-x)H,即煤礦企業(yè)檢查脫崗成本與礦工脫崗被處罰期望相等,無論煤礦企業(yè)是否檢查脫崗企業(yè)獲得的收益都是一樣的,所以無論企業(yè)是否檢查均為穩(wěn)定狀態(tài)。F>(1-x)H,即煤礦企業(yè)檢查脫崗成本大于礦工脫崗被處罰期望,y=0即煤礦企業(yè)為避免過大的檢查成本而采取不檢查措施為穩(wěn)定狀態(tài);F<(1-x)H,即煤礦企業(yè)檢查脫崗成本小于礦工脫崗被處罰期望,y=1,即煤礦企業(yè)成本可通過對礦工的處罰來彌補(bǔ)而采取檢查脫崗措施為穩(wěn)定狀態(tài)。 綜上分析可知,礦工與煤礦企業(yè)選擇是動態(tài)變化的一個過程,礦工在崗概率x與煤礦企業(yè)檢查概率y雙向影響,且二者穩(wěn)定狀態(tài)由懲罰力度F、在崗?fù)獠繐p失K、事故發(fā)生后礦工損失L、檢查成本F等因素共同決定。 命題3:依據(jù)上述分析,礦工和煤礦企業(yè)博弈存在相關(guān)影響,為進(jìn)一步分析建立系統(tǒng),見式(3)。 (3) 系統(tǒng)平衡點(diǎn)有A點(diǎn)(脫崗,不檢查)、B點(diǎn)(脫崗,檢查)、C點(diǎn)(在崗,不檢查)、D點(diǎn)(在崗,檢查)、E點(diǎn)((H-F)/H,(K-qL)/H)。各假設(shè)條件的多樣性導(dǎo)致平衡點(diǎn)E的不確定性??紤]E點(diǎn)在坐標(biāo)軸中位置的各種情況,分析可知系統(tǒng)最終收斂于A點(diǎn)、B點(diǎn)、C點(diǎn),即博弈雙方演化過程的穩(wěn)定點(diǎn)為A點(diǎn)(脫崗,不檢查)、B點(diǎn)(脫崗,檢查)、C點(diǎn)(在崗,不檢查)。 某煤礦共有礦工約200人,礦工年收入為8萬元,煤礦收益為每年15 000萬元,煤礦企業(yè)檢查脫崗成本為15萬元,依據(jù)式(4)可得出脫崗導(dǎo)致事故先驗(yàn)概率的極大似然估計(jì)值是0.08,且事故總損失為1 000萬元,該礦管理方式以懲罰為主,對于脫崗礦工的罰金為30萬元。綜合以上分析可確定各假設(shè)條件(單位:萬/a):W=8,q=0.08,L=150,H=30,K=10,S=15 000,F(xiàn)=15,B=1 000。此時平衡點(diǎn)E點(diǎn)為(0.5,-0.07),由上述參數(shù)可得博弈雙方收益見圖1,其中-2>-4,因此礦工選擇在崗時收益大,在此條件上,15 000>14 985,即煤礦企業(yè)選擇不檢查的收益最大,此系統(tǒng)最終收斂于(不脫崗,不檢查)。 k=1,2,…K (4) 式中:I(yi=ck)指示函數(shù),yi=ck為真,輸出1,yi=ck非真,則輸入0。 從演化規(guī)律來看,礦工在崗概率x與平衡點(diǎn)E橫坐標(biāo)存在兩種關(guān)系。 1) 當(dāng)x>E點(diǎn)橫坐標(biāo)時,以0.55為起點(diǎn),0.75為終點(diǎn),步長為0.05,取不同的x值。 (5) 將x分別代入式(5)并積分,可以得出x不同取值下煤礦企業(yè)檢查脫崗概率隨時間變化曲線。由圖2可以看出,x>0.5(E點(diǎn)橫坐標(biāo))時,煤礦企業(yè)剛開始檢查脫崗,但礦工脫崗概率較低,設(shè)置脫崗檢查實(shí)屬浪費(fèi)資源,經(jīng)過長期博弈,煤礦企業(yè)會逐漸趨于不檢查。此外可以看出礦工脫崗的概率越大時,即x越小,煤礦企業(yè)收斂于不檢查的速度就越慢;礦工在崗的概率越大時,即x越大,煤礦企業(yè)就能在短時間內(nèi)達(dá)到不檢查的穩(wěn)定狀態(tài);可見對于礦工脫崗的不同概率值,演化博弈趨向穩(wěn)定的速度也不同。 2) 當(dāng)x 將x分別代入式(5)并積分,可以得出x不同取值下煤礦企業(yè)檢查脫崗概率隨時間變化曲線。由圖3可以看出,x<0.5(E點(diǎn)橫坐標(biāo))時,脫崗情況嚴(yán)重,大部分礦工選擇脫崗,這對企業(yè)的正常運(yùn)營產(chǎn)生嚴(yán)重的影響,煤礦企業(yè)會從剛開始的不檢查逐漸趨于檢查,以減小礦工脫崗行為的發(fā)生。此外可以看出礦工脫崗的概率越大時,即x越小,則煤礦企業(yè)趨向于檢查脫崗所用的時間就越短;礦工在崗的概率越大時,即x越大,則煤礦企業(yè)達(dá)到檢查礦工脫崗的穩(wěn)定狀態(tài)所用的時間就越長;可見對于礦工脫崗的不同概率值,演化博弈趨向穩(wěn)定的速度也不同。 圖2 x>0.5時煤礦企業(yè)策略隨時間變化關(guān)系Fig.2 Relationship between corporate strategy and time(x>0.5) 圖3 x<0.5時煤礦企業(yè)策略隨時間變化關(guān)系Fig.3 Relationship between corporate strategy and time(x<0.5) 3) 為了分析檢查成本F、脫崗礦工處罰H分別對煤礦企業(yè)策略的影響,取x為0.5。F對煤礦企業(yè)策略影響:將案例H數(shù)值代入式(3)F(y),可知此系統(tǒng)平衡點(diǎn)為F=15,F(xiàn)分別取不同的值,代入式(3)F(y)并積分可得不同F(xiàn)值下煤礦企業(yè)檢查脫崗概率隨時間變化曲線。由圖4(a)可知,當(dāng)F值大于平衡點(diǎn)時,y最終趨于0,即當(dāng)檢查脫崗成本F過大時,煤礦企業(yè)為了節(jié)省成本傾向于不檢查;而且隨著檢查成本F值的增大,傾向不檢查所用的時間越短。由圖4(b)可知,當(dāng)F值小于平衡點(diǎn)時,y最終趨向于1,即當(dāng)檢查脫崗成本F不大時,煤礦企業(yè)為了防止脫崗情況的出現(xiàn)傾向于檢查。隨著檢查成本的減小,傾向檢查所用的時間越短。H對煤礦企業(yè)策略影響:將案例F數(shù)值代入式(3)F(y),可知此系統(tǒng)平衡點(diǎn)為H=30,H分別取不同的值,代入式(3)F(y)并積分可得不同H下煤礦企業(yè)檢查脫崗概率隨時間變化曲線。由圖4(c)可知,當(dāng)H值大于平衡點(diǎn),y最終趨于1,即當(dāng)對脫崗礦工的處罰H可以填補(bǔ)檢查脫崗所需成本F值時,煤礦企業(yè)傾向于檢查;H值越大,到達(dá)穩(wěn)定狀態(tài)所用的時間越短。由圖4(d)可知,當(dāng)H值小于平衡點(diǎn),y最終趨向于0,即此時的H值不足以彌補(bǔ)檢查帶來的成本問題,為了節(jié)省資金傾向于不檢查。H值越小,到達(dá)穩(wěn)定狀態(tài)所用時間越短。 圖4 不同F(xiàn)值、H值時煤礦企業(yè)策略隨時間變化關(guān)系Fig.4 Relationship between corporate strategy and time with different F value or H value 1) 將案例參數(shù)代入式(3)可得式(6)。由式(6)可知,y的取值對于dx/dt的正負(fù)無影響,以0.1為起點(diǎn),0.9為終點(diǎn),0.2為步長,取不同的y值。 (6) 將y分別代入式(6)并積分,可得y不同取值下礦工在崗概率x隨時間變化曲線。由圖5可知,不管煤礦企業(yè)檢查概率是多少,礦工都是趨于在崗。煤礦企業(yè)檢查力度越大,即y越大,礦工趨于在崗所用的時間就越短。 2) 為分析K對礦工策略的影響,取y=0.5。將q、L、y、H數(shù)值代入式(3)F(x),可知此系統(tǒng)平衡點(diǎn)為K=27,K取不同值代入式(3)F(x)并積分,得到不同K值下礦工策略隨時間變化關(guān)系。由圖6(a)可知,當(dāng)在崗礦工因脫崗礦工影響其外部損失K過大時,x最終趨于0;即在崗礦工為了降低外部損失對自身的影響,而選擇脫崗;且K越大,趨于穩(wěn)態(tài)時間越短。由圖6(b)可知,K不大時,在崗礦工可以忽略K對自身的影響,而選擇堅(jiān)守崗位;且K越小,礦工達(dá)到堅(jiān)守崗位的穩(wěn)態(tài)所用的時間越短。為分析L值對礦工策略的影響,取y=0。將q、K代入式(3)F(x),可知此系統(tǒng)平衡點(diǎn)為L=125,L取不同值代入式(3)F(x)并積分,得到不同L值下礦工策略隨時間變化關(guān)系。由圖6(c)可知,L值大于平衡點(diǎn)時,x最終趨于1,即礦工為了避免事故后過大的個人損失而選擇在崗,而且L值越大,對礦工的“震懾”作用越大,達(dá)到在崗穩(wěn)定狀態(tài)所用時間越短。由圖6(d)可知,L值較小時,x最終趨向于0,即較小的L值對礦工影響也較小,為獲得較大收益,而選擇脫崗。 圖5 礦工策略隨時間變化關(guān)系Fig.5 Relationship between miner strategy and time 圖6 不同K值、L值時礦工策略隨時間變化關(guān)系Fig.6 Relationship between miner strategy and time with different K value or L value 1) 由分析可知,上述實(shí)例中無論煤礦檢查與否,礦工均趨于在崗,僅存在收斂速度的差別。其中起決定性作用的是K(10) 2) 煤礦企業(yè)還可以從降低外部影響K。本文分析以負(fù)向激勵懲罰為主,煤礦企業(yè)應(yīng)統(tǒng)計(jì)礦工在崗情況并歸檔,對于長期堅(jiān)守在工作崗位的礦工進(jìn)行獎勵,即間接降低在崗礦工的外部性損失,礦工就會選擇忽略外部性損失K,進(jìn)而選擇堅(jiān)守崗位。 3) 在本案例中煤礦企業(yè)檢查與否對礦工脫崗概率影響不大,但是當(dāng)K>qL時,為了達(dá)到K 1) 礦工與煤礦企業(yè)演化博弈是一個動態(tài)的過程,可知礦工是否脫崗和煤礦企業(yè)檢查概率y、外部影響K、脫崗引發(fā)事故概率q、礦工事故損失L、懲罰力度H等因素密切相關(guān)。 2) 對于最終收斂于A點(diǎn)(脫崗,不檢查)的系統(tǒng),這種穩(wěn)定狀態(tài)如果長期不打破的話,會威脅礦工的安全和煤礦企業(yè)的發(fā)展,雙方需要及時改變策略。如煤礦企業(yè)可以從降低檢查成本F和外部影響K入手,前者可以使得煤礦企業(yè)趨于檢查,后者可以使得礦工趨于在崗。 3) 懲罰變量H的引入填補(bǔ)企業(yè)損失的缺口,也間接增加了不脫崗礦工收入,所以企業(yè)需要及時處理脫崗事故,以制止脫崗事故發(fā)生。2 實(shí)例分析
2.1 案例概況
2.2 煤礦企業(yè)策略分析
2.3 礦工策略分析
3 改善措施
4 結(jié) 論