楊 珊,明俊樺,周智勇
(中南大學(xué) 資源與安全工程學(xué)院,湖南 長沙 410083)
據(jù)國際勞工組織(ILO)資料顯示,全球范圍每年有接近2百萬人死于職業(yè)相關(guān)疾病。因職業(yè)傷害引起的世界經(jīng)濟(jì)損失達(dá)到2.8萬億美元,在全球各國國民生產(chǎn)總值中占據(jù)4%[1]。喬慶梅、徐金梅[2-3]指出,目前我國職業(yè)病狀況不容小視,與職業(yè)病有關(guān)的相關(guān)參數(shù)都占全球第一。因此,職業(yè)病的預(yù)防形勢相當(dāng)嚴(yán)峻。朱進(jìn)平、梅震[4]的研究表明,職業(yè)病具有遲發(fā)性和隱匿性,未來的病例數(shù)也會(huì)逐漸增加。關(guān)于職業(yè)病研究方面,國內(nèi)外已有較多學(xué)者參與,相關(guān)研究成果也已在職業(yè)病預(yù)防措施中得到應(yīng)用。例如:孫銀鈴、邵華等[5]指出,從整體上來說,中國在職業(yè)病防治方面的力度與美國有一定差距,還有很多工作要做;日本的恒川謙司[6]在了解中國職業(yè)衛(wèi)生的現(xiàn)狀基礎(chǔ)上,結(jié)合日本的職業(yè)衛(wèi)生措施,提出一系列建立、健全中國職業(yè)衛(wèi)生管理的對(duì)策和建議。但是,針對(duì)全國范圍內(nèi)的職業(yè)病預(yù)測,現(xiàn)有研究尚有不足,灰色預(yù)測方法以其所需樣本小、建模簡單、精度高及實(shí)用性強(qiáng)等特點(diǎn),得到廣泛應(yīng)用[7-8]。王維、李建東[9]使用經(jīng)典GM(1,1)模型,對(duì)職業(yè)病分類進(jìn)行了預(yù)測分析,相關(guān)預(yù)測準(zhǔn)確度尚不夠理想;李怡、張華東[10]雖然使用的是改進(jìn)GM(1,1)模型,不過并沒考慮到非線性關(guān)系;文獻(xiàn)[11]和[12]提到了非線性GM(1,1)改進(jìn)模型,其應(yīng)用的領(lǐng)域分別是房地產(chǎn)價(jià)格指數(shù)預(yù)測以及“兩稅”稅收預(yù)測,為本文提供了一定的理論基礎(chǔ),不過該方法的預(yù)測精度仍有提高空間;時(shí)冬青、宋文華等[13]提出灰色 GM(1,1)—馬爾科夫模型,將其應(yīng)用在職業(yè)病預(yù)測方面。在現(xiàn)有學(xué)者相關(guān)職業(yè)病預(yù)測方面的研究成果基礎(chǔ)上,本文進(jìn)一步完善和改進(jìn)相關(guān)預(yù)測模型,提出改進(jìn)的非線性GM(1,1)改進(jìn)模型,為職業(yè)病發(fā)病趨勢的預(yù)測提供理論和方法參考。
將原始數(shù)據(jù)記為序列X(0)=(x(0)(1),x(0)(2),…,x(0)(n)),經(jīng)典GM(1,1)模型建模步驟如下:
1)步驟1,對(duì)原始序列X(0)做一次累加生成,得數(shù)據(jù)序列:
X(1)=(x(1)(1),x(1)(2),…,x(1)(n))
(1)
2)步驟2,建立GM(1,1)模型的基本形式,如式(2)所示:
x(0)(k)+az(1)(k)=b,k=1,2,…,n
(2)
(3)
4)步驟4,模型(2)對(duì)應(yīng)的白化方程或影子方程為:
(4)
由其解得時(shí)間響應(yīng)函數(shù):
(5)
取x(1)(1)=x(0)(1),則模型(2)的時(shí)間響應(yīng)序列為:
(6)
(7)
因國家政策、社會(huì)條件等因素的影響,歷年實(shí)際職業(yè)病例數(shù)規(guī)律性相對(duì)較弱,其增減趨勢不一,會(huì)出現(xiàn)陡增或陡減的現(xiàn)象,因此本文首先選用幾何弱化算子理論對(duì)原始數(shù)據(jù)進(jìn)行處理,使數(shù)據(jù)變得有規(guī)律可循,增強(qiáng)模型預(yù)測的準(zhǔn)確度。
由式(2)可知,經(jīng)典的GM(1,1)模型實(shí)質(zhì)上是把{x(0)(k)}和{z(1)(k)}這2組數(shù)值之間看作線性關(guān)系進(jìn)行求解參數(shù)的。但是,在實(shí)際計(jì)算過程中,{z(1)(k),x(0)(k)}的散點(diǎn)往往不在一條直線上,即不符合線性關(guān)系,若仍做線性關(guān)系進(jìn)行處理,就會(huì)造成較大的誤差。因此,改進(jìn)模型將{z(1)(k),x(0)(k)}原本的線性假設(shè),改為非線性假設(shè)進(jìn)行處理,以提高曲線的擬合度。
為保證方程的可解性,本文將結(jié)合常用曲線(直線:y=a+bx;雙曲線:1/y=a+b/x;冪函數(shù)曲線:y=b0xb1;指數(shù)函數(shù)曲線:y=b0eb1x;增長曲線:y=eb0+b1x)建立非線性方程,再比較各曲線的擬合度,找到最吻合的曲線關(guān)系,分析曲線參數(shù),最終得到非線性GM(1,1)模型。相關(guān)分析步驟如下所示:
1)步驟1,利用幾何平均弱化緩沖算子,對(duì)原始數(shù)據(jù)進(jìn)行處理。設(shè)X(0)=(x(0)(1),x(0)(2),…,x(0)(n))為非負(fù)的系統(tǒng)行為數(shù)據(jù)序列,即x(0)(i)≥0。令
X(0)′ =X(0)D= (x(0)(1)d,x(0)(2)d,…,x(0)(n)d)
(8)
其中:
2)步驟2,分別將數(shù)據(jù)從上述曲線出發(fā),建立非線性回歸模型:
x(0)(k)=fi(z(1)(k),a,b)i=1,2,…,6
(9)
式中:a,b為未知參數(shù)。
3)步驟3,基于R2最大原則,確定最佳擬合曲線f(z(1)(k),a,b)。其中R2是表示各曲線與原始數(shù)據(jù)的擬合程度的參數(shù),其數(shù)值越大,則代表曲線的模擬值和原始數(shù)值的差別越小,則該曲線的模擬效果越好。
4)步驟4,預(yù)測精度的檢驗(yàn),通過后驗(yàn)差比值C和小誤差概率P,評(píng)判模型預(yù)測精度的合格與否[13],如表1所示,其計(jì)算公式分別為:
(10)
P=P{|ε(t)-ε| <0.674 5s1}
(11)
式中:s2為殘差數(shù)列的標(biāo)準(zhǔn)差,s1為原始數(shù)列的標(biāo)準(zhǔn)差,ε(t)為殘差數(shù)列,ε為殘差數(shù)列均值。
本文用我國職業(yè)病發(fā)病例數(shù)作為研究對(duì)象,驗(yàn)證該改進(jìn)的非線性GM(1,1)模型的可靠性和準(zhǔn)確性,使用2005—2014年的數(shù)據(jù)作為研究數(shù)據(jù),資料來源于2005—2014年國家衛(wèi)生和計(jì)劃生育委員會(huì)(衛(wèi)生部)發(fā)布的關(guān)于職業(yè)病防治情況的通報(bào)[13],具體數(shù)據(jù)如表2所示。
表1 后驗(yàn)差比值和小誤差概率預(yù)測精度評(píng)判檢驗(yàn)
表2 2005—2014年我國職業(yè)病發(fā)病例數(shù)統(tǒng)計(jì)
其中,2006年的職業(yè)病例數(shù)為29個(gè)省份的數(shù)據(jù),其他年份均為30個(gè)省份的職業(yè)病數(shù)據(jù),因此,為了使數(shù)據(jù)具有較高的參考性,本文利用“平均值比例差補(bǔ)法”[13],以 2005 年的職業(yè)病發(fā)病例數(shù)作為依據(jù),算出2006年的數(shù)據(jù)為11 805例。
以2005—2013年的9個(gè)職業(yè)病例數(shù)為建模數(shù)據(jù)進(jìn)行處理。設(shè):
X(0)=(x(0)(1),x(0)(2),x(0)(3),x(0)(4),x(0)(5),x(0)(6),x(0)(7),x(0)(8),x(0)(9))=(12 212.00,11 805.00,14 296.00,13 744.00,18 128.00,27 240.00,29 879.00,27 420.00,26 393.00)
采用傳統(tǒng)GM(1,1)模型進(jìn)行擬合,得到結(jié)果如表3所示。
表3 傳統(tǒng)GM(1,1)模型的建模擬合效果
由表3可以看出,傳統(tǒng)GM(1,1)模型擬合的平均相對(duì)誤差為15.20%,并預(yù)測得到2014年的職業(yè)病例數(shù)為32 552例,根據(jù)職業(yè)衛(wèi)生網(wǎng)的數(shù)據(jù),2014年的職業(yè)病例數(shù)為29 972例[13],預(yù)測相對(duì)誤差為8.61%。由此可知,該經(jīng)典模型預(yù)測誤差較大。
3.2.1幾何平均弱化緩沖算子的應(yīng)用
2005—2013年的數(shù)據(jù)并不是呈現(xiàn)穩(wěn)定增長或減少的狀態(tài),會(huì)受到各種因素的影響而波動(dòng)較大,特別是2010年的數(shù)據(jù)陡增。如果直接利用原始數(shù)據(jù)進(jìn)行模型的構(gòu)建,那么預(yù)測結(jié)果很大程度上不具備參考性。針對(duì)這個(gè)問題,灰色系統(tǒng)中提出了“灰色序列”,主要通過對(duì)原始數(shù)據(jù)的挖掘以及整理,重新發(fā)現(xiàn)數(shù)據(jù)之間的規(guī)律,進(jìn)而構(gòu)建數(shù)量關(guān)系模型。從表2可以看出,2010年的職業(yè)病的病例數(shù)陡增,因此采用幾何平均弱化緩沖算子對(duì)原始數(shù)據(jù)進(jìn)行處理,減緩其增長速度[14]。處理過程如下:由式(8)計(jì)算得到弱化值X(0)′ = (18 812.451 4,19 856.500 7, 21 462.816 2, 22 966.707 3,25 450.472 7, 27 703.353 4, 27 859.549 5, 26 901.599 6, 26 393.000 0)。
3.2.2改進(jìn)的非線性GM(1,1)模型的建模
采用SPSS軟件,選取幾種常見的曲線模型進(jìn)行分析,表4給出了各個(gè)曲線模型的擬合優(yōu)度、模型檢驗(yàn)結(jié)果和參數(shù)估計(jì)值。由R2最大原則,確定最佳擬合曲線。其中二次曲線模型的R2=0.966,該模型的擬合度最佳。幾種曲線模型的擬合效果如圖1所示,小圓圈代表原始觀測記錄,從直觀上看,顯然二次曲線和原始數(shù)據(jù)擬合的更好。
表4 常見曲線模型匯總和參數(shù)估計(jì)值
圖1 常見曲線模型擬合效果Fig.1 Fitting effect of common curve model
二次曲線的方程設(shè)為:y=ax2+bx+c。以數(shù)列X(0)′作為因變量y值,而該數(shù)列的緊鄰均值作為自變量x值,利用MATLAB計(jì)算出二次曲線的參數(shù)a,b,c,得到所求二次曲線的方程為:
y=-4.949×10-7x2+0.156x+15 218
(12)
將X(0)′的緊鄰均值數(shù)列作為自變量帶入式(12)中,可求得相應(yīng)的因變量,即擬合值,詳見表5所示。從表5可知,改進(jìn)的非線性GM(1,1)模型的擬合值和原始值之間的平均相對(duì)誤差為1.81%,低于傳統(tǒng)GM(1,1)模型的平均相對(duì)誤差。接著利用該模型,重復(fù)上述步驟重新建模,預(yù)測得到2014年的職業(yè)病例數(shù)為29 042例,根據(jù)職業(yè)衛(wèi)生網(wǎng)的數(shù)據(jù),2014年的職業(yè)病例數(shù)為29 972例,預(yù)測相對(duì)誤差為3.10%,比經(jīng)典GM(1,1)模型的預(yù)測精度高。
3.2.3擬合效果比較
利用后驗(yàn)差比值C和小誤差概率P這2個(gè)參數(shù)指標(biāo)來比較2種模型的預(yù)測精度,如表6所示。
表5 改進(jìn)的非線性GM(1,1)模型的建模擬合效果
表6 2種模型的預(yù)測精度比較
從表6中可以看出,改進(jìn)的非線性GM(1,1)模型的預(yù)測精度比傳統(tǒng)GM(1,1)模型高,可為職業(yè)病預(yù)測以及職業(yè)衛(wèi)生防治措施等工作提供更準(zhǔn)確的參考和支持。
由表3和表5數(shù)據(jù)可分別得到傳統(tǒng)GM(1,1)模型的擬合曲線效果圖和經(jīng)弱化處理的非線性GM(1,1)改進(jìn)模型的擬合曲線效果圖,如圖2和圖3所示。
圖2 傳統(tǒng)GM(1,1)模型的擬合效果Fig.2 The fitting effect diagram of the traditional GM (1,1) model
圖3 改進(jìn)的非線性GM(1,1)模型的擬合效果Fig.3 The fitting effect diagram of the improved GM (1,1) model
由圖2可看出,在傳統(tǒng)GM(1,1)模型預(yù)測中,原始數(shù)據(jù)有較大的波動(dòng),而得到的模擬數(shù)據(jù)卻是一條平滑曲線,并未體現(xiàn)出數(shù)據(jù)的變化特征;由圖3可看出,改進(jìn)的非線性GM(1,1)模型中的弱化數(shù)據(jù)和模擬數(shù)據(jù)基本一致,擬合度較高。可見,改進(jìn)模型中引入的弱化理論和非線性假設(shè),有效地解決了預(yù)測精度不高的問題,為職業(yè)病預(yù)測提供了有效的方法。根據(jù)改進(jìn)的非線性GM(1,1)模型,進(jìn)一步預(yù)測得到2015年的職業(yè)病病例數(shù)為34 900例。
1)改進(jìn)的非線性GM(1,1)模型中,利用幾何平均弱化算子對(duì)原始數(shù)據(jù)進(jìn)行處理,并將原始數(shù)據(jù)與緊鄰均值之間線性假設(shè)變?yōu)榉蔷€性假設(shè),使得該模型在職業(yè)病發(fā)病例數(shù)的預(yù)測精度上有了較大提高。
2)通過比較可知,相比傳統(tǒng)模型的職業(yè)病預(yù)測平均相對(duì)誤差15.20%,改進(jìn)的非線性模型降低到了1.81%;以2014年為驗(yàn)證數(shù)據(jù)時(shí),傳統(tǒng)模型的相對(duì)誤差為8.61%,而改進(jìn)的非線性模型變?yōu)?.10%;在后驗(yàn)差比值和小概率誤差檢驗(yàn)時(shí),傳統(tǒng)模型的預(yù)測精度為三級(jí),而改進(jìn)的非線性模型提高到一級(jí)。
3)根據(jù)該改進(jìn)的非線性GM(1,1)模型,得到2015年職業(yè)病的預(yù)測值為34 900例。
4)職業(yè)病的病例數(shù)會(huì)受到多種因素的影響,例如其本身所具有的“隱匿性”、“遲發(fā)性”等特點(diǎn),各種診斷儀器及標(biāo)準(zhǔn)的更新,人們思想觀念的轉(zhuǎn)變等。以上因素在一定程度上,會(huì)影響該模型的預(yù)測精度,但職業(yè)病的總體趨勢依舊在不斷增長,我國仍需加強(qiáng)對(duì)職業(yè)病的防治力度,盡最大的努力保障最廣大人們?nèi)罕姷纳眢w健康。
5)今后職業(yè)病的預(yù)測將會(huì)越來越細(xì)化,即具體到每一種職業(yè)病的發(fā)病例數(shù)的預(yù)測,以便為我國職業(yè)病的防治工作提供更有力的支持。
[1]賈麟.全球職業(yè)安全健康問題與新形勢[J].中國安全生產(chǎn),2014(11):58-59.
JIA Lin.Global occupational safety and health issues and the new situation[J].China Occupational Safety and Health, 2014(11):58-59.
[2]喬慶梅, 柯常云. 我國職業(yè)病防治的現(xiàn)狀與思考[J]. 中國醫(yī)療保險(xiǎn), 2011(12):59-62.
QIAO Qingmei,KE Changyun.The present situation of occupational disease prevention and cure in china and thoughts on it[J].China Health Insurance,2011(12):59-62.
[3]徐金梅.職業(yè)病防治現(xiàn)狀分析及其對(duì)策[J].西部探礦工程,2008,20(7):239-241.
XU Jinmei.The actuality analysis and countermeasure of prevention and cure of industrial disease in China[J]. West-China Exploration Engineering,2008,20(7):239-241.
[4]朱進(jìn)平,梅震.職業(yè)衛(wèi)生監(jiān)督量化分級(jí)管理模式探討[J].工業(yè)衛(wèi)生與職業(yè)病,2008,34(6):378-381.
ZHU Jinping,MEI Zhen.Discussion on quantitative classified management mode of occupational health supervision[J].Industrial Health and Occupational Diseases,2008,34(6):378-381.
[5]SUN Y, SHAO H, WANG H. Occupational diseases prevention and control in China: a comparison with the United States[J]. Journal of Public Health, 2015, 23(6):379-386.
[6]恒川謙司, 劉寶龍, 高建明,等. 日本職業(yè)衛(wèi)生管理及對(duì)中國的啟示[J]. 中國安全生產(chǎn)科學(xué)技術(shù), 2008, 4(1):116-119.
TSUNEKAWA K, LIU Baolong, GAO Jianming,et al. Occupational health management in Japan and its enlightenment to China[J].Journal of Safety Science and Technology,2008,4(1):116-119.
[7]LIN Y, LIU S. An introduction to grey systems: foundations, methodology and applications[J]. Kybernetes, 2003, 32(4):584-585.
[8]劉思峰. 灰色系統(tǒng)理論及其應(yīng)用(第五版)[M]. 北京:科學(xué)出版社, 2010.
[9]王維,李建東.GM(1,1)灰色模型在職業(yè)病發(fā)病預(yù)測中的應(yīng)用[J].中國公共衛(wèi)生管理,2014,30(6):920-922.
WANG Wei,LI Jiandong. Application of GM(1,1) grey model in prediction of occupational disease[J].Chinese Journal of Public Health Management,2014,30(6): 920-922.
[10]李怡,張華東.改良灰色模型在職業(yè)病發(fā)病趨勢上預(yù)測的分析研究[J].預(yù)防醫(yī)學(xué)情報(bào)雜志,2015,31(8):630-634.
LI Yi,ZHANG Huadong.Application of refined grey model in forecasting the of occupational disease[J].Journal of Preventive Medicine Information,2015,31(8): 630-634.
[11]錢峰, 呂效國, 朱帆. 灰色GM(1,1)模型的改進(jìn)模型在房地產(chǎn)價(jià)格指數(shù)預(yù)測中的應(yīng)用[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí), 2009, 39(7):29-33.
QIAN Feng,LYU Xiaoguo,ZHU Fan.The application of the improved grey GM (1,1) model in real estate price index prediction[J].Mathematics in Practice and Theory,2009,39(7):29-33.
[12]郭曉君,李大治,褚海鷗,等.基于GM(1,1)改進(jìn)模型的“兩稅”稅收預(yù)測研究[J].統(tǒng)計(jì)與決策,2014(4):34-36.
GUO Xioajun,LI Dazhi,CHU Haiou,et al. The study on the prediction of "Two Taxes" tax based on the improved GM(1,1) model[J].Statistics and Decision,2014(4):34-36.
[13]時(shí)冬青, 宋文華, 張桂釧,等. 基于灰色GM(1,1)-馬爾科夫模型的職業(yè)病預(yù)測研究[J]. 中國安全生產(chǎn)科學(xué)技術(shù), 2017, 13(4):176-180.
SHI Dongqing,SONG Wenhua,ZHANG Guichuan,et al.Study on prediction of occupational diseases based on grey GM(1,1)- markov model[J]. Journal of Safety Science and Technology, 2017,13(4):176-180.
[14]陳昌源, 戴冉, 楊婷婷,等. 基于改進(jìn) GM(1,1)模型的上海港集裝箱吞吐量預(yù)測[J]. 船海工程, 2016, 45(4):153-156.
CHEN Changyuan,DAI Ran,YANG Tingting, et al. Study on container throughput prediction of shanghai port based on improved GM(1,1) model[J].Ship & Ocean Engineerine, 2016, 45(4): 153-156.