国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘的塵肺病建模與預測研究?

2014-08-07 12:08:20張翰英楊照峰
微處理機 2014年3期
關鍵詞:塵肺塵肺病殘差

張翰英,楊照峰

(1.平頂山市工業(yè)學校,平頂山467000;2.平頂山學院軟件學院,平頂山467002)

基于數(shù)據(jù)挖掘的塵肺病建模與預測研究?

張翰英1,楊照峰2

(1.平頂山市工業(yè)學校,平頂山467000;2.平頂山學院軟件學院,平頂山467002)

為了提高塵肺病的預測準確性,針對塵肺病歷史數(shù)據(jù)少、不確定的特點,采用多種數(shù)據(jù)挖掘技術進行建模,提出一種基于GM-BPNN的塵肺病組合預測模型。首先利用灰色模型GM(1,1)對塵肺病進行預測,然后采用BP神經(jīng)網(wǎng)絡對GM(1,1)預測結(jié)果進行修正,并采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的初始權值和閾值,最后對1981~2006年的塵肺病例進行仿真測試。仿真結(jié)果表明GM-BPNN很好地解決了塵肺病預測過程中的小樣本、非線性問題,相對于單一預測模型,提高了塵肺病的預測精度。

塵肺?。换疑P?;BP神經(jīng)網(wǎng)絡;遺傳算法;仿真

1 引 言

塵肺病是一種危害嚴重的職業(yè)病。據(jù)統(tǒng)計,塵肺病發(fā)病率一直呈上升趨勢,不僅危害工人身體健康,而且給國家?guī)砹私?jīng)濟損失,因此對塵肺病未來發(fā)病狀況進行有效預測,然后根據(jù)預測結(jié)果對塵肺病進行控制和管理,具有十分重要意義[1]。

當前塵肺病預測方法主要包括傳統(tǒng)統(tǒng)計學方法和數(shù)據(jù)挖掘技術預測方法。傳統(tǒng)統(tǒng)計學方法包括線性回歸預測、時間序列、趨勢外推法和指數(shù)平滑法等[2],這些方法參數(shù)設置少,簡單易實現(xiàn),但它們均假設塵肺病變化趨勢是一種線性變化,實際上塵肺病預測是一種不確定、非線性變化系統(tǒng),因此它們難以建立準確的塵肺病預測模型,預測結(jié)果與實際要求有一定的差距[3]。數(shù)據(jù)挖掘技術預測方法是一種非線性預測方法,其包括支持向量機、專家系統(tǒng)、灰色模型、貝葉斯網(wǎng)絡等[4-5],這些非線性預測方法提高了塵肺病預測精度,但它們都存在各自不足,塵肺病預測精度有待進一步提高。如專家系統(tǒng)通用性差,沒有學習能力;灰色模型對隨機波動性較大的數(shù)據(jù)擬合效果較差;神經(jīng)網(wǎng)絡結(jié)構(gòu)復雜、要求樣本大,而塵肺病是一種小樣本、非線性預測問題,因此在樣本不足的情況下,神經(jīng)網(wǎng)絡易出現(xiàn)過擬合缺陷[5]。支持向量機訓練時間長,速度慢,參數(shù)確定沒有統(tǒng)一標準[6]。近年來,基于組合優(yōu)化理論,一些學者提出組合模型來克服單一模型的不足,預測精度相應提高,在經(jīng)濟、水資源、糧食產(chǎn)量等領域得到了廣泛應用[7-8]。但到目前為今,還沒有學者將組合模型應用于塵肺病預測。

為了提高塵肺病預測,將遺傳算法、神經(jīng)網(wǎng)絡、灰色模型等多種數(shù)據(jù)挖掘技術組合在一起,建立一種灰色遺傳神經(jīng)網(wǎng)絡的塵肺病組合預測模型。首先利用灰色模型對塵肺病歷史數(shù)據(jù)建模和預測,然后采用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡對灰色模型的塵肺病預測結(jié)果進行修正,最后采用具體數(shù)據(jù)對建立的塵肺病預測模型性能進行驗證。

2 關鍵概念概述

2.1 灰色模型

灰色模型可以將無序塵肺病數(shù)據(jù)變成有規(guī)律數(shù)據(jù),然后建立相應的微分方程模型,從而預測塵肺病未來發(fā)展趨勢。在諸多的灰色模型中,以灰色系統(tǒng)中單序列一階線性微分方程模型GM(1,1)最為常用。

(1)設有原始數(shù)據(jù)序列x(0),n為數(shù)據(jù)個數(shù)。

(2)對原始數(shù)據(jù)序列累加以便弱化隨機序列的波動性和隨機性,得到新數(shù)據(jù)序列:

(3)建立相應的微分方程模型為

式中,a為發(fā)展系數(shù);u為灰色作用量。

只要求出參數(shù)a,u,就可以計算出x(1)(t),進一步可以得到x(0)的未來預測值。

(4)用累加生成數(shù)據(jù)構(gòu)造累加矩陣B與常數(shù)項向量yn,即

(5)用最小二乘法對灰參數(shù)求解

(6)該微分方程的解為

(7)累減還原得到

經(jīng)過GM(1,1)對塵肺病預測后,捕捉到塵肺病總體變化規(guī)律,預測誤差存在于預測值與原始值之間的殘差中,因此采用BP神經(jīng)網(wǎng)絡對GM(1,1)預測殘差進行修正,以提高塵肺病預測精度。

2.2 遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡

遺傳算法是美國密執(zhí)安(Michigan)大學的John.H.Holland教授設計的一種借鑒生物界自然選擇、遺傳變異和進化機制的高度并行、隨機、自適應的搜索算法,該算法具有簡單易懂、魯棒性強、適合并行處理的特點,可用于解決各種復雜優(yōu)化問題。遺傳算法對BP神經(jīng)網(wǎng)絡的優(yōu)化主要用于得到最優(yōu)網(wǎng)絡初始權值和網(wǎng)絡閾值[9]。遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡算法流程如圖1所示。經(jīng)過遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡能夠獲得更好的訓練效果,提高預測精度。

圖1 遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡

3 GM-BPNN的預測模型構(gòu)建

灰色模型適用于對近似指數(shù)增長、數(shù)據(jù)相對較少的數(shù)據(jù)序列進行預測,且灰色模型的累加生成不但能削弱原始數(shù)據(jù)存在的隨機性,而且使累加后的序列單調(diào)增長,突出了總體發(fā)展趨勢,適合用BPNN網(wǎng)絡進行逼近,因此將BPNN和GM預測方法結(jié)合起來,使它們互相取長補短,構(gòu)造性能更好的塵肺病預測組合模型是可行的。根據(jù)以上分析,本研究只保留灰色預測方法中的"累加生成”和“累減還原”運算,不再求參數(shù)a和u。利用GM-BPNN對塵肺病進行預測過程如下:

(1)收集塵肺病歷史數(shù)據(jù)。

(2)對塵肺病歷數(shù)據(jù)進行灰色累加,生成累加序列

(3)采用歸一化方法對生成的數(shù)據(jù)進行縮放,將它們變換到[0,1]之間,具體歸一化公式為

(4)建立塵肺病的GM(1,1)預測模型,并對測試樣本進行預測。

(5)將GM(1,1)預測值進行“累減還原”運算,得到塵肺病預測值。

(6)計算GM(1,1)預測值與實際塵肺病值間殘差,并對殘差進行重構(gòu),得到BP神經(jīng)網(wǎng)絡的訓練和測試樣本。

(7)將殘差訓練樣本輸入到BPNN網(wǎng)絡訓練,并通過遺傳算法優(yōu)化其參數(shù),建立塵肺病殘差預測模型。

(8)根據(jù)建立的塵肺病殘差預測模型對測試樣本殘差進行預測。

(9)將BPNN的預測結(jié)果與GM(1,1)的預測結(jié)果相加,得到塵肺病最終值。

4 仿真實驗

4.1 數(shù)據(jù)來源

為了檢驗GM-BPNN對塵肺病預測的有效性,采用1981~2006年潞安礦區(qū)塵肺病例數(shù)據(jù)進行仿真實驗,具體如表1所示。將數(shù)據(jù)分成為兩部分:1981~2000年為訓練樣本,用于訓練建立塵肺病預測模型,2001~2006年為測試樣本,用于檢驗模型的有效性。

4.2 灰色模型擬合結(jié)果

將1981~2000年為訓練樣本輸入到GM(1,1)中,采用Matlab 2007編寫程序,建立GM(1,1)的塵肺病預測模型,然后對訓練樣本進行擬合,得到的擬合結(jié)果如圖2所示。從圖2可知,GM(1,1)對1981~2000年塵肺病例擬合精度為95.45%,擬合誤差較大。可以把塵肺病總體變化趨勢進行擬合,然后采用BP神經(jīng)網(wǎng)絡對GM(1,1)擬合殘差進行校正,進一步挖掘塵肺病細節(jié)變化規(guī)律。

表1 1981~2006潞安礦區(qū)塵肺病例

圖2 GM(1,1)對1981~2000年塵肺病例的擬合效果

4.3 BP神經(jīng)網(wǎng)絡對GM(1,1)擬合殘差進行修正

由于BP神經(jīng)網(wǎng)絡要求數(shù)據(jù)多維,不能對一維GM(1,1)殘差時間序列進行直接建模,因此首先采用逐步增加維數(shù)方法選擇GM(1,1)塵肺病擬合殘差的維數(shù),最后選擇最佳維數(shù)為3,表示塵肺病例與前4年的塵肺病發(fā)生率相關,重構(gòu)BP神經(jīng)網(wǎng)絡的塵肺病殘差樣本。將訓練樣本的殘差輸入到BP神經(jīng)網(wǎng)絡進行學習,采用遺傳算法對BP神經(jīng)網(wǎng)絡初始權值和閾值進行優(yōu)化,遺傳算法的平均適應度函數(shù)值變化過程如圖3所示。

BP神經(jīng)網(wǎng)絡的結(jié)構(gòu)為:輸入節(jié)點數(shù)為3,隱含層節(jié)點數(shù)為7,輸出層節(jié)點數(shù)為1。采用優(yōu)化后BP神經(jīng)網(wǎng)絡對訓練樣本的殘差進行學習,然后進行擬合,最后采用BP神經(jīng)網(wǎng)絡對GM(1,1)的擬合結(jié)果進行修正,得到結(jié)果如圖4所示。

從圖4中知,相對于單一GM(1,1),GMBPNN的塵肺病擬合精度為99.54%,遠遠高于GM(1,1)。同時采用單一的BPNN對塵肺病訓練樣本進行訓練和擬合,得到的擬合結(jié)果如圖5所示。

圖3 BP神經(jīng)網(wǎng)絡參數(shù)優(yōu)化的適應度值變化過程

圖4 GM-BPNN對1981~2000年塵肺病例的擬合效果

圖5 BPNN對1981~2000年塵肺病例的擬合效果

從圖5可知,單一BPNN對塵肺病擬合精度也不高,擬合精度為96.48%,難以準確、全面描述塵肺病的發(fā)生變化規(guī)律。各種模型的擬合結(jié)果對比表明,單一GM(1,1)或BPNN僅能反映塵肺病發(fā)生的部分信息,而GM-BPNN利用了GM(1,1)和BPNN優(yōu)勢,克服各自不足,對塵肺病發(fā)生規(guī)律進行深入、充分挖掘,有效降低了塵肺病擬合誤差,初步證明GM-BPNN是一種有效的塵肺病預測模型。

4.4 模型的泛化能力比較

對于一個預測模型來說,其性能的優(yōu)劣主要通過泛化能力來衡量。為此,采用GM(1,1)、BPNN作為模型,對測試樣本進行預測,模型的評價標準為均方根誤差(RMSE)和平均絕對相對誤差(MAPE),它們分別定義如下:

式中,yt為塵肺病例實際值,為模型預測值。

GM(1,1)、BPNN、GM-BPNN預測結(jié)果的RMSE和MAPE如表2所示。根據(jù)表2中的3種模型檢驗結(jié)果可知,對于小樣本塵肺病例數(shù)據(jù),GM-BPNN可以獲得較高的預測精度,而單一GM(1,1)、BPNN預測結(jié)果不理想。綜合上述可知,無論擬合能力或泛化能力,GM-BPNN均要優(yōu)于單一預測模型,其預測結(jié)果更加可靠、客觀,為國家管理和控制塵肺病提供科學依據(jù)。

表2 幾種塵肺病預測模型的綜合性能對比

5 結(jié)束語

建立了一種基于GM-BPNN的塵肺病預測模型。仿真結(jié)果表明,GM-BPNN的擬合精度高,預測誤差小,適合對我國塵肺病的預測研究。

[1]葉麗芳,朱瑋.錫山市塵肺病發(fā)病趨勢的觀察與分析[J].中國工業(yè)醫(yī)學雜志,2004,10(2):90-98.

[2]盧國棟,周心權.礦山企業(yè)塵肺病預測研究[J].礦業(yè)安全與環(huán)保,2006,33(4):12-14.

[3]譚希文.礦山企業(yè)塵肺病灰色殘差預測模型研究[J].礦業(yè)快報,2008(10):51-53.

[4]鄭雙忠.基于神經(jīng)網(wǎng)絡的塵肺病預測模型研究[J].中國安全生產(chǎn)科學技術,2005,6(1):78-81.

[5]李舒才,肖全華,曹永興,等.GM(1,1)灰色模型在塵肺患病人數(shù)預測的應用與評價[J].預防醫(yī)學,2004,18(10):70-73.

[6]柳靜獻,劉鐵民.塵肺危害的神經(jīng)網(wǎng)絡評價及預測研究[J].中國安全科學學報,2001,11(2):18-21.

[7]陳雄山,姚海飛,李東.基于灰色系統(tǒng)模型的潞安礦區(qū)塵肺病發(fā)病趨勢預測[J].中國煤炭,2011,37(2):96-99.

[8]常杰,杭小平,魏彩娥等.塵肺病相關致病因素及防治對策的調(diào)查研究[J].中國衛(wèi)生工程學,2008,7(1):100-103.

[9]劉全,王曉燕,傅啟明,等.雙精英協(xié)同進化遺傳算法[J].軟件學報,2012,23(4):765-775.

Study on Modeling and Prediction of Dust-pulmonary Disease based on GM-BPNN

ZHANG Han-ying1,YANG Zhao-feng2
(1.Pingdingshan Technical School,Pingdingshan 467000,China;2.School of Software Engineering,Pingdingshan University,Pingdingshan 467002,China)

Aiming at the problem of fewer historical data with uncertainty characteristics,in order to improve the accuracy of prediction for dust-pulmonary disease,the paper proposes one predictionmodel based on the GM-BPNN by usingmany datamining technology.Firstly,GM(1,1)is used to predict the dust-pulmonary disease,and then BP neural network is used to modify the prediction results of GM(1,1)which initial weights and thresholds of the BP neural network are optimized by genetic algorithm,and finally the test for dust-pulmonary disease case from 1981 to 2006 is conducted.The simulation results show that GM-BPNN is a good solution to the problems of small sample and nonlinear and the proposed model improves the precision of prediction for dust-pulmonary disease.

Dust-pulmonary disease;Greymodel;BP neural network;Genetic algorithm;Simulation

10.3969/j.issn.1002-2279.2014.03.015

TP183

:A

:1002-2279(2014)03-0052-04

河南省科技計劃重點項目(102102210416)

張翰英(1979-),男,河南平頂山人,講師,主研方向:從事計算機及網(wǎng)絡技術應用方面的研究。

2013-10-25

猜你喜歡
塵肺塵肺病殘差
國家塵肺病診療中心組建
基于雙向GRU與殘差擬合的車輛跟馳建模
一例塵肺病患者的呼吸康復治療體會
痛瀉要方加味湯治療塵肺病驗案2則
基于殘差學習的自適應無人機目標跟蹤算法
基于遞歸殘差網(wǎng)絡的圖像超分辨率重建
自動化學報(2019年6期)2019-07-23 01:18:32
煤工塵肺30例生存質(zhì)量調(diào)查與分析
塵肺合并肺結(jié)核136例患者的護理
平穩(wěn)自相關過程的殘差累積和控制圖
河南科技(2015年8期)2015-03-11 16:23:52
CBS教學模式在五年制臨床醫(yī)學專業(yè)塵肺病教學中的應用
南部县| 祁阳县| 宁南县| 广安市| 乌审旗| 五峰| 德安县| 库车县| 克什克腾旗| 手游| 瓮安县| 海伦市| 衡阳县| 阿勒泰市| 灵石县| 哈尔滨市| 建德市| 射阳县| 德安县| 虞城县| 峡江县| 昔阳县| 昌黎县| 习水县| 临颍县| 永年县| 色达县| 来凤县| 多伦县| 云阳县| 抚松县| 雅江县| 平乡县| 惠安县| 连平县| 祥云县| 云南省| 南澳县| 武胜县| 姚安县| 德庆县|