国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時間序列方法適配建模分析的衛(wèi)生支出預(yù)測實(shí)證研究*

2015-03-09 11:13李望晨王春平張利平
中國衛(wèi)生統(tǒng)計(jì) 2015年2期
關(guān)鍵詞:時序差分預(yù)測值

李望晨王春平張利平△

基于時間序列方法適配建模分析的衛(wèi)生支出預(yù)測實(shí)證研究*

李望晨1,2,3王春平1,2,3張利平1,2,3△

目的探討幾種代表時間序列預(yù)測建模原理和適配性能,根據(jù)算例分別建立程序和綜合比較。方法衛(wèi)生支出預(yù)測算例以ARIMA、GM、SVM和曲線擬合法制定方案,借助MATLAB、SAS等軟件實(shí)現(xiàn),討論性能差異和應(yīng)用價值。結(jié)果ARIMA法通用性好、GM法擬合失效、SVM技術(shù)設(shè)計(jì)待完善、曲線擬合法有限制而應(yīng)作預(yù)分析,數(shù)據(jù)資料特點(diǎn)影響方法適配性能。結(jié)論ARIMA法擬合長較多期隨機(jī)時序資料有代表意義;GM法適于貧信息小樣本資料建模;SVM泛化性能強(qiáng)但滑動窗多試取、結(jié)果對參數(shù)敏感;曲線擬合法受數(shù)據(jù)特點(diǎn)、離群數(shù)據(jù)和建模數(shù)據(jù)段等條件限制;各法應(yīng)對特定問題擇優(yōu)取舍。

時間序列 適配比較 程序設(shè)計(jì) 衛(wèi)生預(yù)測 實(shí)證研究

時間序列法以擬合歷史資料而慣性延續(xù)外推未來,原理性能和信息提取效果受數(shù)據(jù)量和資料特點(diǎn)限制,而且適于短期預(yù)測。當(dāng)前衛(wèi)生領(lǐng)域預(yù)測問題較代表性統(tǒng)計(jì)方法[1-2]包括ARIMA(autoregressive integrated moving average)、GM(grey method)、SVM(support vector machine)和曲線擬合(curve fit)法。但文獻(xiàn)檢索發(fā)現(xiàn)多以方法實(shí)現(xiàn)為主,有必要進(jìn)行綜合適配比較研究。

基本原理

1.GM(1,1):根據(jù)原始數(shù)據(jù)序列進(jìn)行一次累加生成序列該法包括序列累加、建模、識別、檢驗(yàn)、外推和累減過程。對隨機(jī)不規(guī)則序列累加生成為規(guī)律性序列,建模提取信息擬合和外推,計(jì)算殘差序列并作可行性檢驗(yàn)、殘差檢驗(yàn)和后驗(yàn)差檢驗(yàn),然后預(yù)測應(yīng)用。

2.SVM:屬于基于結(jié)構(gòu)風(fēng)險最小化原則的數(shù)據(jù)挖掘技術(shù),解決樣本容量依賴、維數(shù)災(zāi)難、局部極小點(diǎn)問題,根據(jù)樣本集訓(xùn)練逼近非線性關(guān)系,泛化性能優(yōu)良。根據(jù)SVM智能算法原理建立關(guān)系模型,進(jìn)行數(shù)據(jù)段組成的樣本集訓(xùn)練后,映射關(guān)系f以“黑箱”存儲,可根據(jù)新數(shù)據(jù)段的輸入信息仿真外推和預(yù)測應(yīng)用。

3.曲線擬合法:假定序列隨時間變化類似某種曲線特點(diǎn),可建立與時序t的回歸曲線y=f(t),應(yīng)用時還應(yīng)對曲線類型進(jìn)行優(yōu)選。序列預(yù)處理后計(jì)算增長特征并與曲線理論性質(zhì)比較:一階差分ut大致線性時取直線;二階差分u(2)t大致線性時選拋物線;lgut特征大致線性時取曲線yt=k+abt;lg(lgyt-lgyt-1)特征大致線性時選曲線yt=kgbt,lg(ut/ytyt-1)特征大致線性時取曲線yt=k/(1+ae-bt)。以特征線性顯著擇優(yōu)適配相應(yīng)曲線,常以與時序t相關(guān)系數(shù)r優(yōu)選。優(yōu)選并識別模型參數(shù)后,可將時序t代入表達(dá)式擬合或外推計(jì)算yt。

4.ARIMA:

基本步驟包括定階、識別、檢驗(yàn)和應(yīng)用。序列趨勢性時應(yīng)差分實(shí)現(xiàn)平穩(wěn)化。自相關(guān)系數(shù)q階截尾則擬合MA(q)模型,偏自相關(guān)系數(shù)p階截尾則擬合AR(p)模型,兩種相關(guān)系數(shù)均拖尾則擬合ARIMA(p,q)模型,可根據(jù)AIC、SBC信息量選擇最佳模型,經(jīng)條件最小二乘法識別參數(shù)。該法以序列低階差分后的平穩(wěn)序列建模,提取長期序列變化信息,已成為隨機(jī)時間序列經(jīng)典方法,算法復(fù)雜成熟。

實(shí)證分析

本文擬借助衛(wèi)生支出算例進(jìn)行實(shí)證比較和適配論證。以1990-2011年醫(yī)療衛(wèi)生服務(wù)支出數(shù)據(jù)為例,資料來自《中國衛(wèi)生統(tǒng)計(jì)年鑒》,數(shù)據(jù)平滑變化、規(guī)律性強(qiáng)、資料連貫豐富、有趨勢性,早期長時線性增長而近期起伏顯著,見圖1:

圖1 醫(yī)療衛(wèi)生服務(wù)支出時序演化

1.GM(1,1)預(yù)測。借助excel或MATLAB軟件計(jì)算實(shí)現(xiàn)。將1990-2011年數(shù)據(jù)組成序列{x(0)},累加計(jì)算序列{x(1)}和均值序列{z(1)},最后計(jì)算參數(shù)a=-0.193056,b=-42.2857。得到序列{x(1)}擬合模型依次回代數(shù)值k,并累減還原為擬合或預(yù)測值擬合與原始序列x(0)不相符,擬合失效。重新以1990年-2000年早期較平緩數(shù)據(jù)建立擬合模型-956.9024,經(jīng)比較與原序列擬合尚可以。最后繼續(xù)建立模型對少量近期強(qiáng)增長趨勢數(shù)據(jù)擬合仍不太好。

2.SVM預(yù)測。借助Matlab軟件Libsvm工具箱實(shí)現(xiàn)。SVM法是通過樣本自組織訓(xùn)練反映時序延續(xù)規(guī)律及非線性聯(lián)系。通過設(shè)置滑動窗將等間隔數(shù)據(jù)進(jìn)行組對,順次截取組成訓(xùn)練樣本和映射關(guān)系f:{x(i),x(i+1),x(i+2)}→{x(i+3)},其中輸出為x(i+3),輸入為x(i),x(i+1),x(i+2)。將訓(xùn)練樣本對分別演示如下:{122.86 132.38 144.77}→{164.81};{132.38 144.77 164.81}→{212.85};…;{1397.23 2081.09 2565.6}→{3111.36}。

訓(xùn)練完畢經(jīng)對原始輸入依次測試后得到仿真結(jié)果,經(jīng)驗(yàn)證比較仿真誤差幾乎為零,說明SVM對訓(xùn)練集有極強(qiáng)“內(nèi)插”能力再由輸入{2081.09 2565.6 3111.36}外推預(yù)測值773,與實(shí)際差距太遠(yuǎn)。如果改變滑動窗設(shè)置映射f:{x(i),x(i+1)}→{x(i+2)}。重新訓(xùn)練SVM,經(jīng)驗(yàn)證預(yù)測值與實(shí)際相差仍很大,滑動窗設(shè)置改變對結(jié)果影響不大。如調(diào)試參數(shù)重新訓(xùn)練SVM,結(jié)果變化敏感但預(yù)測值無法超過3000,與實(shí)際不符。原因是原序列訓(xùn)練后融入早期線性信息,對近期新趨勢的外推不好但符合該方法原理特點(diǎn)。

3.擬合曲線預(yù)測。借助excel和SPSS軟件實(shí)現(xiàn)。對原序列yt平滑處理后差分計(jì)算增長特征發(fā)現(xiàn)均與時序t有大致線性變化關(guān)系。又計(jì)算增長特征與時序t相關(guān)系數(shù)分別為r1=0.9501,r2=0.749,r3=-0.534。|r1|最大說明修正指數(shù)曲線為最優(yōu)模型。然后用三和法識別參數(shù),去除1990年數(shù)據(jù)后可將序列(共21個數(shù)據(jù))等分為三段,計(jì)算參數(shù)得預(yù)測模型yt=132.5122+36.2046× 1.2417t。令t=21,帶入計(jì)算2012年預(yù)測值3546.73。重取2003-2011年數(shù)據(jù)建立模型yt=513.7442+115.2188×1.4994t。令t=9計(jì)算2012年預(yù)測值4927.22,因近期少量數(shù)據(jù)突增起伏趨勢,預(yù)測值大于實(shí)際值,小樣本建模時外推結(jié)果受個別數(shù)據(jù)影響而敏感、不穩(wěn)定。建模數(shù)據(jù)段須經(jīng)調(diào)試以保證曲線適配所給該時段特點(diǎn),該法解釋性好但精度欠佳。

4.ARIMA預(yù)測。全步驟借助SAS軟件編程實(shí)現(xiàn)。序列經(jīng)二階差分平穩(wěn)化預(yù)處理消除趨勢,并經(jīng)過平穩(wěn)性檢驗(yàn)和純隨機(jī)性檢驗(yàn)。設(shè)置自回歸和移動平均最高階數(shù)為5,分別建模后根據(jù)AIC、SBC或BIC信息量擇優(yōu)配置階數(shù),最優(yōu)定階q=4時信息量最小,AIC=241.34,SBC=245.32。LB,Q或DW統(tǒng)計(jì)量用于檢驗(yàn)擬合效果。經(jīng)殘差自相關(guān)檢驗(yàn),延遲6階、12階和18階,P值0.4509,0.9864,0.9998>0.05,經(jīng)確認(rèn)原序列信息已提取充分,ARIMA(0,1,4)表達(dá)式:(1-B)2xt=1-0.3016B+0.7922B2-0.6868B3+0.11B4。經(jīng)分析模型擬合效果佳,對2012年外推預(yù)測值3556.7,與實(shí)際情況相符。

討 論

1.衛(wèi)生支出時序數(shù)據(jù)有早期長時平緩、后期起伏遞增趨勢,GM模型累加后無法擬合指數(shù)函數(shù),截取近期強(qiáng)趨勢數(shù)據(jù)后仍不好,對該類特點(diǎn)數(shù)據(jù)擬合性能不高,有選擇性,尤為適配于數(shù)據(jù)少、貧信息、欠規(guī)則、隨機(jī)時序數(shù)據(jù)特點(diǎn)問題[3]。

2.衛(wèi)生支出時序數(shù)據(jù)SVM法建模時,順次截取等數(shù)據(jù)段后,段前數(shù)據(jù)為輸入,段后數(shù)據(jù)為輸出,經(jīng)反復(fù)訓(xùn)練計(jì)算,經(jīng)外推仿真得預(yù)測值。數(shù)據(jù)有強(qiáng)趨勢性,雖經(jīng)參數(shù)調(diào)試優(yōu)化,外推預(yù)測欠佳,該法未有效適配強(qiáng)趨勢數(shù)據(jù),預(yù)測應(yīng)用代表意義不應(yīng)夸大。

3.衛(wèi)生支出時序數(shù)據(jù)有平緩光滑曲線增長趨勢,類型多而須借助特征計(jì)算優(yōu)選。鑒于對數(shù)據(jù)量要求低,不應(yīng)全納入,否則歷史數(shù)據(jù)干擾近期信息描述力度,外推效果差。該法對趨勢反映會過度敏感,引起曲線外推值過大,該法適于短期外推。

4.衛(wèi)生支出時序數(shù)據(jù)有明顯趨勢,且觀測期較長(數(shù)據(jù)豐富),可差分提取趨勢信息后平穩(wěn)序列以ARIMA法建模,算法復(fù)雜易實(shí)現(xiàn)。簡言之,ARIMA法通用性強(qiáng)且長時數(shù)據(jù)優(yōu)先應(yīng)用,短時數(shù)據(jù)可選GM法,趨勢數(shù)據(jù)可選曲線法,時序數(shù)據(jù)圖預(yù)分析和方法性能特點(diǎn)綜合論證后預(yù)測建模設(shè)計(jì)有科學(xué)性,探索應(yīng)用對策有必要。

1.徐國祥.統(tǒng)計(jì)預(yù)測與決策.上海:上海財(cái)經(jīng)大學(xué)出版社,2012.

2.王燕.應(yīng)用時間序列分析.北京:中國人民大學(xué)出版社,2012,12:120-177.

3.周林.GM(1,1)模型預(yù)測腸道傳染病發(fā)病趨勢的應(yīng)用.中國衛(wèi)生統(tǒng)計(jì),2013,30(5):715,718.

(責(zé)任編輯:郭海強(qiáng))

*健康山東重大社會風(fēng)險預(yù)測與治理協(xié)同創(chuàng)新中心項(xiàng)目(XT1401001-1401003);山東統(tǒng)計(jì)局項(xiàng)目(2014-184);濰坊市科技局項(xiàng)目(201301079)

1.濰坊醫(yī)學(xué)院公共衛(wèi)生學(xué)院(261053)

2.健康領(lǐng)域社會風(fēng)險預(yù)測治理協(xié)同創(chuàng)新中心

3.健康山東重大社會風(fēng)險與治理協(xié)同創(chuàng)新中心

△通信作者:張利平

猜你喜歡
時序差分預(yù)測值
RLW-KdV方程的緊致有限差分格式
顧及多種弛豫模型的GNSS坐標(biāo)時序分析軟件GTSA
符合差分隱私的流數(shù)據(jù)統(tǒng)計(jì)直方圖發(fā)布
清明
加拿大農(nóng)業(yè)部下調(diào)2021/22年度油菜籽和小麥產(chǎn)量預(yù)測值
±800kV直流輸電工程合成電場夏季實(shí)測值與預(yù)測值比對分析
數(shù)列與差分
AI講座:ML的分類方法
基于不同建設(shè)時序的地鐵互聯(lián)互通方案分析
基于FPGA 的時序信號光纖傳輸系統(tǒng)
永修县| 四子王旗| 钦州市| 河南省| 九龙县| 漳浦县| 化德县| 平谷区| 尤溪县| 辉县市| 平远县| 德保县| 巫溪县| 高雄市| 河曲县| 沂水县| 肥城市| 漳浦县| 高青县| 象山县| 靖宇县| 宁蒗| 琼结县| 宜黄县| 安国市| 平昌县| 隆昌县| 梅河口市| 民乐县| 竹溪县| 五寨县| 柳州市| 清河县| 大关县| 新巴尔虎右旗| 惠安县| 洛宁县| 章丘市| 岳阳市| 龙门县| 东平县|