熊萍萍, 石 佳, 姚天祥, 閆書(shū)麗
(1.南京信息工程大學(xué) 管理工程學(xué)院,江蘇 南京 210044; 2.南京信息工程大學(xué) 風(fēng)險(xiǎn)治理與應(yīng)急管理研究院,江蘇 南京 210044; 3.南京信息工程大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,江蘇 南京 210044)
些年來(lái),霧霾作為我國(guó)較嚴(yán)重的一種空氣污染問(wèn)題,不僅對(duì)我國(guó)的自然環(huán)境造成了不良影響[1],而且對(duì)人類(lèi)的身體健康也帶來(lái)極大的負(fù)面作用[2]。因此,對(duì)霧霾進(jìn)行準(zhǔn)確的預(yù)測(cè),對(duì)社會(huì)和人類(lèi)而言意義重大。
國(guó)內(nèi)外的眾多研究人員為了更好地解決霧霾問(wèn)題并進(jìn)行有效防控和治理,建立了回歸模型[3]、時(shí)間序列模型[4]、神經(jīng)網(wǎng)絡(luò)模型[5]等并對(duì)霧霾展開(kāi)了預(yù)測(cè)分析。因?yàn)樵陟F霾期間的霧霾衡量指標(biāo)以及因素變量數(shù)據(jù)都是以小數(shù)據(jù)特點(diǎn)展現(xiàn)出來(lái),所以研究人員便通過(guò)灰色系統(tǒng)理論來(lái)探討霧霾,得到預(yù)測(cè)精度較高的結(jié)果。Wu等[6]為了預(yù)測(cè)京津冀地區(qū)的空氣質(zhì)量數(shù)據(jù),采用累加生成的階數(shù)為分?jǐn)?shù)的形式,構(gòu)建預(yù)測(cè)模型;為了較準(zhǔn)確地預(yù)測(cè)淮安市和南京市的空氣質(zhì)量,王志祥[7]和熊萍萍[8]等則采用GM(1,1)和MGM(1,m,N)模型。
灰色系統(tǒng)理論是一門(mén)新興的學(xué)科,主要解決不確定性問(wèn)題,它以貧信息、少數(shù)據(jù)建模為特點(diǎn),對(duì)已有信息進(jìn)行深入挖掘,進(jìn)而探究不確定系統(tǒng)中的運(yùn)行規(guī)律[9]。GM(1,1)模型是常見(jiàn)的一種預(yù)測(cè)模型,許多研究人員從多種視角對(duì)該模型進(jìn)行改進(jìn)[10~12],并在經(jīng)、管、農(nóng)、林、理、工、醫(yī)等眾多領(lǐng)域都有著廣泛的應(yīng)用。在GM(1,1)模型的基礎(chǔ)上拓展可得到GM(1,N)模型,目前,對(duì)GM(1,N)模型的改進(jìn)主要集中于背景值改進(jìn)[13,14]、驅(qū)動(dòng)項(xiàng)優(yōu)化[15,16]、模型離散化[17,18]等方面。還有一些學(xué)者根據(jù)系統(tǒng)中存在的滯后性效應(yīng),對(duì)GM(1,N)模型[19,20]進(jìn)行改進(jìn)。
在對(duì)實(shí)驗(yàn)數(shù)據(jù)分析的過(guò)程中,往往不能用精確的數(shù)值來(lái)表達(dá)已存在的變動(dòng)參數(shù),這是因?yàn)橥饨缭驎?huì)對(duì)數(shù)據(jù)的測(cè)量產(chǎn)生影響。所以這一區(qū)別于一般預(yù)測(cè)模型的灰色預(yù)測(cè)模型——在非精確數(shù)值區(qū)間建立模型被人們重視起來(lái)。曾波[21]和黨耀國(guó)等[22]分別通過(guò)核和灰度序列、殘差思想,針對(duì)區(qū)間灰數(shù)構(gòu)建了GM(1,1)模型,石佳等[23]在核和灰度序列的基礎(chǔ)上,引入線(xiàn)性時(shí)變參數(shù),建立了GM(1,N)模型,上述優(yōu)化模型是將實(shí)驗(yàn)數(shù)據(jù)中的實(shí)數(shù)范疇擴(kuò)大到區(qū)間灰數(shù)范疇,以便于灰色模型在不同條件下的合理應(yīng)用,使得灰色系統(tǒng)理論更加的完整且豐富。
在目前的實(shí)際應(yīng)用過(guò)程中,原始GM(1,N)模型[24]只能適用于在同一時(shí)間下的變量,在建模的過(guò)程中沒(méi)有過(guò)多地考慮時(shí)間滯后變化關(guān)系,因此常常在預(yù)測(cè)過(guò)程中產(chǎn)生或多或少的模擬預(yù)測(cè)偏差。本文將分析當(dāng)期系統(tǒng)特征數(shù)據(jù)在往期相關(guān)因素作用下的滯后效應(yīng),在可能度函數(shù)為已知條件下,構(gòu)建時(shí)滯GM(1,N)模型,并求解滯后參數(shù)。本文將會(huì)研究在大氣污染物的影響下,霧霾可能受到的滯后影響,并將新構(gòu)建的模型應(yīng)用到南京市霧霾的模擬預(yù)測(cè)中。
定義1設(shè)行為特征序列為:
與之對(duì)應(yīng)的影響因素序列如下:
影響因素的第τi期時(shí)滯序列記為:
(1)
同理,基于新灰度序列建立的時(shí)滯GM(1,N)模型為:
(2)
特別地,當(dāng)τi=0時(shí),意味著行為特征序列與影響因素序列都處在同一時(shí)期,此時(shí)新型核與灰度的時(shí)滯GM(1,N)模型,退化為新型核與灰度的GM(1,N)模型。
(1)白化方程
的解為:
(3)
的近似時(shí)間響應(yīng)式為:
(4)
(3)累減還原式為:
(5)
(6)
其累減還原式為:
(7)
證明同定理2。
為了提高模型預(yù)測(cè)精度,以新型核序列為例,給出新型核的時(shí)滯GM(1,N)模型關(guān)于滯后參數(shù)的目標(biāo)函數(shù):
(8)
同樣地,可給出新型灰度序列的時(shí)滯GM(1,N)模型關(guān)于滯后參數(shù)的目標(biāo)函數(shù)。利用MATLAB求解滯后參數(shù),求出滯后參數(shù)τi的最優(yōu)解之后,對(duì)模型中的結(jié)構(gòu)參數(shù)進(jìn)行辨識(shí),最后,根據(jù)時(shí)間響應(yīng)函數(shù)確定模擬值和預(yù)測(cè)值。
根據(jù)下列方程組,求得每個(gè)區(qū)間灰數(shù)的上界及下界的模擬值和預(yù)測(cè)值[24]:
(9)
預(yù)測(cè)模型的好壞,其中一個(gè)重要的評(píng)價(jià)標(biāo)準(zhǔn),就是模型的預(yù)測(cè)精度和預(yù)測(cè)效果。預(yù)測(cè)精度越高,則認(rèn)為預(yù)測(cè)效果越好。在本文中規(guī)定,當(dāng)平均相對(duì)誤差控制在10%之內(nèi)時(shí),認(rèn)為預(yù)測(cè)模型具有較好的預(yù)測(cè)效果,預(yù)測(cè)精度較高[25]。
PM10是一種粒徑非常小的顆粒物,其粒徑小于10微米,PM10濃度與NO2濃度密切相關(guān)[26],因此可以將NO2濃度選作PM10濃度的影響因素。本節(jié)將選擇南京市2019年11月6日至11月21日的PM10濃度和NO2濃度展開(kāi)探究剖析。
11月6日~11月21日區(qū)間灰數(shù)的上下界確定規(guī)則如下:將11月4日至11月6日實(shí)際值的最高值和最低值作為11月6日對(duì)應(yīng)區(qū)間灰數(shù)的上界和下界,根據(jù)對(duì)比,可以獲得7日至21日相對(duì)應(yīng)區(qū)間灰數(shù)的上下界。記PM10濃度的灰數(shù)序列為X1(?),NO2濃度的灰數(shù)序列為X2(?),取6~10日的數(shù)據(jù)為前期數(shù)據(jù),11~17日為當(dāng)期數(shù)據(jù)。各區(qū)間灰數(shù)的可能度函數(shù)由專(zhuān)家打分法求得,初始數(shù)據(jù)如表1所示。結(jié)合南京市近兩年NO2濃度和PM10濃度的統(tǒng)計(jì)觀測(cè)值,確定它們的論域?yàn)棣?=Ω2∈[0,500]。
表1 PM10濃度、NO2濃度區(qū)間灰數(shù)及可能度函數(shù)
步驟1結(jié)合表1的數(shù)據(jù),訓(xùn)練集選取2019年11月11日到17日的相關(guān)觀測(cè)數(shù)據(jù),測(cè)試集選取18日到21日的相關(guān)統(tǒng)計(jì)數(shù)據(jù),根據(jù)新型核和灰度的計(jì)算公式,分別得到NO2和PM10濃度的核與灰度序列。
步驟2先后建立基于新型核和灰度序列的時(shí)滯GM(1,2)模型,利用滯后參數(shù)的求解方法,確定出兩個(gè)模型中的滯后參數(shù)均為1。
步驟3構(gòu)建PM10濃度關(guān)于新型核以及灰度序列的時(shí)滯GM(1,2)模型,可得到:
依據(jù)所得到的模型,計(jì)算出PM10濃度新型核以及灰度序列的模擬、預(yù)測(cè)值。
步驟4計(jì)算區(qū)間灰數(shù)的上、下界的模擬值和預(yù)測(cè)值,可直接由步驟3得到的PM10濃度新型核與灰度序列的模擬、預(yù)測(cè)值還原計(jì)算得出,具體結(jié)果詳見(jiàn)表2和表3。
步驟5在步驟4的基礎(chǔ)上,進(jìn)一步計(jì)算對(duì)應(yīng)的相對(duì)誤差及平均相對(duì)誤差,結(jié)果如表2和表3所示。本文通過(guò)比較一元回歸模型和新構(gòu)建的時(shí)滯GM(1,2)模型,以此驗(yàn)證本文所提出模型的有效性和適用性,兩個(gè)模型的相關(guān)結(jié)果詳見(jiàn)表2、表3所示。
表2 PM10濃度區(qū)間灰數(shù)的下界模擬預(yù)測(cè)值及相對(duì)誤差
表3 PM10濃度區(qū)間灰數(shù)的上界模擬預(yù)測(cè)值及平均相對(duì)誤差
為了更清晰地對(duì)比基于新型核與灰度序列的時(shí)滯GM(1,2)模型和GM(1,2)模型、一元回歸模型的結(jié)果,結(jié)合表2、和表3的數(shù)據(jù),可以畫(huà)出PM10濃度上下界相對(duì)誤差對(duì)比圖,如圖1、圖2所示。
圖1 PM10濃度下界相對(duì)誤差
圖2 PM10濃度上界相對(duì)誤差
從表2與表3的數(shù)據(jù)中可以發(fā)現(xiàn),文中提出的優(yōu)化時(shí)滯預(yù)測(cè)模型適用于處理具有時(shí)滯特征的小數(shù)據(jù)、貧信息的不確定系統(tǒng)問(wèn)題。從模擬值來(lái)看,對(duì)比一元回歸模型5%左右的上、下界平均相對(duì)誤差,本文所提出的時(shí)滯GM(1,2)模型和傳統(tǒng)的GM(1,2)模型的平均相對(duì)誤差更低,均處于2%以下。從預(yù)測(cè)值來(lái)看,本文提出的時(shí)滯模型GM(1,2)相較于傳統(tǒng)GM(1,2)模型和一元回歸模型,上、下界的平均相對(duì)誤差前者明顯均低于后兩個(gè)模型,為3.46%。這主要是由于后兩個(gè)模型未將NO2濃度與PM10濃度之間的時(shí)滯效應(yīng)考慮在內(nèi)而導(dǎo)致相對(duì)誤差偏大?;谝陨戏治觯疚奶岢龅脑谛滦秃伺c灰度基礎(chǔ)上建立的時(shí)滯GM(1,2)模型,由于將大氣污染物濃度之間存在的滯后關(guān)系考慮進(jìn)來(lái),所以能夠降低傳統(tǒng)GM(1,2)模型的平均相對(duì)誤差,提升預(yù)測(cè)效果。
本文在對(duì)滯后參數(shù)的識(shí)別和對(duì)模型機(jī)理的探索過(guò)程中,將影響因素的滯后特征考慮在內(nèi),建立了基于新型核與灰度的時(shí)滯GM(1,2)模型。在已給出可能度函數(shù)的情形下,將滯后參數(shù)引入到傳統(tǒng)GM(1,N)模型的驅(qū)動(dòng)項(xiàng)中,得到本文所提出的優(yōu)化模型。該模型在計(jì)算、應(yīng)用過(guò)程以及計(jì)算機(jī)操作中都具有較強(qiáng)優(yōu)勢(shì),不僅可以對(duì)小數(shù)據(jù)樣本進(jìn)行處理,還能解決因素變量的滯后效應(yīng)帶來(lái)的相關(guān)問(wèn)題。通過(guò)案例實(shí)證,結(jié)果顯示:在考慮南京市PM10濃度與NO2濃度的滯后關(guān)系后,模型對(duì)污染物濃度的預(yù)測(cè)精度更高,高達(dá)96%以上。由此可見(jiàn),本文提出的考慮了相關(guān)因素滯后影響的新模型進(jìn)一步完善了灰色預(yù)測(cè)模型,并拓展了其應(yīng)用范圍。