李四海,魏邦龍,李愛英
(1.甘肅中醫(yī)學(xué)院 公共課部,蘭州 730000;2.蘭州城市學(xué)院 信息工程學(xué)院,蘭州 730070;3.蘭州市經(jīng)濟(jì)管理干部學(xué)校,蘭州 730083)
大氣污染物濃度的變化主要受同期氣象條件的影響,研究氣象條件與大氣污染之間的關(guān)系對(duì)于大氣質(zhì)量預(yù)報(bào)及控制具有重要作用。近年來,小波分析及BP神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用于氣象因子與污染物濃度之間的非線性建模。小波分析用于對(duì)空氣污染指數(shù)和大氣污染物濃度時(shí)間序列進(jìn)行多尺度分解,以發(fā)現(xiàn)序列的趨勢(shì)性及局部波動(dòng)性和隨機(jī)性[1]。BP神經(jīng)網(wǎng)絡(luò)則用于建立氣象因子與大氣污染物SO2、NOx、可吸入顆粒物PM10等之間的非線性映射[2-3],但是單純以氣象因子作為網(wǎng)絡(luò)輸入,基于BP預(yù)報(bào)空氣污染指數(shù)時(shí),在時(shí)間序列非平穩(wěn)段的預(yù)測(cè)精度不高且網(wǎng)絡(luò)的收斂速度慢。
該文結(jié)合小波分析的多分辨率性質(zhì)和人工神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)、非線性逼近能力,提出了一種新的空氣污染指數(shù)預(yù)報(bào)模型,小波神經(jīng)網(wǎng)絡(luò)模型(Wavelet Neural Network)。該模型應(yīng)用小波的特征提取能力,提取時(shí)間序列在不同系列小波焦距下的高低頻信息。以各尺度上的小波系數(shù)序列和重要的氣象因子為輸入,對(duì)蘭州地區(qū)的空氣污染指數(shù)進(jìn)行實(shí)例預(yù)報(bào),結(jié)果表明模型具有較高的預(yù)測(cè)精度,用于空氣污染指數(shù)預(yù)報(bào)具有可行性和有效性。
研究表明[4],靜風(fēng)、逆溫是構(gòu)成蘭州大氣污染的基礎(chǔ)原因,由于靜風(fēng)、逆溫頻率高,造成大氣的穩(wěn)定度高,這又進(jìn)一步加劇了該市冬季的大氣污染。
空氣污染指數(shù)通常是根據(jù)SO2、NO2、PM10的濃度計(jì)算得出,根據(jù)計(jì)算結(jié)果的不同將空氣質(zhì)量分為優(yōu)、良、輕度污染、中度污染、重度污染五個(gè)級(jí)別。研究表明,這三種污染物濃度與平均風(fēng)速、平均溫度呈負(fù)相關(guān),與相對(duì)濕度呈正相關(guān)[5]。
根據(jù)以上分析,以最高溫度、最低溫度、平均風(fēng)速及相對(duì)濕度作為小波神經(jīng)網(wǎng)絡(luò)的第一組輸入。
小波分析是一種非平穩(wěn)信號(hào)分析方法,通過一個(gè)基本小波的伸縮和平移構(gòu)成一系列小波函數(shù)用于對(duì)信號(hào)進(jìn)行多尺度逼近和分析。小波變換具有良好的時(shí)頻局部化能力,能夠?qū)⑿盘?hào)分解為任意系列頻帶的直和,享有信號(hào)處理的“數(shù)學(xué)顯微鏡”美譽(yù)。
設(shè)信號(hào)f(t)在Vj空間中的離散采樣序列為f(k),k=0,1,2,…,n-1,則Mallat小波分解算法為:
其中cj,k和dj,k分別為信號(hào)的低頻和高頻部分,h(n)和g(n)分別為低通濾波器H和高通濾波器G的系數(shù),且gn=(-1)nh1-n
Mallat重構(gòu)算法為:
2.2.1 小波特征提取
小波具有許多良好的性質(zhì),如消失矩、正交性等,小波變換常用于去噪、壓縮及特征提取。該文選用db3小波,使用Matlab7.1中的小波工具箱對(duì)2011.4.21-2012.4.20的空氣污染指數(shù)序列進(jìn)行三層小波分解,對(duì)各層高低頻系數(shù)使用wrcoef函數(shù)進(jìn)行單支重構(gòu),得到原始序列的小波分解序列{a3,d3,d2,d1},其中a3為低頻子序列,是原始序列的近似,反映了原始序列的長(zhǎng)期變化趨勢(shì);d3,d2,d1是高頻子序列,是原始序列的細(xì)節(jié),反映了原始序列在不同“焦距”下的隨機(jī)性和波動(dòng)性。小波分解的結(jié)果如圖1所示:
圖1 原始時(shí)間序列的小波分解
2.2.2 網(wǎng)絡(luò)結(jié)構(gòu)
小波神經(jīng)網(wǎng)絡(luò)綜合了小波變換的分辨率性質(zhì)和神經(jīng)網(wǎng)絡(luò)的自學(xué)習(xí)能力,在處理非線性問題時(shí)表現(xiàn)優(yōu)異,已廣泛用于各個(gè)領(lǐng)域[6-7]。
小波神經(jīng)網(wǎng)絡(luò)主要有兩種結(jié)構(gòu):松散型和緊湊型。松散型不改變網(wǎng)絡(luò)的結(jié)構(gòu),首先利用小波對(duì)信號(hào)進(jìn)行多層分解,然后將分解得到的小波系數(shù)序列交由神經(jīng)網(wǎng)絡(luò)處理,特別適用于非平穩(wěn)信號(hào)的預(yù)測(cè)與分析。緊湊型結(jié)構(gòu)則以小波基函數(shù)作為隱層單元的激勵(lì)函數(shù),常用的小波基函數(shù)為Morlet函數(shù),本研究采用松散型結(jié)構(gòu),網(wǎng)絡(luò)分為輸入層、隱層和輸出層。
取2011.4.21 日 -2012.4.20 日氣象數(shù)據(jù)中的最高溫度、最低溫度、平均風(fēng)速、相對(duì)濕度、前一日空氣污染指數(shù)及小波單支重構(gòu)序列{a3,d3,d2,d1}作為網(wǎng)絡(luò)的最終輸入,共9個(gè)輸入,輸出為空氣污染指數(shù)。網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示:
以2011.4.21-2012.4.20 的數(shù)據(jù)作為訓(xùn)練樣本,將數(shù)據(jù)按維度歸一化至[-1,1]。隱層單元范圍由經(jīng)驗(yàn)公式確定[15],假設(shè)n1,n2分別為輸入層和輸出層單元數(shù),n為隱層單元數(shù),則最佳隱層單元的范圍為:[log2n1,+[1,10]],在此范圍內(nèi)經(jīng)過多次實(shí)驗(yàn),比較訓(xùn)練誤差和測(cè)試誤差,最終取n=13。因此,網(wǎng)絡(luò)結(jié)構(gòu)為9-13-1。隱層和輸出層轉(zhuǎn)移函數(shù)分別為tan-sig、purelin,采用 traingdx 算法訓(xùn)練網(wǎng)絡(luò),訓(xùn)練精度0.001,lr=0.015。
圖2 小波神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
將2012.4.21日-2012.6.17日的58個(gè)樣本作為測(cè)試樣本,使用WNN模型進(jìn)行測(cè)試,當(dāng)訓(xùn)練步數(shù)達(dá)到2303步時(shí)網(wǎng)絡(luò)收斂,其誤差平方曲線如圖3所示。
僅以四個(gè)氣象因子和前一日的空氣污染指數(shù)作為BP網(wǎng)絡(luò)輸入對(duì)相同的樣本進(jìn)行測(cè)試,兩種模型的測(cè)試結(jié)果如表1所示。
圖3 誤差平方曲線
表1 小波神經(jīng)網(wǎng)絡(luò)和BP網(wǎng)絡(luò)仿真結(jié)果對(duì)比
從仿真實(shí)驗(yàn)的結(jié)果可知,兩種模型都能反映出空氣污染指數(shù)序列的總體變化趨勢(shì)。從收斂速度來看,BP網(wǎng)絡(luò)在訓(xùn)練精度為0.01時(shí),到達(dá)預(yù)設(shè)的10000步才收斂,收斂速度慢。比較兩者的預(yù)測(cè)精度,BP神經(jīng)網(wǎng)絡(luò)在時(shí)間序列的平穩(wěn)階段預(yù)測(cè)精度較好,但在時(shí)間序列波動(dòng)較大的階段,預(yù)測(cè)精度較差,部分原因在于訓(xùn)練樣本較少導(dǎo)致欠學(xué)習(xí),模型泛化能力不高,更重要的原因在于有限樣本中包含的信息量少,輸入中沒有時(shí)間序列本身的趨勢(shì)性及波動(dòng)性信息。小波神經(jīng)網(wǎng)絡(luò)由于對(duì)原始序列進(jìn)行了小波分解,其低頻序列能夠表現(xiàn)空氣污染指數(shù)序列的趨勢(shì)性,各尺度上的高頻子序列則反映了空氣污染指數(shù)序列的隨機(jī)性和波動(dòng)性。這種多尺度分析能夠以任意精度“聚焦”原始序列在任意細(xì)節(jié)上的差異性,有利于提前預(yù)判序列的變化趨勢(shì)及局部的波動(dòng)性,從而提高網(wǎng)絡(luò)的預(yù)測(cè)精度,特別當(dāng)時(shí)間序列局部波動(dòng)性較大時(shí),效果更為明顯,充分顯示了小波神經(jīng)網(wǎng)絡(luò)模型較強(qiáng)的魯棒性。表1對(duì)比了兩種模型的收斂速度及預(yù)測(cè)精度,其中MAE為平均絕對(duì)誤差。
從表1可以看出,與BP神經(jīng)網(wǎng)絡(luò)相比,小波神經(jīng)網(wǎng)絡(luò)具有更好的預(yù)測(cè)精度,更快的收斂速度以及較好的自適應(yīng)性。
BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)空氣污染指數(shù)時(shí)收斂速度慢、泛化能力較差,提出了小波神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,研究了網(wǎng)絡(luò)模型的結(jié)構(gòu)及參數(shù)對(duì)網(wǎng)絡(luò)性能的影響。對(duì)空氣污染指數(shù)的仿真結(jié)果表明該模型對(duì)序列的平穩(wěn)和非平穩(wěn)階段均具有較高的預(yù)測(cè)精度和魯棒性,是一種行之有效的空氣污染指數(shù)預(yù)報(bào)方法。基于各種智能算法自適應(yīng)調(diào)節(jié)權(quán)重參數(shù)和學(xué)習(xí)率,進(jìn)一步提高小波神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度、收斂速度及泛化能力將是下一步的研究方向。
[1] 王海鵬,等.基于小波變換的蘭州市近十年空氣污染指數(shù)變化[J].環(huán)境科學(xué)學(xué)報(bào),2011,31(5):1071-1076.
[2] 張靜,李旭祥,許先意,等.大氣環(huán)境數(shù)據(jù)分析預(yù)測(cè)方法對(duì)比研究[J].中國(guó)環(huán)境監(jiān)測(cè),2010,26(6):66-70.
[3] 王芳,程水源,李明君,等.遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)用于大氣污染預(yù)報(bào)[J].北京工業(yè)大學(xué)學(xué)報(bào),2009,35(9):1230-1234.
[4] 高建華.蘭州市大氣污染規(guī)律及治理對(duì)策[J].西安石油學(xué)院學(xué)報(bào):自然科學(xué)版,2003,18(4):85-88.
[5] 周秀杰,蘇小紅,袁美英.基于BP網(wǎng)絡(luò)的空氣污染指數(shù)預(yù)報(bào)研究[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2004,36(5):582-585.
[6] 張坤,郁湧,李彤.小波神經(jīng)網(wǎng)絡(luò)在黃金價(jià)格預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(27):224-241.
[7] 楊艷,李靖,馬顯瑩,等.基于小波神經(jīng)網(wǎng)絡(luò)的城市用水量長(zhǎng)期預(yù)測(cè)研究[J].云南農(nóng)業(yè)大學(xué)學(xué)報(bào),2010,25(2):272-276.
[8] 沈花玉,王兆霞,高成耀,等.BP神經(jīng)網(wǎng)絡(luò)隱含層單元數(shù)的確定[J].天津理工大學(xué)學(xué)報(bào),2008,24(5):13-15.