花曉蕾,唐慧強(qiáng),2,張紅燕,張麗萍
(1.南京信息工程大學(xué) 信息與控制學(xué)院,江蘇 南京210044;2.南京信息工程大學(xué) 氣象災(zāi)害預(yù)報(bào)預(yù)警與評(píng)估協(xié)同創(chuàng)新中心,江蘇 南京210044)
隨著人類(lèi)社會(huì)的快速發(fā)展,我國(guó)生態(tài)環(huán)境日益惡化,2012 年中國(guó)主要城市連續(xù)出現(xiàn)空氣質(zhì)量指數(shù)突破300 的重度污染,2013 年中國(guó)遭遇史上最嚴(yán)重的霧霾天氣。據(jù)統(tǒng)計(jì),霧霾天涉及25 個(gè)省份,100 多個(gè)大中型城市,創(chuàng)52 年之最,其頻率之高,波及面之廣,污染程度之重前所未有,這不僅影響人類(lèi)日常生活秩序,還嚴(yán)重威脅人類(lèi)身體健康[1]。因此,實(shí)時(shí)向公眾發(fā)布空氣質(zhì)量狀況,準(zhǔn)確分析大氣污染物特征和區(qū)域分布趨勢(shì),是科學(xué)有效的控制區(qū)域大氣污染的重要手段。
中國(guó)監(jiān)測(cè)總站從2000 年6 月5 日開(kāi)始在各主要城市建設(shè)數(shù)量不等的空氣自動(dòng)監(jiān)測(cè)站,但這些監(jiān)測(cè)站數(shù)量有限,離散、不均勻,僅簡(jiǎn)單采用監(jiān)測(cè)站點(diǎn)的數(shù)據(jù),不能代表整個(gè)區(qū)域的空氣質(zhì)量??臻g插值法[2]根據(jù)已知點(diǎn)的信息推測(cè)未知地理空間信息,并依據(jù)某種函數(shù)關(guān)系式最好的逼近已知的空間數(shù)據(jù),推導(dǎo)出區(qū)域范圍內(nèi)其余任意點(diǎn)或分區(qū)的值[3],可以很好地滿(mǎn)足上述需求。
常用的空間插值法有克里格法、樣條曲線(xiàn)法、反比距離加權(quán)法等[4],這些插值法現(xiàn)已應(yīng)用于多個(gè)不同的領(lǐng)域[5]??死锔穹ㄒ蚬乐蹈泳_而被廣泛使用,但其適用條件是區(qū)域化變量存在空間相關(guān)性,并且假設(shè)數(shù)據(jù)變化服從正態(tài)分布,若某些數(shù)據(jù)存在主導(dǎo)型趨勢(shì)或不是正態(tài)分布,則會(huì)降低克里格插值精度[6],因此,這種方法僅限于相對(duì)小的空間尺度上。介于克里格法的局限性[7],本文提出基于鄰近點(diǎn)輸入的RBF 神經(jīng)網(wǎng)絡(luò)插值法選擇對(duì)空氣質(zhì)量監(jiān)測(cè)項(xiàng)目中的PM 2.5,PM 10,CO 和O3進(jìn)行空間插值,它借鑒了克里格法的插值思想[8],不同的是,它認(rèn)為地理空間信息具有非平穩(wěn)性,是空間異質(zhì)的??臻g不確定信息的建模是根據(jù)空間分布現(xiàn)象等概率的、可選的數(shù)值表達(dá)式,定義各種隨機(jī)變量之間的空間相關(guān),并依據(jù)相鄰數(shù)據(jù)將高度不確定的先驗(yàn)分布轉(zhuǎn)化為低不確定性的后驗(yàn)分布,其函數(shù)逼近能力強(qiáng)、收斂速度快且需要人為調(diào)節(jié)的參數(shù)少[9],因此,本文提出的RBF神經(jīng)網(wǎng)絡(luò)適用于大空間尺度的大氣污染物的空間插值預(yù)測(cè)研究,且實(shí)驗(yàn)結(jié)果表明此方法用于空氣質(zhì)量的監(jiān)測(cè)表現(xiàn)出較強(qiáng)的優(yōu)越性。
RBF 神經(jīng)網(wǎng)絡(luò)是以函數(shù)逼近理論為基礎(chǔ)而構(gòu)建的一類(lèi)前向網(wǎng)絡(luò)[10],本文研究的基于鄰近點(diǎn)輸入的RBF 神經(jīng)網(wǎng)絡(luò)對(duì)大氣污染物濃度預(yù)測(cè)模型結(jié)構(gòu)如圖1。
圖1 RBF 網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)Fig 1 RBF network topology structure
它由三層組成[11],第一層為輸入層,本結(jié)構(gòu)的輸入層是經(jīng)緯度坐標(biāo)和與插值點(diǎn)距離最近的3 個(gè)已知監(jiān)測(cè)點(diǎn)的大氣污染物濃度值,輸入層傳遞信號(hào)到隱含層;第二層為隱含層,節(jié)點(diǎn)函數(shù)一般選用高斯函數(shù),如公式(1),第三層是輸出層,它有一個(gè)神經(jīng)元,即某大氣污染物濃度預(yù)測(cè)值
其中,uj為第j 個(gè)隱含層節(jié)點(diǎn)的輸出,X 為輸入樣本,Cj為高斯函數(shù)中心值,δj為標(biāo)準(zhǔn)化常數(shù),Nh為隱含層節(jié)點(diǎn)數(shù)。由式(1)可知,節(jié)點(diǎn)輸出范圍為0 和1 之間,且越靠近節(jié)點(diǎn)中心的輸入樣本,輸出值越大[12]。
大氣污染物濃度信息插值可以看作是曲面插值問(wèn)題,即根據(jù)已知點(diǎn)數(shù)值對(duì)所要研究的復(fù)雜曲面進(jìn)行擬合,多種因素綜合影響其空間分布規(guī)律,考慮到大氣污染物污染信息空間分布的復(fù)雜性,可以用一個(gè)復(fù)雜的非線(xiàn)性函數(shù)來(lái)模擬它們之間的關(guān)系,如式(2)
其中,Z 為某大氣污染物濃度值,(x,y,A1,A2,…,An)為污染物濃度的影響因素。RBF 網(wǎng)絡(luò)對(duì)該非線(xiàn)性函數(shù)逼近:以各站點(diǎn)經(jīng)緯度[13](即x,y)和與插值點(diǎn)距離最近的n 個(gè)已知點(diǎn)的某污染物濃度值(這里n 取3,即A1,A2,A3)為輸入,對(duì)應(yīng)的大氣污染物濃度值為輸出,即網(wǎng)絡(luò)的輸入層節(jié)點(diǎn)數(shù)為5,其中最后3 個(gè)神經(jīng)元的確定依據(jù)空間距離衰減規(guī)律:已知點(diǎn)對(duì)插值點(diǎn)的影響與它們之間的距離成負(fù)相關(guān),因此,網(wǎng)絡(luò)輸入層后3 個(gè)神經(jīng)元為與插值點(diǎn)距離由近至遠(yuǎn)的已知點(diǎn)的污染物濃度值。網(wǎng)絡(luò)首先利用訓(xùn)練樣本確定網(wǎng)絡(luò)隱節(jié)點(diǎn)的中心和寬度,然后調(diào)節(jié)網(wǎng)絡(luò)的連接權(quán)值,將輸入輸出之間的非線(xiàn)性關(guān)系隱藏在收斂后的網(wǎng)絡(luò)之中,最后將未知點(diǎn)的經(jīng)緯度坐標(biāo)和與之最近的3 個(gè)站點(diǎn)的污染物濃度值作為網(wǎng)絡(luò)輸入,對(duì)網(wǎng)絡(luò)進(jìn)行仿真預(yù)測(cè),即可得到該未知點(diǎn)的大氣污染物濃度信息值。
2.2.1 實(shí)驗(yàn)數(shù)據(jù)
實(shí)驗(yàn)數(shù)據(jù)來(lái)源于南京市環(huán)境監(jiān)測(cè)中心站,目前南京市共布設(shè)了13 個(gè)大氣環(huán)境監(jiān)測(cè)站點(diǎn),監(jiān)測(cè)站點(diǎn)的地理空間分布如圖2 所示。其中有9 個(gè)國(guó)控點(diǎn)和4 個(gè)郊區(qū)點(diǎn),郊區(qū)點(diǎn)為溧水永陽(yáng)、高淳淳溪、六合雄州和江寧彩虹橋。選取2014 年收集的空氣污染物監(jiān)測(cè)項(xiàng)目中的PM 2.5,PM 10,CO 和O3作為區(qū)域化變量,以各站點(diǎn)污染物監(jiān)測(cè)日均值為研究基礎(chǔ)數(shù)據(jù),對(duì)南京市各站點(diǎn)的空氣質(zhì)量數(shù)據(jù)進(jìn)行空間插值。
圖2 南京市大氣環(huán)境監(jiān)測(cè)站地理空間分布圖Fig 2 Atmospheric environment monitoring station geospatial distribution of Nanjing
2.2.2 模型仿真
模型仿真步驟可總結(jié)如下:
1)數(shù)據(jù)預(yù)處理:由于神經(jīng)網(wǎng)絡(luò)在進(jìn)行學(xué)習(xí)和預(yù)測(cè)過(guò)程中,可能會(huì)出現(xiàn)某類(lèi)數(shù)據(jù)的絕對(duì)值過(guò)大,從而偏離神經(jīng)元的有效區(qū)間,使其他分量失去對(duì)整個(gè)網(wǎng)絡(luò)的調(diào)控能力,為了提高學(xué)習(xí)速度,首先對(duì)原始輸入數(shù)據(jù)進(jìn)行歸一化處理,歸一化公式如式(3)所示
式中 Pmax和Pmin為序列中的最大值和最小值。
2)插值點(diǎn)的生成:使用Matlab 的meshgrid()函數(shù)在[-1,1]之間生成大量節(jié)點(diǎn)的二維網(wǎng)絡(luò),每一個(gè)節(jié)點(diǎn)對(duì)應(yīng)空間中的一組經(jīng)緯度序列,并采用上述方法進(jìn)行歸一化處理。
3)網(wǎng)絡(luò)輸入生成:以訓(xùn)練樣本中各已知站點(diǎn)經(jīng)緯度坐標(biāo)為基礎(chǔ),搜索與之最鄰近的3 個(gè)已知點(diǎn),按距離由小到大分別賦予輸入矩陣的第3,4,5 行,插值點(diǎn)網(wǎng)絡(luò)輸入生成同訓(xùn)練樣本網(wǎng)絡(luò)輸入生成。
4)網(wǎng)絡(luò)訓(xùn)練:選用Matlab 神經(jīng)網(wǎng)絡(luò)工具箱提供的newrb()函數(shù)建立基函數(shù)神經(jīng)網(wǎng)絡(luò),以訓(xùn)練樣本數(shù)據(jù)中的各站點(diǎn)經(jīng)緯度坐標(biāo)和最鄰近的3 個(gè)已知站點(diǎn)大氣污染物濃度值對(duì)應(yīng)于網(wǎng)絡(luò)輸入層的5 個(gè)節(jié)點(diǎn),相應(yīng)站點(diǎn)的污染物濃度值作為網(wǎng)絡(luò)輸出,對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,網(wǎng)絡(luò)訓(xùn)練誤差設(shè)定為0.2,散步常數(shù)設(shè)置為1.2,經(jīng)9 步迭代,網(wǎng)絡(luò)均方差已達(dá)到0.087,滿(mǎn)足實(shí)驗(yàn)要求,如圖3 所示。訓(xùn)練獲取研究區(qū)各大氣污染物與5 個(gè)輸入層節(jié)點(diǎn)之間的非線(xiàn)性映射關(guān)系,并存儲(chǔ)于網(wǎng)絡(luò)之中。
圖3 基于鄰近點(diǎn)輸入的RBF 神經(jīng)網(wǎng)絡(luò)訓(xùn)練圖Fig 3 Training diagram of RBF neural network based on neighborhood point inputs
5)網(wǎng)絡(luò)仿真:將生成的二維坐標(biāo)矩陣和污染物濃度值代入訓(xùn)練好的RBF 神經(jīng)網(wǎng)絡(luò)進(jìn)行仿真,預(yù)測(cè)出對(duì)應(yīng)的大氣污染物信息值,并反歸一化使其重新返回原來(lái)的量綱和量級(jí)。
2.2.3 實(shí)驗(yàn)結(jié)果
根據(jù)上述步驟,選取邁皋橋國(guó)控點(diǎn)半月的大氣污染物PM 2.5,PM 10,CO 和O3網(wǎng)絡(luò)輸出結(jié)果生成圖4 ~圖7。
圖4 PM 2.5 網(wǎng)絡(luò)輸出結(jié)果Fig 4 Result of PM 2.5 network output
從圖中可以看出:該模型對(duì)樣本的擬合效果很好,監(jiān)測(cè)值和預(yù)測(cè)值偏差不大,說(shuō)明本文提出的插值方法精度高,預(yù)測(cè)能力強(qiáng)。
圖5 PM 10 網(wǎng)絡(luò)輸出結(jié)果Fig 5 Result of PM 10 network output
圖6 CO 網(wǎng)絡(luò)輸出結(jié)果Fig 6 Result of CO network output
圖7 O3 網(wǎng)絡(luò)輸出結(jié)果Fig 7 Result of O3 network output
本文同時(shí)選用僅基于經(jīng)緯度輸入的RBF 神經(jīng)網(wǎng)絡(luò)和基于鄰近點(diǎn)輸入的RBF 神經(jīng)網(wǎng)絡(luò)(記為方案1,方案2)選取邁皋橋站點(diǎn)半月的大氣污染物濃度進(jìn)行預(yù)測(cè),表1 是兩種方案得出的PM 2.5,PM 10,CO 和O3預(yù)測(cè)值和監(jiān)測(cè)值的比較。
由表1 可知,對(duì)上述四種大氣污染物按精度排序?yàn)镃O >PM 2.5 >PM 10 >O3,雖然基于鄰近點(diǎn)輸入的RBF 神經(jīng)網(wǎng)絡(luò)對(duì)大氣污染物濃度值的預(yù)測(cè)仍存在誤差,但它們的平均誤差和誤差均方根均小于方案1,尤其是CO 的預(yù)測(cè)效果,說(shuō)明神經(jīng)網(wǎng)絡(luò)輸入層提供的信息數(shù)量對(duì)預(yù)測(cè)的結(jié)果有一定的影響,由此表明:本文提出的插值方法對(duì)空氣質(zhì)量的預(yù)測(cè)研究具有良好的適用性。
本文以空間自相關(guān)為理論基礎(chǔ),“地理學(xué)第一定律”為基本假設(shè):即空間位置上越接近的點(diǎn)具有相似特征值的可能性越大,提出了基于鄰近點(diǎn)輸入的RBF 神經(jīng)網(wǎng)絡(luò)空間插值法,應(yīng)用于空氣質(zhì)量的監(jiān)測(cè),此方法具有以下特點(diǎn):
1)建模方法簡(jiǎn)便,即只要在研究領(lǐng)域內(nèi)有一定的監(jiān)測(cè)數(shù)據(jù)就可以作為RBF 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本,使網(wǎng)絡(luò)完成對(duì)研究領(lǐng)域內(nèi)主要大氣污染物濃度信息的存貯,并從中發(fā)現(xiàn)輸入和輸出之間的內(nèi)在規(guī)律;
表1 兩種方案PM 2.5,PM 10,CO 和O3 預(yù)測(cè)值和監(jiān)測(cè)值對(duì)比Tab 1 Comparison of predictive and monitoring values of PM 2.5,PM 10,CO and O3 of two schemes
2)將RBF 神經(jīng)網(wǎng)絡(luò)方法與地理信息系統(tǒng)相結(jié)合,充分應(yīng)用神經(jīng)網(wǎng)絡(luò)方法的非線(xiàn)性計(jì)算能力和地理信息系統(tǒng)處理地理數(shù)據(jù)能力,更好地實(shí)現(xiàn)對(duì)復(fù)雜地理系統(tǒng)的定量分析;
3)因大氣污染物濃度信息空間分布的復(fù)雜性,RBF 神經(jīng)網(wǎng)絡(luò)憑借其良好的自學(xué)能力和優(yōu)良的非線(xiàn)性逼近能力高效地解決了此類(lèi)預(yù)測(cè)問(wèn)題,為環(huán)保業(yè)務(wù)提供良好的決策支持;
4)神經(jīng)網(wǎng)絡(luò)輸入層提供的信息越多,將會(huì)提高預(yù)測(cè)精度,本文采用地理坐標(biāo)和鄰近點(diǎn)作為網(wǎng)絡(luò)輸入,若加入其他因素,如氣溫、氣壓、風(fēng)速等,則有可能得到更準(zhǔn)確的插值結(jié)果。
[1] 吳 兌,鄧雪嬌.環(huán)境氣象學(xué)與特種氣象預(yù)報(bào)[M].北京:氣象出版社,2001.
[2] 黃杏元.地理信息系統(tǒng)概論[M].北京:高等教育出版社,2001.
[3] 李 新,程國(guó)棟,盧 玲.空間內(nèi)插方法比較[J].地球科學(xué)進(jìn)展,2000,5(3):260-265.
[4] 丁 卉,徐偉嘉,曹生現(xiàn),等.三種區(qū)域空氣質(zhì)量空間插值方法對(duì)比研究[C]∥中國(guó)環(huán)境科學(xué)學(xué)會(huì)學(xué)術(shù)年會(huì),北京:中國(guó)學(xué)術(shù)期刊電子出版社,2013:7052-7059.
[5] 李軍龍,張 劍,張 眾,等.氣象要素空間插值方法的比較分析[J].草業(yè)科學(xué),2006,23(8):6-11.
[6] 李啟權(quán).基于RBF 神經(jīng)網(wǎng)絡(luò)的土壤屬性信息空間插值方法研究[D].雅安:四川農(nóng)業(yè)大學(xué),2006:1-56.
[7] Boznar M,Lesjak M,Mlakar P.A neural network-based method for the short-term predictions of ambient SO2concentrations in highly polluted areas of complex terrain[J].Atmospheric Environment B,1993,27(2):221-230.
[8] 王玉璟.空間插值算法的研究及其在空氣質(zhì)量監(jiān)測(cè)中的應(yīng)用[D].鄭州:河南大學(xué),2010:1-57.
[9] 孟 健,馬小明.Kriging 空間分析法及其在城市大氣污染中的應(yīng)用[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2002,32(2):309-312.
[10]王玉霞.基于RBF 神經(jīng)網(wǎng)絡(luò)的PM10 污染預(yù)測(cè)研究[D].西安:西安建筑科技大學(xué),2008:1-70.
[11]唐慧強(qiáng),李全月,劉鉦江.基于粗糙RBF 神經(jīng)網(wǎng)絡(luò)的氣象數(shù)據(jù)插補(bǔ)方法研究[J].計(jì)算機(jī)工程與計(jì),2014,35(1):282-286.
[12]廖 微,馮小兵,許春冬,等.徑向基神經(jīng)網(wǎng)絡(luò)的匯率預(yù)測(cè)模型研究[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(24):210-212.
[13]廖永豐,張 莉,王五一,等.城市空氣質(zhì)量GIS 數(shù)據(jù)模型及分析系統(tǒng)的集成與應(yīng)用[J].地球信息科學(xué),2007,9(1):123-127.