蘇靖晰 王圣堂 陳紅敏 王永忠
摘要:為探究成都地區(qū)大氣能見度的區(qū)域特性,構(gòu)建基于GA-BP神經(jīng)網(wǎng)絡(luò)的大氣能見度預(yù)測(cè)模型,將空氣中的相對(duì)濕度、PM2.5及PMio作為能見度主要影響因子輸入到預(yù)測(cè)模型中,輸出預(yù)測(cè)時(shí)間段每小時(shí)的大氣能見度,再與實(shí)際值作比較。結(jié)果顯示,經(jīng)過(guò)遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型能較好地預(yù)測(cè)該地區(qū)的大氣能見度,預(yù)測(cè)值基本貼近于實(shí)際值,且預(yù)測(cè)結(jié)果優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。
關(guān)鍵詞:大氣能見度;BP神經(jīng)網(wǎng)絡(luò);遺傳算法
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)18-0019-03
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
大氣能見度是指人們?cè)跉馊苣z粒子作用下所能看到物體大致輪廓的最大水平距離,同時(shí)也是表征空氣質(zhì)量的一項(xiàng)重要指標(biāo)[1]。隨著工業(yè)化生產(chǎn)的飛速發(fā)展,低能見度的發(fā)生頻率也越來(lái)越高。低能見度不僅影響人們的生活質(zhì)量,同時(shí)也嚴(yán)重危害到公路及航空運(yùn)輸?shù)恼_\(yùn)行,造成了大量的人員傷亡及財(cái)產(chǎn)損失,因此低能見度的精準(zhǔn)預(yù)測(cè)成為規(guī)避不安全事件的主要手段[2]。
國(guó)內(nèi)外針對(duì)能見度的預(yù)測(cè)研究開始于20世紀(jì)50年代[3],Stuart Naegele和William Sellers[4]對(duì)美國(guó)的18個(gè)機(jī)場(chǎng)的能見度與其影響因子做線性回歸分析,發(fā)現(xiàn)相對(duì)濕度與氣溶膠粒子濃度能較為準(zhǔn)確預(yù)測(cè)大氣能見度的數(shù)值,但由于線性函數(shù)的局限性,導(dǎo)致預(yù)測(cè)精準(zhǔn)度較為粗糙。Srivastava SK等[5]運(yùn)用ARIMA模型對(duì)印度加茲阿巴德市的霧霾發(fā)生概率進(jìn)行預(yù)測(cè),結(jié)果顯示預(yù)測(cè)較傳統(tǒng)預(yù)測(cè)方法要好。而國(guó)內(nèi)學(xué)者宋明等[6]研究能見度與相對(duì)濕度和PM2.5及PM10之間的相關(guān)性發(fā)現(xiàn),多元非線性回歸模型能較好地預(yù)測(cè)大氣能見度的變化趨勢(shì)。Marzban等[7]對(duì)預(yù)測(cè)方法進(jìn)行改進(jìn),發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)性能較多元非線性回歸預(yù)測(cè)要好。
本文所采用的數(shù)據(jù)來(lái)源于2014-2018年成都?xì)庀笥^測(cè)站及環(huán)境監(jiān)測(cè)站的大氣能見度、相對(duì)濕度、PM25及PM10質(zhì)量濃度的小時(shí)數(shù)據(jù),共28346組。
1 BP神經(jīng)網(wǎng)絡(luò)及遺傳算法的原理及適用性
BP神經(jīng)網(wǎng)絡(luò)是人工神經(jīng)網(wǎng)絡(luò)中最常使用的一種網(wǎng)絡(luò)模型,其基于誤差反向傳播來(lái)調(diào)整權(quán)重和閾值從而達(dá)到進(jìn)一步減小誤差的方法,經(jīng)過(guò)多次迭代調(diào)整從而達(dá)到誤差均方滿足精度為止。BP神經(jīng)網(wǎng)絡(luò)一般具有3層或3層以上的層級(jí)結(jié)構(gòu),包含輸入層、輸出層以及隱含層,層級(jí)結(jié)構(gòu)內(nèi)部存在有限個(gè)節(jié)點(diǎn),層與層之間進(jìn)行信息的正向傳播及誤差的反向傳播。信息通過(guò)輸入層正向傳播到隱含層再到輸出層,輸出結(jié)果與實(shí)際結(jié)果之間的誤差均方不滿足精度要求,則誤差反向傳播并逐層修改權(quán)值及閾值,再進(jìn)行下一步的信息正向傳輸,如此經(jīng)過(guò)多次迭代后得到滿足輸出精度的值為止。
BP神經(jīng)網(wǎng)絡(luò)是一種模仿人類大腦結(jié)構(gòu)和信息處理方式的一種人工模型,它反映了人類大腦的一種智能化信息處理方式,其具有極強(qiáng)的并行處理、自學(xué)習(xí)和自適應(yīng)等特性。但BP神經(jīng)網(wǎng)絡(luò)也存在著一定的缺陷,隨著樣本數(shù)據(jù)量的增大,BP神經(jīng)網(wǎng)絡(luò)存在著收斂慢、網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)不穩(wěn)定、易陷入局部最優(yōu)解和平坦區(qū)域等問(wèn)題,為了解決該類問(wèn)題,在本文預(yù)測(cè)模型中引入遺傳算法對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,BP神經(jīng)網(wǎng)絡(luò)的層級(jí)結(jié)構(gòu)如圖1所示。
遺傳算法是模擬大自然在進(jìn)化過(guò)程所表現(xiàn)出“優(yōu)勝劣汰”的自然選擇和基于遺傳學(xué)生物進(jìn)化過(guò)程的一種計(jì)算模型,其運(yùn)算的本質(zhì)是在一個(gè)大的數(shù)據(jù)樣本中隨機(jī)選取一個(gè)特定數(shù)量的種群,種群中的每一個(gè)個(gè)體代表該問(wèn)題的一個(gè)解決方案,再根據(jù)每一個(gè)個(gè)體的適應(yīng)度大小,篩選出最優(yōu)個(gè)體,被選擇出的最優(yōu)個(gè)體通過(guò)組合交叉和變異操作,得到一個(gè)具有新解集的種群,再對(duì)新的解集采取同樣的篩選,對(duì)最后一代種群中的最優(yōu)個(gè)體進(jìn)行解碼,得到的即為BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的初始權(quán)值及閾值。
2 GA-BP神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建
2.1 遺傳算法模型的構(gòu)建
遺傳算法的主要步驟包括隨機(jī)樣本初始化、選擇適應(yīng)度函數(shù)、選擇個(gè)體樣本、交叉運(yùn)算和變異運(yùn)算。
(1)隨機(jī)樣本初始化:為了方便程序運(yùn)算,樣本編碼均使用二進(jìn)制編碼,每個(gè)樣本均為一個(gè)二進(jìn)制字符串,輸入層到隱含層再到輸出層之間的每個(gè)連接權(quán)值及閾值均使用M位的二進(jìn)制編碼,將數(shù)據(jù)組的所有權(quán)值和閾值編碼連接起來(lái)即為一個(gè)樣本編碼。
(2)選擇適應(yīng)度函數(shù):為了使預(yù)測(cè)值與實(shí)際值之間的殘差平方和盡可能的小,所以選擇采用適應(yīng)度分配函數(shù):
FitnV= ranking (obj)
(1)
其中obj為目標(biāo)函數(shù)的輸出。
(3)選擇個(gè)體樣本種群:基于(2)中的適應(yīng)度分配函數(shù)選擇最優(yōu)個(gè)體樣本群。
(4)交叉運(yùn)算:交叉操作采用單點(diǎn)交叉算子樣本個(gè)體。
(5)變異運(yùn)算:以一定概率產(chǎn)生變異的基因數(shù),用隨機(jī)的方法選出發(fā)生變異的基因。如果所選的基因編碼為1,則變?yōu)?;如果所選的基因編碼為0,則變?yōu)?.
2.2 BP神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建
構(gòu)建BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型是為對(duì)數(shù)據(jù)樣本的未來(lái)每小時(shí)的能見度均做預(yù)測(cè),選取3個(gè)主要影響因子相對(duì)濕度、PM2.5及PM10,設(shè)定輸出結(jié)果為大氣能見度VIS。
(1)網(wǎng)絡(luò)輸入層及輸出層
根據(jù)前面確定的3個(gè)主要影響因子相對(duì)濕度、PM:5及PMio質(zhì)量濃度可知,輸入層神經(jīng)元節(jié)點(diǎn)數(shù)為3,輸出層神經(jīng)元節(jié)點(diǎn)數(shù)根據(jù)需要唯一預(yù)測(cè)的能見度確定為1。
(2)網(wǎng)絡(luò)隱含層
BP網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)的確定關(guān)乎于該預(yù)測(cè)模型誤差值的大小及準(zhǔn)確度,因此,正確的設(shè)置隱含層節(jié)點(diǎn)數(shù)至關(guān)重要。
l=√m+n+a
(2)
而根據(jù)以前學(xué)者針對(duì)這類問(wèn)題的研究總結(jié)出如式(2)的隱含層節(jié)點(diǎn)選擇公式,m為輸入層節(jié)點(diǎn)數(shù),n為輸出層節(jié)點(diǎn)數(shù),a為[1,10]區(qū)間的任意整數(shù)值,因?yàn)閙=3,n=1.故l的取值范圍為[3,121,根據(jù)試湊法對(duì)l在[3,12]范圍內(nèi)進(jìn)行隱含層節(jié)點(diǎn)數(shù)的確定。隨機(jī)選取2000組數(shù)據(jù)用作試湊數(shù)據(jù),不同隱含層節(jié)點(diǎn)個(gè)數(shù)的試湊結(jié)果如表2所示。
由表(2)可知,當(dāng)隱含層節(jié)點(diǎn)數(shù)為4時(shí),試湊結(jié)果與實(shí)際值相關(guān)性較高且相對(duì)誤差較小,所以選擇隱含層節(jié)點(diǎn)數(shù)為4.
(3)激勵(lì)函數(shù)
激勵(lì)函數(shù)是位于層與層之間用來(lái)傳遞參數(shù)的工具,輸入值根據(jù)激勵(lì)函數(shù)得到輸出值。而MATLAB中最常見的2種激勵(lì)函數(shù)有線性激勵(lì)函數(shù)purelin及雙曲正切S型激勵(lì)函數(shù)tan -sigmod.
1)線性激勵(lì)函數(shù)purelin:對(duì)層與層之間采用線性關(guān)系連接輸出權(quán)值及閾值,輸入值的取值范圍沒有限制,輸出值沒有最大值與最小值的限制,c為正的常數(shù);
y= pureLin(X)= cX
(3)
2)雙曲正切S型激勵(lì)函數(shù)tan - sigmod:輸入值與輸出值沒有限制,輸出值的取值范圍為(-1,1),以0為中心,c為旋轉(zhuǎn)度的S型函數(shù),c為正的常數(shù);
根據(jù)本文數(shù)據(jù)要求,選擇雙曲正切S型激勵(lì)函數(shù)為輸入層到隱含層之間的激勵(lì)函數(shù),選擇線性激勵(lì)函數(shù)為隱含層到輸出層之間的激勵(lì)函數(shù)。
(4)訓(xùn)練函數(shù)與學(xué)習(xí)函數(shù)
訓(xùn)練函數(shù)進(jìn)行權(quán)值和閾值的求解以及誤差分析得出結(jié)果,再通過(guò)學(xué)習(xí)函數(shù)進(jìn)行修改權(quán)值與閾值的返回,訓(xùn)練函數(shù)根據(jù)返回值再次進(jìn)行數(shù)值求解及誤差分析,并多次循環(huán)迭代使得整體誤差達(dá)到最小精度要求,從而得到最優(yōu)值的方法。此處訓(xùn)練函數(shù)及學(xué)習(xí)函數(shù)均采用Levenberg-Marquardt算法。
3 GA-BP神經(jīng)網(wǎng)絡(luò)的參數(shù)設(shè)置
GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的BP網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)設(shè)置如表3所示,BP網(wǎng)絡(luò)迭代算法參數(shù)設(shè)置如表4所示,遺傳算法運(yùn)行參數(shù)設(shè)置如表5所示。
4 實(shí)驗(yàn)結(jié)果的驗(yàn)證與分析
由圖2可知,圖2(a)與圖2(b)為2個(gè)月中能見度實(shí)際值與預(yù)測(cè)值隨時(shí)間變化的曲線,灰色陰影部分為能見度實(shí)際值,黑色折線為GA-BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)值,整體預(yù)測(cè)結(jié)果均貼近于實(shí)際值,其中擬合度最高的是1月份,最低的是9月份。
5 結(jié)論
經(jīng)過(guò)遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型能較好地預(yù)測(cè)成都地區(qū)的大氣能見度,其預(yù)測(cè)數(shù)值基本貼近于實(shí)際值,且對(duì)于小于5km范圍的低能見度預(yù)測(cè)較為精準(zhǔn),對(duì)于大于Skm范圍的能見度預(yù)測(cè)相對(duì)較差,其原因主要受能見度觀測(cè)儀器量程的限制以及短時(shí)間內(nèi)能見度的大尺度突變影響。
參考文獻(xiàn):
[1]黃儀方.航空氣象[M].成都:西南交通大學(xué)出版社,2011:55-55.
[2]于庚康,于達(dá)人,洪貞銓.專業(yè)氣象預(yù)報(bào)服務(wù)系統(tǒng)[J].氣象,1992(1):18-22.
[3] Holzworth G C,Maga J A. A method for analyzing the trendin visibility [J].
Journal of the Air Pollution Control Associa-tion, 1960,10(6):430-467.
[4] Naegele P S,Sellers W D.A Study of Visibdity in EighteenCities in the Western and Southwestern United States[Jl.Monthly Weather Review, 2009, 109(11).
[5] Srivastava S K,Sharma A R,Sachdeva K.An observation-based climatology and forecasts of winter fog in?Ghaziabad, In-dia[Jl. Weather, 2017, 72(1):16-22.
[6]宋明,韓素芹,張敏,姚青,等.天津大氣能見度與相對(duì)濕度和PM_(10)及PMJ2.5)的關(guān)系[J].氣象與環(huán)境學(xué)報(bào),2013,29(2):34-41.
[7] Marzban C,Leyton S,Coleman B.Ceiling and VisibilityForecasts via Neural Networks[Jl. Weather& Forecasting,2006, 22(3):466-479.
【通聯(lián)編輯:梁書】
基金項(xiàng)目:中國(guó)民用航空飛行學(xué)院研究生科研創(chuàng)新項(xiàng)目(X2018-39)
作者簡(jiǎn)介:蘇靖晰(1992-),男,碩士研究生在讀,主要從事空中交通運(yùn)行環(huán)境一航空氣象方向的研究。