呂新帥 田 斌 梁 翔 譚玉霖 劉圣良
(1.中國人民解放軍海軍工程大學(xué) 武漢 430033)(2.中國人民解放軍91668部隊 上海 200083)
微波輻射計作為一種被動微波遙感技術(shù)的典型應(yīng)用,是遙感探測溫度、濕度、水汽以及云液態(tài)水等大氣參數(shù)的有力工具,已被廣泛應(yīng)用于天氣預(yù)報以及氣象變化監(jiān)測等諸多領(lǐng)域。微波輻射計通過實時探測大氣微波輻射信號,形成亮溫數(shù)據(jù),利用大氣參數(shù)剖面反演算法模型對亮溫數(shù)據(jù)進行反演處理,從而得到大氣溫度廓線、水汽廓線、相對濕度廓線、液態(tài)水廓線、積分水汽含量及云液態(tài)水含量等參數(shù)[1]。
目前,國內(nèi)很多學(xué)者利用研究構(gòu)建的逆向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)反演大氣參數(shù)廓線,得到了比較好的反演效果。王小蘭等[2]利用研究構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)反演大氣溫度和水汽密度,其反演效果優(yōu)于輻射計自帶的BP-mp網(wǎng)絡(luò),其所構(gòu)建的訓(xùn)練樣本具有較好的代表性,很好地表征了所研究問題的特性,而且其研究構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu)和歸一化方法是經(jīng)過多次實驗計算而確定的,合理的網(wǎng)絡(luò)結(jié)構(gòu)確保了BP神經(jīng)網(wǎng)絡(luò)的泛化能力。張北斗等[3]利用改進BP神經(jīng)網(wǎng)絡(luò)計算模型,發(fā)展了一套大氣溫濕及液態(tài)水廓線反演算法,也取得了較好的反演效果。然而,國內(nèi)利用徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)反演大氣廓線的研究文獻相對比較缺乏,RBF神經(jīng)網(wǎng)絡(luò)在微波輻射計反演算法領(lǐng)域并沒有得到足夠的關(guān)注。
RBF神經(jīng)網(wǎng)絡(luò)是一種局部逼近網(wǎng)絡(luò),結(jié)構(gòu)簡單,只具有一個隱含層,其隱含層神經(jīng)單元采用徑向基函數(shù),具有堅實的數(shù)學(xué)基礎(chǔ),已經(jīng)證明它能以任意精度逼近任意連續(xù)函數(shù)。RBF神經(jīng)網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò)相比有很多獨特的優(yōu)勢,它在逼近能力、分類能力和學(xué)習(xí)速度等方面均優(yōu)于BP神經(jīng)網(wǎng)絡(luò)[4]。因此,若能利用RBF神經(jīng)網(wǎng)絡(luò)構(gòu)建算法模型應(yīng)用到大氣廓線反演上來,可能會得到比BP神經(jīng)網(wǎng)絡(luò)算法模型更好的反演效果。
本文提出了一種基于RBF神經(jīng)網(wǎng)絡(luò)的大氣溫度廓線及水汽密度廓線反演方法,利用地基16通道微波輻射計在武漢地區(qū)的觀測資料和對應(yīng)的探空資料作為訓(xùn)練數(shù)據(jù)以及測試數(shù)據(jù),對研究構(gòu)建的RBF神經(jīng)網(wǎng)絡(luò)反演算法模型進行訓(xùn)練和測試,將反演結(jié)果和BP神經(jīng)網(wǎng)絡(luò)反演算法模型的反演結(jié)果進行對比,主要從反演準確度、運算速度以及泛化能力三個方面對RBF神經(jīng)網(wǎng)絡(luò)反演算法模型的反演性能進行評價。
實驗所用的地基16通道微波輻射計在水汽敏感的K波段(20GHz~30GHz)設(shè)置了8個通道,分別為 22.24GHz、23.04GHz、23.84GHz、25.44GHz、26.24GHz、27.84GHz、30.00GHz、31.40GHz,在溫度敏感的V波段(50GHz~60 GHz)設(shè)置了8個通道,分別 為 51.26GHz、52.28GHz、53.86GHz、54.94GHz、55.50GHz、56.66GHz、57.30GHz、58.0GHz。該輻射計還帶有測量溫度、濕度和氣壓的地面氣象傳感器。該輻射計觀測的時間頻率約為每4s一組,儀器接收微波輻射產(chǎn)生電壓信號,通過輻射計的標定模塊將電壓信號轉(zhuǎn)化為亮溫數(shù)據(jù),然后利用輻射計的BP神經(jīng)網(wǎng)絡(luò)反演模型可以連續(xù)反演獲得從地表至10km的溫度、水汽密度的垂直分布廓線。在地表至10km的垂直高度范圍內(nèi),將其劃分為38個高度層,具體劃分方法如表1所示。
表1 垂直高度層劃分方法
輻射計觀測得到的16個通道的亮溫數(shù)據(jù)及地面氣象信息(包括地面溫度、氣壓和相對濕度)構(gòu)成其反演軟件的輸入數(shù)據(jù),即對于該輻射計來說,BP神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點個數(shù)為19。該輻射計反演得到的從地面到10km范圍內(nèi)的溫度、水汽密度廓線各為38層,即每個BP神經(jīng)網(wǎng)絡(luò)的輸出節(jié)點個數(shù)為38。本研究建立在該輻射計的實驗基礎(chǔ)上,所構(gòu)建的RBF神經(jīng)網(wǎng)絡(luò)反演模型采取19個輸入節(jié)點和38個輸出節(jié)點的網(wǎng)絡(luò)結(jié)構(gòu),以便和該輻射計自身所帶的BP神經(jīng)網(wǎng)絡(luò)反演模型對比反演性能。
2017年10 月~11月,利用該地輻射計在武漢地區(qū)進行大氣觀測實驗,從獲得的觀測資料中抽樣選取1000組觀測數(shù)據(jù)作為樣本資料,結(jié)合對應(yīng)的探空廓線數(shù)據(jù)分別構(gòu)建RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練數(shù)據(jù)樣本和測試數(shù)據(jù)樣本。關(guān)于訓(xùn)練數(shù)據(jù)樣本的構(gòu)建,從抽取的1000組觀測數(shù)據(jù)中選擇800組作為訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)樣本,每組輸入數(shù)據(jù)由16個通道的亮溫數(shù)據(jù)以及地面氣象信息數(shù)據(jù)(包括地面溫度、氣壓和相對濕度)構(gòu)成,對應(yīng)的800組探空數(shù)據(jù)作為訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò)的輸出數(shù)據(jù)樣本,每組輸出數(shù)據(jù)由38個高度層的溫度以及水汽密度數(shù)據(jù)構(gòu)成。關(guān)于測試數(shù)據(jù)樣本的構(gòu)建,將另外200組輻射計觀測數(shù)據(jù)作為輸入數(shù)據(jù)測試訓(xùn)練后的RBF神經(jīng)網(wǎng)絡(luò),對應(yīng)的200組探空數(shù)據(jù)作為測試輸出數(shù)據(jù)的比照標準值。
本文研究構(gòu)建的RBF神經(jīng)網(wǎng)絡(luò)反演算法模型基于K-means聚類的學(xué)習(xí)法,該算法使用廣泛并且較為成熟,在這里不做詳細敘述,具體可參考文獻[5~13]。RBF神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元個數(shù)為19,包括地基微波輻射計的16通道觀測亮溫和地面氣象信息(包括地面溫度、氣壓和相對濕度)。RBF神經(jīng)網(wǎng)絡(luò)的輸出層神經(jīng)元個數(shù)為38,分別為探空的溫度和水汽密度廓線對應(yīng)于從地面到10km高度劃分的38層的數(shù)值,與地基微波輻射計的反演結(jié)果分層一致。
反演算法模型的RBF神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)如圖1所示,其中,輸入層節(jié)點共19個,輸出層節(jié)點共38個,隱含層節(jié)點數(shù)k小于輸入樣本數(shù)。
圖1 RBF神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu)圖
樣本中經(jīng)常存在異常數(shù)據(jù),稱為奇異樣本數(shù)據(jù),這些數(shù)據(jù)與樣本中的其他數(shù)據(jù)相比明顯偏大或偏小。它們的存在使得神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間增加,還有可能使得神經(jīng)網(wǎng)絡(luò)無法收斂,這將會嚴重限制神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度及學(xué)習(xí)效能。為避免這種情況的發(fā)生,就需要對樣本進行歸一化處理。在本文研究構(gòu)建的RBF神經(jīng)網(wǎng)絡(luò)反演算法模型中,先利用歸一化函數(shù)對RBF神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù)或輸出數(shù)據(jù)進行歸一化處理,再對神經(jīng)網(wǎng)絡(luò)的訓(xùn)練輸出結(jié)果或測試輸出結(jié)果進行反歸一化,得到實際值。
利用構(gòu)建的輸入、輸出樣本,并進行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,隨后將測試樣本輸入到訓(xùn)練好的RBF神經(jīng)網(wǎng)絡(luò)模型,即可得到溫度廓線及水汽密度廓線。比較RBF神經(jīng)網(wǎng)絡(luò)反演廓線與探空資料的均方根誤差(RMSE),就可以對反演精度做出評價。由第1節(jié)可知,整個0~10km高度范圍內(nèi)的大氣廓線被分為了38層,那么反演精度應(yīng)當(dāng)在每層中進行計算才有意義。作為真值的探空測量值記為Vi,RBF神經(jīng)網(wǎng)絡(luò)反演值記為Ui,這里i表示第i個樣本,樣本數(shù)記為n,則反演值對真值(探空測量值)的均方根誤差(RMSE)表示:
反演算法模型流程圖如圖2所示。
圖2 反演算法模型流程圖
仿真實驗在 Matlab2015a,處理器為 Intel(R)Core(TM)i5-4200M CPU,2.50GHz,RAM為4.00GB的Windows7系統(tǒng)的軟硬件環(huán)境中完成。地基16通道微波輻射計所采用的反演算法是采取19-40-38三層結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)。
首先利用訓(xùn)練樣本對兩個神經(jīng)網(wǎng)絡(luò)分別進行訓(xùn)練,再利用測試樣本對訓(xùn)練后的兩個神經(jīng)網(wǎng)絡(luò)的反演性能進行測試,反演結(jié)果如下。
圖3是分別利用訓(xùn)練后的RBF神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò)對測試樣本進行大氣溫度廓線反演,反演的溫度廓線和探空溫度廓線的均方根誤差隨高度的變化對比。由圖3可知,RBF神經(jīng)網(wǎng)絡(luò)對于測試樣本的反演精確度性能要優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。圖4是兩個神經(jīng)網(wǎng)絡(luò)利用測試樣本反演的溫度廓線和探空溫度廓線對比。圖4中的實際廓線反映了探空溫度廓線在地面到1km高度范圍內(nèi)的垂直分布規(guī)律,可以粗略看出大約在1.4km高度至2km高度范圍內(nèi)大氣溫度變化很緩慢,這一高度范圍作為整個研究范圍的局部就分布規(guī)律而言是非常關(guān)鍵的轉(zhuǎn)折過渡階段,因此能否抓住這個關(guān)鍵局部特征也是體現(xiàn)神經(jīng)網(wǎng)絡(luò)反演性能的一個指標。就圖4反映的結(jié)果來看,兩個訓(xùn)練后的神經(jīng)網(wǎng)絡(luò)對于測試樣本的反演性能都很不錯,上面提到的關(guān)鍵局部特征也都得到了較好的體現(xiàn)。
圖3 RBF和BP利用測試樣本反演的溫度廓線和探空溫度廓線的均方根誤差對比
綜合圖3和圖4分析可知,經(jīng)過訓(xùn)練后的RBF神經(jīng)網(wǎng)絡(luò)在反演測試樣本時,依然能夠給出較小誤差的合理輸出結(jié)果,反演的溫度廓線和探空溫度廓線的均方根誤差大體落于0.7K~2.5K的范圍內(nèi)。然而對于經(jīng)過訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)而言,對于測試樣本的處理適應(yīng)能力相對較弱,反演的溫度廓線和探空溫度廓線的均方根誤差大體落于1.8K~3.9K的范圍內(nèi)。這證明,RBF神經(jīng)網(wǎng)絡(luò)對于新鮮樣本的適應(yīng)能力亦即泛化能力要強于BP神經(jīng)網(wǎng)絡(luò)的泛化能力。泛化能力是評價神經(jīng)網(wǎng)絡(luò)性能的重要指標,它反映了神經(jīng)網(wǎng)絡(luò)對于新鮮樣本的適應(yīng)能力,體現(xiàn)了神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)能力與程度。在對兩種網(wǎng)絡(luò)進行訓(xùn)練時,收斂誤差均設(shè)置為0.0001。設(shè)置BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率為0.1,迭代次數(shù)為10000。為了對比兩個神經(jīng)網(wǎng)絡(luò)在運算速度方面的性能,分別對兩個神經(jīng)網(wǎng)絡(luò)進行100次運算,計算兩者的平均運行時間,結(jié)果如表2所示。
圖4 RBF和BP利用測試樣本反演的溫度廓線和探空溫度廓線對比
表2 兩個神經(jīng)網(wǎng)絡(luò)反演溫度廓線的運算速度性能對比
從表2可以看出,RBF神經(jīng)網(wǎng)絡(luò)的平均運行時間明顯比BP神經(jīng)網(wǎng)絡(luò)短,這說明RBF神經(jīng)網(wǎng)絡(luò)在進行大氣溫度廓線反演時較BP神經(jīng)網(wǎng)絡(luò)有著更快的運算速度。
兩個神經(jīng)網(wǎng)絡(luò)經(jīng)訓(xùn)練后對測試樣本反演大氣水汽密度廓線的結(jié)果如下。
圖5是利用測試樣本分別對本研究構(gòu)建的RBF神經(jīng)網(wǎng)絡(luò)和地基微波輻射計所帶的BP神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練后,得到的反演的水汽密度廓線和探空水汽密度廓線的均方根誤差隨高度的變化對比。由圖5可知,RBF神經(jīng)網(wǎng)絡(luò)反演精確度性能要優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。圖6是兩個神經(jīng)網(wǎng)絡(luò)利用測試樣本反演的水汽密度廓線和探空水汽密度廓線對比,該圖反映了大氣水汽密度在地面到10km高度范圍內(nèi)的垂直分布規(guī)律比較復(fù)雜,尤其是在2km高度以下范圍內(nèi)的垂直分布呈現(xiàn)出具有較大跳躍性的局部特征。從反演結(jié)果對于局部特征的體現(xiàn)來看,兩個神經(jīng)網(wǎng)絡(luò)的反演性能都很不錯。
圖5 RBF和BP利用測試樣本反演的水汽密度廓線和探空水汽密度廓線的均方根誤差對比
綜合圖5和圖6可知,RBF神經(jīng)網(wǎng)絡(luò)利用測試樣本反演的水汽密度廓線和探空水汽密度廓線的均方根誤差大體落于0.2g/m3~0.6g/m3之間,反映出其對測試樣本的適應(yīng)能力比較強。然而BP神經(jīng)網(wǎng)絡(luò)適應(yīng)測試樣本的能力相對較弱,反演的水汽密度廓線和探空水汽密度廓線的均方根誤差大體落于0.4g/m3~1.3g/m3之間。這也再次證明,RBF神經(jīng)網(wǎng)絡(luò)的泛化能力強于BP神經(jīng)網(wǎng)絡(luò)的泛化能力。與反演大氣溫度廓線類似,在對兩種網(wǎng)絡(luò)進行訓(xùn)練時,收斂誤差均設(shè)置為0.0001。設(shè)置BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率為0.1,迭代次數(shù)為10000。為了對比兩個神經(jīng)網(wǎng)絡(luò)在運算速度方面的性能,分別對兩個神經(jīng)網(wǎng)絡(luò)進行100次運算,計算兩者的平均運行時間,結(jié)果如表3所示。
圖6 RBF和BP利用測試樣本反演的水汽密度廓線和探空水汽密度廓線對比
表3 兩個神經(jīng)網(wǎng)絡(luò)反演水汽密度廓線的運算速度性能對比
從表可以看出,神經(jīng)網(wǎng)絡(luò)的平均運行時間也明顯比BP神經(jīng)網(wǎng)絡(luò)短,這說明RBF神經(jīng)網(wǎng)絡(luò)在進行大氣水汽密度廓線反演時較BP神經(jīng)網(wǎng)絡(luò)同樣有著更快的運算速度。
本文利用地基16通道微波輻射計在武漢地區(qū)的觀測資料(包含16個通道的亮溫數(shù)據(jù)及地面氣象信息數(shù)據(jù))和對應(yīng)的探空資料(包含溫度廓線及水汽密度廓線)組建神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本和測試樣本。地基16通道微波輻射計所帶的BP神經(jīng)網(wǎng)絡(luò)反演算法作為本研究構(gòu)建的RBF神經(jīng)網(wǎng)絡(luò)反演算法的比較對象,通過比較RBF神經(jīng)網(wǎng)絡(luò)與BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練結(jié)果以及測試結(jié)果,驗證了RBF神經(jīng)網(wǎng)絡(luò)在不確定條件下的預(yù)測準確性和可行性。實驗結(jié)果表明:RBF神經(jīng)網(wǎng)絡(luò)在反演大氣溫度廓線及水汽密度廓線方面擁有比BP神經(jīng)網(wǎng)絡(luò)更快的運算速度,更準確的反演能力和更強的泛化能力。