張繼學(xué) 王鵬 張琳 王一
摘 要:本文利用沈陽市2002年夏季的地面和高空氣象觀測(cè)資料,建立逐日降水量的三層BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。通過分析降水的形成原因,選擇了高空和地面的氣壓場(chǎng)、溫度場(chǎng)、濕度場(chǎng)和風(fēng)場(chǎng)等18個(gè)氣象要素作為模型的輸入因子,以第二天的降水量作為模型的輸出因子,并利用7月和9月的觀測(cè)數(shù)據(jù)作為訓(xùn)練樣本,確定了以tansig-logsig為傳遞函數(shù),traingdx等三種函數(shù)為訓(xùn)練函數(shù)的網(wǎng)絡(luò)最終結(jié)構(gòu)。最后,利用2002年8月的觀測(cè)數(shù)據(jù)對(duì)模型進(jìn)行檢驗(yàn),結(jié)果顯示:訓(xùn)練函數(shù)為trainlm函數(shù)時(shí),網(wǎng)絡(luò)的擬合效果和預(yù)測(cè)效果最好,對(duì)降水的預(yù)報(bào)準(zhǔn)確率達(dá)到83.3%,降水綜合TS評(píng)分為50%。實(shí)驗(yàn)表明了人工神經(jīng)網(wǎng)絡(luò)在短期降水預(yù)報(bào)方面具有良好的應(yīng)用前景。
關(guān)鍵詞:短期降水;BP神經(jīng)網(wǎng)絡(luò);預(yù)測(cè)模型;訓(xùn)練函數(shù)
降水量是影響干旱最主要的因素,它直接決定著干旱的發(fā)生發(fā)展,在干旱預(yù)報(bào)中準(zhǔn)確預(yù)報(bào)降水量是非常關(guān)鍵的。因此,深入研究降水預(yù)報(bào)新技術(shù),提高預(yù)報(bào)準(zhǔn)確率,對(duì)防災(zāi)減災(zāi)、推動(dòng)社會(huì)經(jīng)濟(jì)的可持續(xù)發(fā)展具有重要意義。
目前預(yù)報(bào)降水的方法眾多,主要包括傳統(tǒng)的統(tǒng)計(jì)學(xué)方法和數(shù)值預(yù)報(bào)方法。這些方法均給出了具體的函數(shù)關(guān)系,意味著將降水變化規(guī)律化、公式化,反而限制了預(yù)測(cè)的準(zhǔn)確性。
而人工神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)方法建立在對(duì)輸入和輸出變量的非線性映射之上,它只和訓(xùn)練樣本和目標(biāo)有關(guān)。該方法不僅克服了具體函數(shù)表達(dá)式的局限性,還能通過學(xué)習(xí)、訓(xùn)練過程選擇相對(duì)最優(yōu)網(wǎng)絡(luò)對(duì)目標(biāo)值進(jìn)行預(yù)測(cè)。非線性,具反饋能力的神經(jīng)網(wǎng)絡(luò)模型在水文,泥沙等許多方面得到了廣泛的應(yīng)用,并取得了比較理想的結(jié)果。
郭光和嚴(yán)紹瑾等人[ 1 ]利用BP網(wǎng)絡(luò)模型對(duì)我國東部6個(gè)城市的1991年(歷史罕見澇年)和1994年(旱年)的汛期(5-9月)降水進(jìn)行了模擬預(yù)報(bào)試驗(yàn),模式預(yù)報(bào)的旱澇總體趨勢(shì)與實(shí)況相符。誤差分析表明:1991年和1994年預(yù)報(bào)值與實(shí)測(cè)值的相對(duì)誤差和相關(guān)系數(shù)分別為0.134,0.150和0.931及0.904,效果較好。
金龍等人[ 2 ]進(jìn)行了神經(jīng)網(wǎng)絡(luò)汛期降水預(yù)報(bào)性能與逐步回歸預(yù)報(bào)準(zhǔn)確率的對(duì)比分析,認(rèn)為神經(jīng)網(wǎng)絡(luò)預(yù)報(bào)模型的預(yù)報(bào)性能明顯優(yōu)于逐步回歸預(yù)報(bào)模型。
鑒于上述情況,本研究的主要目的是利用BP神經(jīng)網(wǎng)絡(luò)強(qiáng)大的非線性函數(shù)逼近功能,建立基于BP神經(jīng)網(wǎng)絡(luò)方法的短期降水量的預(yù)測(cè)模型,為降水量的預(yù)測(cè)提供一種新的嘗試。
1 數(shù)據(jù)收集與處理
1.1 數(shù)據(jù)的收集
本次試驗(yàn)數(shù)據(jù)來源于遼寧省沈陽市氣象觀測(cè)站,位置為北緯41°44′、東經(jīng)122°25′,海拔高度42.8米。沈陽市地處中國東北地區(qū)的南部,遼寧省的中部,位于北溫帶亞洲季風(fēng)區(qū)北緣,屬濕潤半濕潤暖溫帶大陸性氣候,全年平均氣溫6.8℃-8.0℃,7月份氣溫最高,平均氣溫約24.0℃,1月份氣溫最低,月平均氣溫8.5℃,年降水量平均為721.9毫米。
本文收集沈陽氣象站2002年的氣象觀測(cè)資料,包括地面觀測(cè)圖和高空500hPa觀測(cè)圖。選取7~9月的氣壓場(chǎng)、溫度場(chǎng)、濕度場(chǎng)、風(fēng)場(chǎng)和高度場(chǎng)等18個(gè)數(shù)據(jù),用其中的7月和9月數(shù)據(jù)作為模型的訓(xùn)練集,8月的數(shù)據(jù)作為模型的檢驗(yàn)集,來建立人工神經(jīng)網(wǎng)絡(luò)的降水預(yù)測(cè)模型。
1.2 數(shù)據(jù)的處理
從地面觀測(cè)圖和高空?qǐng)D中提取相關(guān)的數(shù)據(jù),根據(jù)提取的數(shù)據(jù)的完整程度,進(jìn)行修正。然后根據(jù)各個(gè)因子與日降水量的相關(guān)程度,選取相關(guān)系數(shù)較大的因子作為人工神經(jīng)網(wǎng)絡(luò)的輸入因子。
由于原始數(shù)據(jù)幅值大小不一,有時(shí)候還相差比較懸殊。如果直接投入使用,測(cè)量值大的波動(dòng)就會(huì)阻斷神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程,使其不能反映小的測(cè)量值的變化。
所以,在網(wǎng)絡(luò)訓(xùn)練之前,輸人數(shù)據(jù)和目標(biāo)矢量都要經(jīng)過歸一化處理。其中,歸一化處理采用的公式如下:
式中:xn o r m為樣本歸一化的值;xi為樣本初始值;xmax為樣本最大值;xmin為樣本最小值。
2 模型的建立及應(yīng)用檢驗(yàn)
2.1 BP神經(jīng)網(wǎng)絡(luò)建模
應(yīng)用BP神經(jīng)網(wǎng)絡(luò)建模進(jìn)行降水量的預(yù)測(cè)時(shí),需先確定訓(xùn)練和檢驗(yàn)樣本集。為了能夠更好地反映降水量的復(fù)雜程度,這里選擇每年中降水量較大的7~9月的逐日氣象資料作為樣本,其中7月和9月的逐日氣象資料作為訓(xùn)練樣本,8月的數(shù)據(jù)作為檢驗(yàn)樣本。
在確定輸入因子方面,主要選擇與降水量相關(guān)的因子,氣壓場(chǎng)選擇地面02時(shí)、14時(shí)氣壓和高空500hPa氣壓,溫度場(chǎng)選擇日平均氣溫和02時(shí)、04時(shí)的氣溫,此外,還選擇了一些與降水密切相關(guān)的因素,如:日平均溫度、低云量等。
確定輸出因子為第二天的降水量。
2.2 網(wǎng)絡(luò)參數(shù)的最終確定
確定優(yōu)化的BP網(wǎng)絡(luò)模型的具體參數(shù)如下:
2.3 三種訓(xùn)練函數(shù)預(yù)測(cè)評(píng)分
從預(yù)報(bào)準(zhǔn)確率(對(duì)晴天和雨天預(yù)報(bào)正確的天數(shù)占總天數(shù)的百分比)、降水的準(zhǔn)確率(成功預(yù)報(bào)降水的天數(shù)占實(shí)際降水天數(shù)的百分比)和綜合降水的TS評(píng)分(對(duì)降水預(yù)報(bào)正確的天數(shù)占報(bào)對(duì)、報(bào)空和報(bào)漏總天數(shù)的百分比)方面,分別對(duì)這三種預(yù)測(cè)結(jié)果進(jìn)行分析對(duì)比。如表3:
由上表可知,對(duì)于總的預(yù)報(bào)準(zhǔn)確度來說,traingdx函數(shù)和trainlm函數(shù)的準(zhǔn)確性相同,均為66.7%,trainscg函數(shù)的準(zhǔn)確性較低,為56.7%。
對(duì)于降水預(yù)報(bào)的準(zhǔn)確性來說,三種函數(shù)的差別很大,其中trainlm函數(shù)的預(yù)報(bào)效果最好,準(zhǔn)確度達(dá)到83.3%,TS評(píng)分也最高,達(dá)到了50%,達(dá)到了預(yù)期的預(yù)報(bào)效果。
其次是trainscg函數(shù),降水預(yù)報(bào)準(zhǔn)確度為66.7%,降水的TS評(píng)分為38.1%,略高于traingdx函數(shù)的TS評(píng)分。
綜上所述,當(dāng)BP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練函數(shù)為trainlm時(shí),模型的預(yù)測(cè)效果做好,收斂速度也最快。對(duì)降水的預(yù)報(bào)準(zhǔn)確率達(dá)到了83.3%,降水TS評(píng)分為50%,效果較好。
3 結(jié)論與討論
3.1 主要結(jié)論
主要的結(jié)論可以概括如下:
1)本文在研究了降水的形成原因的基礎(chǔ)上,確定了影響降水的相關(guān)因子,通過比較它們與輸出因子之間的相關(guān)性,確定了18個(gè)因子作為網(wǎng)絡(luò)的輸入因子,主要有:高空的氣壓場(chǎng)、風(fēng)場(chǎng)、濕度場(chǎng)和溫度場(chǎng),地面的氣壓場(chǎng)、變壓場(chǎng)等,還有與降水相關(guān)的低云量。
2)通過利用樣本對(duì)模型進(jìn)行訓(xùn)練,確定了網(wǎng)絡(luò)各個(gè)層次之間的傳遞函數(shù):輸入層到隱層為tansig函數(shù),隱層到輸出層位logsig函數(shù)。并且選擇出了擬合效果比較好的訓(xùn)練函數(shù),依次為traingdx函數(shù)、trainlm函數(shù)和trainscg函數(shù)。
3)由于隱層節(jié)點(diǎn)數(shù)對(duì)網(wǎng)絡(luò)的性能影響比較大,本文通過比較三種不同訓(xùn)練函數(shù)對(duì)樣本的擬合誤差和訓(xùn)練速度,確定了每種訓(xùn)練函數(shù)的最佳隱層數(shù):traingdx函數(shù)為12個(gè)、trainlm函數(shù)13個(gè)和trainscg函數(shù)9個(gè)。
4)分別利用三種訓(xùn)練函數(shù)進(jìn)行降水預(yù)測(cè),通過比較發(fā)現(xiàn):當(dāng)BP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練函數(shù)為trainlm時(shí),模型的預(yù)測(cè)效果最好,收斂速度也最快。對(duì)降水的預(yù)報(bào)準(zhǔn)確率達(dá)到了83.3%,總降水的TS評(píng)分為50%。但對(duì)于中雨及以上量級(jí)的預(yù)測(cè),效果不是很明顯,還有待于進(jìn)一步完善。
3.2 討論
本文對(duì)降水的預(yù)報(bào)的準(zhǔn)確率達(dá)到83.3%,但是對(duì)于中雨及中雨以上的降水預(yù)報(bào)效果不是很好。主要是逐日降水量是非正態(tài)、非線性、非平衡序列的問題,尤其是對(duì)于夏季短時(shí)降水,突變性非常強(qiáng),無法抓住其規(guī)律。
所以,要增加降水預(yù)報(bào)的準(zhǔn)確率,還需要做大量的工作。比如收集沈陽及沈陽周邊地區(qū)4個(gè)以上的站點(diǎn)觀測(cè)數(shù)據(jù),增加降水預(yù)報(bào)的時(shí)空范圍。收集更多有物理意義的輸入因子,通過計(jì)算輸入因子與降水量之間的相關(guān)系數(shù),選擇相關(guān)性較好的因子。若輸入因子過多,可以嘗試?yán)弥鞒煞址治觯瑢⒁蜃幼鲋鞒煞址治?,將濃縮的主成分作為新的輸入因子。這樣有可能提高預(yù)報(bào)精度。
參考文獻(xiàn):
[1] 郭光,嚴(yán)紹瑾,尹樹新.人工神經(jīng)網(wǎng)絡(luò)用于我國東部汛期降水預(yù)測(cè)的研究[J].南京氣象學(xué)院學(xué)報(bào),1996,19(3):354-357.
[2] 金龍,陳寧,林振山.基于人工神經(jīng)網(wǎng)絡(luò)的集成預(yù)報(bào)方法研究和比較[J].氣象學(xué)報(bào),1999,57(2):198- 207.