袁 凱 李武階 李 明 龐 晶
武漢市氣象臺(tái),武漢 430040
提 要: 基于PredRNN++、MIM、CrevNet和PhyDNet四種機(jī)器深度學(xué)習(xí)算法,利用武漢地區(qū)2012—2019年的雷達(dá)和降水資料,開展了人工智能技術(shù)在武漢地區(qū)臨近預(yù)報(bào)中的應(yīng)用研究,根據(jù)均方誤差(MSE)、結(jié)構(gòu)相似性指數(shù)(SSIM)、命中率(POD)、虛警率(FAR)和臨界成功指數(shù)(CSI)等指標(biāo)檢驗(yàn)評(píng)估了四種機(jī)器學(xué)習(xí)算法對(duì)武漢地區(qū)雷達(dá)回波臨近預(yù)報(bào)的預(yù)報(bào)性能,并以半拉格朗日光流法進(jìn)行了對(duì)比,得到以下主要結(jié)論:MIM算法的MSE和FAR最低,SSIM最高;PredRNN++算法的POD和CSI最高。機(jī)器深度學(xué)習(xí)算法的POD、CSI和SSIM均高于光流法,F(xiàn)AR和MSE則更低,其中SSIM、POD、CSI三種指標(biāo)的提升幅度在3.2%~24.7%,MSE和FAR兩種指標(biāo)的降幅在13.1%~43.3%。30 min以內(nèi),除CrevNet外,其余三種機(jī)器學(xué)習(xí)算法和光流法的預(yù)報(bào)能力較為接近;30 min以后,深度學(xué)習(xí)算法和光流法都隨著預(yù)報(bào)時(shí)效的延長(zhǎng),預(yù)報(bào)能力均顯著下降,但機(jī)器學(xué)習(xí)算法下降得更緩慢,尤其是60 min以后光流法的降幅進(jìn)一步增加,顯示出機(jī)器學(xué)習(xí)長(zhǎng)預(yù)報(bào)時(shí)效的優(yōu)勢(shì)。此外,機(jī)器學(xué)習(xí)算法之間針對(duì)不同評(píng)分指標(biāo)在不同預(yù)報(bào)時(shí)效的下降速度并不一致。PredRNN++算法在所有強(qiáng)度上CSI均表現(xiàn)最佳,MIM和PhyDNet兩種算法對(duì)≥40 dBz的回波預(yù)報(bào)、CrevNet算法對(duì)≥50 dBz的回波預(yù)報(bào)均好于光流法。機(jī)器學(xué)習(xí)算法和光流法都隨著回波強(qiáng)度的增加,CSI和POD迅速降低,F(xiàn)AR快速上升,但機(jī)器學(xué)習(xí)算法的FAR上升得更慢。四個(gè)不同回波形態(tài)、不同發(fā)展趨勢(shì)個(gè)例的分析結(jié)果表明,機(jī)器學(xué)習(xí)算法不僅具備對(duì)一定回波強(qiáng)度變化的預(yù)報(bào)能力,而且對(duì)回波強(qiáng)度和面積變化趨勢(shì)的時(shí)間節(jié)點(diǎn)預(yù)報(bào)也與實(shí)況基本一致。此外,機(jī)器學(xué)習(xí)算法對(duì)回波運(yùn)動(dòng)的預(yù)報(bào)能力明顯強(qiáng)于光流法,顯示出機(jī)器學(xué)習(xí)算法良好的應(yīng)用前景。
在天氣預(yù)報(bào)業(yè)務(wù)中,臨近預(yù)報(bào)通常是指對(duì)某一區(qū)域未來0~2 h內(nèi)的短時(shí)強(qiáng)降水、冰雹、雷暴大風(fēng)、龍卷和雷電等災(zāi)害性天氣進(jìn)行預(yù)測(cè)(俞小鼎等,2012),在氣象災(zāi)害防御中具有極為重要的地位。臨近預(yù)報(bào)的方法主要有雷達(dá)回波外推預(yù)報(bào)、中尺度數(shù)值模式預(yù)報(bào)以及概念模型預(yù)報(bào)等(Wilson et al,1998)。中尺度數(shù)值模式預(yù)報(bào)由于模式初始場(chǎng)協(xié)調(diào)和資料同化時(shí)效等問題的限制,在最初的幾個(gè)小時(shí)內(nèi)其預(yù)報(bào)效果較差,甚至無法直接用于臨近預(yù)報(bào)(王丹等,2014;吳劍坤等,2019);概念模型預(yù)報(bào)帶有預(yù)報(bào)員一定的個(gè)人主觀性,且精細(xì)化程度較低。因此,目前業(yè)務(wù)上臨近預(yù)報(bào)方法仍以雷達(dá)回波的外推預(yù)報(bào)為主(Wilson et al,2010;Wang et al,2016),主要包括單體質(zhì)心法、交叉相關(guān)法和光流法。
目前業(yè)務(wù)上廣泛使用的單體質(zhì)心算法主要有TITAN(thunder identification tracking analysis and nowcasting)(Dixon and Wiener,1993)和SCIT(storm cell identification and tracking)(Johnson et al,1998)。單體質(zhì)心法最先由Austin and Bellon(1982)提出,然后Rosenfelds(1987)、Dixon and Wiener(1993)和徐月飛等(2011)對(duì)其進(jìn)行了大量試驗(yàn)和改進(jìn),雖然取得了一定的效果,但其較大的計(jì)算量和只適用于強(qiáng)對(duì)流風(fēng)暴的“先天性缺陷”,導(dǎo)致其預(yù)報(bào)準(zhǔn)確率很難以較大幅度地提高。
交叉相關(guān)法由Rinehart and Garvey(1978)提出,其后國內(nèi)外專家和學(xué)者從不同角度對(duì)其進(jìn)行了改進(jìn),改進(jìn)后的交叉相關(guān)法解決了回波波形變化導(dǎo)致的運(yùn)動(dòng)無序(Rinehart,1981)和反演矢量不連續(xù)等問題(Li et al,1995),得到了較為均勻的風(fēng)場(chǎng)(徐亞欽等,2011),但基于交叉相關(guān)法的外推預(yù)報(bào)技術(shù)主要獲得的是雷達(dá)回波的水平運(yùn)動(dòng)矢量,并沒有考慮深對(duì)流系統(tǒng)通常伴隨較強(qiáng)的垂直運(yùn)動(dòng),因此該方法僅適用于緩慢變化的層狀云降水系統(tǒng),而對(duì)快速增長(zhǎng)或消散的強(qiáng)對(duì)流系統(tǒng)的預(yù)報(bào)效果并不理想(韓雷等,2008;曹春燕等,2015)。
為了進(jìn)一步提高雷達(dá)回波的外推預(yù)報(bào)技術(shù),許多專家和學(xué)者引入了計(jì)算機(jī)視覺領(lǐng)域的光流法,該方法最早由Gibson(1979)提出,眾多專家學(xué)者對(duì)其進(jìn)行了大量檢驗(yàn)和優(yōu)化升級(jí),結(jié)果表明:光流法可以較為準(zhǔn)確地得到雷暴的整體運(yùn)動(dòng)趨勢(shì),對(duì)于移動(dòng)型局地生成及強(qiáng)度和形狀隨時(shí)間變化較快的雷暴,光流法明顯優(yōu)于交叉相關(guān)法,而對(duì)于熱帶降水系統(tǒng)尤其是臺(tái)風(fēng)系統(tǒng),光流法沒有考慮雷達(dá)回波的旋轉(zhuǎn)性,預(yù)報(bào)效果不如交叉相關(guān)法(曹春燕等,2015;Bechini and Chandrasekar,2017)。雖然光流法已較大幅度地提高了回波臨近預(yù)報(bào)的準(zhǔn)確率,但其基本模型較實(shí)況仍存在不少誤差,比如要求圖像遵循灰度不變形假設(shè),即線性外推原則,此外求解光流場(chǎng)時(shí),也只適用于回波運(yùn)動(dòng)較小的情況,對(duì)于快速移動(dòng)的回波誤差仍然較大。
近年來,以機(jī)器深度學(xué)習(xí)為代表的人工智能技術(shù)在圖像識(shí)別和視頻領(lǐng)域取得了突破性進(jìn)展,由于其挖掘海量數(shù)據(jù)和非線性建模的優(yōu)秀能力,眾多學(xué)者將其引入到以雷達(dá)回波預(yù)報(bào)為主的短時(shí)臨近預(yù)報(bào)業(yè)務(wù)中,并取得了良好的成果(許小峰,2018;黃驕文等,2021)。Shi et al(2015) 提出了卷積長(zhǎng)短期記憶單元網(wǎng)絡(luò)算法(convolutional LSTM network,ConvLSTM),結(jié)果表明ConvLSTM優(yōu)于普通的光流法;Wang et al(2017)提出了PredRNN算法,并在此之上,提出了PredRNN++算法(Wang et al,2018),結(jié)果顯示PredRNN++效果較ConvLSTM有明顯的提升;Wang et al(2019)提出了MIM(memory in memory)算法,結(jié)果表明MIM算法不僅具有良好的平穩(wěn)信息的提取能力,還具備一定提取非平穩(wěn)信息的能力;陳元昭等(2019)研究了基于生成對(duì)抗網(wǎng)絡(luò)的臨近預(yù)報(bào)方法,結(jié)果表明對(duì)中等強(qiáng)度的回波其預(yù)報(bào)效果較好。Yu et al(2020)提出了 CrevNet算法,結(jié)果顯示該算法對(duì)交通視頻識(shí)別與處理精準(zhǔn)度較高,具有較強(qiáng)的預(yù)測(cè)能力;Le Guen and Thone(2020)以ConvLSTM為內(nèi)核,提出了PhyDNet算法,結(jié)果表明該算法在視頻預(yù)測(cè)上具有良好的時(shí)空預(yù)測(cè)能力,尤其對(duì)長(zhǎng)時(shí)間預(yù)測(cè)具有明顯的優(yōu)勢(shì)。陳訓(xùn)來等(2021)利用卷積門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)算法(convolutional gated recurrent unit,ConvGRU)對(duì)雷達(dá)回波進(jìn)行臨近預(yù)報(bào),結(jié)果表明,基于ConvGRU方法對(duì)強(qiáng)對(duì)流天氣具有較好的預(yù)報(bào)效果,業(yè)務(wù)中具有廣泛的應(yīng)用前景;顧建峰等(2020)采用TrajGRU算法,建立了重慶地區(qū)三維雷達(dá)回波智能預(yù)報(bào)系統(tǒng),并將其業(yè)務(wù)化,結(jié)果顯示機(jī)器學(xué)習(xí)在回波演變的臨近預(yù)報(bào)方面具有明顯優(yōu)勢(shì),人工智能技術(shù)在重慶臨近預(yù)警業(yè)務(wù)中已初見成效。
雖然基于深度學(xué)習(xí)的臨近預(yù)報(bào)技術(shù)已經(jīng)取得了令人欣喜的成果,各種算法都表現(xiàn)出特有的預(yù)報(bào)性能,但雷達(dá)回波的發(fā)生、發(fā)展和移動(dòng)是非常復(fù)雜的,它與站點(diǎn)所處的氣候帶、站點(diǎn)附近特殊的地形和地貌特征等因素相關(guān),所以開展機(jī)器深度學(xué)習(xí)算法預(yù)報(bào)性能的檢驗(yàn)評(píng)估,有利于各地選擇適用于本地的深度學(xué)習(xí)方法,建立最優(yōu)的深度學(xué)習(xí)模型(陳錦鵬等,2021;周康輝等,2021)。因此,本文選取在常規(guī)數(shù)據(jù)集中表現(xiàn)良好、計(jì)算成本較低且內(nèi)部結(jié)構(gòu)差異較大的四種深度學(xué)習(xí)算法,利用武漢地區(qū)較長(zhǎng)時(shí)間序列的雷達(dá)和降水資料,開展基于機(jī)器深度學(xué)習(xí)算法的雷達(dá)回波臨近預(yù)報(bào)應(yīng)用研究和預(yù)報(bào)結(jié)果的檢驗(yàn)評(píng)估,并與業(yè)務(wù)中常用的半拉格朗日光流法進(jìn)行對(duì)比分析和檢驗(yàn),以期尋找到適合武漢地區(qū)的深度學(xué)習(xí)算法,為武漢地區(qū)雷達(dá)回波臨近預(yù)報(bào)提供智能化的客觀參考。
本研究主要用到以下兩種資料:逐日和逐小時(shí)的降水資料,主要用來選取訓(xùn)練和檢驗(yàn)樣本;新一代多普勒天氣雷達(dá)組合反射率因子拼圖產(chǎn)品,時(shí)間分辨率為6 min,本文所選范圍為覆蓋湖北東部地區(qū)的以武漢雷達(dá)站為中心、邊長(zhǎng)為256 km的正方形區(qū)域,其經(jīng)緯度范圍分別為29.247°~31.797°N、113.098°~115.648°E,空間分辨率為1 km ×1 km。雷達(dá)回波數(shù)據(jù)進(jìn)行了孤立噪音過濾和超折射回波抑制(吳濤等,2013),并利用中值濾波(趙悅等,2007)進(jìn)行質(zhì)量控制。
為盡可能地增多訓(xùn)練和檢驗(yàn)樣本個(gè)數(shù),使算法能夠?qū)W習(xí)到不同種類的回波特征,同時(shí)降低樣本嚴(yán)重失調(diào)(弱降水過程和無降水的天氣占全年的絕大多數(shù)時(shí)間)帶來的不利影響,本文以武漢地區(qū)5個(gè)國家氣象觀測(cè)站和14個(gè)觀測(cè)環(huán)境良好、數(shù)據(jù)質(zhì)量較高且地理分布較為均勻的自動(dòng)氣象觀測(cè)站為基礎(chǔ)(具體站點(diǎn)和位置如圖1所示),選取2012年6月1日至2019年12月31日,上述任一站點(diǎn)日降水量≥10 mm、小時(shí)降水量≥0.6 mm且組合反射率因子拼圖連續(xù)3小時(shí)不斷裂的連續(xù)雷達(dá)回波為1個(gè)樣本(如有重疊則算為1個(gè)樣本),然后對(duì)樣本進(jìn)行切片(這里所說的“切片”是指將樣本進(jìn)行分段處理,即樣本前10張連續(xù)的雷達(dá)回波作為模型訓(xùn)練的輸入資料,后20張連續(xù)的雷達(dá)回波為模型訓(xùn)練的輸出資料),共計(jì)得到3 112個(gè)樣本,考慮到各年之間天氣過程的差異性較大,本文按照4∶1的比例,隨機(jī)分配訓(xùn)練和檢驗(yàn)樣本(2 490個(gè)訓(xùn)練樣本和622個(gè)檢驗(yàn)樣本),由于檢驗(yàn)樣本沒有參與算法的訓(xùn)練和參數(shù)調(diào)整,因此可以客觀地衡量各算法的學(xué)習(xí)能力和預(yù)報(bào)效果。
圖1 武漢市5個(gè)國家氣象觀測(cè)站、14個(gè)自動(dòng)氣象觀測(cè)站以及武漢雷達(dá)站的空間分布(圓點(diǎn)為國家站,十字形為自動(dòng)站,實(shí)心三角形為雷達(dá)站)Fig.1 Spatial distribution of observation stations (dot: national station, cross: automatic station, solid triangle: radar station)
為了統(tǒng)一有效地評(píng)估各算法的預(yù)報(bào)能力,以半拉格朗日光流法為對(duì)比(本中所指光流法如無特殊說明,皆為半拉格朗日光流法),以實(shí)況回波圖像為基礎(chǔ),將實(shí)際回波圖像和預(yù)報(bào)的回波圖像格點(diǎn)化成單獨(dú)的像素點(diǎn),再逐個(gè)像素點(diǎn)檢驗(yàn)預(yù)報(bào)準(zhǔn)確率,用均方誤差(mean squared error,MSE)表征預(yù)報(bào)回波圖像與實(shí)際回波圖像在強(qiáng)度上的誤差,用結(jié)構(gòu)相似性指數(shù)(structural similarity index,SSIM)(Wang et al,2004)衡量預(yù)報(bào)回波圖像與實(shí)際回波圖像的相似度,SSIM介于-1~1,當(dāng)兩張圖片一模一樣時(shí)SSIM的值等于1,MSE和SSIM的計(jì)算公式如下:
此外,為了考察各方法對(duì)不同量級(jí)范圍內(nèi)反射率因子的預(yù)報(bào)能力,采用臨界成功指數(shù)(critical success index,CSI)、命中率(probability of detection,POD)和虛警率(false alarm rate,F(xiàn)AR)等指標(biāo)對(duì)預(yù)報(bào)結(jié)果進(jìn)行量化評(píng)估,其計(jì)算公式如下:
式中:NAk為預(yù)報(bào)正確格點(diǎn)數(shù),NBk為空?qǐng)?bào)格點(diǎn)數(shù),NCk為漏報(bào)格點(diǎn)數(shù),k為檢驗(yàn)雷達(dá)回波不同強(qiáng)度閾值,采用分閾值的檢驗(yàn)方法(分別為20、30、40和50 dBz),對(duì)逐個(gè)像素點(diǎn)進(jìn)行檢驗(yàn)。
表1 雷達(dá)回波預(yù)報(bào)分級(jí)檢驗(yàn)表Table 1 Classification of radar echo forecast test
眾所周知,雷達(dá)回波臨近預(yù)報(bào)的本質(zhì)就是時(shí)空序列的預(yù)測(cè),在機(jī)器學(xué)習(xí)方面可以分為以卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)為基礎(chǔ)的兩個(gè)大類,其中以CNN為基礎(chǔ)的機(jī)器算法側(cè)重于對(duì)空間特征的提取,而以RNN為基礎(chǔ)的機(jī)器算法則更偏重于對(duì)時(shí)間特征的捕捉,且存在梯度消失的問題(Wang et al,2018)。為了兼顧空間特征和時(shí)間信息的均衡性,因此大多數(shù)的深度學(xué)習(xí)算法將CNN和RNN結(jié)合起來使用,本文采用的四種算法亦如此,其中PredRNN++、MIM算法已經(jīng)應(yīng)用于雷達(dá)回波臨近預(yù)報(bào),而CrevNet和PhyDNet算法則是視頻預(yù)測(cè)領(lǐng)域最新的算法,尚未應(yīng)用于雷達(dá)回波臨近預(yù)報(bào)。
Shi et al(2015)將RNN中傳統(tǒng)的LSTM(long short-term memory)中的全連接層改為卷積層,提出了ConvLSTM算法,而后發(fā)展出的ConvGRU、TrajGRU等算法(Shi et al,2017)與ConvLSTM并無本質(zhì)的區(qū)別,這些算法將LSTM或GRU中的記憶模塊改造成CNN結(jié)構(gòu),增強(qiáng)了算法對(duì)空間特征的提取能力。Wang et al(2017)在ConvLSTM算法的基礎(chǔ)之上,將可以記憶的單元放置在算法的堆疊結(jié)構(gòu)中,提出了PredRNN算法,為了緩解該算法中梯度容易消失的問題以及提高其對(duì)短時(shí)非線性時(shí)空特征的提取能力,引入了GHU(gradient highway unit),該結(jié)構(gòu)使得梯度能夠在第一層和第二層之間高速傳遞,有效抑制了梯度的消失,最終提出了PredRNN++算法(Wang et al,2018)。
Wang et al(2019)為了解決PredRNN中LSTM遺忘門的飽和問題,將圖片的信息分為平穩(wěn)信息和非平穩(wěn)信息兩部分,提出了MIM算法,該算法分兩次對(duì)圖片信息進(jìn)行提取,首先由MIM-N結(jié)構(gòu)提取出非平穩(wěn)信息,而后傳遞給MIM-S,MIM-S則利用門控來選擇記憶或忘記非平穩(wěn)信息的多少,同時(shí)通過多層模塊之間相互的差分運(yùn)算,使得非平穩(wěn)信息緩慢降低,從而提取出各種高階的非平穩(wěn)信息,最終將所提取的平穩(wěn)信息和非平穩(wěn)信息相結(jié)合,進(jìn)行輸出與預(yù)測(cè)。
Yu et al(2020)提出的CrevNet算法,是一種全新的嵌套了三維卷積模塊的雙向可逆自編碼結(jié)構(gòu),其在一系列正向和反向計(jì)算過程中使得輸入和特征之間建立了一對(duì)一的雙向映射關(guān)系,這種關(guān)系理論上保證了在特征提取過程中不丟失信息,因而保留更多信息進(jìn)行預(yù)測(cè),明顯提高了預(yù)測(cè)圖片的清晰度。此外,該算法的內(nèi)存和計(jì)算開銷都較小,對(duì)于硬件要求不高,易于訓(xùn)練和調(diào)試。
Le Guen and Thome(2020)提出了PhyDNet算法,該算法參考了MIM算法的基本假設(shè),將圖片信息分為已知的物理過程和未知因素(包括生消、發(fā)展等)兩個(gè)部分,然后用深度網(wǎng)絡(luò)結(jié)構(gòu)來約束模型,以ConvLSTM為主要內(nèi)核來提取未知因素,此外利用卷積過程模擬偏導(dǎo),從而學(xué)習(xí)到新的物理信息,最后將物理信息和已有的未知因素結(jié)合,從而進(jìn)行更好的預(yù)測(cè)。
本文所指的半拉格朗日光流法均為L(zhǎng)ucas-Kanade稀疏光流法(Lucas and Kanade,1981)。Lucas-Kanade稀疏光流法處理的像素點(diǎn)較少,耗時(shí)短,該算法需滿足以下3個(gè)基本假設(shè):(1)亮度恒定,即同一點(diǎn)隨著時(shí)間的變化,其亮度不變;(2)小運(yùn)動(dòng),即隨著時(shí)間的變化不會(huì)引起位置的劇烈變化;(3)空間一致,即場(chǎng)景中鄰近點(diǎn)投影到圖像上相鄰位置不變且相鄰點(diǎn)速度一致。具體的計(jì)算步驟:首先,根據(jù)每組樣本中最后連續(xù)的s3張雷達(dá)回波實(shí)際圖像,利用Lucas-Kanade方法計(jì)算出光流場(chǎng);然后,基于已經(jīng)計(jì)算出的光流場(chǎng),利用半拉格朗日方法進(jìn)行外推預(yù)報(bào)(張蕾等,2014)。
3.1.1 2018年6月30日片狀回波個(gè)例
2018年6月30日11:30的雷達(dá)回波上顯示(圖2),武漢地區(qū)西部有強(qiáng)度超過45 dBz的片狀回波,從回波的演變來看,預(yù)報(bào)時(shí)效內(nèi)該片狀回波不斷東移進(jìn)入湖北東部地區(qū),回波面積變大,強(qiáng)度無明顯變化。對(duì)比光流法和機(jī)器深度算法的預(yù)報(bào)結(jié)果:光流法對(duì)片狀回波的位置把握較好,但對(duì)回波形態(tài)的預(yù)報(bào)較差,尤其是對(duì)后側(cè)進(jìn)入武漢地區(qū)的回波缺乏預(yù)報(bào)能力。而四種機(jī)器學(xué)習(xí)算法中,除CrevNet算法外均準(zhǔn)確預(yù)報(bào)出了后期進(jìn)入武漢地區(qū)的片狀回波面積的增大,尤其是PhyDNet和PredRNN++算法預(yù)報(bào)的回波形態(tài)與強(qiáng)回波位置與實(shí)況吻合較好。另外,從回波強(qiáng)度上看,深度學(xué)習(xí)算法預(yù)報(bào)的回波強(qiáng)度較實(shí)況都偏弱,PhyDNet和PredRNN++算法強(qiáng)度最強(qiáng),最接近實(shí)況。
圖2 2018年6月30日11:30—14:24(a~g)回波實(shí)況和(h~l)預(yù)報(bào)回波對(duì)比(a)11:30,(b)11:54,(c)12:24,(d)12:54,(e)13:24,(f)13:54,(g)14:24;(h)光流法,(i)MIM,(j)CrevNet,(k)PhyDNet,(l)PredRNN++Fig.2 Comparison between (a-g) observation and (h-l) forecast of radar echo from 11:30 BT to 14:24 BT 30 June 2018(a) 11:30 BT, (b) 11:54 BT, (c) 12:24 BT, (d) 12:54 BT, (e) 13:24 BT, (f) 13:54 BT, (g) 14:24 BT; (h) optical flow, (i) MIM, (j) CrevNet, (k) PhyDNet, (l) PredRNN++
3.1.2 2014年7月4日弓狀回波個(gè)例
2014年7月4日08:30的雷達(dá)回波上顯示(圖3),武漢中北部和南部地區(qū)有多個(gè)強(qiáng)度達(dá)45 dBz以上的塊狀回波存在,從回波的演變來看,預(yù)報(bào)時(shí)效內(nèi)這些塊狀回波在東移的過程中,逐漸合并和組織化,強(qiáng)度幾乎保持不變,最終形成一個(gè)經(jīng)武漢東北部—東南部—西南部的環(huán)繞湖北東部地區(qū)的大弓狀回波。從光流法和機(jī)器深度算法的預(yù)報(bào)結(jié)果來看:光流法對(duì)東北側(cè)回波位置的把握較好,但對(duì)整體的回波形態(tài)的預(yù)報(bào)較差,尤其是對(duì)塊狀回波移動(dòng)過程中的合并缺乏預(yù)報(bào)能力。而除CrevNet以外的其他三種機(jī)器學(xué)習(xí)算法均成功預(yù)報(bào)出了塊狀回波在東移過程中的合并,整體回波形狀和回波中心位置與實(shí)況非常吻合。最后,從回波強(qiáng)度上看,所有深度學(xué)習(xí)算法預(yù)報(bào)的強(qiáng)度較實(shí)況都偏弱,但PredRNN++算法強(qiáng)度最強(qiáng),與實(shí)況最接近。
圖3 同圖2,但為2014年7月4日08:30—11:24(a~g)雷達(dá)實(shí)況(a)08:30,(b)08:54,(c)09:24,(d)09:54,(e)10:24,(f)10:54,(g)11:24Fig.3 Same as Fig.2, but from 08:30 BT to 11:24 BT 4 July 2014(a) 08:30 BT, (b) 08:54 BT, (c) 09:24 BT, (d) 09:54 BT, (e) 10:24 BT, (f) 10:54 BT, (g) 11:24 BT
3.1.3 2018年7月30日分散性回波個(gè)例
2018年7月30日20:30的雷達(dá)回波上顯示(圖4),武漢地區(qū)中部和南部有多個(gè)分散性塊狀回波存在,其中中部塊狀回波強(qiáng)度超過50 dBz,南部塊狀回波強(qiáng)度較弱,從回波的演變來看,預(yù)報(bào)時(shí)效內(nèi)中部塊狀回波的面積和強(qiáng)度均快速減弱,至23:30基本消散殆盡,而南部的塊狀回波面積逐漸減小,強(qiáng)度略有減弱。對(duì)比光流法和機(jī)器深度算法的預(yù)報(bào)結(jié)果:光流法虛報(bào)出了中部地區(qū)多塊的強(qiáng)回波以及過高估計(jì)了南部塊狀回波的強(qiáng)度和面積。而機(jī)器學(xué)習(xí)算法中,除PhyDNet算法外,均準(zhǔn)確預(yù)報(bào)出了中部塊狀回波的強(qiáng)烈衰減,而且對(duì)回波強(qiáng)度減弱和面積變小的時(shí)間節(jié)點(diǎn)的預(yù)報(bào)也與實(shí)況幾乎一致,都表現(xiàn)為21:54—22:24回波強(qiáng)度的稍有減弱和面積的稍微變小,以及22:24—23:24回波強(qiáng)度的明顯減弱和面積的顯著縮小,尤其是CrevNet算法還成功地預(yù)報(bào)出了南側(cè)塊狀回波面積的變小,其預(yù)報(bào)的回波面積與回波位置與實(shí)況吻合較好,強(qiáng)度也非常接近實(shí)況回波強(qiáng)度。
圖4 同圖2,但為2018年7月30日20:30—23:24(a)20:30,(b)20:54,(c)21:24,(d)21:54,(e)22:24,(f)22:54,(g)23:24Fig.4 Same as Fig.2, but from 20:30 BT to 23:24 BT 30 July 2018(a) 20:30 BT, (b) 20:54 BT, (c) 21:24 BT, (d) 21:54 BT, (e) 22:24 BT, (f) 22:54 BT, (g) 23:24 BT
3.1.4 2016年7月1日帶狀回波個(gè)例
2016年7月1日15:30的雷達(dá)回波上顯示(圖5),武漢地區(qū)有南北兩塊中心強(qiáng)度超過45 dBz的強(qiáng)回波,北部呈塊狀,南部則呈帶狀,從后期回波的演變來看,北部的塊狀回波緩慢東移,強(qiáng)度減弱,面積變小,南側(cè)的帶狀回波強(qiáng)度和面積無太大變化,但位置略有南壓。從光流法和機(jī)器深度算法的預(yù)報(bào)結(jié)果來看:光流法對(duì)北部回波移動(dòng)的把握較好,預(yù)報(bào)的強(qiáng)回波的位置與實(shí)況基本吻合,但其預(yù)報(bào)的回波強(qiáng)度較實(shí)況略偏強(qiáng),而對(duì)南側(cè)帶狀回波位置預(yù)報(bào)誤差較大,尤其在30 min之后誤差進(jìn)一步增大。而四種機(jī)器學(xué)習(xí)算法均預(yù)報(bào)出了北部塊狀回波在東移過程中強(qiáng)度減弱和面積變小的變化趨勢(shì),而且對(duì)回波強(qiáng)度減弱和面積變小的時(shí)間節(jié)點(diǎn)的預(yù)報(bào)也與實(shí)況幾乎一致,都表現(xiàn)為16:54—17:24回波強(qiáng)度的稍有減弱和面積的稍微變小以及17:24—18:24回波強(qiáng)度的明顯減弱和面積的顯著縮小。此外,機(jī)器學(xué)習(xí)算法對(duì)強(qiáng)回波位置的預(yù)報(bào)也與實(shí)況基本一致,其所預(yù)報(bào)的南北兩塊強(qiáng)回波位置與實(shí)況基本一致,但南側(cè)帶狀回波的面積較實(shí)況稍有偏大。另外,從強(qiáng)度上看,所有算法預(yù)報(bào)的回波強(qiáng)度較實(shí)況都偏弱,其中MIM算法偏弱的最明顯,而CrevNet算法強(qiáng)度最強(qiáng),與實(shí)況最為吻合。
圖5 同圖2,但為2016年7月1日15:30—18:24(a)15:30,(b)15:54,(c)16:24,(d)16:54,(e)17:24,(f)17:54,(g)18:24Fig.5 Same as Fig.2, but from 15:30 BT to 18:24 BT 1 July 2016(a) 15:30 BT, (b) 15:54 BT, (c) 16:24 BT, (d) 16:54 BT, (e) 17:24 BT, (f) 17:54 BT, (g) 18:24 BT
上述四個(gè)不同回波形態(tài)、不同發(fā)展趨勢(shì)個(gè)例的分析結(jié)果表明:光流法由于其“剛體邊界”以及對(duì)非線性運(yùn)動(dòng)的擬合,隨著外推時(shí)間的增長(zhǎng),光流場(chǎng)使得預(yù)報(bào)圖片的形變就越明顯,導(dǎo)致其對(duì)回波位置預(yù)報(bào)誤差較大,尤其在30 min之后這種誤差表現(xiàn)得更加明顯。此外,由于亮度恒定假設(shè)的限制,使得光流法缺乏回波強(qiáng)度變化的預(yù)報(bào)能力。而機(jī)器學(xué)習(xí)算法不僅對(duì)回波運(yùn)動(dòng)的把握能力明顯強(qiáng)于光流法,而且還具備一定回波強(qiáng)度變化的預(yù)報(bào)能力,并且對(duì)回波強(qiáng)度和面積變化趨勢(shì)時(shí)間節(jié)點(diǎn)的預(yù)報(bào)也與實(shí)況基本一致,但所有算法預(yù)報(bào)的回波強(qiáng)度較實(shí)況都偏弱。而造成各種機(jī)器算法預(yù)報(bào)的回波強(qiáng)度偏弱的原因主要有以下兩個(gè)方面:一方面各算法所采用的網(wǎng)絡(luò)結(jié)構(gòu)在提取空間特征的過程中不可避免地存在信息損失,預(yù)報(bào)時(shí)效越長(zhǎng),信息損失得越明顯,從而導(dǎo)致預(yù)報(bào)的回波強(qiáng)度較實(shí)況偏弱;另一方面還可能與損失函數(shù)的設(shè)定有關(guān),由于以MSE為損失函數(shù)平均了整幅圖像的誤差,使得在預(yù)報(bào)的后期時(shí)段像素值趨于平均,導(dǎo)致所預(yù)報(bào)的回波強(qiáng)度偏弱,在視覺上產(chǎn)生逐漸“模糊化”的過程(Zhao et al,2017;陳訓(xùn)來等,2021)。后期將圖像梯度差(gradient difference loss,GDL)引入損失函數(shù)中,進(jìn)行多損失函數(shù)的加權(quán)試驗(yàn)(Nie et al,2018),讓算法更加注重圖像整體結(jié)構(gòu)而忽略局部噪音影響,同時(shí)探索不同預(yù)報(bào)方式的可行性,改進(jìn)算法對(duì)空間信息提取的效果,讓新算法預(yù)報(bào)的圖像更接近實(shí)際的回波強(qiáng)度。
為滿足戶外重大活動(dòng)氣象保障臨近預(yù)報(bào)精細(xì)化服務(wù)的需求,以10 dBz為回波強(qiáng)度閾值,對(duì)622組檢驗(yàn)樣本2 h的平均得分(預(yù)報(bào)時(shí)間間隔為6 min)進(jìn)行再平均(結(jié)果見表2),可以看到四種機(jī)器學(xué)習(xí)算法中,MIM算法的MSE和FAR最低、SSIM最高,表明其對(duì)大多數(shù)回波位置和整體回波形狀的預(yù)報(bào)較其他算法更為準(zhǔn)確;而PredRNN++的POD和CSI最高,表明該算法對(duì)大多數(shù)強(qiáng)度回波預(yù)報(bào)最為準(zhǔn)確。但四種機(jī)器學(xué)習(xí)算法無論是哪種檢驗(yàn)指標(biāo)均要明顯好于光流法,其中SSIM、POD、CSI三種指標(biāo)的提升幅度在3.2%~24.7%,MSE和FAR兩種指標(biāo)降幅在13.1%~43.3%。
表2 平均的MSE、SSIM、POD、FAR和CSITable 2 The average MSE, SSIM, POD, FAR and CSI of algorithms
從各種評(píng)分指標(biāo)隨時(shí)間的演變來看(圖6),在初始的30 min以內(nèi),除CrevNet算法外,其余三種算法和光流法的預(yù)報(bào)能力比較接近,都表現(xiàn)出MSE、FAR的緩慢上升以及SSIM、POD、CSI的緩慢下降,而CrevNet算法的MSE和FAR幾乎持平,甚至略有降低,而且SSIM、POD甚至還略有上升的趨勢(shì),這種差異可能與其特有的結(jié)構(gòu)有關(guān),即CrevNet算法對(duì)預(yù)報(bào)的回波采取預(yù)測(cè)圖像和實(shí)況回波圖像相結(jié)合的策略,即對(duì)于靠前時(shí)刻的回波圖像,它重點(diǎn)考慮輸入的第8~10張實(shí)況回波圖像,而后隨著預(yù)報(bào)時(shí)刻的延長(zhǎng)這種權(quán)重不斷降低。換而言之,在剛開始進(jìn)行預(yù)測(cè)的半小時(shí)內(nèi),由于過分考慮了輸入的第8~10張實(shí)況回波圖像,導(dǎo)致其所預(yù)報(bào)的回波位置出現(xiàn)了較大偏差,因而MSE和FAR較其余算法明顯偏大,POD、SSIM和CSI則明顯偏低,但30 min之后這種權(quán)重減弱顯著,與其他算法表現(xiàn)一致。
圖6 平均的(a)MSE、(b)SSIM、(c)POD、(d)FAR和(e)CSI隨時(shí)間的演變(橫坐標(biāo)為預(yù)報(bào)時(shí)間,預(yù)報(bào)時(shí)效為0~120 min,時(shí)間間隔為6 min)Fig.6 The average evaluation of (a) MSE, (b) SSIM, (c) POD, (d) FAR and (e) CSI(The abscissa axis is forecast time, 0-120 min, the interval is 6 min)
30 min以后,各種機(jī)器學(xué)習(xí)算法和光流法都隨著預(yù)報(bào)時(shí)效的延長(zhǎng),預(yù)報(bào)能力逐步下降,但所有指標(biāo)都顯示機(jī)器學(xué)習(xí)算法較光流法下降得更加緩慢,尤其是60 min以后,光流法的降幅進(jìn)一步增加,而機(jī)器學(xué)習(xí)算法降幅相對(duì)平穩(wěn),兩者之間的差距隨著預(yù)報(bào)時(shí)效的延長(zhǎng)而顯著增加。以MSE為例,30 min 時(shí)光流法與MIM算法的MSE差值為9.43 (dBz)2,到120 min時(shí)兩者之間的MSE差值擴(kuò)大到了11.64 (dBz)2,這與顧建峰等(2020)和陳訓(xùn)來等(2021)的研究結(jié)果一致。此外,四種機(jī)器學(xué)習(xí)算法針對(duì)不同評(píng)分指標(biāo)在不同預(yù)報(bào)時(shí)效內(nèi)的變化趨勢(shì)也不盡相同: MIM算法的MSE、SSIM、POD和FAR在30~120 min內(nèi)變化得最慢;PhyDNet算法的CSI在30~120 min變化最慢;CrevNet算法在30 min內(nèi)的變化與其他算法相比有較大不同,預(yù)報(bào)效果最差,但在30~120 min內(nèi),其和PredRNN++算法在SSIM、POD和FAR上的變化趨勢(shì)幾乎一致,只是CrevNet的CSI下降較PredRNN++稍快。
為了客觀衡量各算法對(duì)于不同強(qiáng)度回波的預(yù)報(bào)能力,進(jìn)行了不同閾值回波的檢驗(yàn)評(píng)估(表3)。整體來看,各算法隨著回波強(qiáng)度的增加,CSI和POD都迅速降低,F(xiàn)AR則陡然上升,但各指標(biāo)下降和上升最快的區(qū)間有一定的差異:CSI和POD在20~30 dBz 的區(qū)間下降最快,而光流法和CrevNet算法的FAR在此區(qū)間上升最快,MIM、PredRNN++和PhyDNet算法則在40~50 dBz 急劇上升。
表3 各算法對(duì)不同閾值回波預(yù)報(bào)的平均評(píng)分表(預(yù)報(bào)時(shí)效2 h,預(yù)報(bào)時(shí)間間隔為6 min)Table 3 The average score table of each algorithm for radar echo prediction with different thresholds (lead time: 2 h, forecast interval: 6 min)
逐個(gè)指標(biāo)來看,PredRNN++算法在所有強(qiáng)度上CSI均表現(xiàn)最佳,MIM、PhyDNet算法對(duì)≥40 dBz回波的預(yù)報(bào)較光流法好,而CrevNet算法則對(duì)≥50 dBz 回波的預(yù)報(bào)較光流法好;對(duì)≥20 dBz、≥30 dBz和≥40 dBz回波預(yù)報(bào),POD得分最高的均為PredRNN++算法,而對(duì)≥50 dBz回波預(yù)報(bào),則是CrevNet算法的POD得分最高;從FAR指標(biāo)檢驗(yàn)來看,≥20 dBz和≥30 dBz回波預(yù)報(bào)得分最低的都為MIM算法,≥40 dBz回波預(yù)報(bào)得分最低則為PhyDNet算法,而PredRNN++算法則對(duì)≥50 dBz回波預(yù)報(bào)的虛警率最低。
本文基于PredRNN++、MIM、CrevNet和PhyDNet四種機(jī)器深度學(xué)習(xí)算法,利用2012年6月1日至2019年12月31日武漢地區(qū)的雷達(dá)和降水資料,以MSE為損失函數(shù),對(duì)武漢地區(qū)雷達(dá)回波臨近預(yù)報(bào)的性能進(jìn)行了初步探討,得到以下主要結(jié)論:
(1)通過622組隨機(jī)樣本的檢驗(yàn)表明:MIM算法的MSE和FAR最低、SSIM最高,PredRNN++的POD和CSI最高。但這四種機(jī)器學(xué)習(xí)算法無論是哪種檢驗(yàn)指標(biāo)均要明顯好于光流法,其中SSIM、POD、CSI三種種指標(biāo)的提升幅度約在3.2%~24.7%,MSE和FAR兩種指標(biāo)降幅約在13.1%~43.3%。
(2)從各指標(biāo)的時(shí)間演變來看:30 min以內(nèi)除CrevNet算法外,PredRNN++、MIM和PhyDNet算法與光流法的預(yù)報(bào)能力較為接近,30 min以后機(jī)器算法和光流法都隨著預(yù)報(bào)時(shí)效的延長(zhǎng),預(yù)報(bào)能力均下降,但機(jī)器學(xué)習(xí)算法較光流法下降得更加緩慢,尤其是60 min以后光流法的降幅進(jìn)一步增加,因此兩者之間的差距進(jìn)一步增大,顯示出機(jī)器學(xué)習(xí)長(zhǎng)預(yù)報(bào)時(shí)效的優(yōu)勢(shì)。此外,機(jī)器學(xué)習(xí)算法之間對(duì)不同評(píng)分指標(biāo)在不同時(shí)段下降速度的反映不盡相同:MIM算法的MSE、SSIM、POD和FAR在30~120 min內(nèi)變化最慢,PhyDNet的CSI在30~120 min變化最慢,CrevNet和PredRNN++算法在SSIM、POD和FAR上幾乎一致,但CrevNet的CSI下降較PredRNN++稍快。
(3)從不同閾值強(qiáng)度回波的評(píng)分來看:Pred-RNN++算法在所有強(qiáng)度上CSI均表現(xiàn)最佳,MIM、PhyDNet算法對(duì)≥40 dBz回波的預(yù)報(bào)較光流法好,而CrevNet則對(duì)≥50 dBz回波的預(yù)報(bào)較光流法好;POD方面,≥20 dBz、≥30 dBz和≥40 dBz回波得分最高的均為PredRNN++算法,≥50 dBz以上則是CrevNet算法;FAR方面,≥20 dBz和≥30 dBz 回波得分最低的都為MIM算法,≥40 dBz最低則為PhyDNet,≥50 dBz最低則為PredRNN++。
(4)四個(gè)不同回波形態(tài)、不同發(fā)展趨勢(shì)個(gè)例的分析結(jié)果表明:光流法由于其固有缺陷,對(duì)回波強(qiáng)度的變化缺乏預(yù)報(bào)能力,并且30 min以后對(duì)回波移速和移向的估計(jì)也出現(xiàn)明顯偏差,而且這種偏差隨著預(yù)報(bào)時(shí)效的增長(zhǎng)不斷增加,最終導(dǎo)致其所預(yù)報(bào)的回波位置與實(shí)況的誤差越來越大,而機(jī)器學(xué)習(xí)算法不僅對(duì)回波運(yùn)動(dòng)的把握能力明顯強(qiáng)于光流法,而且還具備一定回波強(qiáng)度變化的預(yù)報(bào)能力,并且對(duì)回波強(qiáng)度和面積變化趨勢(shì)時(shí)間節(jié)點(diǎn)的預(yù)報(bào)也與實(shí)況基本一致,但所有算法預(yù)報(bào)的回波強(qiáng)度較實(shí)況都偏弱。
(5)就四種機(jī)器學(xué)習(xí)算法而言:MIM算法對(duì)大多數(shù)回波的位置和整體回波形狀的把握最好,Pred-RNN++算法對(duì)大多數(shù)強(qiáng)度回波預(yù)報(bào)最為準(zhǔn)確,CrevNet算法對(duì)50 dBz以上強(qiáng)回波的預(yù)報(bào)能力最強(qiáng),但MIM、PhyDNet和PredRNN++算法所預(yù)報(bào)的回波強(qiáng)度較實(shí)況明顯偏弱,尤其是MIM偏弱得非常顯著,而CrevNet則最強(qiáng)與實(shí)況強(qiáng)度最為接近,但其強(qiáng)回波范圍較實(shí)況略偏大。
雖然機(jī)器深度學(xué)習(xí)算法較光流法表現(xiàn)出一定程度的優(yōu)勢(shì),但也存在一些問題:首先,從時(shí)間演變來看,機(jī)器學(xué)習(xí)算法預(yù)測(cè)的回波在60 min之后逐漸開始“霧化”,這種“模糊化”作用會(huì)讓小面積的最強(qiáng)回波被平滑掉,并“泛化”出較大的次強(qiáng)回波的范圍,因此在業(yè)務(wù)應(yīng)用過程中,對(duì)于60 min后,尤其是90 min 后,機(jī)器學(xué)習(xí)預(yù)報(bào)出回波面積顯著增大的區(qū)域,需要特別警惕降水區(qū)域可能有顯著的變化。此外,這種過度平滑的回波預(yù)報(bào)圖像將會(huì)對(duì)機(jī)器算法的檢驗(yàn)評(píng)分也產(chǎn)生一定程度的影響,比如對(duì)于一個(gè)實(shí)況上回波強(qiáng)度明顯減弱的個(gè)例,將導(dǎo)致其評(píng)分偏高,而對(duì)于一個(gè)實(shí)況上回波強(qiáng)度明顯增強(qiáng)的個(gè)例,又將導(dǎo)致其評(píng)分偏低,而具體定量的影響則可能與各算法對(duì)回波強(qiáng)度整體的平滑程度、檢驗(yàn)樣本中不同的回波強(qiáng)度演變趨勢(shì)個(gè)例的占比等因素有關(guān)。其次,由于大多數(shù)雷暴的平均生命期僅為30 min,對(duì)于生命期短于這個(gè)時(shí)間的雷暴,外推預(yù)報(bào)的意義不大(俞小鼎等,2012),只有對(duì)那些生命期較長(zhǎng)的對(duì)流系統(tǒng),外推預(yù)報(bào)才具有意義。最后,僅基于雷達(dá)回波的外推預(yù)報(bào)仍具有一定的局限性,快速更新循環(huán)同化預(yù)報(bào)的高分辨率中尺度數(shù)值模式與不斷發(fā)展的外推技術(shù)的融合將是未來臨近預(yù)報(bào)的發(fā)展方向(王丹等,2014)。