国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于深度學習的臺風強度估測技術(shù)*

2021-06-21 07:37:48錢奇峰徐雅靜周冠博聶高臻
氣象 2021年5期
關(guān)鍵詞:利奇馬云圖臺風

錢奇峰 王 川 徐雅靜 周冠博 劉 達 聶高臻

1 國家氣象中心,北京 100081 2 北京郵電大學,北京 100876

提 要:臺風客觀定強是提高臺風業(yè)務(wù)現(xiàn)代化水平的重要支撐技術(shù),深度學習通過機器對大量樣本的分析和學習,能夠隱式提取圖像中深層抽象的復雜特征,越來越多地被應(yīng)用到氣象領(lǐng)域中。本文利用ResNet深度學習模型,采用預(yù)訓練后遷移學習的方式,以2005—2018年西北太平洋及南海臺風的衛(wèi)星云圖為樣本,構(gòu)建了一種自動、客觀的臺風強度估測技術(shù)。通過對2019年全年的業(yè)務(wù)臺風云圖的檢驗分析,結(jié)果表明利用該技術(shù)能夠?qū)崿F(xiàn)對不同強度、不同發(fā)展階段的臺風客觀強度估測,且對2019年全年獨立樣本估測的平均絕對誤差和均方根誤差分別為4.3 m·s-1和5.5 m·s-1,精度優(yōu)于傳統(tǒng)客觀定強方法,具有一定的業(yè)務(wù)應(yīng)用價值。

引 言

由于臺風一般生成于開闊洋面,而海洋上觀測資料稀少,特別是在臺風進入雷達有效探測范圍之前,臺風的監(jiān)測主要依靠氣象衛(wèi)星探測來完成。因此在臺風業(yè)務(wù)預(yù)報實踐中,衛(wèi)星云圖就成為了確定臺風強度的最主要的依據(jù),而如何通過衛(wèi)星云圖更準確地估測臺風強度也就成為了尤為重要的課題。

這方面,目前世界氣象組織(World Meteorological Organization,WMO)推薦使用的方法為20世紀70年代美國國家海洋和大氣管理局(National Oceanic and Atmospheric Administration,NOAA)的Dvorak(1975)在統(tǒng)計經(jīng)驗的基礎(chǔ)上建立的基于臺風云型特征的臺風強度估測技術(shù)。而經(jīng)過多年業(yè)務(wù)實踐,Dvorak方法也已成為各國官方機構(gòu)最常使用的臺風主觀定強方法(許映龍等,2015)。Dvorak方法的缺點是在云特征指數(shù)的確定方面存在較大主觀性,準確率依賴預(yù)報員的經(jīng)驗和訓練,因此國外一些學者提出了客觀Dvorak方法,從而減少人工操作、提高自動化程度,如ODT(objective Dvorak technique;Velden et al,1998)和AODT(advanced objective Dvorak technique;Olander and Velden,2007)等方法,其中AODT一直在被不斷改進并在國外進行業(yè)務(wù)應(yīng)用。

我國早在20世紀80年代就開始探索利用衛(wèi)星云圖確定臺風強度(方宗義和周連翔,1980;范蕙君等,1990),并制定了臺風強度確定的技術(shù)流程,在業(yè)務(wù)中發(fā)揮了重要作用。2010年以后,中央氣象臺開始在業(yè)務(wù)中使用WMO推薦的Dvorak技術(shù)版本進行臺風定強(許映龍等,2015),進一步提高了我國臺風定強精度以及與其他業(yè)務(wù)中心的可比性。在客觀定強方面,也有不少國內(nèi)學者取得一定進展,如魯小琴等(2014)利用熱帶云團對流核的相關(guān)特征,建立了估測臺風強度的方法,估算精度能與Dvorak方法接近。

近年來,隨著人工智能學科的廣泛應(yīng)用,由于其在圖像識別方面的優(yōu)勢,如何將深度學習技術(shù)應(yīng)用于氣象領(lǐng)域的臺風定強研究,受到越來越多的關(guān)注。美國最先開展了相關(guān)研究工作。Pradhan et al(2018)使用基于多層深度CNN(convolutional neural network)對臺風等級進行估計,僅使用遙感云圖就取得了超過當時公認最好方法的準確率和均方根誤差值(RMSE);在德國,Zahera et al(2019)使用LSTM(long short-term memory)和DNN(deep neural network)對臺風強度進行估計, 結(jié)合臺風發(fā)生時的社會媒體信息,提升了對災(zāi)難性天氣的強度估計。在臺灣,Chen et al(2018)發(fā)布了一個開放數(shù)據(jù)集,提出了基于CNN強度回歸的多模型融合方法,證明了深度學習技術(shù)在氣象學研究中具有巨大的應(yīng)用潛力。Tian et al(2019)使用分類和回歸神經(jīng)網(wǎng)絡(luò)對臺風強度進行更加精細的劃分,證明了深度學習技術(shù)對熱帶氣旋(TC)強度估計能力的提升。張淼等(2017)利用FY-3C微波溫度計通道特征與臺風強度建立統(tǒng)計關(guān)系估計熱帶氣旋強度,并開展了嘗試性的研究。越來越多的研究成果表明,運用深度學習技術(shù)解決臺風定強問題具有巨大的應(yīng)用前景(Combinido et al,2018;鄒國良等,2019)。然而,由于這些工作多為針對大西洋或東太平洋颶風,使用的強度標簽(真值)也都采用美國或日本發(fā)布的最佳路徑。已有研究表明,采用不同機構(gòu)的最佳路徑作為實況參考會對臺風強度誤差評定結(jié)果產(chǎn)生較大的影響(陳國民等,2019)。因此本文將基于更匹配我國臺風業(yè)務(wù)的中國氣象局臺風最佳路徑集,采用目前人工智能領(lǐng)域最新發(fā)展的ResNet深度學習模型,構(gòu)建一種自動、客觀的臺風強度估測技術(shù),以期為我國臺風業(yè)務(wù)提供應(yīng)用。

1 深度學習模型簡介

2015年He et al(2016)提出了ResNet,在計算機視覺(CV)領(lǐng)域的頂級賽事ImageNet比賽中獲得第一名,之后CV領(lǐng)域的很多方法都建立在ResNet的基礎(chǔ)上完成,檢測、分割、識別等領(lǐng)域都紛紛使用ResNet。ResNet深度網(wǎng)絡(luò)的優(yōu)勢為允許原始輸入信息直接傳到后面的層中,將在一定程度上彌補傳統(tǒng)的卷積網(wǎng)絡(luò)或者全連接網(wǎng)絡(luò)的缺陷,比如在信息傳遞的時候或多或少會存在信息丟失、信息損耗,隨著深度增加導致梯度消失或者梯度爆炸等問題。具體解決的方法就是通過ResNet網(wǎng)絡(luò)的殘差結(jié)構(gòu)(圖1),直接將輸入信息旁路傳到輸出,保護信息的完整性,整個網(wǎng)絡(luò)只需要學習輸入、輸出差別的那一部分,簡化學習目標和難度。

圖1 ResNet的殘差學習模塊

圖1中:x表示輸入,F(xiàn)(x)表示殘差塊在第二層激活函數(shù)之前的輸出,即F(x)=W2σ(W1x),其中W1和W2表示第一層和第二層的權(quán)重,σ表示修正線性單元(rectified linear unit,ReLU)的激活函數(shù)。最后殘差塊的輸出是σ[F(x)+x]。

由于ResNet的這一優(yōu)點,首先使用ResNet50深度學習模型,在ImageNet(Deng et al,2009)數(shù)據(jù)集上進行訓練,使其具有識別物體的基本能力,然后在最后兩個卷積層進行遷移學習,這種做法被稱為預(yù)訓練模型(Russakovsky et al,2015;He et al,2019)。其中,模型最后一層卷積經(jīng)過平均池化生成2 048維的特征向量,代表了經(jīng)過深度學習之后與臺風強度有關(guān)的云圖特征,該特征向量再通過一個softmax分類器,按照1 m·s-1的間隔輸出預(yù)測強度及相應(yīng)的概率(圖2)。

圖2 ResNet50深度學習模型示意圖

2 強度估測模型的構(gòu)建

本文中所有試驗均基于RedHat EL 7.6系統(tǒng),模型使用TensorFlow深度學習框架,通過CUDA與cuDNN利用NVIDIA Tesla T4 GPU加速模型訓練。采用的集成開發(fā)環(huán)境為Anaconda,由Python語言編寫而成。

2.1 深度學習數(shù)據(jù)集準備

建模所用的資料包括2005—2018年西北太平洋及南海臺風衛(wèi)星云圖(http:∥weather.is.kochi-u.ac.jp/sat/GAME),水平分辨率為0.05°,根據(jù)中國氣象局《熱帶氣旋年鑒》熱帶氣旋最佳路徑資料(http:∥tcdata.typhoon.org.cn/zjljsjj_zlhq.html),截取對應(yīng)時刻臺風中心400×400像素的云圖(約2 000 km×2 000 km),并按照最佳路徑臺風強度標注標簽,共計15 730張臺風云圖,作為深度學習數(shù)據(jù)樣本集。

樣本集數(shù)據(jù)的風速分布情況如圖3所示,可以看到各個風速的分布并不是均勻的,其中以18、20、23和25 m·s-1等風速樣本最多,而較小風速(<15 m·s-1)和較高風速(>65 m·s-1)的樣本數(shù)明顯偏少。因此,本文使用了機器學習中較常用的數(shù)據(jù)增強技術(shù)(Pradhan et al,2018)進行一定程度的改善,即對云圖采用臺風圖像進行90°、180°和270°的旋轉(zhuǎn)處理,通過數(shù)據(jù)增強技術(shù)增加臺風樣本數(shù)量。另外,個別風速的樣本即使經(jīng)過數(shù)據(jù)增強后仍然較少,如21、22、27和32 m·s-1等風速的樣本,我們將其剔除出樣本集,最終形成深度學習模型的數(shù)據(jù)集。

圖3 樣本集中各風速的樣本數(shù)目

為了保證模型能對所有風速的臺風云圖特征進行學習,將每種風速均按7∶3的比例分配形成深度學習模型訓練集和測試集,其中訓練集用來訓練模型,測試集用來檢驗?zāi)P偷膶W習效果。值得注意的是,旋轉(zhuǎn)后的圖像需和原始圖像位于同一個圖像集,即若原圖像存在于訓練集,那么由其旋轉(zhuǎn)得到的圖像也應(yīng)存在于訓練集。最終訓練集共有12 550個×4=50 200個樣本,測試集共有3 138個×4=12 552個樣本。

2.2 模型訓練流程

在ResNet深度學習網(wǎng)絡(luò)的訓練過程中,主要是通過更新網(wǎng)絡(luò)中的每一個權(quán)重,使得最終的輸出接近于真實標簽值,即將整個網(wǎng)絡(luò)的誤差作為一個整體進行了最小化,從而使模型逐步擬合訓練集。ResNet網(wǎng)絡(luò)包含大量的參數(shù),準備的訓練數(shù)據(jù)集樣本量對于有50層的ResNet深度學習網(wǎng)絡(luò)建模而言是遠遠不夠的,而在小數(shù)據(jù)集上訓練會導致過度擬合,并極大地影響泛化能力。

因此,選擇在預(yù)訓練模型上進行遷移學習,即使用訓練數(shù)據(jù)集提供給最后兩個卷積層進行針對性學習,從而大大提高樣本的使用率,降低學習成本。訓練流程為:先使用訓練集的圖像和對應(yīng)的強度信息不斷地調(diào)整預(yù)訓練網(wǎng)絡(luò)的權(quán)重,最終使得模型的輸出與真實強度值間的差異最小。模型訓練的難點在于臺風強度相近的圖像差別非常小,人眼難以辨別。而模型要通過學習相似圖像間的微小差別來判定不同的類別,需要不斷地更新模型的權(quán)重,多次微調(diào)和測試不同的模型參數(shù)。

2.3 建模檢驗指標

模型的精確度通過正確率檢驗,假設(shè)在n個樣本中第i個樣本的真值標簽為Oi,模型估測標簽為Si,則模型分類的正確率可以表示為:

(1)

式中表示當模型的輸出和真實風速值完全一致時才被認為是準確的(例如真實風速值為48 m·s-1,那么只有模型輸出也是48 m·s-1,被認為是該樣本估測正確)。圖4給出了訓練過程中訓練集和測試集的準確率變化情況,其中藍色代表訓練集上的準確率曲線,橙色代表測試集上的準確率變化情況??梢钥吹?,隨著網(wǎng)絡(luò)訓練次數(shù)不斷增加,訓練集的正確率一直在提升并趨近于1(接近1代表模型過擬合),而測試集的正確率當訓練次數(shù)達到300次以后就趨于穩(wěn)定,達到58%左右。因此,將訓練300次后的ResNet模型參數(shù)確定為訓練完成的模型。

圖4 訓練集與測試集的準確率曲線

2.4 建模測試結(jié)果分析

為了檢驗?zāi)P托Ч?,這里利用訓練完成的模型對測試集3 138個原始云圖樣本(對比表明,旋轉(zhuǎn)后的樣本估測結(jié)果與原樣本相同)的估測結(jié)果進行了分析。一般來講,softmax分類器輸出的最大概率對應(yīng)的強度即為模型估測結(jié)果,但是也注意到模型輸出除了第一猜值以外,還有其余可能值及相應(yīng)概率。經(jīng)過比較(表1),其中第一猜值(TOP1)的平均概率為75.3%,前兩位猜值(TOP2)累計平均概率為88.8%,TOP3的累計概率就達到了94.2%,其余分類值的概率占比已經(jīng)很小,可以忽略不計。

這里使用模型輸出結(jié)果進行了三組對比分析,如式(2)所示,Ui為模型估測的第i個猜值風速,λi為第i個猜值風速相應(yīng)的概率。TOP1代表使用模型輸出的第一猜值作為對測試樣本的定強結(jié)果,TOP2代表使用前兩位猜值按概率進行加權(quán)平均后的強度值作為定強結(jié)果,同理可算得TOP3的強度值,見式(2),結(jié)果如表1??梢?,使用TOP3得到的樣本估測強度的平均絕對誤差(MAE)和RMSE分別為2.385 m·s-1和3.523 m·s-1,相比于TOP1和TOP2都較小,反映了更好的估測效果。

表1 ResNet模型輸出結(jié)果TOP1~TOP3的累計概率及其MAE和RMSE比較

TOPi=∑(Ui·λi)/∑λi(i=1,2,3)

(2)

3 實時檢驗分析

由于期望模型最終能在業(yè)務(wù)上應(yīng)用,但建模數(shù)據(jù)與實際業(yè)務(wù)數(shù)據(jù)總是存在一定差異,而目前業(yè)務(wù)使用的衛(wèi)星數(shù)據(jù)有我國的FY-4A衛(wèi)星和日本葵花8號衛(wèi)星,不同衛(wèi)星的臺風云圖亮溫值也存在微小的差異??紤]到葵花8號衛(wèi)星的范圍較好覆蓋了西北太平洋所有的臺風,因此這里準備了2019年西北太平洋及南海全年臺風的云圖(數(shù)據(jù)來源于業(yè)務(wù)接收的葵花8號衛(wèi)星),經(jīng)過挑選與最佳路徑定強對應(yīng)時刻的云圖,共計596個樣本,包含了2019年西北太平洋和南海的29個臺風。然后利用上文訓練好的深度學習模型對這些樣本云圖進行定強,用來檢驗?zāi)P蛯嶋H業(yè)務(wù)中全新未知樣本的估測能力,以此評估其業(yè)務(wù)應(yīng)用的前景。

3.1 2019年模型定強性能分析

這里將2019年的云圖樣本按照最佳路徑定強分成7~17級以上共12個風速等級(表2),共包含了588個樣本(另有8個6級的風速樣本未包含),其中8~9級(熱帶風暴級)的樣本數(shù)最多,之后隨著風速增長,樣本數(shù)基本逐漸減少,這與圖3給出的建模樣本的風速分布較為相似。

表2 模型對2019年云圖臺風樣本的強度估計分析

首先,從強度估計的最大、最小值和中位數(shù)來看,隨著臺風實際風速的增長,這三個特征值也總體呈增長趨勢,表明模型對不同強度的臺風云圖有一定的識別能力,但從模型估測的最小至最大強度跨度來看均較大,也表明模型估測中對一些樣本存在較大偏差,在實際應(yīng)用中需要加以注意。進一步,從中位數(shù)與各級風的風速范圍比較來看,比如模型對7級樣本的估測值的中位數(shù)為8級(18.5 m·s-1),說明對此類樣本,模型強度估測略偏強;而模型對8~11級樣本的估測則沒有明顯的偏差;對更高風級的樣本(12級及以上),模型估測結(jié)果略有偏弱。

其次,從各風級樣本的MAE和RMSE來看,模型對8~9級的樣本估測效果最好,其MAE和RMSE都是最小的,其中對8級樣本MAE為2.8 m·s-1、對9級樣本MAE為3.3 m·s-1,其強度估測能力基本達到了可以業(yè)務(wù)參考的水平。而模型對13~16級的樣本的估測效果相對較差,估測MAE在5 m·s-1以上,其中13級樣本MAE達到了6.3 m·s-1,對15級樣本MAE也達到了6.2 m·s-1,業(yè)務(wù)上對這類臺風需要預(yù)報員加強主觀分析。此外,在2019年的樣本中,17級和17級以上的樣本個數(shù)均不超過10個,模型對這類較強臺風的強度估測能力,尚需要更多的實時資料驗證。

表2最后也給出了ResNet模型對2019年全年樣本強度估測的MAE和RMSE,分別為4.3 m·s-1和5.5 m·s-1,對比Pradhan et al(2018)利用深度CNN模型對大西洋68個TC和太平洋30個TC共8 138張云圖強度估測的結(jié)果(RMSE約為5.84 m·s-1),ResNet模型結(jié)果與之相比略有優(yōu)勢。另外,對比傳統(tǒng)的統(tǒng)計學方法對云圖進行強度估測的方法(魯小琴等,2014),其獨立樣本的MAE和RMSE分別為5.9 m·s-1和7.7 m·s-1,本文的ResNet模型也有比較明顯的優(yōu)勢。

3.2 個例分析

1909號臺風利奇馬是2019年登陸我國最強的臺風,給華東及環(huán)渤海等地造成了嚴重風雨影響,“利奇馬”于8月4日生成,10日在浙江省以超強臺風級別登陸,隨后北上于13日前后減弱消失。

圖5給出了“利奇馬”全過程ResNet模型根據(jù)云圖估計的臺風強度與最佳路徑強度??傮w而言,模型對臺風各個階段強度的估計與實際變化均比較一致。在臺風增強階段,對臺風在8月6日12時之前的強度估計略有偏弱。在臺風發(fā)展階段,能較好識別出臺風在7日快速增強的過程,對臺風峰值強度估計亦較為準確,特別是較為準確地估測出了“利奇馬”在8日和9日的兩次強度峰值。隨后,10日當臺風受陸地影響開始減弱,此時模型對臺風強度變化存在一定的高估,也是整個臺風期間模型估計偏差最大的階段,表明ResNet模型對臺風剛登陸后的快速減弱階段強度估計偏強。最后,在臺風深入內(nèi)陸的階段,雖然臺風較弱,但模型對臺風強度的估計與實況基本吻合。經(jīng)計算,模型對1909號臺風利奇馬強度估計的MAE為3.5 m·s-1,RMSE為4.5 m·s-1。

圖5 ResNet模型對2019年8月臺風利奇馬模型估計的強度(綠點線)與最佳路徑定強(彩色臺風符號)比較

圖6給出了ResNet模型對臺風利奇馬三個不同時刻云圖的強度估計結(jié)果,其中圖6a為“利奇馬”達到峰值強度(62 m·s-1)時的云圖,模型認為該時刻臺風強度為60 m·s-1的概率為86%,65 m·s-1的概率為7%以及55 m·s-1的概率為4%(該樣本TOP3的概率已經(jīng)近似為100%),最終模型加權(quán)平均后給出60.2 m·s-1的強度估計,與最佳路徑定強非常接近。圖6b為“利奇馬”達到巔峰強度后的維持階段,與圖6a比,云型發(fā)生較大的變化,云系從南北較為對稱變成了南少北多,臺風眼也逐漸開始填塞,此時模型給出的強度估計(52.3 m·s-1)與最佳路徑強度(48 m·s-1)相比略有偏強。值得注意的是,該時刻模型TOP3的概率分別為37%、22%和22%,說明模型判斷時認為最可能的三個估測強度(55、48和52 m·s-1)不相伯仲,因此這一階模型對臺風結(jié)構(gòu)調(diào)整期間云型的變化非常敏感,強度估測容易出現(xiàn)波動。圖6c是“利奇馬”深入內(nèi)陸后(8月11日00 UTC)的云圖,此時臺風云型松散,中心空心明顯,但模型估計結(jié)果為24.4 m·s-1,與業(yè)務(wù)定強基本一致。

圖6 2019年8月(a)8日1200 UTC,(b)9日12 UTC,(c)11日00 UTC ResNet模型對臺風利奇馬云圖的強度估計結(jié)果

4 結(jié)論與討論

本文利用ResNet50預(yù)訓練深度學習網(wǎng)絡(luò),建立了一種基于紅外衛(wèi)星云圖的臺風定強模型,能夠僅根據(jù)紅外云圖估測出臺風強度,主要結(jié)論如下:

(1)在深度學習模型訓練數(shù)據(jù)準備中,對臺風圖像進行90°、180°及270°旋轉(zhuǎn)等處理的數(shù)據(jù)增強技術(shù),能夠增加臺風樣本數(shù)量,并一定程度上改善樣本數(shù)據(jù)不均衡。

(2)在模型訓練中,隨著網(wǎng)絡(luò)訓練次數(shù)不斷增加,訓練集的準確率一直在提升,但測試集的準確率在300次以后趨于穩(wěn)定,最終測試集準確率能達到58%左右。

(3)利用該模型能夠?qū)崿F(xiàn)對不同強度、不同發(fā)展階段的臺風強度估測,且對2019年獨立樣本估測的MAE和RMSE分別為4.3 m·s-1和5.5 m·s-1,精度與國際水平相當,并優(yōu)于傳統(tǒng)統(tǒng)計方法。

該模型已經(jīng)于2019年在中央氣象臺進行了業(yè)務(wù)測試,并當我國責任海區(qū)有編號臺風時,實時給出當前臺風的客觀強度估測供預(yù)報員作為定強參考。從檢驗結(jié)果來看,模型基本能夠刻畫臺風增強、維持到減弱各個階段的強度變化,對預(yù)報員臺風定強有一定的參考價值。不足之處是由于模型在強度估測時僅利用了單幀臺風云圖,同一個臺風相鄰時刻的估測結(jié)果有時會有較大差異,這將影響業(yè)務(wù)應(yīng)用效果。因此,在下一步工作中將嘗試利用多張云圖改進模型,繼續(xù)提高強度估測精度。

猜你喜歡
利奇馬云圖臺風
臺風過韓
臺風來了
小讀者(2020年4期)2020-06-16 03:33:46
成都云圖控股股份有限公司
迎戰(zhàn)抗擊臺風“利奇馬” 全力確保上海安全運行
淮委防御超強臺風“利奇馬”
治淮(2019年9期)2019-10-09 07:24:52
山東煤炭系統(tǒng)救援搶險,全力應(yīng)戰(zhàn)“利奇馬”
全媒體時代災(zāi)難報道的創(chuàng)新實踐——以溫州日報“利奇馬”臺風報道為例
傳媒評論(2019年10期)2019-06-05 09:25:58
臺風愛搗亂
黃強先生作品《雨后松云圖》
名家名作(2017年3期)2017-09-15 11:13:37
臺風來時怎樣應(yīng)對
会东县| 望奎县| 洛宁县| 兴国县| 上虞市| 大连市| 五家渠市| 调兵山市| 雅安市| 林州市| 军事| 怀远县| 北碚区| 吉木乃县| 阜阳市| 曲沃县| 上杭县| 开平市| 锦屏县| 萨嘎县| 合水县| 什邡市| 平凉市| 合川市| 桃江县| 长葛市| 虹口区| 谢通门县| 大冶市| 株洲市| 中阳县| 紫阳县| 芜湖市| 延长县| 忻州市| 响水县| 吐鲁番市| 深圳市| 中山市| 万宁市| 涟源市|