国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)的大霧天氣背景下特強(qiáng)濃霧本地化診斷研究*

2018-04-12 06:08史達(dá)偉史逸民張銀意
災(zāi)害學(xué) 2018年2期
關(guān)鍵詞:濃霧大霧連云港

史達(dá)偉,李 超,史逸民,張銀意

(1.江蘇省連云港市氣象局,江蘇 連云港 222006;2.江蘇省氣象臺(tái),江蘇 南京 210008)

大霧是一種近地面局地性很強(qiáng)的低能見(jiàn)度天氣現(xiàn)象,在華東地區(qū)四季均可見(jiàn),多發(fā)生在冬季,能夠?qū)Υ哼\(yùn)期間的交通狀況產(chǎn)生嚴(yán)重影響[1],是重要的自然災(zāi)害之一。大霧天氣已被氣象部門(mén)列入需要發(fā)布預(yù)警信息的重要?dú)庀鬄?zāi)害。

目前大霧天氣的預(yù)報(bào),常常是由科研業(yè)務(wù)人員對(duì)發(fā)生大霧的天氣特征與氣候特征進(jìn)行總結(jié)歸納,建立經(jīng)驗(yàn)預(yù)報(bào)模型,具有較強(qiáng)的主觀性[2-3],亦或是通過(guò)數(shù)值天氣預(yù)報(bào)模式進(jìn)行預(yù)測(cè),但模式對(duì)于霧的預(yù)測(cè)效果并不能滿足社會(huì)發(fā)展需求。周自江等人對(duì)長(zhǎng)三角地區(qū)濃霧事件進(jìn)行了氣候特征分析,發(fā)現(xiàn)仲秋至翌年仲春為濃霧多發(fā)季[4]。吳彬貴等人的研究表明,濃霧的發(fā)生往往伴隨著近地面逆溫、微風(fēng)以及水汽輻合[5]。大霧天氣是一種災(zāi)害性天氣現(xiàn)象,且具有很強(qiáng)的局地性[6-7],即在大霧天氣發(fā)生時(shí),相似的氣象條件在不同的地理環(huán)境中有可能產(chǎn)生不同強(qiáng)度的霧。利用主觀的角度診斷大霧天氣發(fā)生時(shí)的天氣特征(溫度、氣壓、濕度、風(fēng)向、風(fēng)速)很難準(zhǔn)確把握不同地理環(huán)境的大霧強(qiáng)度,尤其對(duì)于能見(jiàn)度小于50 m的特強(qiáng)濃霧。對(duì)特強(qiáng)濃霧的準(zhǔn)確預(yù)測(cè)具有重要現(xiàn)實(shí)意義,目前對(duì)特強(qiáng)濃霧的發(fā)生發(fā)展問(wèn)題的探討和研究相對(duì)較少,對(duì)于強(qiáng)濃霧的微物理研究相對(duì)較多,許多研究成果表明,飽和環(huán)境與輻射降溫是霧滴增長(zhǎng)的主要因素[8-13]。Choularton 等的研究表明僅靠輻射冷卻不能產(chǎn)生大的霧滴[14]??蒲袠I(yè)務(wù)人員判斷是否有霧時(shí),難以定性地預(yù)報(bào)出霧的強(qiáng)度,尤其是影響程度最強(qiáng)的特強(qiáng)濃霧。

機(jī)器學(xué)習(xí)是人工智能領(lǐng)域的重要分支。國(guó)內(nèi)外越來(lái)越多的學(xué)者將機(jī)器學(xué)習(xí)技術(shù)應(yīng)用于氣象的業(yè)務(wù)科研領(lǐng)域。Zhang等[15-16]利用C4.5算法對(duì)西北太平洋臺(tái)風(fēng)是否登陸與是否轉(zhuǎn)向做出了預(yù)測(cè)準(zhǔn)確的模型;史達(dá)偉等人[17]利用決策樹(shù)算法對(duì)道路結(jié)冰建立了準(zhǔn)確的預(yù)測(cè)模型;Geng等人[18]利用有限混合模型算法及分類(lèi)與回歸樹(shù)算法對(duì)于登陸中國(guó)熱帶氣旋進(jìn)行了路徑分類(lèi)及頻數(shù)的預(yù)測(cè),達(dá)到了較好的預(yù)測(cè)效果;David A等人[19]利用Random Forest(RF)算法基于雷達(dá)資料、衛(wèi)星資料以及模式輸出資料建立了中尺度對(duì)流系統(tǒng)(MCS)的預(yù)報(bào)模型。機(jī)器學(xué)習(xí)在大霧研究中的應(yīng)用也日益廣泛,近十幾年來(lái),越來(lái)越多的學(xué)者利用支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等算法對(duì)大霧的預(yù)測(cè)與診斷進(jìn)行建模,并且收獲了較好的效果[20-22],然而目前對(duì)于算法間效果探討和比較的文章仍然很少。

鑒于以上背景,本文擬從機(jī)器學(xué)習(xí)的角度去研究分析能見(jiàn)度低于50 m的特強(qiáng)濃霧,希望能找出一些規(guī)律,對(duì)解決這一業(yè)務(wù)和科研難點(diǎn)有所助益。文章以連云港地區(qū)為例,利用機(jī)器學(xué)習(xí)中幾種經(jīng)典的有監(jiān)督算法(CART、SVM、ANN)對(duì)大霧天氣發(fā)生背景下的能見(jiàn)度低于50 m的特強(qiáng)濃霧建立基于氣象觀測(cè)要素的診斷模型。絕大多數(shù)機(jī)器學(xué)習(xí)算法都是“黑箱”算法,為了能夠簡(jiǎn)單直觀描述特強(qiáng)濃霧的診斷模型,本文以算法復(fù)雜度較低但可理解程度較高的CART算法為例重點(diǎn)展開(kāi)討論。

1 資料與方法

1.1 資料來(lái)源

本文利用機(jī)器學(xué)習(xí)對(duì)特強(qiáng)濃霧進(jìn)行研究,考慮到算法對(duì)于數(shù)據(jù)質(zhì)量要求較高,文章選取2014年1月1日至2016年12月31日的連云港58044站逐小時(shí)自動(dòng)觀測(cè)資料,較2014年以前的1d人工觀測(cè)四次的氣象觀測(cè)數(shù)據(jù)而言,該套資料具有觀測(cè)密度高,數(shù)據(jù)質(zhì)量較好的特點(diǎn)。為了研究大霧天氣發(fā)生背景下特強(qiáng)濃霧的氣象觀測(cè)要素的特征,文章選取能見(jiàn)度小于1 km時(shí)段,相對(duì)濕度 ≥ 90% 的逐小時(shí)觀測(cè)資料,選取氣溫、氣壓、相對(duì)濕度、風(fēng)速、風(fēng)向、降水、0 cm地表溫度及能見(jiàn)度等觀測(cè)要素。

1.2 CART算法的基本原理

分類(lèi)與回歸樹(shù)(CART)算法,由Breinman等人提出,是機(jī)器學(xué)習(xí)中的一種有監(jiān)督的分類(lèi)算法[23]。該算法是一種二叉樹(shù)非參數(shù)機(jī)器學(xué)習(xí)算法,適用于離散型變量和連續(xù)型變量的分類(lèi)。若目標(biāo)屬性是離散型變量,那么CART算法生成分類(lèi)樹(shù);若目標(biāo)屬性是連續(xù)型變量,則CART算法生成回歸樹(shù),本文運(yùn)用的是CART的分類(lèi)樹(shù)算法。在分類(lèi)樹(shù)的構(gòu)建中CART選擇最小Gini系數(shù)的屬性作為測(cè)試屬性,Gini系數(shù)越小,樣本的純度越大,分割效果越好。

CART算法首先將數(shù)據(jù)按升序排序,從小到大以相鄰數(shù)值的中間值將樣本分為兩組,然后通過(guò)Gini系數(shù)計(jì)算兩組樣本中輸出變量取值純度:

(1)

式中:t為節(jié)點(diǎn),K為輸出變量的類(lèi)別數(shù),p(j|t)為節(jié)點(diǎn)t樣本輸出變量取j的概率。當(dāng)節(jié)點(diǎn)樣本為同一類(lèi)別值時(shí),輸出變量取值的差異性最小,Gini系數(shù)為0,而當(dāng)各類(lèi)別概率相等時(shí),輸出變量取值差異性最大,Gini系數(shù)也最大,為1-1/k。

CART算法利用Gini系數(shù)的減少量描述純度的提升:

(2)

式中:G(t)和N分別為分組前輸出變量的Gini系數(shù)和樣本量,G(tr)、Nr和G(tl)、Nl分別分組后右子樹(shù)的Gini系數(shù)和樣本量及左子樹(shù)的Gini系數(shù)和樣本量。

按照這種方式,反復(fù)計(jì)算便可得到純度提升最多的分割點(diǎn),即使ΔG(t)達(dá)到最大的組限為當(dāng)前最佳分割點(diǎn)。

CART算法是一種經(jīng)典的決策樹(shù)算法,算法結(jié)果為一顆展示邏輯判斷的倒置樹(shù)形圖(根節(jié)點(diǎn)在樹(shù)頂,葉節(jié)點(diǎn)在樹(shù)底),與人的思考方式類(lèi)似,容易理解,方便使用。

2 連云港地區(qū)大霧與特強(qiáng)濃霧發(fā)生特征的統(tǒng)計(jì)分析

連云港市是地處江蘇東北部的黃海之濱,屬于溫帶季風(fēng)性氣候。由于地處東部沿海,因而大霧發(fā)生規(guī)律相對(duì)復(fù)雜,既有下墊面長(zhǎng)波輻射冷卻引起的輻射霧,又有由洋面暖濕平流引起的平流霧,還有兩者混合生成的輻射平流霧。本文以連云港地區(qū)的大霧天氣為研究背景對(duì)特強(qiáng)濃霧天氣的發(fā)生發(fā)展規(guī)律以及診斷模型展開(kāi)研究。針對(duì)連云港地區(qū)的大霧天氣以及特強(qiáng)濃霧天氣的時(shí)間分布特征進(jìn)行統(tǒng)計(jì),對(duì)影響連云港地區(qū)的大霧天氣與特強(qiáng)濃霧天氣的氣象要素特征進(jìn)行統(tǒng)計(jì)分析,既研究大霧與特強(qiáng)濃霧的發(fā)生發(fā)展規(guī)律,也為下一節(jié)診斷模型的建立提供數(shù)據(jù)特征上的描述。

2.1 大霧與特強(qiáng)濃霧的時(shí)間分布特征分析

2014-2016年連云港地區(qū)的大霧天氣與特強(qiáng)濃霧天氣隨月份的分布特征如圖1所示,大霧天氣在全年各月均有發(fā)生其中10月份至翌年4月份發(fā)生大霧天氣的頻次較高5-9月份的發(fā)生頻次較低,大霧天氣發(fā)生頻次最高在12月份,累計(jì)發(fā)生了162 h的大霧天氣,占總發(fā)生頻次的15%,9月份發(fā)生大霧天氣的頻次最低,僅有累計(jì)發(fā)生24 h的大霧天氣。特強(qiáng)濃霧天氣主要發(fā)生在春冬季節(jié),7-10月份沒(méi)有特強(qiáng)濃霧的記錄。特強(qiáng)濃霧發(fā)生頻次最高的月份在12月,共計(jì)25 h,占總發(fā)生頻次的42%。

圖1 2014-2016年大霧天氣與特強(qiáng)濃霧天氣的頻數(shù)的月分布

圖2 2014-2016年大霧天氣與特強(qiáng)濃霧天氣的頻數(shù)的時(shí)次分布

圖3 2014-2016年大霧天氣與特強(qiáng)濃霧天氣頻數(shù)的相對(duì)濕度分布

圖4 2014-2016年大霧天氣與特強(qiáng)濃霧天氣頻數(shù)的風(fēng)力分布

可以看出,特強(qiáng)濃霧天氣較大霧天氣的發(fā)生具有更強(qiáng)的季節(jié)性,冬春季節(jié)更易發(fā)生,夏秋季節(jié)鮮有發(fā)生。

大霧天氣與特強(qiáng)濃霧天氣的時(shí)次分布如圖2所示,大霧天氣在各個(gè)時(shí)次均有發(fā)生,發(fā)生時(shí)次主要集中在夜晚和凌晨,在午后時(shí)段鮮有發(fā)生,最常發(fā)生的時(shí)次在6時(shí),發(fā)生過(guò)117次,占比11%,而在15、16時(shí)發(fā)生次數(shù)最少均為7次,占比0.6%。觀察圖2b可以發(fā)現(xiàn),特強(qiáng)濃霧的發(fā)生時(shí)次主要集中在午夜至上午,而在13時(shí)至21時(shí)不曾發(fā)生過(guò)特強(qiáng)濃霧天氣,最常發(fā)生時(shí)次在2時(shí),共發(fā)生過(guò)8次,占比14%。通過(guò)觀察對(duì)比,大霧天氣與特強(qiáng)濃霧天氣發(fā)生規(guī)律較為相似,但是特強(qiáng)濃霧天氣發(fā)生的時(shí)間分布特征較大霧天氣更為集中,在冬季和凌晨發(fā)生的概率更大。

2.2 大霧與特強(qiáng)濃霧的氣象要素特征分析

本節(jié)對(duì)2014-2016年發(fā)生大霧天氣和特強(qiáng)濃霧天氣時(shí)段內(nèi)相對(duì)濕度、風(fēng)向、風(fēng)速的統(tǒng)計(jì)分析,描述大霧天氣及特強(qiáng)濃霧天氣發(fā)生時(shí)段內(nèi)氣象要素的分布特征。

大霧天氣及特強(qiáng)濃霧天氣發(fā)生時(shí)相對(duì)濕度的分布特征如圖3所示,大霧天氣在相對(duì)濕度90%以上均有分布,主要發(fā)生在相對(duì)濕度96%~98%這一區(qū)間,發(fā)生了546個(gè)時(shí)次,占比51%,而在相對(duì)濕度90%~92%這一區(qū)間分布最少,發(fā)生了133個(gè)時(shí)次,占比12%。觀察圖3b可以發(fā)現(xiàn),特強(qiáng)濃霧發(fā)生的相對(duì)濕度區(qū)間分布在93%至100%,90%~92%這一區(qū)間沒(méi)有特強(qiáng)濃霧天氣的記錄。與大霧天氣發(fā)生類(lèi)似,發(fā)生時(shí)次同樣在96%~98%這一區(qū)間最為集中,發(fā)生了37個(gè)時(shí)次,占比63%。

相比大霧天氣,特強(qiáng)濃霧的發(fā)生時(shí)的相對(duì)濕度區(qū)間更窄,并且在相對(duì)濕度96%以上這一區(qū)間更加集中。

圖5 2014-2016年大霧天氣與特強(qiáng)濃霧天氣頻數(shù)的風(fēng)向分布

圖6 選取訓(xùn)練樣本的策略示意圖

2014~2016年大霧天氣與特強(qiáng)濃霧發(fā)生時(shí)的風(fēng)力分布如圖4所示,大霧天氣發(fā)生時(shí),風(fēng)力從0級(jí)至4級(jí)及以上均有分布,在風(fēng)力1級(jí)時(shí)發(fā)生大霧天氣的時(shí)次最多,有550次,占比51%,風(fēng)力4級(jí)及以上時(shí)發(fā)生大霧的時(shí)次最少,僅有12次,占比1%。從圖4b可以看出,特強(qiáng)濃霧發(fā)生時(shí)次集中在0~2級(jí)風(fēng),其中風(fēng)力達(dá)1級(jí)時(shí)發(fā)生的頻次最多,計(jì)43次,占比73%,而當(dāng)風(fēng)力達(dá)到3級(jí)或3級(jí)以上時(shí)便沒(méi)有特強(qiáng)濃霧天氣的記錄。較大霧天氣而言,特強(qiáng)濃霧天氣具有發(fā)生的風(fēng)力級(jí)別區(qū)間窄,僅在0~2級(jí)風(fēng)之間有發(fā)生,在1級(jí)風(fēng)這一區(qū)間樣本更加集中等特點(diǎn)。

圖5為連云港地區(qū)2014-2016年大霧天氣與特強(qiáng)濃霧天氣發(fā)生時(shí)段的風(fēng)向分布。通過(guò)觀察,可以發(fā)現(xiàn)大霧天氣發(fā)生時(shí),整體以緯向風(fēng)為主,偏東風(fēng)場(chǎng)時(shí)更有利于大霧天氣的發(fā)生,發(fā)生大霧天氣頻次最多的風(fēng)向?yàn)镋NE,計(jì)184個(gè)時(shí)次,占比17%。觀察圖5b,可以發(fā)現(xiàn),特強(qiáng)濃霧天氣發(fā)生時(shí)風(fēng)向以緯向風(fēng)為主,發(fā)生特強(qiáng)濃霧天氣頻次最多的風(fēng)向?yàn)镋,計(jì)11次,占比18%,偏北風(fēng)向時(shí)發(fā)生特強(qiáng)濃霧的天氣狀況非常少。

通過(guò)觀察對(duì)比,大霧天氣與特強(qiáng)濃霧天氣發(fā)生時(shí)都具有風(fēng)向偏緯向的特點(diǎn),偏東風(fēng)分量作用強(qiáng)于偏西風(fēng),這與連云港地區(qū)地理位置是東部沿海城市不無(wú)關(guān)系,偏東風(fēng)可以從海洋上帶來(lái)更充沛的水汽。不同的是特強(qiáng)濃霧的發(fā)生與否對(duì)北風(fēng)分量更加敏感,當(dāng)風(fēng)向出現(xiàn)北風(fēng)分量時(shí),特強(qiáng)濃霧幾乎不會(huì)發(fā)生,反映了冷空氣極不利于特強(qiáng)濃霧天氣發(fā)生發(fā)展,也從側(cè)面反映特強(qiáng)濃霧對(duì)暖濕空氣輸送的要求更高。

通過(guò)對(duì)大霧天氣和特強(qiáng)濃霧天氣發(fā)生時(shí)的特征統(tǒng)計(jì),可以看出在發(fā)生大霧天氣時(shí),是否能夠增強(qiáng)至能見(jiàn)度低于50 m的特強(qiáng)濃霧需要具備以下幾個(gè)條件更加有利:①季節(jié)上,從深秋至翌年春季,冬季更為有利;②時(shí)次上,在夜間至早晨,2-8時(shí)最為有利;③相對(duì)濕度需在93%以上;④風(fēng)力較弱,但又不是靜風(fēng)狀態(tài),1級(jí)風(fēng)最為有利;⑤弱的緯向風(fēng)和弱的南風(fēng)分量。

3 基于機(jī)器學(xué)習(xí)算法的特強(qiáng)濃霧診斷模型

通過(guò)上節(jié)分析總結(jié),可以定性得到特強(qiáng)濃霧的發(fā)生發(fā)展的有利天氣條件,但是特強(qiáng)濃霧天氣的發(fā)生發(fā)展是復(fù)雜非線性的天氣過(guò)程,若希望能夠通過(guò)這些定性得到的特強(qiáng)濃霧發(fā)生的有利條件準(zhǔn)確判斷特強(qiáng)濃霧是否發(fā)生并非易事。因此,本節(jié)將利用機(jī)器學(xué)習(xí)中的幾種經(jīng)典有監(jiān)督分類(lèi)預(yù)測(cè)算法,對(duì)特強(qiáng)濃霧是否發(fā)生建立診斷模型。

3.1 實(shí)驗(yàn)數(shù)據(jù)的預(yù)處理

本文使用的機(jī)器學(xué)習(xí)算法均為有標(biāo)記的有監(jiān)督算法,該類(lèi)算法可通過(guò)留出法的方式檢驗(yàn)?zāi)P托Ч?,即將?shù)據(jù)樣本分為訓(xùn)練集與測(cè)試集兩部分,并且訓(xùn)練集與測(cè)試集為互斥關(guān)系,訓(xùn)練集用來(lái)建立模型,測(cè)試集用于檢驗(yàn)?zāi)P偷姆夯芰?。一般情況下,訓(xùn)練集占總樣本的四分之三左右,余下的約四分之一的樣本為測(cè)試集。首先,我們將大霧期間“能見(jiàn)度是否低于50 m“抽象成為一個(gè)二元分類(lèi)的問(wèn)題。經(jīng)過(guò)統(tǒng)計(jì),在2014年1月1日至2016年12月31日發(fā)生大霧天氣的1 073個(gè)時(shí)次里,有59個(gè)時(shí)次發(fā)生了能見(jiàn)度低于50 m的特強(qiáng)濃霧。為了維持目標(biāo)屬性量級(jí)上的平衡以及盡可能不影響數(shù)據(jù)原有分布,本文選取測(cè)試集的策略為等距離抽樣,即以時(shí)間為序,將研究樣本中每第4n個(gè)數(shù)據(jù)放入測(cè)試集,n=1,2,3…(4n<=1073),仍然以時(shí)間為序,其余的數(shù)據(jù)樣本為訓(xùn)練集,如圖6所示。

即分別對(duì)訓(xùn)練集與測(cè)試集進(jìn)行統(tǒng)計(jì),就訓(xùn)練集而言,共805個(gè)數(shù)據(jù)樣本,其中能見(jiàn)度低于50 m的特強(qiáng)濃霧樣本為45個(gè),為了維持目標(biāo)屬性“是否為特強(qiáng)濃霧”是與否的平衡,以及模型最后效果更加客觀真實(shí),本文針對(duì)能見(jiàn)度低于50 m的特強(qiáng)濃霧數(shù)據(jù)樣本采取有放回采樣的策略,將特強(qiáng)濃霧數(shù)據(jù)樣本量擴(kuò)大到與非特強(qiáng)濃霧數(shù)據(jù)樣本量相當(dāng)(756個(gè)特強(qiáng)濃霧數(shù)據(jù)樣本),利用這種方法不僅可以擴(kuò)大特強(qiáng)濃霧數(shù)據(jù)樣本規(guī)模同時(shí)也保證不丟失數(shù)據(jù)特征。同樣地,通過(guò)統(tǒng)計(jì)發(fā)現(xiàn),在測(cè)試集中共有268個(gè)數(shù)據(jù)樣本,其中能見(jiàn)度低于50 m的特強(qiáng)濃霧數(shù)據(jù)樣本有14個(gè),采取有放回抽樣的策略將測(cè)試集中特強(qiáng)濃霧數(shù)據(jù)樣本數(shù)量擴(kuò)大到與非特強(qiáng)濃霧樣本數(shù)量相當(dāng)(253個(gè)特強(qiáng)濃霧數(shù)據(jù)樣本),具體如表1所示。這樣就完成機(jī)器學(xué)習(xí)所需訓(xùn)練集與測(cè)試集的選取與處理,接下來(lái)文章將分別利用分類(lèi)與回歸樹(shù)(CART)算法、支持向量機(jī)(SVM)、線性支持向量機(jī)(LSVM)以及兩種人工神經(jīng)網(wǎng)絡(luò)對(duì)連云港地區(qū)的特強(qiáng)濃霧建立診斷模型。

表1 通過(guò)有放回采樣方式平衡訓(xùn)練集與測(cè)試集二元目標(biāo)變量樣本

3.2 基于CART算法的特強(qiáng)濃霧本地化診斷模型

以是否為特強(qiáng)濃霧為模型的目標(biāo)變量,模型的輸入變量為氣溫、氣壓、相對(duì)濕度、10 min平均風(fēng)速、10 min平均風(fēng)向、降水、0 cm地表溫度。將預(yù)處理好的訓(xùn)練集輸入CART算法,得到?jīng)Q策樹(shù)(圖7)。

決策樹(shù)形式直觀,符合人們邏輯判斷的思維方式,從決策樹(shù)模型可以發(fā)現(xiàn),根節(jié)點(diǎn)為氣溫,換言之,相對(duì)于其他強(qiáng)度的大霧天氣而言,氣溫這一屬性對(duì)于特強(qiáng)濃霧是否發(fā)生的影響最為關(guān)鍵。決策樹(shù)模型中,每從根節(jié)點(diǎn)(氣溫)到一個(gè)葉節(jié)點(diǎn)(T/F)都可以抽象為一條If…then形式的決策規(guī)則,眾多規(guī)則形成決策規(guī)則集(表2)。

通過(guò)決策樹(shù)抽象出判斷大霧天氣背景下是否會(huì)出現(xiàn)能見(jiàn)度低于50m的特強(qiáng)濃霧的規(guī)則集。通過(guò)訓(xùn)練集數(shù)據(jù)參與模型的建立,模型整體的學(xué)習(xí)準(zhǔn)確率為90.04%,每條規(guī)則都有各自的學(xué)習(xí)準(zhǔn)確率,方便與實(shí)際情況對(duì)照參考。接著,利用預(yù)處理好的測(cè)試集數(shù)據(jù)對(duì)模型的泛化能力進(jìn)行測(cè)試,測(cè)試準(zhǔn)確率為82.25%。通過(guò)驗(yàn)證發(fā)現(xiàn),模型整體的分類(lèi)效果好,泛化能力強(qiáng)。對(duì)于大霧天氣背景下診斷與預(yù)測(cè)特強(qiáng)濃霧的發(fā)生提供了簡(jiǎn)潔、可理解、有價(jià)值的參考。

3.3 一些其他機(jī)器學(xué)習(xí)算法效果對(duì)比

類(lèi)支持向量機(jī)與類(lèi)神經(jīng)網(wǎng)絡(luò)算法同樣也是機(jī)器學(xué)習(xí)領(lǐng)域中重要的有監(jiān)督算法。相比決策樹(shù)算法而言,這兩類(lèi)算法都具有較高的計(jì)算復(fù)雜度與較低的算法可理解性,在大多數(shù)情況下有著較高的平均準(zhǔn)確率。表3是通過(guò)預(yù)處理的實(shí)驗(yàn)數(shù)據(jù)基于線性支持向量機(jī)(LSVM)、支持向量機(jī)(SVM)、多層神經(jīng)網(wǎng)絡(luò)(MLP)以及徑向基神經(jīng)網(wǎng)絡(luò)(RBF network)四種算法的實(shí)驗(yàn)效果。

表2 CART算法發(fā)現(xiàn)的連云港地區(qū)大霧發(fā)生背景下特強(qiáng)濃霧氣象觀測(cè)要素特征診斷規(guī)則集

圖7 2014-2016年連云港地區(qū)大霧發(fā)生背景下特強(qiáng)濃霧氣象觀測(cè)要素特征診斷決策樹(shù)模型

算法學(xué)習(xí)準(zhǔn)確率/%測(cè)試準(zhǔn)確率/%LSVM83718425SVM83698061MLP94027239RBF82557719

圖3 各算法學(xué)習(xí)準(zhǔn)確率及測(cè)試準(zhǔn)確率

為了方便各算法效果更加直觀的對(duì)比,我們將包括CART算法在內(nèi)的五種算法的學(xué)習(xí)與測(cè)試效果繪圖,如圖3所示,MLP學(xué)習(xí)效果最佳,但測(cè)試效果也最差,存在過(guò)擬合的問(wèn)題較為嚴(yán)重,LSVM的學(xué)習(xí)效果較CART稍差,但是測(cè)試準(zhǔn)確率最高,模型泛化能力表現(xiàn)較好。整體上看,類(lèi)支持向量機(jī)算法對(duì)于特強(qiáng)濃霧的診斷效果要優(yōu)于類(lèi)神經(jīng)網(wǎng)絡(luò)算法。

與CART算法不同的是,類(lèi)支持向量機(jī)算法與類(lèi)神經(jīng)網(wǎng)絡(luò)算法具有更高的算法復(fù)雜度與很低的算法可理解度,算法收斂速度較慢并且模型難以解釋。但是隨著計(jì)算機(jī)計(jì)算速度的不斷提高,多種機(jī)器學(xué)習(xí)算法并行已經(jīng)成為可能,利用多種性能優(yōu)良的算法對(duì)同一種目標(biāo)進(jìn)行建模,可以相關(guān)業(yè)務(wù)人員提供更加有力的參考。

4 總結(jié)

本文針對(duì)連云港地區(qū)的大霧天氣和特強(qiáng)濃霧天氣進(jìn)行了時(shí)間特征和氣象要素特征的分析,并利用機(jī)器學(xué)習(xí)技術(shù)與氣象科研業(yè)務(wù)問(wèn)題相結(jié)合是一種可以嘗試的角度。本文利用機(jī)器學(xué)習(xí)技術(shù)中的幾種有監(jiān)督算法針對(duì)連云港58044站點(diǎn)大霧天氣背景下的特強(qiáng)濃霧特征建立了診斷模型,得到以下結(jié)論:

(1)通過(guò)對(duì)連云港地區(qū)大霧與特強(qiáng)濃霧天氣特征的統(tǒng)計(jì)分析,發(fā)現(xiàn)特強(qiáng)濃霧相對(duì)大霧的發(fā)生發(fā)展對(duì)時(shí)間和氣象條件有著更加苛刻的要求。

(2)基于CART決策樹(shù)算法對(duì)預(yù)處理數(shù)據(jù)建立的診斷模型可以看出,決策樹(shù)的根節(jié)點(diǎn)為氣溫,說(shuō)明在大霧天氣發(fā)生的背景下氣溫是判斷能否發(fā)生特強(qiáng)濃霧的最重要因素;該模型的學(xué)習(xí)準(zhǔn)確率90.04%,測(cè)試準(zhǔn)確率為82.25%,該模型具有很好的診斷效果以及較強(qiáng)的泛化能力。

(3)CART算法相對(duì)于類(lèi)支持向量機(jī)與類(lèi)神經(jīng)網(wǎng)絡(luò)算法而言具有簡(jiǎn)潔,計(jì)算復(fù)雜度低,理解直觀,準(zhǔn)確率較高等特點(diǎn)。

(4)類(lèi)支持向量機(jī)對(duì)于大霧天氣發(fā)生背景下特強(qiáng)濃霧的診斷效果要強(qiáng)于類(lèi)神經(jīng)網(wǎng)絡(luò)算法,與CART算法相比,學(xué)習(xí)效果稍差,但測(cè)試效果較好。

隨著計(jì)算機(jī)性能的不斷提高,大數(shù)據(jù)時(shí)代的不斷推進(jìn),利用人工智能、機(jī)器學(xué)習(xí)技術(shù)對(duì)自然災(zāi)害的發(fā)生發(fā)展進(jìn)行預(yù)測(cè)將成為一種必然發(fā)展趨勢(shì)。然而,多元、海量、異構(gòu)的數(shù)據(jù)進(jìn)行有機(jī)融合讓算法更易挖掘有用信息,以及算法本身的進(jìn)一步優(yōu)化改良同樣也是值得思考與研究的問(wèn)題。

參考文獻(xiàn):

[1]張禮春,朱彬,耿慧,等. 南京一次持續(xù)性濃霧天氣過(guò)程的邊界層特征及水汽來(lái)源分析[J]. 氣象,2013,39(10):1284-1292.

[2]袁成松,梁敬東,焦圣明,等. 低能見(jiàn)度濃霧監(jiān)測(cè)、臨近預(yù)報(bào)的實(shí)例分析與認(rèn)識(shí)[J]. 氣象科學(xué),2007,27(6):661-665.

[3]馮民學(xué),顧松山,卞光輝. 高速公路濃霧監(jiān)測(cè)預(yù)警系統(tǒng)[J]. 中國(guó)公路學(xué)報(bào),2004,17(3):95-100.

[4]周自江,朱燕君,鞠曉慧. 長(zhǎng)江三角洲地區(qū)的濃霧事件及其氣候特征[J]. 自然科學(xué)進(jìn)展,2007,17(1):66-71.

[5]吳彬貴,馬翠平,蔡子穎,等. 輻射霧局地爆發(fā)性增強(qiáng)原因探討[J]. 高原氣象,2014,33(5):1393-1402.

[6]丁秋冀,包云軒,袁成松,等. 滬寧高速公路團(tuán)霧發(fā)生規(guī)律及局地性分析[J]. 氣象科學(xué),2013,33(6):634-642.

[7]高潤(rùn)祥,司鵬,宋明,等. 近50年天津地區(qū)局地氣候變化特征分析[J]. 氣候與環(huán)境研究,2011,16(2):159-168.

[7]萬(wàn)齊林,吳兌,葉燕強(qiáng). 南嶺局地小地形背風(fēng)坡增霧作用的分析[J]. 高原氣象,2004,23(5):709-713.

[8]Eldridge R G. A few fog drop-size distribution [J] . J Atmos Sci, 1961,18(5):671-676.

[9]Eldridge R G. Haze and fog aerosol distribution [J]. J Atmos Sci, 1966,23(5):605-613.

[10] Eldridge R G. The relationship between visibility and liquid water content in fog [J]. J Atmos Sci , 1971,28(07):1183-1186.

[11] Goodman J. The microstructure of California coastal fog and stratus [J]. J Appl Meteor , 1977,16(10): 1056-1067.

[12] Pickering K E , Jiusto J E. Observations of the relationship between dew and radition fog [J]. J Geophys Res , 1978,83(5):4-8.

[13] Gerber H. Supersaturation and droplet spectral evolution in fog [J]. J Atmos Sci ,1991,48(48):2569-2588.

[14] Choularton T W , Fullarton G , Lartham J , et al. A field study of radition fog in Meppen , West Germany [J]. Quart J Roy Meteor or Soc , 1981,107(452):381-394.

[15] ZHANG W, LEUNG Y, CHAN J C L, et al. The Analysis of Tropical Cyclone Tracks in the Western North Pacific through Data Mining. Part I: Tropical Cyclone Recurvature[J]. JOURNAL OF APPLIED METEOROLOGY AND CLIMATOLOGY,2013, 52(6):1394-1416.

[16] ZHANG W, LEUNG Y, CHAN J C L, et al. The Analysis of Tropical Cyclone Tracks in the Western North Pacific through Data Mining. Part II: Tropical Cyclone Landfall [J]. JOURNAL OF APPLIED METEOROLOGY AND CLIMATOLOGY, 2013,52(6):1417-1432.

[17] 史達(dá)偉,耿煥同,吉辰,等. 基于C4.5決策樹(shù)算法的道路結(jié)冰預(yù)報(bào)模型構(gòu)建及應(yīng)用[J]. 氣象科學(xué),2015,35(2):204-209.

[18] Geng H, Shi D, Zhang W , et al. A prediction scheme for the frequency of summer tropical cyclone landfalling over China based on data mining methods [J]. Meterol Appl,2016,23(4):587-593.

[19] David A , James O P , John K W , et al. Probabilistic Forecasts of Mesoscale Convective System Initiation Using the Random Forest Data Mining Technique [J].Wea Forecasting , 2016,31(2):581-599.

[20] 賀皓,羅慧. 基于支持向量機(jī)模式識(shí)別的大霧預(yù)報(bào)方法[J]. 氣象科技,2009,37(2):149-151.

[21] 李才媛,韋惠紅,鄧紅. SVM方法在武漢市大霧預(yù)警預(yù)報(bào)中的應(yīng)用[J]. 暴雨災(zāi)害,2008,27(3):264-267.

[22] 王彥磊,曹炳偉,黃兵,董兆俊,路澤廷,陳興明.基于神經(jīng)網(wǎng)絡(luò)的單站霧預(yù)報(bào)試驗(yàn)[J].應(yīng)用氣象學(xué)報(bào),2010,21(1):110-114.

[23] Breiman, L, Friedman J H, R Olshen,et al. Classification and Regression Trees[M]. Wadsworth and Brooks.1984.

猜你喜歡
濃霧大霧連云港
連云港杜鐘新奧神氨綸
大霧帖(組詩(shī))
獨(dú)立江畔
江蘇連云港:為農(nóng)民工送上“寒冬暖查”
連云港:為農(nóng)民工討薪“撐腰”
濃霧
我迷失在茫茫濃霧中
趣談大霧的功與過(guò)
大霧
連云港港口控股集團(tuán)揭牌