張倩影,鐘少波,黃全義
(清華大學(xué)工程物理系/公共安全研究院,北京100084)
基于模糊C均值的廣東省登陸熱帶氣旋路徑分類研究*
張倩影,鐘少波,黃全義
(清華大學(xué)工程物理系/公共安全研究院,北京100084)
利用中國(guó)臺(tái)風(fēng)網(wǎng)(www.typhoon.gov.cn)的“CMA-STI熱帶氣旋最佳路徑數(shù)據(jù)集”獲取1949-2013年間登陸廣東省的熱帶氣旋的登陸位置、強(qiáng)度、路徑長(zhǎng)度等主要的特征參數(shù),利用模糊C聚類(FCM)法建立了登陸廣東省熱帶氣旋路徑分類方法,并對(duì)分類得到的6個(gè)路徑類型熱帶氣旋在空間分布特征、強(qiáng)度和生命史以及活動(dòng)時(shí)間等方面進(jìn)行了對(duì)比分析。結(jié)果表明各類熱帶氣旋特征量有明顯的差異。從65年的變化趨勢(shì)看,廣東省熱帶氣旋存在著西多東少的頻次規(guī)律,而強(qiáng)度分布卻是東強(qiáng)西弱。
熱帶氣旋;路徑插值;路徑聚類;模糊C均值;空間特征;廣東
熱帶氣旋是世界上最災(zāi)難性的自然災(zāi)害之一,統(tǒng)計(jì)數(shù)據(jù)顯示,在所有氣象災(zāi)害中,熱帶氣旋造成的保險(xiǎn)損失為最高[1]。對(duì)于位于熱帶氣旋易發(fā)區(qū)域來說,熱帶氣旋(TC)是最具破壞性的自然災(zāi)害之一。由于其登陸過程中總是伴隨強(qiáng)勁的陣風(fēng),暴雨和風(fēng)暴潮,每年熱帶氣旋的登陸都會(huì)給沿海和內(nèi)陸區(qū)域造成巨大的損失。研究熱帶氣旋的形成及其演化過程具有很高的科學(xué)價(jià)值,社會(huì)價(jià)值和經(jīng)濟(jì)價(jià)值[2]。熱帶氣旋登陸我國(guó)的沿海區(qū)域顯示了典型的季節(jié)性、年際和年代際變化,合理地根據(jù)歷史數(shù)據(jù)分析熱帶氣旋登陸的時(shí)間特征,可以有效地提前做好準(zhǔn)備,為減緩災(zāi)害造成的損失提供科學(xué)依據(jù)[3]。
熱帶氣旋的登陸通常發(fā)生在中國(guó)東南部的沿海地區(qū),本文的主要研究區(qū)域是我國(guó)的沿海大省——廣東省。廣東省是一個(gè)財(cái)富高度集中的沿海地區(qū),并且每年都在因熱帶氣旋的登陸遭受巨大的損失[4]。隨著廣東省人口數(shù)量的增長(zhǎng),由熱帶氣旋登陸造成的財(cái)產(chǎn)損失、經(jīng)濟(jì)損失以及由臺(tái)風(fēng)造成的人口傷亡也在逐漸增加。例如,在2013年,臺(tái)風(fēng)Usagi(NO.1319)從廣東省汕尾市登陸,估計(jì)共造成177.6億元的經(jīng)濟(jì)損失,造成至少29人死亡。這樣驚人的例子更加強(qiáng)調(diào)對(duì)熱帶氣旋的形成時(shí)間和空間移動(dòng)特征研究的迫切需要。由于氣候變化影響了氣象系統(tǒng)的動(dòng)態(tài)平衡,熱帶氣旋時(shí)序變化特征以及熱帶氣旋的空間上的路徑變化及登陸頻率和強(qiáng)度的變化也受到了一定程度的影響[4-5]。認(rèn)識(shí)熱帶氣旋的時(shí)空特征可以有效提高風(fēng)險(xiǎn)評(píng)估的準(zhǔn)確性,增強(qiáng)預(yù)防和減緩災(zāi)害造成損失的能力。
為了能夠準(zhǔn)確地預(yù)測(cè)熱帶氣旋登陸的可能性,并且提前減緩其帶來的經(jīng)濟(jì)損失,研究熱帶氣旋登陸路徑特征是很有必要的。之前的一些學(xué)者[1,6-8]表明,可以有效地說明不同熱帶氣旋路徑特征的方法是根據(jù)定義好的類別,將相應(yīng)路徑進(jìn)行歸類。針對(duì)不同區(qū)域,一些探索性的研究將熱帶氣旋路徑歸類到有限的形式。Hodanish和Gray[9]針對(duì)西北太平洋的熱帶氣旋,根據(jù)其行進(jìn)過程中的折彎程度,將其分為四種不同的形式:大幅向后彎曲,逐漸向后彎曲,左轉(zhuǎn),直線。Harr和Elsberry[10]基于異常大氣環(huán)流與季風(fēng)槽和副熱帶高壓脊的活動(dòng),將西北太平洋的熱帶氣旋登陸路徑劃分為三類:直線,向南折回和向北折回。Lander[11]也同樣將中國(guó)南海登陸的熱帶氣旋分為了四大類:直線移動(dòng),向后折回移動(dòng),向北移動(dòng)和停留在南海。
數(shù)值聚類方法已經(jīng)成為了熱帶氣旋路徑分類主要選擇。聚類的主要優(yōu)點(diǎn)是其客觀性,因?yàn)樗畲罂赡苄缘嘏懦朔治鋈说闹饔^性。Elsner[12]表明通過利用路徑中最大強(qiáng)度的坐標(biāo)以及其消逝坐標(biāo),K-means聚類方法可以有效地對(duì)熱帶氣旋路徑將進(jìn)行分類。這個(gè)方法也被應(yīng)用到太平洋颶風(fēng)路徑分類和北太平洋溫帶氣旋路徑的分類。Camargo等人[13]指出由于k-means聚類方法要求矢量數(shù)據(jù)必須具有相同的長(zhǎng)度,所以利用k-means聚類方法并不能夠覆蓋路徑上包含的所有點(diǎn)。由于不同熱帶氣旋的路徑是由點(diǎn)組成的,k-means的這種處理數(shù)據(jù)的局限性會(huì)使路徑的一些重要信息缺失,造成分類結(jié)果的偏差。為了克服這種局限性,Camargo提出一種新的聚類方法—混合回歸模型,并且利用該方法對(duì)不同特征的熱帶氣旋進(jìn)行了分類及特征分析,在此基礎(chǔ)上分析了其與大尺度環(huán)境變化的一些關(guān)系。Nakamura等人[14]建議基于熱帶氣旋路徑的第一和第二質(zhì)量矩陣,也就是其形狀和長(zhǎng)度的接近性進(jìn)行分類。通過將質(zhì)量矩陣應(yīng)用于k-means的方法,他們針對(duì)起源于太平洋的熱帶氣旋路徑得到了可靠的分類結(jié)果。這個(gè)研究也解決了不同長(zhǎng)度的矢量數(shù)據(jù)聚類的問題。
在本研究中,我們將利用另一種方法——模糊C均值聚類方法(FCM),針對(duì)登陸廣東省的熱帶氣旋路徑進(jìn)行聚類。大量的熱帶氣旋路徑在地圖上看起來非常的雜亂無章,以至于無法確定可以劃分的模式類型。這種類型的數(shù)據(jù)的模糊屬性,使其非常適合利用模糊聚類方法。k-means聚類或者分層聚類屬于硬聚類結(jié)果,也就是說每個(gè)數(shù)據(jù)被特定地分配到一個(gè)類中。相反的,在模糊聚類方法中,數(shù)據(jù)并不是直接被分配到一個(gè)類別中,而是允許保留數(shù)據(jù)的模糊性。這種方法中,一個(gè)數(shù)據(jù)最初以不同的隸屬度屬于所有的類別,隸屬度從0變化到1(0代表一個(gè)數(shù)據(jù)完全不屬于一個(gè)類別,而1表示該數(shù)據(jù)完全包含在這個(gè)類別)[15]。隸屬度代表一個(gè)數(shù)據(jù)屬于某個(gè)特定類別的概率大小,綜合熱帶氣旋路徑的模糊屬性來看,利用模糊聚類方法對(duì)一組熱帶氣旋路徑進(jìn)行分析,可以得到更為合理的聚類結(jié)果。
利用模糊C均值聚類方法,我們?cè)噲D的從1949-2013年間登陸廣東省的熱帶氣旋路徑找到的聚類中心,并且這些被歸為一類的熱帶氣旋路徑有著相似的路徑形狀和鄰近的地理路徑。在分類的基礎(chǔ)上,分別就路徑空間分布特征,強(qiáng)度和生命史的特征以及時(shí)間分布特征進(jìn)行了分析。
1.1 資料介紹
(1)本文采用的臺(tái)風(fēng)路徑數(shù)據(jù)來自中國(guó)臺(tái)風(fēng)網(wǎng)(www.typhoon.gov.cn)的“CMA-STI熱帶氣旋最佳路徑數(shù)據(jù)集”。該數(shù)據(jù)集中包括1949-2012年西太平洋和南海(赤道以北,180°E以西)海域生成的熱帶氣旋每6 h的位置和強(qiáng)度,包括臺(tái)風(fēng)中心點(diǎn)位置,中心氣壓,近中心最大風(fēng)速,熱帶氣旋活動(dòng)天數(shù)等。
(2)熱帶氣旋基礎(chǔ)資料
1949-2013年登陸廣東省的熱帶氣旋名稱、登陸時(shí)間、強(qiáng)度及登陸地點(diǎn)的相關(guān)資料,來源于中國(guó)氣象局發(fā)布的《臺(tái)風(fēng)年鑒》和《熱帶氣旋年鑒》。熱帶氣旋登陸期間廣東省各站點(diǎn)的風(fēng)速、雨量等逐日資料,來源于中國(guó)氣象科學(xué)數(shù)據(jù)共享服務(wù)網(wǎng)。
(3)地理信息數(shù)據(jù)
廣東省地理區(qū)劃信息數(shù)據(jù)主要是來自國(guó)家基礎(chǔ)地理信息系統(tǒng)全國(guó)1:400萬(wàn)數(shù)據(jù)庫(kù)。圖1中展示的1949-2013年間登陸廣東省的熱帶氣旋的路徑圖。
圖1 1949-2013年間登陸廣東省的熱帶氣旋路徑
1.2 方法簡(jiǎn)介
1.2.1 FCM聚類方法
模糊聚類分析就是把模糊數(shù)學(xué)的概念引入聚類分析中,用來研究“物以類聚”的一種多元統(tǒng)計(jì)分析方法,即用數(shù)學(xué)方法把原來樣品之間的模糊關(guān)系定量地確定關(guān)系,從而客觀地進(jìn)行分類,因此模糊聚類分析的理論基礎(chǔ)即是模糊理論。模糊理論是建立在模糊集合基礎(chǔ)之上的,是描述和處理人類語(yǔ)言中所特有的模糊信息的理論,其主要概念包括模糊集合、隸屬度函數(shù)、模糊算子、模糊運(yùn)算和模糊關(guān)系等。
本文使用的是模糊C-均值聚類,在眾多模糊聚類算法中,模糊C-均值算法應(yīng)用最為廣泛且較成功,它通過優(yōu)化目標(biāo)函數(shù)得到每個(gè)樣本點(diǎn)對(duì)所有類中心的隸屬度,從而決定樣本點(diǎn)的類屬以達(dá)到自動(dòng)樣本數(shù)據(jù)進(jìn)行分類的目的。假設(shè)樣本集合為熱帶氣旋路徑及X={x1,x2,…,xn},根據(jù)模糊C-均值聚類算法將其劃分成C個(gè)模糊組,并求每組的聚類中心Cj(j=1,2,…,C),使目標(biāo)函數(shù)達(dá)到最小。
目標(biāo)函數(shù)定義為J,J的算法為:
式中:μik表示第k條熱帶氣旋路徑屬于第i個(gè)聚類中心的隸屬度,m表示大于1的模糊系數(shù),xk表示第k條熱帶氣旋路徑,ci表示的是第i個(gè)聚類中心,C表示聚類中心的數(shù)目,K表示熱帶氣旋路徑集。任意向量范數(shù)‖‖表示熱帶氣旋路徑與聚類中心的距離。
在本文研究中,我們使用歐幾里得范數(shù)來計(jì)算,其在模糊C-均值聚類算法使用最為廣泛。為了優(yōu)化C-均值目標(biāo)函數(shù)J,我們給其定義了兩個(gè)限制條件:μik≥0和χCi=1μik=1。模糊系數(shù)m表示每條路徑屬于不同聚類中心的重疊度,也就是說,如果m的值較小時(shí),越靠近聚類中心的數(shù)據(jù),所被賦予的權(quán)重值也會(huì)更大,同理可得,越是遠(yuǎn)離聚類中心的數(shù)據(jù),所被賦予的權(quán)重值只會(huì)更小。m系數(shù)值越是接近1,對(duì)于遠(yuǎn)離某個(gè)聚類中心的路徑數(shù)據(jù)所得到的隸屬度值μ_ik會(huì)收斂于0,而對(duì)于靠近某個(gè)聚類中心的路徑數(shù)據(jù)而言,所得到的隸屬度值μik會(huì)收斂于1。在本文中,我們將模糊系數(shù)m設(shè)定為模糊C-均值算法最常用的值2。
為了使得目標(biāo)函數(shù)最小化,采用如何的迭代的過程:
對(duì)于給定的數(shù)據(jù)集x,選擇聚類的數(shù)量為1<C<K,加權(quán)指數(shù)m>1,迭代停止閾值ε>0,劃分矩陣為:
其中初始的劃分矩陣U(0)是隨機(jī)生成的。然后重復(fù)下列步驟直到‖J(l)-J(l-1)‖≤ε,其中l(wèi)=1,2,…。
第一步:計(jì)算聚類中心:
第二步:更新劃分矩陣:
整個(gè)計(jì)算過程就是反復(fù)修改聚類中心和分類矩陣的過程,因此常稱此類方法為動(dòng)態(tài)聚類或者逐步聚類法。
1.2.2 TC路徑數(shù)據(jù)插值
與k-均值聚類算法類似,模糊C-均值聚類同樣也要求樣本數(shù)據(jù)有著相同的長(zhǎng)度,為了能夠處理不同長(zhǎng)度的路徑,之前利用k-均值和質(zhì)量矩陣的一些研究多是在熱帶氣旋路徑上選取一些特定的點(diǎn),一般是最大強(qiáng)度或者消逝點(diǎn)。與這些方法不同的是,利用插值的方法可以保證在聚類過程中保證熱帶氣旋路徑的完整性。為了實(shí)現(xiàn)這種目的,在插值的過程中,將每條熱帶氣旋路徑插值成相等長(zhǎng)度的M段,也就是M+1個(gè)數(shù)據(jù)點(diǎn)。
利用每個(gè)熱帶氣旋路徑原始最佳路徑集中每6 h的位置信息,可以得到整條路徑的長(zhǎng)度,di=其中i=1,…,N-1,(xi,yi)表示熱帶氣旋路徑的第i個(gè)經(jīng)緯度點(diǎn),N表示的是每6 h熱帶氣旋路徑觀測(cè)點(diǎn)的數(shù)量。插值部分的長(zhǎng)度可以用表示,M表示插值的段數(shù)。經(jīng)過插值后的熱帶氣旋路徑的坐標(biāo)可以用下列公式計(jì)算得到:
為了對(duì)樣本數(shù)據(jù)進(jìn)行模糊聚類分析,插值后的熱帶氣旋觀測(cè)點(diǎn)的經(jīng)緯度坐標(biāo)點(diǎn)用下列的列向量來表示:
式中:xk表示的是第k條熱帶氣旋路徑的列向量,和分別表示的是經(jīng)過插值后的熱帶氣旋路徑的經(jīng)緯度坐標(biāo)。在這里k是我們所得到的所有的熱帶氣旋路徑的數(shù)量,也就是180。這個(gè)列向量作為樣本數(shù)據(jù)用在式(5)中。然后在優(yōu)化隸屬度函數(shù)和聚類中心的過程中,使得C均值目標(biāo)函數(shù)達(dá)到最小值。
1.2.3 最優(yōu)聚類數(shù)的確定
對(duì)于任何一種聚類分析來講,確定最佳聚類中心數(shù)目都是最關(guān)鍵的步驟。FCM聚類的結(jié)果極大程度地依賴于聚類中心的數(shù)目,因此在進(jìn)行聚類算法之前必須優(yōu)先確定最佳聚類數(shù)目。在本文中,聚類中心數(shù)目有四個(gè)參數(shù)來確定:劃分系數(shù)(PC),分類指數(shù)(SC),離散指數(shù)(S)和Dunn指數(shù)(DI)。
劃分系數(shù)(PC)是由Bezdek[16]定義用來檢測(cè)聚類中心的重疊性。PC最大的缺陷在于其的計(jì)算僅僅依靠于隸屬度,因此,它缺少與樣本數(shù)據(jù)的地理屬性的直接聯(lián)系。
式中:μij表示數(shù)據(jù)j在聚類中心i的隸屬度,當(dāng)PC值最大時(shí),聚類中心數(shù)目達(dá)到最優(yōu)值。
分類指數(shù)(SC)是由Bensaid[17]提出的,表示聚類的緊湊性和分散性和的比例,是指每個(gè)聚類的模糊基數(shù)歸一化的參數(shù)和。它在驗(yàn)證聚類緊湊性的同時(shí)也考慮到分散性,其中緊湊性是由樣本數(shù)據(jù)與聚類中心的平均距離得到,而分散性是指一個(gè)聚類中心到所有聚類中心的距離的和:
與分類指數(shù)(SC)相反的是,由Xie和Beni[18]提出的離散指數(shù)(S)利用最短距離來進(jìn)行分類來保證劃分的有效性:
Dunn指數(shù)(DI)最初由Dunn[19]提出來用于驗(yàn)證聚類結(jié)果的緊湊性和分散性。這個(gè)指數(shù)表示的是兩個(gè)樣本到各自聚類中心的最短距離與最長(zhǎng)聚類的比值,在本文中,它主要用于每個(gè)樣本數(shù)據(jù)分配到指定聚類中心后:
與PC不同的是,其他的指數(shù)(SC,S,DI)都是用來檢測(cè)聚類的緊湊度和分散度,所以,其值越小得到的聚類結(jié)果越好。但是必須注意的是,單純滿足某一指數(shù)并不能夠得到最佳的聚類結(jié)果,應(yīng)該需要同時(shí)滿足四個(gè)指數(shù)才可以得到最佳的聚類中心。圖2展示了以聚類中心數(shù)目為函數(shù)的四個(gè)參數(shù)的值。從圖2中我們可以看出,PC指數(shù)隨著聚類中心的增加而逐漸遞減,表明最佳的聚類中心數(shù)目應(yīng)該是2。SC和S指數(shù)最小值使聚類中心數(shù)目為13,另一方面,DI指數(shù)在聚類中心數(shù)目為6時(shí)達(dá)到最小值。綜合四個(gè)指數(shù),我們可以得到PC和S指數(shù)在聚類中心為6時(shí)變化最大,而SC指數(shù)也在聚類中心為6時(shí)發(fā)生了突變,所以我們將聚類中心的數(shù)目確定為6。
圖2 四個(gè)有效性參數(shù)與聚類個(gè)數(shù)的關(guān)系圖
2.1 空間分布特征
圖3 登陸廣東省的熱帶氣旋6類聚類結(jié)果
表1 180條熱帶氣旋路徑聚類結(jié)果
圖3展示了1949-2013從廣東省登陸的熱帶氣旋路徑的模糊聚類結(jié)果,為了對(duì)比,圖3中也顯示了所有熱帶氣旋路徑。從圖中我們可以得到6個(gè)聚類中心在空間路徑上有著明顯的區(qū)別,但是根據(jù)路徑的起源地及地理空間走向大致可以分為三類:西行型,轉(zhuǎn)折型和北上型。其中B類路徑屬于西行型,該類路徑登陸的熱帶氣旋主要來自西北太平洋,熱帶氣旋形成后向西北偏西方向移動(dòng),進(jìn)入南海后繼續(xù)西北行,進(jìn)入廣西后逐漸消逝。而A、D和F類屬于轉(zhuǎn)折型路徑,此類路徑登陸的臺(tái)風(fēng)主要也是來自西北太平洋。熱帶氣旋形成后向偏西方向移動(dòng),但是由于“副高”位置東撤或冷空氣及其他天氣系統(tǒng)廣東而影響,路徑發(fā)生轉(zhuǎn)向,程拋物線型轉(zhuǎn)向東北移動(dòng)。C和E類路徑屬于北上型,該類路徑熱帶氣旋多是形成與南海中、北部海面。但是在形成后借助熱帶氣旋內(nèi)力和副高西元偏北氣流引導(dǎo),使其向北移動(dòng),分別在福建省和湖南省逐漸消逝。
表2 熱帶氣旋路徑空間聚類分布特征
表1和表2分別對(duì)熱帶氣空間路徑聚類結(jié)果以及分布特征進(jìn)行一個(gè)比較。熱帶氣旋的登陸點(diǎn)很大程度低依賴其路徑,表3展示了A-F類熱帶氣旋登陸地分布情況。廣東省海岸線較長(zhǎng),在對(duì)登陸點(diǎn)的研究中,按廣東省的地理環(huán)境將此海岸線分為了三個(gè)沿岸:粵東沿岸,珠江沿岸,粵西沿岸。登陸廣東省的熱帶氣旋基本集中在4個(gè)地區(qū),自西向東為雷州半島、陽(yáng)江-臺(tái)山、珠江口兩側(cè)以及汕尾-惠來。根據(jù)表3可以得出,不同類別的熱帶氣旋登陸點(diǎn)的分布情況:熱帶氣旋的總體情況大致為西多東少,對(duì)于A類路徑來說,94%的登陸點(diǎn)在粵西沿岸和珠江沿岸,幾乎沒有從粵東沿岸登陸的情況發(fā)生;而同樣為轉(zhuǎn)折型的路徑E、F類路徑來說,其登陸點(diǎn)的情況較一致,多是選擇在粵東沿岸登陸。B類路徑作為西行型路徑的代表,多是選擇珠江口岸登陸,而對(duì)于C和E類路徑來說,粵西沿岸登陸數(shù)約等于珠江三角洲和粵東沿岸之和,而且從粵東沿岸登陸數(shù)最少。
2.2 強(qiáng)度分布特征
熱帶氣旋氣旋的登陸情況呈現(xiàn)的是一種西多東少的分布,然而針對(duì)強(qiáng)度來說,總體呈現(xiàn)的是一種東強(qiáng)西弱的分布趨勢(shì),這個(gè)與廣東省所處的地理緯度、大氣環(huán)流系統(tǒng)的平均位置有密切的關(guān)系。圖4以盒須圖的形式展示了各類TC的登陸過程最大風(fēng)速的分布狀況。在各類路徑中,平均最大風(fēng)速最大值為轉(zhuǎn)折型路徑A和F類。按照不同臺(tái)風(fēng)等級(jí)分類來看,各類路徑的強(qiáng)度分布情況如圖5所示。從總體強(qiáng)度分布來說,強(qiáng)熱帶風(fēng)暴以上強(qiáng)度的熱帶氣旋登陸次數(shù)的概率是基本近似的,而熱帶氣壓和熱帶風(fēng)暴的登陸分別在13%和28%左右。A、C和D類路徑的強(qiáng)度分布情況與總體情況基本保持一致,相反的是,E和F類路徑在強(qiáng)度的分布上表現(xiàn)出一定的異常,E類為北上路徑,多是在粵西沿岸登陸,并且多是以強(qiáng)熱帶風(fēng)暴和臺(tái)風(fēng)的強(qiáng)度級(jí)別登陸,強(qiáng)熱帶風(fēng)暴強(qiáng)度的熱帶氣旋數(shù)占此類路徑總數(shù)的85%左右。F類為轉(zhuǎn)折路徑,主要是從粵東沿岸進(jìn)行登陸,此類路徑總占最大比例的是強(qiáng)臺(tái)風(fēng)(50%),而且強(qiáng)臺(tái)風(fēng)多是從粵東沿岸登陸,幾乎沒有從珠江和粵西沿岸登陸,其次臺(tái)風(fēng)占有29%,這類強(qiáng)度中,只有兩個(gè)是從珠江口岸登陸,其余均是從粵東沿岸登陸。西行型的B類路徑中,熱帶風(fēng)暴、強(qiáng)熱帶風(fēng)暴及臺(tái)風(fēng)三類強(qiáng)度分布情況平均在9個(gè),超強(qiáng)臺(tái)風(fēng)出現(xiàn)的概率較低,僅有的三個(gè)全部都是從粵東沿岸登陸,然后進(jìn)入廣西后逐漸消逝。熱帶氣旋強(qiáng)度與路徑的長(zhǎng)度也有著一定的關(guān)系,也就是與其生命史有著一定的關(guān)系。各類熱帶氣旋的生命史分布見圖4(b),圖中方框的上下界分別為各類路徑75%和25%分位值,方框內(nèi)短線為中位值,方框外短線為各類上、下邊界值。生命史變化幅度從1 d到60 d。其中C和F類熱帶氣旋的平均生命史最長(zhǎng),其次是A、D和E類,西型路徑的B類生命史最短。熱帶氣旋的平均最大風(fēng)速和生命史的相關(guān)系數(shù)達(dá)0.70,在海表溫度高和垂直風(fēng)切變小的條件下,一般生命史越長(zhǎng),氣旋發(fā)展的可能性就越大。
圖4 廣東省熱帶氣旋最大風(fēng)速和生命史箱圖(1949-2013)
圖5 不同級(jí)別熱帶氣旋在各類別的分布特征
2.3 活動(dòng)時(shí)間
不同類別登陸廣東省的熱帶氣旋路徑有著不同的季節(jié)性變化,但總體而言,隨著季節(jié)的推移,不同類別的熱帶氣旋路徑也在發(fā)生相應(yīng)的變化。在4月份之前由于“副高”位置偏南、偏東,鮮有熱帶氣旋登陸廣東。
圖6展示了不同類別的TC登陸廣東省月份的變化,各類熱帶氣旋有明顯的季節(jié)變化。由圖6可知,各種路徑的熱帶氣旋整體集中在7-10月,也就是說夏秋季節(jié)。但是針對(duì)不同類別,熱帶氣旋登陸的頻次峰值也各有不同:(1)A類、D類和F類:7月份;(2)B類:8月份;(3)C類:六月份和8月份;(4)E類:9月份。熱帶氣旋路徑頻數(shù)的這種季節(jié)變化與副熱帶高壓季節(jié)性的北移和南退密切相關(guān),并且與海平面的溫度的變化有著不可分割的關(guān)聯(lián)。
圖6 各類熱帶氣旋的每月平均分布數(shù)
針對(duì)不同的月份而言,臺(tái)風(fēng)的路徑也有所不同:5月時(shí),臺(tái)風(fēng)路徑多是以E類走向?yàn)橹?,此類熱帶氣旋多是在珠江口岸登陸,且源地多為南海?月,多是以A類和C類為主,此類路徑分別屬于轉(zhuǎn)折型和北上型,期間登陸熱帶氣旋共計(jì)22個(gè),其中有8個(gè)來自南海,占42%;7月份,登陸的路徑以A類為主,其次為F類,這兩類都屬于轉(zhuǎn)折型路徑,北上路徑在七月份時(shí)明顯減少;8月份,多是以A類和B類,其中以西行型路徑為主,其次是轉(zhuǎn)折型路徑;9月份,A類路徑最多,C類和F類其次;10-12月份時(shí),以A和D類轉(zhuǎn)折型路徑為主,北上路徑明顯減少,其中在11-12月份期間,基本沒有北上C和E類路徑的發(fā)生。
用FCM聚類方法,對(duì)廣東省熱帶氣旋路徑進(jìn)行了分類,并分析了不同類別的空間分布特征、強(qiáng)度和時(shí)間分布特征。
(1)利用插值的方法,將每條登陸廣東省的熱帶氣旋的路徑都劃分為20段,在此過程中極大程度地保證了路徑空間完整性?;?949-2013年的熱帶氣旋路徑數(shù)據(jù),利用PC、SC、S和DI四個(gè)參數(shù),定量地確定了使用FCM聚類算法時(shí)最優(yōu)的聚類數(shù)目為6。將熱帶氣旋路徑分為了6類:三類轉(zhuǎn)折型路徑、1類西行型路徑和2類北上型路徑。
(2)在對(duì)熱帶氣路徑空間特征進(jìn)行分析時(shí),將廣東省的海岸線分為粵東沿岸、珠江沿岸、粵西沿岸??傮w來說,熱帶氣旋的登陸情況是西多東少,結(jié)合聚類結(jié)果,轉(zhuǎn)折型路徑A多是選擇粵西沿岸登陸,而D和F類多是選擇粵東沿岸登陸,西行型的典型代表類B路徑,多是選擇珠江口岸登陸,C和E類作為北上型路徑,多是選擇從粵西沿岸和珠江沿岸進(jìn)行登陸,然后分別進(jìn)入湖南省和福建省。
(3)在對(duì)熱帶性強(qiáng)度和生命史分析時(shí),可以得出,最大風(fēng)速與生命史具有明顯的正相關(guān)型,這兩個(gè)特征量的系數(shù)在0.70左右。其中A、C和F類的強(qiáng)度和生命史居前三位,而西行型B類和北上型E類在強(qiáng)度和生命史上均居于后兩位
(4)就熱帶氣旋活動(dòng)時(shí)間而言,5-11月份是熱帶氣旋出現(xiàn)的集中期,但是不同類別在登陸時(shí)間上也有著一定的差異性。5月份是北上型路徑E類的高發(fā)期,其他類別出現(xiàn)的頻率相對(duì)較少。8月份以西行型路徑為主,而9-12月是轉(zhuǎn)折型路徑的登陸高峰期,
廣東省熱帶氣旋災(zāi)害發(fā)生的頻率高并且影響范圍較廣,利用FCM方法對(duì)路徑進(jìn)行聚類分析,并且根據(jù)聚類結(jié)果對(duì)路徑進(jìn)行空間分析,分析路徑的空間格局及其高發(fā)時(shí)段的時(shí)空耦合規(guī)律,進(jìn)而對(duì)廣東省因地制宜、因時(shí)制宜地采取針對(duì)性的適應(yīng)對(duì)策提供一定的參考依據(jù),可有效減輕熱帶氣旋災(zāi)害損失。
參考文獻(xiàn):
[1] Zuki ZM,Lupo A R.Interannual variability of tropical cyclone activity in the southern South China Sea[J].Journal of Geophysical Research.2008,113(D6):10-19.
[2] 曹祥村.2005年登陸我國(guó)熱帶氣旋特征分析[J].應(yīng)用氣象學(xué)報(bào),2007,18(3):412-416.
[3] 王毅,石漢青,黃思訓(xùn).西北太平洋熱帶氣旋的時(shí)空分布特征分析[J].自然災(zāi)害學(xué)報(bào),2009,19(6):166-174.
[4] 林繼生,羅金鈴.登陸廣東的熱帶氣旋災(zāi)害評(píng)估和預(yù)測(cè)模式[J].自然災(zāi)害學(xué)報(bào),1995,3(1):92-97.
[5] 周俊華,史培軍,陳學(xué)文.1949-1999年西北太平洋熱帶氣旋活動(dòng)時(shí)空分異研究[J].自然災(zāi)害學(xué)報(bào),2002,10(3):44-49.
[6] Camargo SJ,Robertson AW,Gaffney SJ,etal.Cluster Analysis of Typhoon Tracks.Part II:Large-Scale Circulation and ENSO[J].Journal of Climate.2007,20(14):3654-3676.
[7] Hsu K C,Li ST.Clustering spatial-temporal precipitation data using wavelet transform and self-organizingmap neural network[J]. Advances in Water Resources,2010,33(2):190-200.Advances in Water Resources,2010,33(2):190-200.
[8] 唐麗麗,胡德勇,李小娟.1951-2006年西北太平洋熱帶氣旋活動(dòng)時(shí)空特征[J].自然災(zāi)害學(xué)報(bào),2012,21(1):31-38.
[9] Ho C,Baik J,Kim J,etal.Interdecadal Changes in Summertime Typhoon Tracks[J].Journal of Climate.2004,17(9):1767-1776.
[10]Harr P A,Elsberry R L.Large-scale circulation variability over the tropical western North Pacific.Part I:Spatial patterns and tropical cyclone characteristics[J].Monthly weather review,1995,123(5):1225-1246.
[11]Lander M A.Specific tropical cyclone track types and unusual tropical cyclonemotions associated with a reverse-orientedmonsoon trough in the western north pacific[J].Weather and Forecasting. 1996,11(2):170-186.
[12]Elsner JB.Tracking hurricanes[J].Bulletin of the American Meteorological Society.2003,84(3):353-356.
[13]Camargo S J,Robertson AW,Gaffney SJ,etal.Cluster analysis of typhoon tracks.Part I:General Properties[Z].2007:20,3635-3653.
[14]Nakamura J,Lall U,Kushnir Y,et al.Classifying north atlantic tropical cyclone tracks bymassmoments[J].Journal of Climate. 2009,22(20):5481-5494.
[15]高新波.模糊聚類分析及其應(yīng)用[M].西安:西安電子科技大學(xué)出版社,2004:212.
[16]Bezdek J C.Pattern Recognition with Fuzzy Objective Function Algorithms[M].Kluwer Academic Publishers,1981:256.
[17]Amine M.Bensaid L O H J.Validity-guided(re)clustering with applications to image segmentation[J].IEEE Transactions on Fuzzy Systems.1996,4(2):112-123.
[18]Xie X L,Beni G A.A validity measure for fuzzy clustering[J]. IEEE Transactions on pattern Analysis and Machine Intelligence. 1991,13(8):841-847.
[19]Dunn JC.A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters[J].Cybernetics and Systems.1973,3(3):32-57.
Classification of Tropical Cyclone Tracks Striking Guangdong from 1949-2013 based on Fuzzy c-means
Zhang Qianying,Zhong Shaobo and Huang Quanyi
(Tsinghua University,Department of Engineering Physics/Institute of Public Safety Research,Beijing 100084,China)
Based on the best-track dataset from thewww.typhoon.gov.cn between 1949-2013,amethod is established for objective classification of tropical cyclone(TC)tracks striking Guangdong province by Fuzzy cmeans(FCM)that takes into account such characteristic parameters as the position,intensity,path length,etc. Six clusters from classification are analyzed for comparison in terms of the TC’s genesis and landfall position,intensity and lifespan,the temporal characteristics was analyzed.These parameters are quite different among the clusters.From the trends in the 65 years,the frequency of the western ismore than the eastern,while the intensity is opposite.
tropical cyclone;interpolation;cluster analysis;FCM;spatial characteristic;Guangdong
P4;X43
A
1000-811X(2015)04-0187-07
10.3969/j.issn.1000-811X.2015.04.033
張倩影,鐘少波,黃全義.基于模糊C均值的廣東省登陸熱帶氣旋路徑分類研究[J].災(zāi)害學(xué),2015,30(4):187-193.[Zhang Qianying,Zhong Shaobo and Huang Quanyi.Classification of tropical cyclone tracks striking Guangdong from 1949-2013 based on fuzzy c-means[J].Journal of Catastrophology,2015,30(4):187-193.]*
2015-04-03 修改日期:2015-05-27
國(guó)家自然科學(xué)基金項(xiàng)目(91224004)
張倩影(1990-),女,河南周口人,碩士,主要從事氣象災(zāi)害研究.E-mail:skrvvtg@163.com