郭艷萍,高 云,呂丙東,彭 煒
(山西大同大學(xué)計(jì)算機(jī)與網(wǎng)絡(luò)工程學(xué)院,山西 大同 037009)
強(qiáng)對(duì)流引發(fā)的災(zāi)害性天氣[1]具有變化速度快、破壞性強(qiáng)的特點(diǎn),其巨大的殺傷性對(duì)國(guó)民的生命財(cái)產(chǎn)安全造成嚴(yán)重威脅,災(zāi)害性天氣預(yù)報(bào)技術(shù)逐漸成為氣象領(lǐng)域的重要研究課題,雷達(dá)回波外推技術(shù)[2]應(yīng)運(yùn)而生。作為臨近天氣預(yù)報(bào)的主要手段,外推技術(shù)以多普勒天氣雷達(dá)探測(cè)到的當(dāng)前回波數(shù)據(jù)為參考依據(jù),明確回波強(qiáng)度分布與回波體的運(yùn)動(dòng)方向與速度,經(jīng)線性或非線性外推回波體,獲取天氣變化過(guò)程的回波數(shù)據(jù)。
當(dāng)前較為主流的雷達(dá)回波外推技術(shù)主要是變分回波跟蹤算法[3]。該算法通過(guò)添加兩個(gè)的約束條件,利用變分技術(shù)迭代計(jì)算雷達(dá)回波運(yùn)動(dòng)矢量場(chǎng),實(shí)現(xiàn)強(qiáng)對(duì)流天氣的臨近預(yù)報(bào)。對(duì)比傳統(tǒng)交叉相關(guān)法,此算法在命中率、臨界成功指數(shù)以及虛警率方面具有突出優(yōu)勢(shì),外推預(yù)報(bào)效果優(yōu)勢(shì)顯著。
當(dāng)雷達(dá)回波穩(wěn)定性較為理想時(shí),雷達(dá)回波外推技術(shù)具備精準(zhǔn)跟蹤回波運(yùn)動(dòng)變化的能力,一旦災(zāi)害性天氣的危險(xiǎn)程度呈急劇上升或衰減趨勢(shì),外推預(yù)報(bào)誤差將隨時(shí)間推移直線增加,嚴(yán)重影響制定抗災(zāi)決策的合理性。因此,預(yù)報(bào)數(shù)據(jù)誤差識(shí)別是一個(gè)具有重大意義與價(jià)值的研究方向。利用預(yù)報(bào)與實(shí)際回波的相關(guān)系數(shù),定量反映誤差相關(guān)性,為后續(xù)識(shí)別奠定理論基礎(chǔ);融合平均絕對(duì)誤差與探測(cè)概率,直觀分析預(yù)報(bào)數(shù)據(jù)誤差情況;應(yīng)用有監(jiān)督?jīng)Q策樹(shù)理念,賦予誤差識(shí)別描述性。
劃分某個(gè)時(shí)刻的多普勒天氣雷達(dá)回波圖,得到多個(gè)小空間區(qū)域,假定光流在小空間Ω中處于恒定狀態(tài),其短時(shí)內(nèi)連續(xù)幀的回波圖像運(yùn)動(dòng)呈線性,因此光流目標(biāo)函數(shù)式如下所示
(1)
式中,zt(x,y)表示t時(shí)刻像素點(diǎn)(x,y)的雷達(dá)回波強(qiáng)度;?z(x,y)與W(x,y)分別是該像素點(diǎn)的回波強(qiáng)度矢量微分值與窗口權(quán)值函數(shù),其中,后者與此像素點(diǎn)到中心點(diǎn)的距離呈反比;V表示像素中心點(diǎn)的光流[4]。
若等式方程組(2)成立,則解得空間Ω的光流場(chǎng)[5],如式(3)所示
(2)
(3)
其中,T表示矩陣轉(zhuǎn)置因子;α、β各是空間Ω的回波強(qiáng)度矢量微分值集矩陣與t時(shí)刻回波強(qiáng)度集逆矩陣;W′指代窗口權(quán)值函數(shù)集的對(duì)角矩陣[6];{(x1,y1),(x2,y2),…,(xn,yn)}表示小空間Ω內(nèi)n個(gè)像素點(diǎn)的集合。
同理,解得各空間光流場(chǎng)。經(jīng)過(guò)整合所有空間的光流場(chǎng),得到整個(gè)回波的光流場(chǎng)。
氣象數(shù)據(jù)種類(lèi)多樣。當(dāng)待預(yù)報(bào)對(duì)象是降水系統(tǒng)或風(fēng)場(chǎng)時(shí),則連續(xù)幀的回波圖像運(yùn)動(dòng)在短時(shí)內(nèi)為非線性,若利用以往的線性外推技術(shù)來(lái)預(yù)報(bào)數(shù)據(jù),就會(huì)導(dǎo)致預(yù)報(bào)與實(shí)際的回波位置之間存在顯著誤差。
求算研究區(qū)域O在同一預(yù)報(bào)時(shí)效下預(yù)報(bào)雷達(dá)回波與實(shí)際雷達(dá)回波的相關(guān)系數(shù),定量反映出兩數(shù)據(jù)間誤差的相關(guān)性,為預(yù)報(bào)數(shù)據(jù)誤差識(shí)別奠定理論基礎(chǔ)。
假設(shè)實(shí)際與預(yù)報(bào)的雷達(dá)回波光流場(chǎng)分別是f、,預(yù)報(bào)初始時(shí)間與時(shí)效各為t0、τ,則采用下列計(jì)算公式,即解得預(yù)報(bào)雷達(dá)回波光流場(chǎng)與實(shí)際雷達(dá)回波光流場(chǎng)在預(yù)報(bào)時(shí)效為τ時(shí)的相關(guān)系數(shù)χ(τ)
(4)
其中,p指代雷達(dá)回波光流的當(dāng)前位置[7]。
通過(guò)下列微積分公式微分預(yù)報(bào)時(shí)效τ,獲取去相關(guān)時(shí)間L
(5)
對(duì)由所有光流位置得出的相關(guān)系數(shù)取平均值,以更好地分析預(yù)報(bào)與實(shí)際光流場(chǎng)數(shù)據(jù)之間的誤差。當(dāng)兩個(gè)雷達(dá)回波光流場(chǎng)間的相關(guān)系數(shù)χ(t)呈指數(shù)規(guī)律變化時(shí),將去相關(guān)時(shí)間L作為指數(shù)時(shí)間常數(shù),反映所測(cè)雷達(dá)回波的可預(yù)報(bào)性[8]。
為使預(yù)報(bào)數(shù)據(jù)誤差分析更具直觀性,結(jié)合平均絕對(duì)誤差MAE與探測(cè)概率POD兩指標(biāo)[9,10]加以定性補(bǔ)充說(shuō)明,各指標(biāo)計(jì)算公式分別如下所示
(6)
(7)
該式內(nèi),N為雷達(dá)回波圖像含有的總像素點(diǎn)數(shù)量;N′、N″各指代預(yù)報(bào)與實(shí)際回波像素點(diǎn)的兩種共生狀態(tài)。
關(guān)于探測(cè)概率指標(biāo),結(jié)合預(yù)報(bào)結(jié)果影響因子產(chǎn)生的預(yù)報(bào)數(shù)據(jù)誤差,逐個(gè)像素點(diǎn)比對(duì)預(yù)報(bào)回波與實(shí)際回波。若某像素點(diǎn)的回波值比預(yù)設(shè)閾值大,則判定其為有效;反之,則判定為無(wú)效。故當(dāng)預(yù)報(bào)與實(shí)際的回波像素點(diǎn)均有效時(shí),該像素點(diǎn)的狀態(tài)為N′;當(dāng)預(yù)報(bào)回波像素點(diǎn)無(wú)效,實(shí)際像素點(diǎn)有效時(shí),其狀態(tài)為N″。
將預(yù)報(bào)數(shù)據(jù)誤差的識(shí)別階段視為數(shù)據(jù)挖掘技術(shù)[11]的分類(lèi)問(wèn)題,應(yīng)用有監(jiān)督?jīng)Q策樹(shù)理念[12],建立出外推技術(shù)預(yù)報(bào)數(shù)據(jù)誤差識(shí)別模型。
由于預(yù)報(bào)結(jié)果的影響因素除氣候條件外,還包含溫濕度傳感器的距離與角度,故在預(yù)報(bào)數(shù)據(jù)特征集合中加入傳感距離與角度兩指標(biāo)數(shù)據(jù),并按照以下步驟架構(gòu)預(yù)報(bào)數(shù)據(jù)誤差識(shí)別模型:
1)合并所有預(yù)報(bào)數(shù)據(jù)特征屬性,把所得屬性集作為有監(jiān)督?jīng)Q策樹(shù)的根節(jié)點(diǎn);
2)遍歷屬性集中各屬性的所有分割模式,完成分割點(diǎn)尋優(yōu)處理。預(yù)報(bào)數(shù)據(jù)的屬性值個(gè)數(shù)不盡相同,故應(yīng)用信息增益率,評(píng)估分割點(diǎn)的尋優(yōu)純度,以防止確定分割點(diǎn)時(shí)偏向多屬性值的屬性,降低決策樹(shù)在誤差識(shí)別模型中的適用性。信息增益率的計(jì)算流程描述如下:
①已知訓(xùn)練數(shù)據(jù)集S內(nèi)m個(gè)屬性的集合是A={a1,a2,…,am},對(duì)應(yīng)k個(gè)類(lèi)別標(biāo)識(shí)的集合為C={c1,c2,…,ck},屬性集劃分?jǐn)?shù)據(jù)集S為m個(gè)子集,所得子集的集合是S={s1,s2,…,sm},訓(xùn)練集S中含有|S|個(gè)數(shù)據(jù),其中,屬性集為ai(i=1,2,…,m)的訓(xùn)練數(shù)據(jù)個(gè)數(shù)是|si|,類(lèi)別標(biāo)識(shí)集為cj(j=1,2,…,k)的數(shù)據(jù)個(gè)數(shù)是|cj|,當(dāng)屬性集為ai的訓(xùn)練數(shù)據(jù)里含有類(lèi)別cj時(shí),此類(lèi)數(shù)據(jù)個(gè)數(shù)為|cja|;
②若類(lèi)別標(biāo)識(shí)集為cj的發(fā)生概率為P(cj),屬性集為ai的發(fā)生概率為P(ai),屬性集是ai的數(shù)據(jù)集里存在類(lèi)別cj的概率為P(cj|ai),則各概率的計(jì)算公式分別如下所示
(8)
(9)
(10)
其中,freq表示重采樣頻率[13]。
③采用下列公式求解各類(lèi)別的信息熵
(11)
④利用下列公式計(jì)算各類(lèi)別的條件熵
=infoi(S)
(12)
⑤結(jié)合類(lèi)別的信息熵與條件熵,推導(dǎo)出類(lèi)別與屬性的信息增益計(jì)算公式,如下所示
G(C,A)=H(C)-H(C|A)
=info(C)-info(C|A)
=info(S)-infoi(S)=gain(a)
(13)
該式內(nèi),H(C)、H(C|A)指代類(lèi)別標(biāo)識(shí)與條件的信息量。
⑥經(jīng)式(14)解得屬性集合A={a1,a2,…,am}的信息熵后,通過(guò)式(15)取得用于評(píng)估分割點(diǎn)尋優(yōu)純度的信息增益率
(14)
(15)
其中,split_info(a)指代分裂信息。
3)根據(jù)得到的最優(yōu)分割點(diǎn),劃分屬性集為兩部分;
4)利用第2)~3)步循環(huán)劃分上步分類(lèi)的兩個(gè)部分,待剩余數(shù)據(jù)無(wú)法分割時(shí)終止迭代運(yùn)行。
面向所建預(yù)報(bào)數(shù)據(jù)誤差識(shí)別模型,逐個(gè)結(jié)點(diǎn)統(tǒng)計(jì)錯(cuò)誤分類(lèi)次數(shù),將下一葉子節(jié)點(diǎn)的錯(cuò)分次數(shù)作為當(dāng)前結(jié)點(diǎn)的錯(cuò)分次數(shù),當(dāng)數(shù)值比識(shí)別模型預(yù)設(shè)的容錯(cuò)閾值大時(shí),用任意葉子節(jié)點(diǎn)替換該結(jié)點(diǎn)并完成標(biāo)記,以此實(shí)現(xiàn)識(shí)別模型的修剪與調(diào)整。
雷達(dá)回波外推技術(shù)常用來(lái)預(yù)測(cè)降水量,因此選取某區(qū)域近七十分鐘降雨量的實(shí)際數(shù)據(jù)與外推技術(shù)的預(yù)報(bào)數(shù)據(jù)作為研究目標(biāo),從降水強(qiáng)度、位置以及形態(tài)等角度,檢驗(yàn)本文模型對(duì)預(yù)報(bào)回波數(shù)據(jù)誤差識(shí)別的有效性與實(shí)踐性。其中,實(shí)際降雨量由西北部的地面觀測(cè)臺(tái)站測(cè)得;預(yù)報(bào)時(shí)效為10分鐘。
圖1所示為通過(guò)多普勒天氣雷達(dá)[14]得到的目標(biāo)區(qū)域?qū)嶋H降水與預(yù)報(bào)降水雷達(dá)回波圖像。
圖1 實(shí)際與預(yù)報(bào)降水的雷達(dá)回波示意圖
該實(shí)驗(yàn)環(huán)節(jié)中,采用本文模型識(shí)別雷達(dá)回波圖像中降水強(qiáng)度誤差與位置誤差,得到各預(yù)報(bào)時(shí)效下缺漏識(shí)別、錯(cuò)誤識(shí)別次數(shù)以及識(shí)別時(shí)長(zhǎng),如圖2所示。
圖2 誤差識(shí)別效果評(píng)估示意圖
由圖2(a)可知,第一次進(jìn)行降水強(qiáng)度誤差識(shí)別時(shí)未出現(xiàn)缺漏情況,最后一次誤差識(shí)別時(shí),缺漏與錯(cuò)誤識(shí)別各自僅發(fā)生4次;從圖2(b)降水位置的兩種無(wú)效識(shí)別結(jié)果可以看出,前兩次均正確識(shí)別出了位置誤差,且僅發(fā)生一次缺漏,最后一次的缺漏與錯(cuò)誤識(shí)別各是3次。較低的無(wú)效識(shí)別次數(shù)說(shuō)明本文模型融合平均絕對(duì)誤差與探測(cè)概率指標(biāo),結(jié)合相關(guān)系數(shù),定量且定性地綜合分析了外推技術(shù)的預(yù)報(bào)數(shù)據(jù)誤差,故識(shí)別精度相對(duì)較高。根據(jù)以上兩組指標(biāo)數(shù)據(jù)的變化趨勢(shì)而言,無(wú)效識(shí)別次數(shù)與識(shí)別時(shí)長(zhǎng)均隨著時(shí)間的推移而大幅上升,這不僅對(duì)長(zhǎng)期預(yù)報(bào)的識(shí)別精度有著極大的負(fù)面影響,而且極有可能發(fā)生因識(shí)別時(shí)間過(guò)長(zhǎng)而導(dǎo)致模型無(wú)法順利運(yùn)行的情況。今后將針對(duì)該問(wèn)題展開(kāi)深入分析與探討。
降水形態(tài)包含主、次軸特征長(zhǎng)度以及覆蓋面積等屬性,將三個(gè)指標(biāo)作為實(shí)際與預(yù)報(bào)數(shù)據(jù)的誤差對(duì)比項(xiàng)。假設(shè)矩陣δ2*ν即回波圖中各像素點(diǎn)與中心的相對(duì)坐標(biāo)集合,利用灰色關(guān)聯(lián)度-主成分分析法[15],求解出協(xié)方差矩陣δδT的特征值λ1、λ2,即降水主軸特征長(zhǎng)度與次軸特征長(zhǎng)度;根據(jù)降水區(qū)域的雷達(dá)回波像素點(diǎn)個(gè)數(shù),確定覆蓋面積,因維度不同時(shí)各像素點(diǎn)的覆蓋面積不盡相同,故采用下列計(jì)算公式解得降水區(qū)域的覆蓋面積
(16)
該式內(nèi),dw表示像素距離,φn表示第n個(gè)像素的維度。
經(jīng)本文識(shí)別實(shí)際與預(yù)報(bào)的降雨形態(tài)指標(biāo)數(shù)據(jù)誤差,得出圖3所示的誤差識(shí)別效果評(píng)估結(jié)果。
圖3 基于降雨形態(tài)的誤差識(shí)別效果評(píng)估示意圖
從缺漏、錯(cuò)誤識(shí)別結(jié)果以及所用時(shí)長(zhǎng)可以看出,該模型應(yīng)用有監(jiān)督?jīng)Q策樹(shù)理念,將預(yù)報(bào)數(shù)據(jù)誤差的識(shí)別階段視為數(shù)據(jù)挖掘技術(shù)的分類(lèi)問(wèn)題,且在預(yù)報(bào)數(shù)據(jù)特征集合中加入了傳感距離與角度兩指標(biāo)數(shù)據(jù),因此,對(duì)比強(qiáng)度與位置的數(shù)據(jù)誤差識(shí)別結(jié)果,錯(cuò)誤、缺漏識(shí)別次數(shù)與識(shí)別時(shí)長(zhǎng)均有所減少,具有更理想的識(shí)別精度與實(shí)時(shí)性,但變化發(fā)展趨勢(shì)仍存在一定的消極性。
雷達(dá)回波外推技術(shù)作為氣象災(zāi)害的主要預(yù)警手段,在短時(shí)預(yù)報(bào)中得以廣泛應(yīng)用。由于當(dāng)前應(yīng)用的雷達(dá)回波外推技術(shù)正處于探索的初期階段,預(yù)報(bào)數(shù)據(jù)仍存在一定誤差,故研究一種誤差識(shí)別方法,以提升外推技術(shù)的預(yù)報(bào)精準(zhǔn)度。為綜合優(yōu)化誤差識(shí)別各項(xiàng)指標(biāo),從以下幾個(gè)角度著手改進(jìn):外推預(yù)報(bào)誤差的產(chǎn)生因素除文中所提外,還有回波自身發(fā)生形變因素,下一階段應(yīng)添加回波增強(qiáng)與減弱趨勢(shì),完善模型的誤差識(shí)別項(xiàng);應(yīng)嘗試采用神經(jīng)網(wǎng)絡(luò)、傅里葉變換等人工智能算法,設(shè)計(jì)出高準(zhǔn)度與高穩(wěn)定性的雷達(dá)回波外推技術(shù),從根本上減小外推預(yù)報(bào)誤差。