国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器學(xué)習(xí)和單站地面氣象要素的雷電臨近預(yù)警方法

2022-03-05 01:21趙生昊覃彬全杜樂(lè)
氣象科技 2022年1期
關(guān)鍵詞:氣象要素特征向量分類器

趙生昊 覃彬全* 杜樂(lè)

(1 重慶市氣象安全技術(shù)中心,重慶 401120; 2 重慶市地質(zhì)礦產(chǎn)勘查開發(fā)局,重慶 401121)

引言

雷電防護(hù)可以有效減少雷電災(zāi)害造成的人身傷亡和經(jīng)濟(jì)損失。在雷電防護(hù)中,除運(yùn)用防雷裝置對(duì)目標(biāo)進(jìn)行直接防護(hù),對(duì)雷電活動(dòng)進(jìn)行預(yù)警預(yù)報(bào)并采取主動(dòng)措施減小損失也是當(dāng)前普遍采用的防護(hù)手段。雷電臨近預(yù)警指提前時(shí)間為0~2 h的雷電預(yù)警[1],近年來(lái)國(guó)內(nèi)外學(xué)者在該方面開展了深入研究。呂偉濤等[1]結(jié)合雷達(dá)、閃電定位系統(tǒng)、電場(chǎng)儀等多種觀測(cè)資料,利用區(qū)域識(shí)別 、跟蹤和外推算法與決策樹算法,建立了雷電臨近預(yù)報(bào)系統(tǒng)。張燁方等[2]根據(jù)預(yù)警對(duì)象與閃電定位數(shù)據(jù)的距離判定關(guān)系,并引入雷達(dá)閾值控制優(yōu)化,建立了一種基于閃電定位數(shù)據(jù)的雷電臨近預(yù)警模型。琚澤立等[3]、徐偉等[4]基于大氣電場(chǎng)儀數(shù)據(jù),通過(guò)對(duì)電場(chǎng)信號(hào)的模態(tài)分解或重構(gòu),分別實(shí)現(xiàn)了雷電臨近預(yù)警方法。Mecikalski等[5]通過(guò)結(jié)合雷達(dá)、GEOS衛(wèi)星系統(tǒng)和數(shù)值模式,實(shí)現(xiàn)了一個(gè)集成的0~1 h初閃預(yù)警框架,能夠在暴雨發(fā)生前30~45 min發(fā)出預(yù)警。

以上研究普遍使用了氣象衛(wèi)星、雷達(dá)、大氣電場(chǎng)儀等專業(yè)氣象探測(cè)設(shè)備取得的資料,一些更是需要建立中心化網(wǎng)絡(luò),推廣應(yīng)用門檻較高,相比之下小型自動(dòng)氣象站技術(shù)成熟、成本低廉,在能源、交通、農(nóng)業(yè)等行業(yè)已有規(guī)?;荚O(shè)。本研究旨在充分利用單站氣象要素和閃電定位資料,結(jié)合知識(shí)發(fā)現(xiàn)和機(jī)器學(xué)習(xí)方法,建立多參數(shù)機(jī)器學(xué)習(xí)模型,探討一種靈活的、基于單站氣象要素的雷電臨近預(yù)警方法及其可行性。

1 數(shù)據(jù)與方法

1.1 數(shù)據(jù)來(lái)源

本文所使用的單站氣象要素資料由重慶市氣象探測(cè)數(shù)據(jù)平臺(tái)提供的接口獲取,對(duì)應(yīng)資料名稱為重慶自動(dòng)站地面5分鐘資料, 該資料包含重慶35個(gè)自動(dòng)站器測(cè)地面氣象要素。綜合考慮數(shù)據(jù)連續(xù)性和站點(diǎn)地理分布、海拔高度情況,從中選取了8個(gè)站點(diǎn)作為研究站點(diǎn),站點(diǎn)分布如圖1所示,資料選取時(shí)間跨度為2017年6月至2019年12月,形成的數(shù)據(jù)集稱為地面要素?cái)?shù)據(jù)集。

圖1 重慶市8個(gè)站點(diǎn)地理位置分布

閃電定位數(shù)據(jù)來(lái)源自重慶市閃電定位系統(tǒng),該系統(tǒng)于2007年基于ADTD閃電定位網(wǎng)絡(luò)搭建,包含重慶市內(nèi)5個(gè)測(cè)站及周邊省份的8個(gè)測(cè)站,能夠?qū)崟r(shí)記錄地閃回?fù)舻陌l(fā)生時(shí)間、地理位置、強(qiáng)度等信息,網(wǎng)內(nèi)理論定位精度優(yōu)于300 m。取全市范圍內(nèi)2017年6月至2019年12月之間的閃電定位資料形成數(shù)據(jù)集,稱為閃電定位數(shù)據(jù)集。

1.2 特征向量選取

氣壓、溫度、濕度和風(fēng)是嚴(yán)格意義上的4種氣象要素[6],當(dāng)雷暴過(guò)境時(shí),各氣象要素均會(huì)發(fā)生變化[7-8]。本文選取地面自動(dòng)站測(cè)量的站位氣壓、氣溫、相對(duì)濕度、風(fēng)速作為特征向量,雖然所選特征只能反映雷暴涉及的地面氣象要素,不能代表與雷暴關(guān)系更緊密的高空氣象要素,但與高空氣象要素相比,地面氣象要素的測(cè)量更為可靠、連續(xù),數(shù)據(jù)的獲取也更容易、及時(shí),目前各類自動(dòng)氣象站都能夠觀測(cè)。

1.3 數(shù)據(jù)清洗

對(duì)于地面氣象要素?cái)?shù)據(jù)集,因其已經(jīng)過(guò)質(zhì)量控制,僅通過(guò)箱線圖分析刪除了站位氣壓異常(小于873.2 hPa)的記錄,通過(guò)經(jīng)驗(yàn)刪除了溫度異常(小于-10 ℃)的記錄。

根據(jù)ADTD定位系統(tǒng)探測(cè)原理,其二站定位采用磁定向交匯法,受地形所限定位精度較低[9],另由于云閃干擾,ADTD對(duì)于10 kA以下回?fù)籼綔y(cè)能力較差[10],因此將閃電定位數(shù)據(jù)集中定位方式低于3站和電流強(qiáng)度絕對(duì)值小于10 kA的記錄刪除。

1.4 標(biāo)簽向量設(shè)置

以20 km為半徑對(duì)8個(gè)站點(diǎn)進(jìn)行緩沖區(qū)處理(Lambert Conformal投影,中央經(jīng)線105 °E, 標(biāo)準(zhǔn)緯線25 °N、47 °N),將氣象要素?cái)?shù)據(jù)集逐行對(duì)應(yīng)緩沖區(qū)與ADTD數(shù)據(jù)集進(jìn)行地理相交運(yùn)算,在相交運(yùn)算結(jié)果中篩選出觀測(cè)時(shí)間t0之后0~10 min、10~20 min、20~30 min 3個(gè)時(shí)間段內(nèi)發(fā)生的地閃活動(dòng),如果篩出的地閃活動(dòng)大于等于1次,則將對(duì)應(yīng)標(biāo)簽設(shè)置為1,反之則設(shè)置為0。如此便得到了3組標(biāo)簽向量,即Ati(i=10,20,30),例如數(shù)據(jù)集中某條記錄對(duì)應(yīng)的觀測(cè)站點(diǎn)為萬(wàn)盛,觀測(cè)時(shí)間為2018年7月15日11:10:00,At20=1,則表示在當(dāng)日 11:20—11:30這10 min內(nèi),萬(wàn)盛站周邊20 km范圍內(nèi)有地閃活動(dòng)發(fā)生。

1.5. 性能評(píng)估指標(biāo)

根據(jù)《GB/T 38121—2019 雷電防護(hù) 雷暴預(yù)警系統(tǒng)》[11],相應(yīng)觀測(cè)事件與預(yù)警列聯(lián)關(guān)系如表1。衡量雷暴預(yù)警系統(tǒng)主要性能的參數(shù)有2個(gè),其中虛報(bào)率(FAR)由虛報(bào)數(shù)和總警報(bào)數(shù)之比確定,F(xiàn)AR越小越好;預(yù)警失敗率(FTWR)由漏報(bào)次數(shù)和應(yīng)報(bào)警總數(shù)之比確定,F(xiàn)TWR越小越好。

表1 雷電觀測(cè)事件與預(yù)警列聯(lián)表

在雷電預(yù)警中,顯然我們最為關(guān)注有效警報(bào),但虛報(bào)率過(guò)高會(huì)引起不必要的操作,影響預(yù)警效率,因此本文還引入了機(jī)器學(xué)習(xí)中的F1作為性能衡量指標(biāo),其定義為準(zhǔn)確率和召回率的調(diào)和平均,即

(1)

F1值越大,分類器性能越好,其最小值為0,可以看出,僅當(dāng)FAR和FTWR同時(shí)接近于0時(shí),F(xiàn)1接近最大值1。

1.6 研究方法

以At10為標(biāo)簽,分別統(tǒng)計(jì)了8個(gè)站點(diǎn)的標(biāo)簽向量類別分布,將標(biāo)簽為0的類別稱為地閃不活躍類別,標(biāo)簽為1的類別稱為地閃活躍類別,統(tǒng)計(jì)結(jié)果如表2所示。從表中可以看出,地閃不活躍類別與活躍類別(不平衡)比最大為307,最小為115,根據(jù)前文中標(biāo)簽的設(shè)置,本文對(duì)雷電的臨近預(yù)警可以看作是不平衡場(chǎng)景下的二分類問(wèn)題。

表2 重慶市8個(gè)站點(diǎn)海拔高度及2017年6月至2019年12月At10標(biāo)簽地閃樣本類別分布

不平衡學(xué)習(xí)是機(jī)器學(xué)習(xí)中的重要領(lǐng)域,常見的解決方法有設(shè)置無(wú)偏評(píng)價(jià)指標(biāo)、重采樣、代價(jià)敏感學(xué)習(xí)等[12],如前文設(shè)置的F1就是一種無(wú)偏的評(píng)價(jià)指標(biāo),其評(píng)價(jià)結(jié)果不會(huì)受不同類別中樣本數(shù)量所影響。重采樣技術(shù)則使用通過(guò)一些采樣機(jī)制來(lái)改變?cè)紨?shù)

據(jù)集的分布,使得處理后的數(shù)據(jù)集分布平衡,從而解決不平衡學(xué)習(xí)的問(wèn)題。重采樣技術(shù)可分為3類:欠采樣、過(guò)采樣與組合采樣,在實(shí)際應(yīng)用中,重采樣技術(shù)的效果因數(shù)據(jù)形態(tài)及分類器的不同存在較大差異,在一些情況下甚至不如直接使用分類器訓(xùn)練。

通過(guò)表2中分析,本文擬使用海拔及不平衡比率均差別較大的榮昌、黔江兩個(gè)站點(diǎn),以At10為標(biāo)簽,形成2個(gè)數(shù)據(jù)子集,并將每個(gè)子集按比例分為訓(xùn)練集和測(cè)試集。首先使用多個(gè)基線分類器(默認(rèn)參數(shù))對(duì)2個(gè)測(cè)試子集進(jìn)行訓(xùn)練并用5折交叉驗(yàn)證評(píng)估其準(zhǔn)確性,其次在不同的重采樣方法下重復(fù)上一步驟,在此基礎(chǔ)上挑選出性能(F1Score)最好的重采樣方法和分類器組合,并使用參數(shù)搜索方法調(diào)整重采樣及分類器參數(shù)以得到最佳模型,最后在測(cè)試集上驗(yàn)證模型并對(duì)于研究區(qū)內(nèi)所有站點(diǎn)做出整體分析。

本文所涉及的分類器有K最近鄰(K-Nearest Neighbors,KNN)、決策樹(Decision Tree,DT)、隨機(jī)森林(Random Forest,RF)、極限樹(Extra Trees,ET)、XGBoost(eXtreme Gradient Boosting),其中KNN、DT屬非線性算法,RF、ET、XGBoost屬集成算法;涉及的重采樣方法有隨機(jī)下采樣(Random Under Sampling,RUS)、Edited Nearest Neighbors(ENN)、SMOTE、ADASYN、SMOTE and Edited Nearest Neighbors(SMOTEENN),其中RUS、ENN屬欠采樣方法,SMOTE、ADASYN屬過(guò)采樣方法,SMOTEENN屬組合采樣方法。本文在前期工作排除了一些明顯不合適的分類器及采樣技術(shù)。

2 結(jié)果分析

2.1 觀測(cè)時(shí)間特征處理

使用核平滑函數(shù)對(duì)榮昌、黔江兩個(gè)數(shù)據(jù)子集進(jìn)行了各特征向量概率密度估計(jì),得到圖2。首先,對(duì)于兩個(gè)子集,氣壓、氣溫兩種特征分離度較好,相對(duì)濕度及風(fēng)速分離度較差;其次,兩子集各特征概率密度分布總體較為近似,但在氣壓概率密度分布上差異較大,如榮昌站點(diǎn)地閃活躍樣本集中發(fā)生于960 hPa 附近,黔江站點(diǎn)則集中在920 hPa左右,明顯與兩站海拔高度差異有關(guān)。

圖2 2017年6月至2019年12月榮昌、黔江自動(dòng)站地閃樣本對(duì)氣壓(a1,b1)、氣溫(a2,b2)、相對(duì)濕度(a3,b3)和風(fēng)速(a4,b4)概率密度估計(jì)

由于可分離特征較少,有必要補(bǔ)充特征向量,除氣象要素外,雷暴活動(dòng)在時(shí)間分布上也具有鮮明的特征,鞏崇水等[13]利用1981—2010年雷暴觀測(cè)資料,對(duì)中國(guó)年平均雷暴日的時(shí)空分布特征進(jìn)行分析,結(jié)果表明中國(guó)年平均雷暴日的時(shí)間分布表現(xiàn)為夏季多、冬季少;一天之中雷暴出現(xiàn)的時(shí)間集中在下午到晚上。因此將地面氣象要素觀測(cè)時(shí)間中的月份和時(shí)段列入特征向量,并利用三角函數(shù)將其分解為正弦和余弦兩個(gè)分量,即

(2)

(3)

(4)

(5)

式中,m、h分別為觀測(cè)月份和觀測(cè)時(shí)段,msin、mcos及hsin、hcos分別為m及h的正、余弦分量,處理后的月份及時(shí)段特征在12月至次年1月,23:00—00:00之間更為連續(xù),符合月份、時(shí)段的周期性特點(diǎn)。

2.2 分類模型選擇

按8∶2比例將榮昌、黔江數(shù)據(jù)子集分為訓(xùn)練集和測(cè)試集,分別基于4特征向量(壓、溫、濕、風(fēng))和8特征向量(壓、溫、濕、風(fēng)及觀測(cè)月份、時(shí)段正余弦分量),使用KNN、DT、RF、ET、XGBoost 5種基線分類器對(duì)訓(xùn)練集進(jìn)行5折交叉驗(yàn)證,各基線分類器均使用默認(rèn)參數(shù)。性能對(duì)比結(jié)果如表3所示。

表3 2017年6月至2019年12月榮昌、黔江訓(xùn)練集在4特征向量及8特征向量下基線分類器性能

從表3中可以看出,對(duì)于兩種訓(xùn)練集,首先,基于樹的集成分類器取得了較好的性能,其中極限樹分類器性能最好,F(xiàn)1分別達(dá)到了0.58及0.50,KNN及XGBoost分類器在本數(shù)據(jù)集上性能較差;其次,除XGBoost分類器外,8特征向量相對(duì)4特性向量分類性能提升巨大,以ET分類器為例,對(duì)于榮昌和黔江訓(xùn)練集分別具有100%和163.16%的性能提升。

在分別在使用RUS,ENN,SMOTE,ADASYN,SMOTEENN 5種采樣技術(shù)對(duì)兩個(gè)訓(xùn)練集(8特征)進(jìn)行重采樣后,再重復(fù)前一步驟,性能對(duì)比結(jié)果如表4所示。從表中可以看出,欠采樣方法性能較差,在隨機(jī)欠采樣后,各分類器性能甚至普遍不如未采樣(即表3中8特征向量分類性能);組合采樣方法性能相對(duì)未采樣有了一定提升;過(guò)采樣方法性能最好,尤其在ADASYN重采樣下,各分類器性能普遍達(dá)到最好;而在各重采樣方法下,仍然是ET分類器性能最好。綜合來(lái)看,雖然榮昌、黔江兩站的地理位置,海拔高度不同,數(shù)據(jù)集不平衡比率相差懸殊,但基于上述方法得到的最佳分類模型同為ADASYN-ET,性能相比未采樣的ET分別提升了10.34%、18%。

表4 2017年6月至2019年12月榮昌、黔江訓(xùn)練集在各種重采樣方法下基線分類器性能

2.3 模型超參數(shù)調(diào)試及適應(yīng)性探討

使用Scikit-Learn中的RandomSearchCV(隨機(jī)搜索調(diào)參)工具,基于榮昌訓(xùn)練集,對(duì)ADASYN-ET分類模型進(jìn)行參數(shù)調(diào)優(yōu),調(diào)優(yōu)過(guò)程中交叉驗(yàn)證設(shè)置為5折,迭代次數(shù)100,模型評(píng)價(jià)標(biāo)準(zhǔn)設(shè)置為F1。最終確定的模型參數(shù)ADASYN方法中鄰居數(shù)為4,ET分類器中最大特征數(shù)為lg2,葉節(jié)點(diǎn)最小樣本數(shù)為1,弱學(xué)習(xí)器個(gè)數(shù)為180,其他默認(rèn),驗(yàn)證曲線如圖3所示。對(duì)于黔江訓(xùn)練集,使用RandomSearchCV后確定的參數(shù)與榮昌訓(xùn)練集基本一致。

圖3 2017年6月至2019年12月榮昌、黔江訓(xùn)練集ADASYN-ET模型RandomSearchCV驗(yàn)證曲線:(a1,b1)鄰居數(shù),(a2,b2)弱學(xué)習(xí)器個(gè)數(shù),(a3,b3)最大特征數(shù),(a4,b4)葉節(jié)點(diǎn)最小樣本數(shù)

為更好研究各站差異,使用SVD(奇異值分解)對(duì)8個(gè)站點(diǎn)地閃活躍樣本中各特征的分布模式進(jìn)行PCA(主成分分析),在每個(gè)站點(diǎn),保留前2個(gè)主成分。圖4顯示了所有8個(gè)站點(diǎn)的每個(gè)特征變量對(duì)兩個(gè)主成分的載荷,并用KMeans聚類分析標(biāo)出了聚類中心(紅點(diǎn)),綜合來(lái)看黔江、酉陽(yáng)兩站在大多特征下有著不同的分布模式,表現(xiàn)在距聚類中心較遠(yuǎn),根據(jù)表2來(lái)看,此2個(gè)站點(diǎn)恰是海拔最高的兩個(gè)站點(diǎn),可以認(rèn)為海拔高度是影響數(shù)據(jù)特征分布的主要因素。

圖4 2017年6月至2019年12月重慶市8個(gè)站點(diǎn)地閃活躍樣本各特征向量對(duì)主成分載荷分布:(a)msin,(b)mcos,(c)hsin,(d)hcos,(e)氣壓,(f)氣溫,(g)相對(duì)濕度,(h)風(fēng)速(圖中黑點(diǎn)為研究站點(diǎn),紅點(diǎn)為KMeans聚類中心)

結(jié)合前文,榮昌、黔江2站點(diǎn)雖然在地理?xiàng)l件及類別比率方面差別較大,但2站確定的最優(yōu)分類模型、模型超參數(shù)均一致, 因此可認(rèn)為ADASYN-ET分類模型適用于本文所有站點(diǎn);但由于各站海拔高度不同,導(dǎo)致特征分布模式迥異,因此對(duì)于目標(biāo)站點(diǎn),不能使用其他站點(diǎn)氣象要素?cái)?shù)據(jù)進(jìn)行訓(xùn)練。

使用ADASYN-ET分類模型,同樣以為標(biāo)簽,對(duì)8個(gè)站點(diǎn)測(cè)試集進(jìn)行分類,各站點(diǎn)分類性能評(píng)估指標(biāo)如表5所示,F(xiàn)1及其不平衡比如圖5所示,可以看到,F(xiàn)1總體隨不平衡比的降低而升高,其中不平衡比最高(307∶1)的酉陽(yáng)子集,F(xiàn)1為0.53;不平衡比最低(115∶1)的萬(wàn)盛子集,F(xiàn)1達(dá)到了0.66。說(shuō)明雖然進(jìn)行了重采樣,但是最終性能仍然受到訓(xùn)練數(shù)據(jù)不平衡比的限制,不平衡比越低,模型性能越好。

表5 2017年6月至2019年12月重慶市8個(gè)研究站點(diǎn)測(cè)試集在At10、At20、At30標(biāo)簽下ADASYN-ET模型分類性能

圖5 2017年6月至2019年12月重慶市8個(gè)站點(diǎn)測(cè)試集ADASYN-ET模型分類性能及不平衡比分布

分別以At10、At20、At30為標(biāo)簽,對(duì)8個(gè)站點(diǎn)測(cè)試集進(jìn)行分類,各站點(diǎn)分類性能評(píng)估F1如圖6所示,其中At10標(biāo)簽下8站點(diǎn)F1平均值為0.60,At20下為0.59,At30下為0.60,說(shuō)明在0~30 min的預(yù)警提前期內(nèi),該分類模型性能基本一致,無(wú)衰減情況出現(xiàn)。

圖6 2017年6月至2019年12月重慶市8個(gè)站點(diǎn)測(cè)試集0~30 min預(yù)警提前期ADASYN-ET模型F1得分(圖中藍(lán)色為0~10 min提前期,橙色為10~20 min提前期,綠色為20~30 min提前期)

2.4 與其他雷電臨近預(yù)警方法對(duì)比

在GB/T 38121—2019發(fā)布前已有雷暴預(yù)警系統(tǒng)中,所使用的評(píng)估指標(biāo)不盡相同,可用于直接對(duì)比的系統(tǒng)較少。本文找到幾種近期臨近預(yù)警系統(tǒng)或方法,為便于對(duì)比,統(tǒng)一將性能評(píng)估指標(biāo)轉(zhuǎn)換為F1得分。

張長(zhǎng)秀等[14]在2019年對(duì)海南地區(qū)8個(gè)雷電預(yù)警站點(diǎn)的預(yù)警效率進(jìn)行了統(tǒng)計(jì)分析,得到海南地區(qū)新型雷電預(yù)警系統(tǒng)在提前期13.9 min的MPOD(平均有效預(yù)警率)約為85.5%,F(xiàn)AR為0.732,文中未提供單站覆蓋區(qū)域,換算得出,其8個(gè)站點(diǎn)在提前期13.9 min的平均F1得分為0.408。

徐偉等[4]基于集成經(jīng)驗(yàn)?zāi)B(tài)分解和極端梯度提升的雷電預(yù)警方法,選取了單站400個(gè)大氣電場(chǎng)儀數(shù)據(jù)樣本,其中有雷電發(fā)生樣本數(shù)為90,無(wú)雷電發(fā)生樣本數(shù)為310,覆蓋區(qū)域25 km,其多分類器融合提前20 min的最佳性能為POD=76.2%,F(xiàn)AR=33.3%,換算得出F1得分等于0.711。值得注意的是,其數(shù)據(jù)集不平衡比為3.4∶1。

雷電臨近預(yù)警系統(tǒng)由于設(shè)計(jì)目的不同,對(duì)評(píng)估指標(biāo)的偏重也不同,不能簡(jiǎn)單以一項(xiàng)指標(biāo)判斷優(yōu)劣。但綜合來(lái)看,本文提出的雷電臨近預(yù)警方法通過(guò)對(duì)模型進(jìn)行2年跨度的氣象要素資料訓(xùn)練即可得到不錯(cuò)的分類性能,在0~30 min預(yù)警提前期性能無(wú)衰減,具備實(shí)際應(yīng)用價(jià)值。

3 結(jié)論與討論

本文提出的雷電臨近預(yù)警研究,基于容易獲得的基本氣象要素,通過(guò)特征工程、重采樣、集成分類等機(jī)器學(xué)習(xí)方法的組合運(yùn)用,創(chuàng)建并挑選了較為合理的預(yù)警模型,該模型本質(zhì)上是一個(gè)不平衡條件下的二分類器,具有以下特征:①在氣象要素特征的基礎(chǔ)上,加入周期處理的觀測(cè)時(shí)段、月份特征能對(duì)模型分類性能提升明顯;②對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行過(guò)采樣可以進(jìn)一步改善模型的分類性能;③該模型適用于所有8個(gè)研究站點(diǎn),但由于不同站點(diǎn)間特征分布差異較大,因此對(duì)于特定站點(diǎn),不能使用他站數(shù)據(jù)集訓(xùn)練模型;④模型性能與數(shù)據(jù)集地閃非活躍/活躍類別不平衡比呈反比關(guān)系。

同時(shí),該預(yù)警模型也存在一些不足之處:①預(yù)警覆蓋區(qū)域不夠精細(xì),本文提出的預(yù)警研究基于氣象站周邊20 km區(qū)域,如縮小預(yù)警區(qū)域,將造成地閃樣本減少,分類性能下降,與一些專業(yè)雷電臨近預(yù)警系統(tǒng)(如具有1 km地閃分辨率的CAMS_LNWS臨近預(yù)警系統(tǒng))尚不具有可比性;②在本文選擇的研究站點(diǎn),該模型至少需2年跨度的單站氣象資料訓(xùn)練方能達(dá)到可用水平,對(duì)應(yīng)用場(chǎng)景有所限制。

綜合來(lái)看,基于模型的預(yù)警方法利用已有氣象站資源,應(yīng)用方式靈活,實(shí)現(xiàn)成本較低,對(duì)缺乏雷達(dá)、衛(wèi)星、電場(chǎng)儀等其他氣象探測(cè)資料的地區(qū)的防雷減災(zāi)工作具有一定的參考意義。

猜你喜歡
氣象要素特征向量分類器
二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計(jì)——以特征值和特征向量為例
學(xué)貫中西(6):闡述ML分類器的工作流程
克羅內(nèi)克積的特征向量
成都電網(wǎng)夏季最大電力負(fù)荷變化特征及其與氣象要素的關(guān)系
基于樸素Bayes組合的簡(jiǎn)易集成分類器①
一種自適應(yīng)子融合集成多分類器方法
三個(gè)高階微分方程的解法研究
河蟹養(yǎng)殖水溫預(yù)報(bào)模型研究
探測(cè)環(huán)境變化對(duì)臨沭站氣象要素的影響
淺談多分類器動(dòng)態(tài)集成技術(shù)
东阳市| 抚顺市| 南靖县| 乌什县| 宜宾县| 海安县| 富平县| 深泽县| 长丰县| 高陵县| 南投县| 葫芦岛市| 固始县| 乡城县| 洛隆县| 高陵县| 府谷县| 宜良县| 天津市| 阜新市| 务川| 白玉县| 松滋市| 镇江市| 大城县| 泰来县| 昂仁县| 广丰县| 滦南县| 大丰市| 盐边县| 博野县| 高青县| 祥云县| 静海县| 连江县| 天全县| 永仁县| 广宁县| 池州市| 马鞍山市|