王秀英 金欣 黃志鳳 歐建芳 羅少輝
摘 要:為探究西寧地區(qū)地閃頻次與雷電流幅值的關(guān)系,利用2013—2017年閃電定位監(jiān)測數(shù)據(jù),運用R語言研究該區(qū)域內(nèi)地閃頻次和雷電流幅值變化特征,通過可視化直觀展示兩者間的相關(guān)性,在相關(guān)性分析基礎(chǔ)上,建立基于地閃頻次的小時雷電流幅值回歸模型。結(jié)果表明,2013—2017年西寧市轄區(qū)內(nèi)小時地閃頻次最大為98次,雷電流幅值最大值為138 kA;地閃頻次極值點處,雷電流幅值為峰值或在峰值左右;累計時次內(nèi)的地閃頻次和雷電流幅值最大值呈顯著正相關(guān),相關(guān)系數(shù)達(dá)0.856([N]=29);基于地閃頻次擬合的小時雷電流幅值回歸模型能夠解釋觀測值73%的方差,模型的模擬效果較好,可用于小時雷電流幅值的預(yù)測。但由于樣本有限,需要在多資料融合的基礎(chǔ)上研究閃電定位監(jiān)測數(shù)據(jù),才能使模型穩(wěn)定性更強(qiáng),更深入了解雷電流幅值變化的機(jī)制,從而為雷電災(zāi)害風(fēng)險區(qū)劃和雷電災(zāi)害調(diào)查提供技術(shù)指標(biāo),為氣象防災(zāi)減災(zāi)提供決策依據(jù)。
關(guān)鍵詞:雷電流幅值;地閃頻次;統(tǒng)計分析;R語言
中圖分類號:P468.02文獻(xiàn)標(biāo)識碼:A文章編號:1003-5168(2020)34-0144-06
The Characteristic Analysis and R Realization of Ground Flicker Frequency
and Lightning Current Amplitude in Plateau Region
WANG Xiuying JIN Xin HUANG Zhifeng OU Jianfang LUO Shaohui
(Qinghai Meteorological Disaster Prevention Technology Center,Xining Qinghai 810000)
Abstract: In order to explore the relationship between lightning frequency and lightning current amplitude in Xining area, this paper used the lightning location monitoring data from 2013 to 2017, studied the variation characteristics of lightning frequency and lightning current amplitude in the region by using R language, and visually displayed the correlation between them. Based on the correlation analysis, the regression model of hourly lightning current amplitude based on ground flash frequency was established. The results show that the maximum hourly lightning frequency is 98 times and the maximum lightning current amplitude is 138 kA in Xining City from 2013 to 2017, and the lightning current amplitude is the peak value or around the peak value at the extreme point of ground flicker frequency. There was a significant positive correlation between the lightning flicker frequency and the maximum lightning current amplitude, and the correlation coefficient was 0.856 (n=29). The maximum regression model of lightning current amplitude fitting based on ground flicker frequency can explain the variance of observed value by 73%, and the simulation effect of the model is good, which can be used to predict the maximum value of lightning current amplitude. However, due to the limited samples, it is necessary to study and analyze the lightning location monitoring data on the basis of multi-data fusion, in order to make the model more stable and to understand the mechanism of lightning current amplitude change more deeply. It can provide technical index for lightning disaster risk regionalization and lightning disaster investigation, and provide decision basis for meteorological disaster prevention and mitigation.
小時地閃頻次.次.? ? ? ? ? ? ?1.0000000? ? ? ? ? ? ? 0.8563068
小時雷電流幅值.kA.? ? ? ? ? ?0.8563068? ? ? ? ? ? ? 1.0000000
結(jié)果表明,小時地閃頻次與不同地閃頻次的小時雷電流幅值呈顯著正相關(guān),相關(guān)系數(shù)為0.856([N]=29)。
4.2 相關(guān)關(guān)系的顯著性檢驗
利用R語言模塊中的cor.test()函數(shù)對單個的Pearson相關(guān)系數(shù)進(jìn)行檢驗。結(jié)果表明,小時地閃頻次與不同地閃頻次的小時雷電流幅值兩者之間相關(guān)度不為0。相關(guān)關(guān)系顯著性檢驗的R核心代碼如下:
cor.test(data_1[,1],data_4[,2])
#運行結(jié)果
Pearson's product-moment correlation
data:? data_1[, 1] and data_1[, 2]
t = 8.6153, df = 27, p-value = 3.137e-09
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
0.7138306? 0.9307155
sample estimates:
cor
0.8563068
4.3 回歸分析
利用OLS(Ordinary Least Square,普通最小二乘法)回歸法研究地閃頻次和雷電流幅值之間的變化規(guī)律。線性回歸模型側(cè)重考察變量之間的變化規(guī)律,并通過線性回歸方程來描述其關(guān)系,進(jìn)而確定一個變量的變化對另一個變量的影響程度,為預(yù)測提供科學(xué)依據(jù)。在R語言中,擬合線性模型最基本的函數(shù)是lm()[22]。為了使結(jié)果更加直觀,制作小時地閃頻次與不同地閃頻次的小時雷電流幅值的散點圖,如圖5所示。從圖5可知,地閃頻次和雷電流幅值呈線性關(guān)系,由此作回歸分析研究。
回歸分析的R核心代碼如下:
data_2-read.delim("clipboard")
myfit<-lm(LD~LN,data=data_2)
summary(myfit)
#運行結(jié)果
Call:
lm(formula = LD ~ LN, data = data_2)
Residuals:
Min? ? ? 1Q? ? ?Median? ? ? 3Q? ? ?Max
-52.883? ?-7.541? ? -1.311? ? 12.288? ?26.480
Coefficients:
Estimate? Std. Error? t value? Pr(>|t|)
(Intercept)? ?25.4612? ?4.3558? ? 5.845? ?3.18e-06 ***
LN? ? ? ? ? ? 0.9623? ? 0.1117? ? 8.615? ?3.14e-09 ***
Signif. codes:? 0 ‘*** 0.001 ‘** 0.01 ‘* 0.05 ‘. 0.1 ‘ 1
Residual standard error: 16.98 on 27 degrees of freedom
Multiple R-squared:? 0.7333, Adjusted R-squared:? 0.7234
F-statistic: 74.22 on 1 and 27 DF,? p-value: 3.137e-09
由計算結(jié)果得到:
[β0=25.4612β1=0.9623sd(β0)=4.3558sd(β1)=0.1117]? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)
回歸系數(shù)的[P]值均小于3.18×10-6,顯著性差異明顯,模型的方差解釋率達(dá)到73.3%。F分布的[P]值為3.137×10-9,顯著性差異明顯,該模型通過了t檢驗和F檢驗,因此,回歸方程為:
[LD=25.46+0.96×LN]? ? ? ? ? ? ? ? ? ? ? ? ? ?(2)
其中,[LD]為小時雷電流幅值;[LN]為小時地閃頻次。
5 結(jié)論和討論
5.1 結(jié)論
本文基于R語言,將數(shù)理統(tǒng)計分析引入雷電信息化系統(tǒng)中,為雷電數(shù)據(jù)的深入分析、挖掘提供了便利。研究結(jié)果表明,2013—2017西寧市轄區(qū)閃電定位監(jiān)測數(shù)據(jù)小時地閃頻次最大為98次,小時雷電流幅值為138 kA。由地閃頻次和雷電流分布圖可知,地閃頻次極值點處,雷電流幅值為峰值或在峰值左右。小時地閃頻次與小時雷電流幅值散點矩陣圖表明,累計時次內(nèi)的地閃頻次和雷電流幅值呈顯著正相關(guān),相關(guān)系數(shù)為0.856([N]=29),說明地閃頻次和雷電流幅值具有較高相關(guān)性,地閃頻次越高,雷電流幅值越大?;诘亻W頻次擬合的小時雷電流幅值回歸模型能夠解釋觀測值73%的方差,模型的模擬效果較好,可用于小時雷電流幅值的預(yù)測。
5.2 討論
在利用雷電流強(qiáng)度和頻次進(jìn)行雷電流活動特征研究分析過程中,國內(nèi)研究人員[23-27]大部分立足于雷電災(zāi)害的致災(zāi)因子、孕災(zāi)環(huán)境和承災(zāi)體系統(tǒng),計算評估值,得出雷電災(zāi)害發(fā)生的潛勢等級。本文利用R語言實現(xiàn)地閃頻次和雷電流幅值的可視化,并通過模型建立,得出地閃頻次和雷電流幅值間的線性關(guān)系。研究表明,地閃頻次和雷電流幅值的回歸模型差異性顯著([P]<0.05),模型可以預(yù)測雷電流幅值的大小,找出可能造成雷擊災(zāi)害的地閃頻次數(shù)。然而,由于閃電數(shù)據(jù)樣本有限,導(dǎo)致模型穩(wěn)定性不強(qiáng),因此,在多資料融合的基礎(chǔ)上,閃電定位數(shù)據(jù)的特征有待進(jìn)一步研究。另外,本研究統(tǒng)計分析結(jié)果出現(xiàn)離群點,在未來研究中,將針對異常雷電流幅值進(jìn)行探索研究,以便更深入地理解雷電流幅值變化的機(jī)制,從而為雷電災(zāi)害風(fēng)險區(qū)劃和雷電災(zāi)害調(diào)查提供技術(shù)指標(biāo),為氣象防災(zāi)減災(zāi)提供決策依據(jù)。
參考文獻(xiàn):
[1]張春松,楊曉玲,劉蓉,等.甘肅武威市雷暴天氣時空分布特征[J].干旱氣象,2015(4):659-665.
[2]王智剛,丁海芳.建(構(gòu))筑物雷電災(zāi)害區(qū)域影響評估方法與應(yīng)用[M].北京:氣象出版社,2014:14.
[3]劉維成,陶健紅,邵愛梅,等.雷電監(jiān)測預(yù)警預(yù)報技術(shù)簡述[J].干旱氣象,2014(3):446-453.
[4]林溪猛,盧輝林,黃月清,等.福建古雷石化基地雷電活動特征及對策分析[J].氣象與環(huán)境科學(xué),2016(4):109-114.
[5]高峰,楊金玲.基于閃電定位儀監(jiān)測的雷暴特征分析[J].現(xiàn)代農(nóng)業(yè)科技,2017(23):194-198.
[6]鄧猛.山東地區(qū)雷暴分布特征及潛勢預(yù)報研究[D].南京:南京信息工程大學(xué),2013:10-11.
[7]張雅斌,高菊霞.高原東北側(cè)災(zāi)害性雷暴的大氣電場特征分析[C]//第26屆中國氣象學(xué)會年會論文集.陜西省防雷中心,2009:2068-2074.
[8]鄒宗峰,朱艷科,夏云等.基于R語言的AHP分析程序設(shè)計[J].數(shù)理醫(yī)藥學(xué)雜志,2013(4):468-470.
[9]黎一盈,王恒儉,李宏超,等.大數(shù)據(jù)時代下高危污染源的預(yù)警研究[J].科技資訊,2016(4):468-470.
[10]楊霞,吳東偉.R語言在大數(shù)據(jù)處理中的應(yīng)用[J].科技資訊,2013(23):19-20.
[11]楊帆,申貴成.基于R語言的網(wǎng)頁抓取與數(shù)據(jù)收集[J].現(xiàn)代經(jīng)濟(jì)信息,2017(33):307-308.
[12]卡巴克弗.R語言實戰(zhàn)[M].2版.王小寧,等譯.北京:人民郵電出版社,2016:121.
[13]袁佳.R語言及ggplot2在環(huán)境空氣監(jiān)測數(shù)據(jù)可視化中的應(yīng)用[J].中國高新技術(shù)企業(yè),2015(16):89-91.
[14]王志良,曹蕾,李彬彬.R語言在降水極值統(tǒng)計分析中的應(yīng)用[J].人民黃河,2012(5):22-24.
[15]肖穎為,葛銘.R語言在數(shù)據(jù)預(yù)處理中的開發(fā)應(yīng)用[J].杭州電子科技大學(xué)學(xué)報,2012(6):165-168.
[16]趙義軍,張小軒,商夢嬌.多元回歸分析在溫度預(yù)測中的應(yīng)用及R實現(xiàn)[J].佳木斯大學(xué)學(xué)報,2016(6):1020-1025.
[17]盛坤,楊麗娟,李曉航等.基于R語言的冬小麥品種穩(wěn)定性分析[J].中國農(nóng)學(xué)通報,2016(30):14-21.
[18]劉二剛,馬建強(qiáng).R語言在統(tǒng)計分析中的使用技巧[J].電腦知識與技術(shù),2017(1):251-253,256.
[19]陳希.基于R語言數(shù)據(jù)挖掘的社交網(wǎng)絡(luò)客戶細(xì)分研究[D].北京:北京郵電大學(xué),2011:34-40.
[20]陳毅恒,梁沛霖.R軟件操作入門[M].北京:中國統(tǒng)計出版社,2006:76-78.
[21]葉文春.淺談R語言在統(tǒng)計學(xué)中的應(yīng)用[J].中共貴州省委黨校學(xué)報,2008(4):123-125.
[22]薛毅,陳立萍.統(tǒng)計建模與R軟件[M].北京:清華大學(xué)出版社,2007:32-33.
[23]王鳳嬌,任鐘冬,韋良文,等.雷電災(zāi)害等級劃分及發(fā)生潛勢指標(biāo)探討[J].氣象科技,2009(6):744-747.
[24]郭虎,熊亞軍,扈海波.北京市雷電災(zāi)害災(zāi)情綜合評估模式[J].災(zāi)害學(xué),2008(1):14-17.
[25]李家啟,秦健,李良福,等.雷電災(zāi)害評估及其等級劃分[J].西南大學(xué)學(xué)報(自然科學(xué)版),2010(11):140-144.
[26]王敏,孔尚成,王秀英.青海東部地區(qū)雷電災(zāi)害易損性分析與區(qū)劃[J].氣象科技,2018(2):26-31.
[27]程萌,王秀麗.基于閃電定位數(shù)據(jù)的魯西南地區(qū)雷電災(zāi)害易損度區(qū)劃[J].氣象與環(huán)境科學(xué),2017(4):126-131.