国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于混合模型ad ap tive L ASSO方法的氣象數(shù)據(jù)實時變點檢測*

2021-08-18 07:24:42黃雄琪田鎮(zhèn)滔王雪梅鄭陳亮
關(guān)鍵詞:變點桂林市降雨量

黃雄琪,田鎮(zhèn)滔,秦 睿,王雪梅,鄭陳亮

(廣西師范大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院,廣西 桂林 541004)

1 研究意義及其背景

近年來,全球氣候變暖備受國內(nèi)外學(xué)術(shù)界的關(guān)注。全球氣候的變化在近幾年的數(shù)據(jù)報告中呈現(xiàn)出致災(zāi)性的特點,例如高溫、強風(fēng)、強降雨這些極端天氣會促使自然災(zāi)害的發(fā)生,繼而嚴(yán)重影響各國人民的生命財產(chǎn)安全。氣候變化所導(dǎo)致的一系列影響,讓全世界的學(xué)者們不得不重視氣象數(shù)據(jù)變點的分析及預(yù)測。

國內(nèi)外有不少學(xué)者在研究變點問題。對于響應(yīng)變量的個數(shù)比較少的情況,Horváth.L等[1]通過最小二乘的方法使用CUSUM方法檢測出了變點。Ga?briela[2]通過使用adaptive LASSO以及分位數(shù)的方法檢測出實時的變點。楊喜壽等[3]研究了氣候時間序列變點的推斷問題。Hawkins[4]研究了位置轉(zhuǎn)移替代方案的似然比檢驗,并應(yīng)用于氣象數(shù)據(jù)序列的變點檢測。Buishand[5]討論了5種累積偏差檢驗的特點,使用累計偏差與平均值構(gòu)建了檢驗統(tǒng)計量,并對荷蘭年平均氣溫進(jìn)行了變點檢測。Alexandersson.H[6]等基于氣候時間序列,提出了一種在正態(tài)分布時間序列中檢測任意長度序列變點的新方法。Beaulieu.C[7]等考慮了氣候時間變化的復(fù)雜性和氣候數(shù)據(jù)序列的自相關(guān)性,提出了一種基于IA(informational ap?proach)的變點檢測模型。趙紅等[8]基于VFP環(huán)境,對氣象數(shù)據(jù)使用滑動t-檢驗法和Yamamoto法進(jìn)行變點的檢測。許歡9]等運用ASAMC算法估計了氣象數(shù)據(jù)結(jié)構(gòu)性變化的位置并給出了發(fā)生結(jié)構(gòu)性變化的原因。

本文將降雨量作為被解釋變量Yi,將風(fēng)向、風(fēng)級等作為解釋變量X1,…,Xp,并且還考慮了被解釋變量的滯后性,引入變量Yi-1,…,Yi-k。通過Lasso方法找到了這幾個變量之間的關(guān)系,并且找出了降雨量對應(yīng)的解釋變量的參數(shù)發(fā)生突變的時間點(變點)。

2 建立混合回歸模型

首先考慮簡單線性模型:

接下來結(jié)合解釋變量的滯后性,考慮如下模型:

我們可以把(2)式轉(zhuǎn)化成如下模型:

通過前m個觀測值得到簡單的最小二乘估計:

通過BIC準(zhǔn)則可以篩選一些變量,但是篩選出來的變量不精確,借助LASSO可以解決變量的稀疏性問題,這個方法是1996年由Tibshirani.R提出的。在設(shè)計矩陣Z滿足某些且不使用假設(shè)檢驗的情況下,來消除掉一些不相關(guān)變量。之后在2006年zou提出了一種叫作的adaptive LASSO的方法,這個方法不需要設(shè)計矩陣Z的那些條件,方法如下:

由此我們可以得到相應(yīng)估計的殘差:

為了便于表述,引入指標(biāo)集A≡{j∈{1,…,p+k};≠0},同 理A*m≡{j∈{1,…,p+k};≠0}。其中A是真實參數(shù)的非零分量的指標(biāo)組成的集合,A*m是使用adaptive LASSO估計得到參數(shù)的分量指標(biāo)組成的集合。一般地對于參數(shù)?,我們用表示包含A相關(guān)因子的?的子向量。

考慮如下假設(shè):

對于誤差εi:

(S1)ε1,…,εm,εm+1,…是獨立同分布的,E[ε1]=0,方差有限Var(ε1)<∞,

(S2)對于解釋變量X1,…,X p,Y i-1,…,Y i-k存在一個正定矩陣C和常數(shù)η>0,有,更進(jìn)一步要求εi與Z i是獨立的。

在條件(S1)下Card(A)不依賴于m,設(shè)計矩陣m-1Z T Z收斂到一個正定矩陣C,調(diào)節(jié)參數(shù)λm有如下條件

有adaptive LASSO估計值滿足oracle性質(zhì):

(P1)漸近正態(tài)性:

矩陣CA包含矩陣C對應(yīng)的指標(biāo)集A中的元素,對于β的最小二乘估計,可以得到

用上述方法得到β的估計后,我們可以得到總體方差σ2的估計:

其中,Card(A*m)表示A*m的基數(shù)。

由于Card(A)不依賴于m,考慮adaptive LAS?SO的估計值的oracle性質(zhì),可以得到

3 利用CUSUM方法構(gòu)造檢驗統(tǒng)計量

首先考慮第一批m個觀測值之后的模型:

對于每一個給定的時間i,檢驗該模型的參數(shù)是否和第一批m個模型的參數(shù)一致:

假設(shè)模型(2)是顯著的,即

為了構(gòu)造統(tǒng)計量,將采用Horváth.L等的CU?SUM(cumulative sum)方法,在此之前先求出=Y i-,i=m+1,…,m+T,然 后 求的CU?SUM,即:對于某個T>0,

對于給定常數(shù)γ∈[0,1/2),考慮歸一化函數(shù)(此歸一化函數(shù)為有界函數(shù)):

引理1在滿足假設(shè)(S1)(S2)的條件下,

(2)當(dāng)備擇假設(shè)成立時,有

因此,根據(jù)上述假設(shè)檢驗可得到相應(yīng)的檢驗統(tǒng)計量

引理2對于給定的顯著性水平α容易通過模擬計算得到對應(yīng)的分位點cα(γ),因此,當(dāng)原假設(shè)被拒絕時,可以得到停時:

4 桂林市降雨數(shù)據(jù)的變點估計

基于第二章提出的變點檢測模型,對廣西桂林市的降雨量真實數(shù)據(jù)進(jìn)行實證分析。

氣象數(shù)據(jù)的預(yù)測問題是氣象學(xué)研究領(lǐng)域中公認(rèn)的較為復(fù)雜的課題之一,其中降雨量為氣象數(shù)據(jù)預(yù)測中最難課題之一,降雨量大小引發(fā)的地質(zhì)災(zāi)害關(guān)系著人民生命財產(chǎn)安全,因此對降雨量大小的監(jiān)控和精準(zhǔn)預(yù)測是一項非常重要的工作。本文選取廣西桂林市的真實降雨量數(shù)據(jù),基于第二章提出的變點檢測模型對降雨量的時間序列數(shù)據(jù)進(jìn)行檢測分析,得出影響降雨量的因素以及降雨量的變點時刻,進(jìn)而為相關(guān)氣象部門做好防護(hù)預(yù)警提供有力的依據(jù),已達(dá)到減少人民生命財產(chǎn)損失的目的。

本章數(shù)據(jù)來自廣西桂林市2019年1月1日至2019年12月31日的降雨量情況。其中影響桂林市降雨量的變量如表1所示。

表1 桂林市降雨量的變量

圖1是桂林市降雨量情況的周度數(shù)據(jù)圖,可以看出時間在第23周時,降雨量發(fā)生驟變,容易看出這個數(shù)據(jù)是存在變點的,因此可以對桂林市降雨量數(shù)據(jù)進(jìn)行變點檢測。

圖1 桂林市降雨量時序圖(周度數(shù)據(jù))

首先研究降雨量數(shù)據(jù)的滯后情況。對數(shù)據(jù)進(jìn)行時間序列分析,確定該降雨量序列是2階滯后的,因此確定滯后項階數(shù)k=2。

其次選用較簡單的最小二乘法(4)對降雨量數(shù)據(jù)進(jìn)行分析,得到該模型(3)的最小二乘法估計為=(5.89,-0.34,0.06,0.025,-0.04,0,0,-0.21)T。

然后選用adaptive LASSO方法(5)對降雨量數(shù)據(jù)進(jìn)行分析,得到該模型(3)的adaptive LASSO估計為=(4.66,-0.26,0,0,0,0,0,-0.06)T,再 根 據(jù) 得到adaptive LASSO估計易得總體標(biāo)準(zhǔn)差估計(8)為=0.73。

接下來根據(jù)數(shù)據(jù)模擬得到統(tǒng)計量的分位數(shù)為(γ=1 4,α=0.05)和cα(γ)=42.37645,并根據(jù)計算不同時間點統(tǒng)計量的值可以得到停時=83。

最后綜合上述分析和結(jié)果得出,只有最高氣溫和降雨量一階滯后項兩個解釋變量是影響廣西桂林市降雨量情況的因素,并得到桂林市2019年1月1日至2019年12月31日降雨量的變點在第m個數(shù)據(jù)后的第83個位置,按照實際時間計算得到變點時刻為2019年4月13日。換句話說,在4月中旬來臨之前,相關(guān)部門應(yīng)該提前做好防洪防汛工作,防止內(nèi)澇和次生災(zāi)害的發(fā)生。桂林市在2017年和2020年分別發(fā)生了內(nèi)澇,導(dǎo)致了政府和人民財產(chǎn)的損失。使用該方法對降雨量進(jìn)行分析,可以為當(dāng)?shù)夭块T提供有效有力的數(shù)據(jù)支持和決策意見,以防止人員傷亡及財產(chǎn)損失。

2019年4月13日正值桂林市濕潤季風(fēng)影響下的雨季,也是當(dāng)?shù)厝怂追Q的“南風(fēng)天”。這說明本文建立的基于混合回歸模型adaptive LASSO方法較為準(zhǔn)確的將實時降雨量驟變點檢測出來了,解決了一個氣象數(shù)據(jù)難預(yù)測的問題,進(jìn)而得出該模型檢測效果不錯,能夠較為準(zhǔn)確的定位降雨量變點,并且結(jié)果符合實際情況,具有較大的實際意義,也為后續(xù)研究其他氣象問題提供一種好用又準(zhǔn)確的方法。

猜你喜歡
變點桂林市降雨量
六點一百分
廣西壯族自治區(qū)桂林市桂林中學(xué)
回歸模型參數(shù)的變點檢測方法研究
桂林市供水管網(wǎng)在線水力模型的建立與應(yīng)用初探
降雨量與面積的關(guān)系
正態(tài)分布序列均值變點檢測的貝葉斯方法
基于二元分割的多變點估計
獨立二項分布序列變點的識別方法
珍稀瀕危植物在桂林市市區(qū)園林綠化中的應(yīng)用
洞庭湖區(qū)降雨特性分析
兴隆县| 榆林市| 永新县| 儋州市| 海口市| 浠水县| 文水县| 太仆寺旗| 大石桥市| 榆社县| 汉源县| 南康市| 刚察县| 莱芜市| 镇原县| 马鞍山市| 库尔勒市| 武鸣县| 巴彦县| 沈阳市| 铜山县| 静安区| 周宁县| 盐山县| 沙雅县| 北川| 汉沽区| 宁陕县| 武隆县| 绥宁县| 将乐县| 吉木乃县| 荔波县| 蒙城县| 保定市| 苍山县| 平山县| 商丘市| 邵阳市| 谢通门县| 交城县|