曹深西,陳子燊
(中山大學(xué) 水資源與環(huán)境系,廣東 廣州 510275)
風(fēng)災(zāi)是廣東最為嚴(yán)重的自然災(zāi)害之一,主要發(fā)生于夏季,沿海地區(qū)發(fā)生頻率較高。風(fēng)災(zāi)不僅自身具有巨大的破壞性,還會(huì)帶來嚴(yán)重的次生災(zāi)害,威脅人民的生命財(cái)產(chǎn)安全,引起系列社會(huì)問題。在土木工程設(shè)計(jì)中,特別是高大土木工程結(jié)構(gòu)中,風(fēng)荷載成為最主要的荷載之一。由于在風(fēng)工程中,結(jié)構(gòu)不僅要承受過去一個(gè)時(shí)段內(nèi)的風(fēng)速,還要保證某一規(guī)定期限內(nèi)的結(jié)構(gòu)能安全可靠的承受可能經(jīng)受的風(fēng)速,在設(shè)計(jì)風(fēng)速時(shí),不僅要考慮一定時(shí)期內(nèi)結(jié)構(gòu)的安全性,還要考慮設(shè)計(jì)的合理性,以保證不過高的設(shè)計(jì)指標(biāo)而導(dǎo)致資源的浪費(fèi),因此極值風(fēng)速的計(jì)算就顯得非常重要(Palutikof,1999)。
隨著極值理論的發(fā)展,學(xué)者把極值理論引入到極值風(fēng)速的計(jì)算,在計(jì)算極值風(fēng)速過程中,誤差主要來自3個(gè)方面:樣本的選取、模型的選取和模型擬合中的參數(shù)估計(jì)(段忠東,2002)。在過去的幾十年中,大量學(xué)者和工程人員通過理論推導(dǎo)和統(tǒng)計(jì)計(jì)算對極值理論在風(fēng)速領(lǐng)域方面的應(yīng)用做了大量研究,以期減小計(jì)算中的各個(gè)環(huán)節(jié)的誤差,提高極值風(fēng)速的計(jì)算精度。
本文主要根據(jù)極值理論的3個(gè)模型對廣東9個(gè)沿海氣象站的極值風(fēng)速統(tǒng)計(jì)計(jì)算,以探討這些模型在廣東沿海的應(yīng)用效果。
AM(Annual Maximum,年最大值方法)抽樣方法是每年取一個(gè)最大值組成一個(gè)新的序列。Gumbel(1958)提出每年的洪水序列中的最大值組成的極值序列,可以用極值分布去擬合,奠定了經(jīng)典極值分布的基礎(chǔ)。
由于AM方法每年只抽取一個(gè)數(shù)據(jù),造成了數(shù)據(jù)的浪費(fèi),而在許多領(lǐng)域,觀測時(shí)間不夠長,只能得到較小的樣本,樣本太小又會(huì)產(chǎn)生較大的樣本誤差,因此為了增加被分析的有效數(shù)據(jù)量,以減小樣本量太小造成的誤差,3種主要的抽樣方法被提出:r-LOS(r-largest order statistics)、POT(Peak over threshold)和 MIS(Method of Independent Storm)。r-LOS(Ying,2007)是每年選取前 r個(gè)最大的次序統(tǒng)計(jì)量組成極值序列;MIS抽樣方法的解釋見文獻(xiàn)(Harris,1999);POT方法是選取給定的閾值(充分大)以上的觀測值組成極值序列,在洪水頻率的計(jì)算中也被稱為PDS(Partial duration series)(Palutikof,1999)。學(xué)者和工程人員(Pickands, 1975;De, 1994;Hosking, 1985;Hosking,1987;Davison,1990;Simiu,1996)對此方法做了大量研究并廣泛應(yīng)用于工程實(shí)際。
Fisher和Tippett(1928)在對獨(dú)立同分布的極大值漸進(jìn)分布進(jìn)行研究時(shí)提出了3種極值分布,分別稱為極值Ⅰ型(Gumbel分布)、極值Ⅱ型(Fréchet分布)和極值Ⅲ型(Weibull分布)。
極值Ⅰ型:
極值Ⅱ型:
極值Ⅲ型:
上面的式中為位置參數(shù),σ為尺度參數(shù),ξ為形狀參數(shù)。
Von(1936)把3個(gè)極值分布統(tǒng)一到一個(gè)形式,稱為GEV分布(Jenkinson,1955):
當(dāng)時(shí)ξ→0,為極值Ⅰ型分布(Gumbel分布);當(dāng)ξ<0時(shí),為極值Ⅱ型分(Fréchet分布);當(dāng)ξ>0時(shí),為極值Ⅲ型(We分布)。
Pickand(1975)給出 閾值的超出量的漸近分布,即GPD分布。
如果隨機(jī)變量X的分布函數(shù)為:
則稱X服從GPD分布。式中u為位置參數(shù),σ為尺度參數(shù),ξ為形狀參數(shù)。
設(shè)X的分布函數(shù)為F(x),如果Xup為其支撐上端點(diǎn),X超過閾值u的超出量分布為Fu(x),如果存在廣義pareto分布G(x),使得
則稱X屬于廣義pareto分布的POT吸引場。
其中GEV分布屬于GPD的POT吸引場,GPD本身屬于GPD的POT吸引場,且形狀參數(shù)不變,后者又稱為GPD的POT穩(wěn)定性(史道濟(jì),2006)。
GPD還有一個(gè)重要的性質(zhì),就是GPD超出量函數(shù)是域值u的線性函數(shù),即
式中σ為尺度參數(shù),ξ為形狀參數(shù)。
這個(gè)性質(zhì)可以作為實(shí)際應(yīng)用中選取閾值的標(biāo)準(zhǔn)。
樣本的超出量函數(shù)en(u)可以根據(jù)下面的公式進(jìn)行估計(jì):
式中n為樣本數(shù)。
超閾值峰量數(shù)符合泊松分布:
式中,λ為年平均發(fā)生的超量數(shù),也稱為年率。
模型參數(shù)的估計(jì)是計(jì)算極值風(fēng)速很重要的一步,為了得到更好的參數(shù),各種參數(shù)估計(jì)方法被提出和應(yīng)用到極值分布模型。
Gumbel模型的參數(shù)估計(jì)方法中,最佳線性無偏估計(jì)(BULE)方法得到了廣泛的應(yīng)用;Harris(1996)對Gumbel模型進(jìn)行了改進(jìn),采用權(quán)重最小二乘法進(jìn)行參數(shù)估計(jì);學(xué)者首先求得Gumbel分布的矩估計(jì)公式,并在其基礎(chǔ)上提出概率權(quán)重矩(PWM)和線性矩(LM),并在Gumbel分布取得比較好的應(yīng)用效果;對于大樣本,性能優(yōu)良的最大似然估計(jì)會(huì)得到更好的參數(shù)。
GPD模型的參數(shù)估計(jì)方法包括Pickand法和超出量函數(shù)法(CME)法,De(1994)提出的 De Hann法,Hosking等學(xué)者對概率權(quán)重矩、線性矩和最大似然估計(jì)在GPD模型中的應(yīng)用進(jìn)行了研究。
經(jīng)驗(yàn)分布是參數(shù)估計(jì)的一個(gè)重要方面,本文使用的經(jīng)驗(yàn)分布公式為數(shù)學(xué)期望公式:pei=m/N+1,其中pei表示經(jīng)驗(yàn)分布頻率,m為樣本數(shù)據(jù)按照從小到大的順序排列后,樣本點(diǎn)的序列號(hào),N表示樣本數(shù)。
擬合優(yōu)度的檢驗(yàn)有很多種方法,本文選取PPCC(probabilityplotcorrelationcoefficient)、RMSE(root mean square error)檢驗(yàn)指標(biāo)作為評估模型適用性的依據(jù)。PPCC和RMSE的計(jì)算公式為:
式中,xi表示實(shí)測樣本排序后的觀測值,xm為xi的平均值,xei表示經(jīng)驗(yàn)分布頻率的pei對應(yīng)的分位數(shù),xem為xei的平均值。
廣東省位于亞洲大陸的東南部、太平洋西岸,瀕臨南海,受到3種季風(fēng)氣團(tuán)的影響,構(gòu)成了特殊的季風(fēng)氣候條件。大風(fēng)天氣成因比較復(fù)雜,從大的方面來看,造成廣東各地出現(xiàn)最大風(fēng)速的天氣系統(tǒng),主要是臺(tái)風(fēng),其次是寒潮。
本文選取的這9個(gè)站點(diǎn)資料源于國家氣象信息中心。測站分布在廣東的沿海地帶,受臺(tái)風(fēng)影響嚴(yán)重,而且由此帶來的暴雨和風(fēng)暴增水往往都對這些地區(qū)的造成災(zāi)害,因此精確推求最大風(fēng)速,不僅為工程設(shè)計(jì)中的風(fēng)荷載提供可靠的參考依據(jù),而且對由此引起的次生災(zāi)害的防御工作也有重要意義。
觀測氣象站的編號(hào)和觀測數(shù)據(jù)的有效時(shí)段見表1,本文選取的數(shù)據(jù)為日最大風(fēng)速。
表1 數(shù)據(jù)來源和描述
根據(jù)經(jīng)典極值理論,使用AM抽樣方法分別對9個(gè)沿海站點(diǎn)的日最大風(fēng)速進(jìn)行抽樣,得到9個(gè)站點(diǎn)的極值序列,然后分別使用Gumbel和GEV模型對9個(gè)極值序列進(jìn)行擬合。Gumbel模型的參數(shù)通過MOM、PWM、ML和LSM方法求取,四種方法得到的PPCC和RMSE指標(biāo)很相近,本文最終選擇在大多數(shù)站點(diǎn)都表現(xiàn)得更好的PWM參數(shù)估計(jì)方法;GEV模型的參數(shù)估計(jì)方法利用PWM和ML兩種參數(shù)估計(jì)方法,由于PWM方法表現(xiàn)更好,因此GEV模型也選取PWM參數(shù)估計(jì)方法;廣州、汕頭、湛江和陽江站的擬合圖見圖1、2、3、4,其他站點(diǎn)的擬合圖略。
圖2 Gumbel和GEV模型擬合汕頭站最大風(fēng)速
圖4 陽江最大風(fēng)速GEV和Gumbel擬合
表2 3個(gè)模型的參數(shù)與擬合優(yōu)度指標(biāo)
根據(jù)POT方法對9個(gè)站點(diǎn)的日最大風(fēng)速數(shù)據(jù)進(jìn)行抽樣。根據(jù)極值分布理論,在增加有效數(shù)據(jù)量的同時(shí)必須保證數(shù)據(jù)的獨(dú)立同分布,因此本文采取改進(jìn)的POT抽樣方法。第一,選取8天作為最小時(shí)間間隔,最小時(shí)間間隔內(nèi)的最大值如果超過給定閾值,則被選取組成極值序列;第二,為了保證閾值足夠大,選取歷年最大值中的最小值作為備選閾值的最小值。
閾值的選取是GPD模型的重要內(nèi)容,本文根據(jù)以下條件選取閾值。第一,為了滿足GPD模型對數(shù)據(jù)的要求,我們選取年率大于1小于4;第二,每年的超出量數(shù)序列服從Possion分布,并采用卡方檢驗(yàn)方法進(jìn)行檢驗(yàn)。第三,用GPD模型擬合滿足條件的閾值下的極值序列,采用PWM、ML參數(shù)估計(jì)方法求取參數(shù),計(jì)算模型的擬合優(yōu)度指標(biāo),選取擬合優(yōu)度指標(biāo)最優(yōu)的閾值。圖5、6、7、8為汕頭、廣州、陽江和湛江氣象站的GPD擬合圖。
圖6 汕頭最大風(fēng)速GPD擬合圖
圖7 湛江最大風(fēng)速GPD擬合圖
圖8 陽江最大風(fēng)速GPD擬合圖
由表2可知9個(gè)站點(diǎn)的GEV模型和Gumbel模型的尺度參數(shù)和位置參數(shù)相近,GEV的形狀參數(shù)有4個(gè)站點(diǎn)大于0,5個(gè)站點(diǎn)小于0。如果形狀參數(shù)大于0,分布為極值Ⅲ型,曲線上凸,如圖1、3所示;如果形狀參數(shù)小于0,分布為極值Ⅱ型,曲線下凸,如圖2所示;凸凹程度取決于形狀參數(shù)絕對值的大小,當(dāng)形狀參數(shù)的絕對值很小時(shí),如陽江站,曲線幾乎與Gumbel重合,Gumbel模型為直線,如圖4所示。兩個(gè)模型計(jì)算的極值風(fēng)速值見表3。
由于GEV模型具有形狀參數(shù)的調(diào)節(jié),比Gumbel模型更靈活,在9個(gè)站點(diǎn)中的擬合效果也比Gumbel更好。而由于廣州和陽江的形狀參數(shù)的絕對值很小,GEV模型的的RMSE指標(biāo)稍微差于Gumbel模型。
理論上GEV的形狀參數(shù)應(yīng)該和GPD的相同,但在9個(gè)站點(diǎn)中,GPD模型中的形狀參數(shù)的差別較大,還有3個(gè)站點(diǎn)GEV和GPD的形狀參數(shù)符號(hào)不一,本文認(rèn)為這是由于樣本太小造成的誤差。GPD模型的形狀參數(shù)與GEV一樣,形狀參數(shù)的符號(hào)和大小對其分布的形態(tài)有很大影響,尤其對極值風(fēng)速的估計(jì),重現(xiàn)期越大,所推算的極值風(fēng)速對形狀參數(shù)越敏感。9個(gè)站點(diǎn)中8個(gè)站點(diǎn)的形狀參數(shù)為負(fù),其中6個(gè)站點(diǎn)GPD模型估計(jì)的50年以上重現(xiàn)期的估計(jì)值比Gumbel模型大,湛江和上川島由于形狀參數(shù)絕對值很小,與Gumbel模型估計(jì)的結(jié)果相近(表3)。
GPD模型的9個(gè)站點(diǎn)的兩項(xiàng)擬合指標(biāo)中,只有汕頭站的PPCC指標(biāo)較GEV模型稍差,為此可以認(rèn)為GPD模型可以更好地?cái)M合歷史數(shù)據(jù)。由于GPD模型應(yīng)用了更多的歷史數(shù)據(jù),減小了抽樣誤差,因此本文認(rèn)為GPD模型是3個(gè)模型中最合適的模型。
表3 3個(gè)模型的參數(shù)與擬合優(yōu)度指標(biāo)
(1)3個(gè)模型的擬合指標(biāo)都較優(yōu),推求的100年以下重遇期的極值風(fēng)速相近,3個(gè)模型都是廣東沿海計(jì)算極值風(fēng)速的合適模型。
(2)GEV和GPD模型計(jì)算的極值風(fēng)速的大小與形狀參數(shù)密切相關(guān),如果形狀參數(shù)小于0,則估算的較大重遇期極值風(fēng)速比Gumbel模型的要大;否則,情況相反。
(3)GPD模型傾向于給出比Gumbel和GEV模型更大的極值風(fēng)速。
(4)GPD模型增加了有效數(shù)據(jù)量,取得更好的擬合優(yōu)度指標(biāo),是估算極值風(fēng)速的更合適的模型。
An Ying,Pandey M D,2007.The largest order statistics model for extreme wind speed estimation.J.Wind Eng.Ind.Aerodyn,95:165-182.
Davison A C,Smith R L,1990.Models for exceedances over high thresholds.Journal of the Royal Statistical Society,52:393-442.
De Haan L,1994.Extreme value statistics.In ExtremeValue Theory and Applications Vol.1(J.Galambos,J.Lechner&E.Simiu,Editors),Kluwer,Dordrecht.
Fisher R A,Tippett L H,1928.Limiting forms of the frequency distribution of the largest or smallest member of a sample.Proc Cambridge Philos Soc,24:180-190.
Gumbel E J,1958.Statistics of Extremes.New York,Columbia University Press,375.
Harris R I,1996.Gumbel re-visited-a new look at extreme value statistics applied to wind speeds.J.Wind Eng.Ind.Aerodyn.,59:1-22.
Harris R I,1999.Improvements to the‘Method of Independent Storms′.J.Wind Eng.Ind.Aerodyn,80:1-30.
Hosking J R M,Wallis J R,Wood E F,1985.Estimation of the generalized extreme-value distribution by the method of probabilityweighted moments.Technometrics,27:251-261.
Hosking J R M,Wallis J R,1987.Parameter and quantile estimation for the generalized Pareto distribution.Technometrics,29:339-349.
Jenkinson A F,1955.The frequency distribution of the annual maximum(or minimum)values of meteorological elements.Quarterly Journal of the Royal Meteorological Society,81:158-171.
Palutikof J P,Brabson B B,Lister D H,et al,1999.A review of methods to calculate extreme wind speeds.Meteorological Applications,6:119-132.
Pickands J,1975.Statistical inference using extreme order statistics,Ann.Statist,3:119-131.
Simiu E,Heckert N A,1996.Extreme wind distribution tails:a peaks over threshold approach.J.Struct.Eng.,122:539-547.
Von Mises R,1936.La Distribution de la Plus Grande de n Valeurs.Reprinted in Selected Papers,II,Amer.Math.Soc.,Providence,RI(1954):271-294.
段忠東,歐進(jìn)萍,周道成,2002.極值風(fēng)速的最優(yōu)概率模型.土木工程學(xué)報(bào),35(5):11-16.
廣東省氣象臺(tái),廣東師院數(shù)學(xué)系,1975.廣東省風(fēng)壓的分析和計(jì)算.華南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),01:79-104
史道濟(jì),2006.實(shí)用極值統(tǒng)計(jì)方法.天津,天津科學(xué)技術(shù)出版社,30.