国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Bootstrap方法的巖土體參數(shù)聯(lián)合分布模型識(shí)別

2015-02-13 06:53唐小松李典慶周創(chuàng)兵方國(guó)光
巖土力學(xué) 2015年4期
關(guān)鍵詞:概率分布變異性雙曲線

唐小松 ,李典慶 ,周創(chuàng)兵 ,方國(guó)光

(1.武漢大學(xué) 水資源與水電工程科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430072;2.武漢大學(xué) 水工巖石力學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430072)

1 引 言

巖土工程可靠度分析中經(jīng)常包含相關(guān)非正態(tài)變量,如巖土體的抗剪強(qiáng)度參數(shù)黏聚力和內(nèi)摩擦角間存在統(tǒng)計(jì)負(fù)相關(guān)性[1-2]、基樁荷載-位移雙曲線參數(shù)具有負(fù)相關(guān)性[3-5],非飽和土的土-水特征曲線參數(shù)亦具有明顯的負(fù)相關(guān)關(guān)系[6],而且這些參數(shù)一般都服從非正態(tài)分布。眾所周知,巖土工程可靠度分析通常需要已知相關(guān)非正態(tài)巖土體參數(shù)的聯(lián)合概率分布函數(shù)。近年來(lái),Copula理論[7]為相關(guān)非正態(tài)巖土體參數(shù)聯(lián)合概率分布函數(shù)的建立提供了一種新的途徑,它在巖土工程領(lǐng)域中逐漸得到應(yīng)用[8-10]。究其原因,在Copula理論框架下構(gòu)造巖土體參數(shù)聯(lián)合概率分布函數(shù)具有以下2方面不可替代的優(yōu)點(diǎn)[7]:其一是該方法將巖土體參數(shù)聯(lián)合概率分布函數(shù)的構(gòu)造簡(jiǎn)化為巖土體參數(shù)邊緣分布函數(shù)估計(jì)和Copula函數(shù)選擇問(wèn)題,且邊緣分布函數(shù)估計(jì)和Copula函數(shù)選擇分開獨(dú)立進(jìn)行;其二是該方法能夠?qū)⒉煌愋偷倪吘壏植己瘮?shù)和Copula函數(shù)結(jié)合在一起,從而構(gòu)造出具有任意邊緣分布函數(shù)及任意相關(guān)結(jié)構(gòu)巖土體參數(shù)的聯(lián)合概率分布函數(shù)。鑒于Copula理論的上述優(yōu)點(diǎn),本文主要研究基于Copula理論的相關(guān)非正態(tài)巖土體參數(shù)聯(lián)合概率分布函數(shù)構(gòu)造方法。

基于Copula理論的巖土體參數(shù)聯(lián)合概率分布函數(shù)構(gòu)造方法中,巖土體參數(shù)的最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)都是基于實(shí)測(cè)數(shù)據(jù)采用AIC(Akaike information criterion)準(zhǔn)則[11]優(yōu)化比較選擇確定的,即具有最小AIC 值的邊緣分布函數(shù)和Copula函數(shù)被認(rèn)為是擬合原始觀測(cè)數(shù)據(jù)概率分布特性和相關(guān)結(jié)構(gòu)最優(yōu)的概率分布模型。AIC 準(zhǔn)則中的AIC 值是巖土體參數(shù)實(shí)測(cè)數(shù)據(jù)的函數(shù),因此,是樣本的函數(shù)。而樣本是一個(gè)N 維隨機(jī)向量,N為樣本容量,從而樣本的函數(shù)亦是一個(gè)隨機(jī)變量,這個(gè)隨機(jī)變量稱為統(tǒng)計(jì)量。統(tǒng)計(jì)量的變異性大小由樣本容量決定,樣本容量越小,變異性越大。一般來(lái)說(shuō),樣本數(shù)目小于100時(shí)屬于小樣本容量。巖土體參數(shù)具有小樣本容量是巖土工程中一個(gè)客觀存在的事實(shí)[1-6],基于有限巖土體參數(shù)試驗(yàn)數(shù)據(jù)計(jì)算得到的AIC 值通常具有較大的變異性。傳統(tǒng)方法沒(méi)有考慮AIC 值的變異性,而僅僅基于巖土體參數(shù)實(shí)測(cè)數(shù)據(jù)求得不同備選邊緣分布函數(shù)和Copula函數(shù)的單一AIC值識(shí)別最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)。眾所周知,隨機(jī)變量的單一取值并不能代表這個(gè)變量的實(shí)際分布,因而基于單一AIC 值的最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)識(shí)別方法是不合理的。為了得到合理的識(shí)別結(jié)果,應(yīng)該充分考慮小樣本容量巖土體參數(shù)引起的統(tǒng)計(jì)量AIC 值的變異性,其關(guān)鍵難點(diǎn)主要體現(xiàn)在以下兩方面:①已知巖土體參數(shù)實(shí)測(cè)數(shù)據(jù)如何模擬AIC 值的變異性;②考慮AIC 值變異性時(shí)如何表述識(shí)別結(jié)果。對(duì)于上述問(wèn)題,迄今為止還未見(jiàn)系統(tǒng)的研究。

近年來(lái)在統(tǒng)計(jì)學(xué)領(lǐng)域應(yīng)用較多的Bootstrap方法[12]為小樣本條件下統(tǒng)計(jì)量分布的直接模擬提供了一種新的工具。Bootstrap方法最早由Efron[12]于1979年提出,近年來(lái)在巖土工程領(lǐng)域中得到了應(yīng)用[13-14];如謝桂華等[13]采用Bootstrap方法模擬了地基沉降計(jì)算經(jīng)驗(yàn)系數(shù)均值的分布及置信區(qū)間;Luo等[14]利用Bootstrap方法研究了小樣本容量引起的土性參數(shù)統(tǒng)計(jì)量變異性對(duì)支護(hù)開挖失效概率的影響。Bootstrap方法的基本思想是通過(guò)對(duì)原始觀測(cè)樣本數(shù)據(jù)進(jìn)行有放回地隨機(jī)抽樣得到大量與原始觀測(cè)樣本相同樣本容量的Bootstrap子樣本,然后基于Bootstrap子樣本計(jì)算統(tǒng)計(jì)量的估計(jì)值,最終獲得統(tǒng)計(jì)量的變異系數(shù)及其概率分布。該方法只依賴于給定的原始觀測(cè)樣本數(shù)據(jù),且能夠充分挖掘原始觀測(cè)數(shù)據(jù)所攜帶的總體信息,不需要對(duì)巖土體參數(shù)的實(shí)際分布作任何假設(shè)以及增加新的數(shù)據(jù)觀測(cè),因此,該方法是一種非參數(shù)統(tǒng)計(jì)方法。從本質(zhì)上說(shuō),Bootstrap方法是一種將小樣本問(wèn)題轉(zhuǎn)化為大樣本問(wèn)題的分析方法。鑒于Bootstrap方法的上述優(yōu)勢(shì),本文將Bootstrap方法應(yīng)用于小樣本容量巖土體參數(shù)AIC 值分布的模擬問(wèn)題,提出了基于Bootstrap方法的巖土體參數(shù)最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)識(shí)別方法。最后以基樁荷載-位移雙曲線參數(shù)試驗(yàn)數(shù)據(jù)為例證明了所提方法的有效性。

2 巖土體參數(shù)聯(lián)合分布函數(shù)構(gòu)造的Copula函數(shù)方法

本文采用Copula函數(shù)構(gòu)造巖土體參數(shù)的聯(lián)合概率分布函數(shù),下面簡(jiǎn)要介紹Copula函數(shù)基本定義以及基于Copula函數(shù)的巖土體參數(shù)聯(lián)合概率分布函數(shù)構(gòu)造方法。Copula函數(shù)是將變量的聯(lián)合分布與其邊緣分布聯(lián)結(jié)起來(lái)的函數(shù),它惟一地描述了變量間相關(guān)性信息,包括變量間相關(guān)系數(shù)大小以及變量間相關(guān)結(jié)構(gòu)類型。對(duì)于二維情況,Copula函數(shù)定義為[0,1]2空間中邊緣分布為[0,1]區(qū)間內(nèi)均勻分布的二維聯(lián)合概率分布函數(shù)[7]:

式中:F(x1,x2)為變量X1和X2的聯(lián)合概率分布函數(shù);u1=F1(x1)和u2=F2(x2)分別為變量X1和X2的邊緣分布函數(shù);C為Copula函數(shù);θ為Copula函數(shù)的相關(guān)參數(shù)。相應(yīng)地,若已知變量X1和X2的概率密度函數(shù)f1(x1)和f2(x2),則通過(guò)對(duì)式(1)兩邊求導(dǎo)可得變量X1和X2的聯(lián)合概率密度函數(shù)f (x1,x2)為

式中:c(F1(x1),F(xiàn)2(x2);θ)=?2C(u1,u2;θ)/?u1?u2,為Copula密度函數(shù)。因此,若已知變量X1和X2的邊緣分布函數(shù)和Copula函數(shù),利用式(1)和式(2)就可以建立變量X1和X2的二維聯(lián)合概率分布模型。Copula函數(shù)的相關(guān)參數(shù)θ 可由變量X1和X2間的Kendall秩相關(guān)系數(shù)τ 由下式直接求出[7]:

因此,當(dāng)變量X1和X2間的Kendall秩相關(guān)系數(shù)τ 已知時(shí),通過(guò)求解式(3)所示的非線性積分方程就可得出參數(shù)θ 。從式(1)和式(2)可以看出,相關(guān)非正態(tài)巖土體參數(shù)聯(lián)合概率分布模型的建立包括2個(gè)步驟:第1步是建立巖土體參數(shù)的邊緣分布函數(shù);第2步是選擇最優(yōu)的Copula函數(shù)描述巖土體參數(shù)間的相關(guān)結(jié)構(gòu)。如前所述,上述2步可以分開獨(dú)立進(jìn)行,下面分別給出巖土體參數(shù)最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)識(shí)別方法。

本文采用工程上常用的AIC準(zhǔn)則[11]識(shí)別最優(yōu)的邊緣分布函數(shù),即具有最小AIC 值的邊緣分布函數(shù)被認(rèn)為是擬合原始觀測(cè)數(shù)據(jù)概率分布特性最優(yōu)的邊緣分布函數(shù)。AIC 值定義為變量原始觀測(cè)數(shù)據(jù)點(diǎn)處概率密度函數(shù)值對(duì)數(shù)和的-2倍與2倍概率密度函數(shù)分布參數(shù)數(shù)目之和,表達(dá)式為

式中:ε為邊緣分布函數(shù)的分布參數(shù)向量;k1為邊緣分布函數(shù)中分布參數(shù)的數(shù)目;N為原始觀測(cè)數(shù)據(jù)的樣本容量。因此,已知巖土體參數(shù)的一組觀測(cè)數(shù)據(jù),就可以采用式(4)求出多種備選邊緣分布函數(shù)的AIC 值,從而識(shí)別出擬合原始觀測(cè)數(shù)據(jù)概率分布特性最優(yōu)的邊緣分布函數(shù)。本文選取巖土工程中常用的正態(tài)分布、對(duì)數(shù)正態(tài)分布、極值I型分布和威布爾分布作為備選邊緣分布函數(shù)擬合巖土體參數(shù)的概率分布特性[15-18]。為了避免出現(xiàn)負(fù)值,正態(tài)分布和極值I型分布在0處進(jìn)行左截尾。上述4種邊緣分布函數(shù)都包含2個(gè)分布參數(shù),因此k1=2,這些分布參數(shù)ε 可以利用巖土體參數(shù)觀測(cè)數(shù)據(jù)的均值和標(biāo)準(zhǔn)差求出。

最優(yōu)的Copula函數(shù)也可以采用AIC準(zhǔn)則[11]識(shí)別,即具有最小AIC 值的Copula函數(shù)被認(rèn)為是擬合原始觀測(cè)數(shù)據(jù)相關(guān)結(jié)構(gòu)最優(yōu)的Copula函數(shù)。AIC 值定義為變量原始觀測(cè)數(shù)據(jù)點(diǎn)處Copula密度函數(shù)值對(duì)數(shù)和的-2倍與2倍Copula函數(shù)相關(guān)參數(shù)數(shù)目之和,表達(dá)式為

式中:k2為Copula函數(shù)中相關(guān)參數(shù)的數(shù)目,對(duì)于二維Copula函數(shù)來(lái)說(shuō)k2=1;(u1i,u2i),為原始觀測(cè)數(shù)據(jù)(x1i,x2i)的經(jīng)驗(yàn)分布值,可由下式計(jì)算:

式中:rank(x1i)和rank(x2i)分別為按升序排列時(shí)實(shí)測(cè)值x1i和x2i在整列觀測(cè)數(shù)據(jù)x1={x11,x12,···,x1N}和x2={x21,x22,···,x2N}中的秩次。因此,已知巖土體參數(shù)的一組觀測(cè)數(shù)據(jù),就可以采用式(5)求出多種備選Copula函數(shù)的AIC 值,從而識(shí)別出擬合原始觀測(cè)數(shù)據(jù)相關(guān)結(jié)構(gòu)最優(yōu)的Copula函數(shù)。本文選取巖土工程中常用的Gaussian、Plackett、Frank和No.16 Copula函數(shù)作為備選Copula函數(shù)擬合巖土體參數(shù)間的相關(guān)結(jié)構(gòu)[8-10]。上述4種Copula函數(shù)都能描述變量間的負(fù)相關(guān)性,且相關(guān)系數(shù)都能達(dá)到-1,它們非常適合描述負(fù)相關(guān)性較強(qiáng)的巖土體參數(shù)間相關(guān)關(guān)系[8-10]。這些Copula函數(shù)的相關(guān)參數(shù)θ 可以利用巖土體參數(shù)觀測(cè)數(shù)據(jù)的Kendall秩相關(guān)系數(shù)由式(3)求出。

從式(4)和式(5)可以看出各備選邊緣分布函數(shù)和Copula函數(shù)的AIC值都是巖土體參數(shù)試驗(yàn)數(shù)據(jù)的函數(shù),因此,都是樣本的函數(shù)。由統(tǒng)計(jì)學(xué)理論可知,樣本是一個(gè)N 維隨機(jī)向量,從而AIC 值這個(gè)樣本的函數(shù)亦是一個(gè)隨機(jī)變量,它稱為統(tǒng)計(jì)量。統(tǒng)計(jì)量的變異性大小由樣本容量決定,樣本容量越小變異性越大。實(shí)際工程中巖土體參數(shù)試驗(yàn)數(shù)據(jù)通常具有較小的樣本容量,基于這些有限試驗(yàn)數(shù)據(jù)計(jì)算得到的AIC 值具有較大的變異性。傳統(tǒng)方法沒(méi)有考慮AIC 值變異性,而僅僅基于巖土體參數(shù)實(shí)測(cè)數(shù)據(jù)求得不同備選邊緣分布函數(shù)和Copula函數(shù)的單一AIC 值識(shí)別最優(yōu)邊緣分布函數(shù)和Copula函數(shù)。眾所周知,隨機(jī)變量的單一取值并不能代表這個(gè)變量的實(shí)際分布,因而基于單一AIC 值的最優(yōu)邊緣分布函數(shù)和Copula函數(shù)識(shí)別方法是不合理的。為了得到合理結(jié)果,應(yīng)該充分考慮小樣本容量巖土體參數(shù)引起的統(tǒng)計(jì)量AIC 值的變異性。下面介紹統(tǒng)計(jì)量AIC 值變異性模擬的Bootstrap方法以及基于Bootstrap的最優(yōu)邊緣分布函數(shù)和Copula函數(shù)識(shí)別方法。

3 巖土體參數(shù)聯(lián)合分布函數(shù)識(shí)別的Bootstrap方法

本文采用Bootstrap方法模擬統(tǒng)計(jì)量AIC值的變異性,下面簡(jiǎn)要介紹Bootstrap方法基本原理以及基于Bootstrap的巖土體參數(shù)最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)識(shí)別方法。Bootstrap方法最早由Efron[12]于1979年提出。它通過(guò)對(duì)原始觀測(cè)樣本數(shù)據(jù)進(jìn)行有放回地隨機(jī)抽樣獲得大量Bootstrap子樣本,然后基于這些子樣本計(jì)算統(tǒng)計(jì)量的估計(jì)值,最終獲得統(tǒng)計(jì)量的變異系數(shù)及其概率分布。該方法只依賴于給定的巖土體參數(shù)的原始觀測(cè)樣本,且能夠充分挖掘原始觀測(cè)樣本所攜帶的巖土體參數(shù)總體信息,不需要對(duì)巖土體參數(shù)的實(shí)際分布作任何假設(shè)和增加新的數(shù)據(jù)觀測(cè)。盡管簡(jiǎn)單,但該方法的理論依據(jù)及其良好的收斂性早已被統(tǒng)計(jì)學(xué)家所證明[12]。Bootstrap方法不僅被證明對(duì)于大部分統(tǒng)計(jì)量滿足大樣本的相合性,而且對(duì)于小樣本分析更具有不可替代的優(yōu)越性?;贐ootstrap的統(tǒng)計(jì)量AIC 值的變異性模擬主要包括以下3步:

(1)令巖土體參數(shù)的原始觀測(cè)樣本數(shù)據(jù)為X0={(x1i,x2i),i=1,2,···,N},從中有放回地隨機(jī)抽樣N次,每次抽取巖土體參數(shù)的一次觀測(cè),從而得到第1個(gè)與X0相同樣本容量的Bootstrap子樣本

(2)重復(fù)上述步驟B 次,即可獲得B 個(gè)Bootstrap子樣本i=1,2,···,N;b=1,2,···,B};

(3)基于每個(gè)Bootstrap子樣本估計(jì)巖土體參數(shù)的樣本均值、標(biāo)準(zhǔn)差和Kendall秩相關(guān)系數(shù),然后采用式(4)和式(5)分別計(jì)算4種備選邊緣分布函數(shù)和Copula函數(shù)的AIC 值,從而得到AIC 值的變異系數(shù)及其概率分布。

一般來(lái)說(shuō),為了達(dá)到良好的收斂效果,Bootstrap子樣本數(shù)目通常取值較大。如文獻(xiàn)[14]研究表明,B=104時(shí)能夠保證Bootstrap模擬的土性參數(shù)的樣本均值和標(biāo)準(zhǔn)差收斂于總體均值和標(biāo)準(zhǔn)差。因此,本文亦采用B=104模擬AIC 值的變異性?;诿總€(gè)Bootstrap子樣本計(jì)算的4種備選邊緣分布函數(shù)和Copula函數(shù)的AIC 值即可識(shí)別出該子樣本的最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)。統(tǒng)計(jì)所有B個(gè)Bootstrap子樣本的4種備選邊緣分布函數(shù)和Copula函數(shù)被識(shí)別為最優(yōu)邊緣分布和最優(yōu)Copula的次數(shù)[19-20],從而得到4種備選邊緣分布函數(shù)和Copula函數(shù)為最優(yōu)邊緣分布和最優(yōu)Copula的權(quán)重系數(shù)。與傳統(tǒng)方法不同,本文在考慮AIC 值變異性基礎(chǔ)上,將識(shí)別結(jié)果表示為4種備選邊緣分布函數(shù),Copula函數(shù)被識(shí)別為最優(yōu)邊緣分布和最優(yōu)Copula的權(quán)重系數(shù)集合。這種表述方法充分考慮了小樣本容量巖土體參數(shù)引起的AIC 值的變異性,從而更加合理地描述了巖土體參數(shù)最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)識(shí)別結(jié)果。與傳統(tǒng)方法一樣,本文方法得出的識(shí)別結(jié)果亦可直接代入巖土工程可靠度分析中,從而反映小樣本容量巖土體參數(shù)引起的AIC 值變異性對(duì)巖土結(jié)構(gòu)物可靠度結(jié)果的影響。

4 算 例

4.1 基樁荷載-位移雙曲線參數(shù)試驗(yàn)數(shù)據(jù)

本文以基樁荷載-位移雙曲線參數(shù)試驗(yàn)數(shù)據(jù)為例,研究Bootstrap方法在小樣本巖土體參數(shù)最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)識(shí)別中的應(yīng)用。對(duì)于基樁荷載-位移關(guān)系的預(yù)測(cè)問(wèn)題,國(guó)內(nèi)外研究人員提出了多種基樁荷載-位移關(guān)系曲線模型,如雙曲線模型、冪函數(shù)模型、指數(shù)函數(shù)模型、GM(1,1)模型等,其中雙曲線模型在基樁中應(yīng)用最為廣泛。原因在于雙曲線模型中參數(shù)較少,而且物理意義明確。為了降低實(shí)測(cè)基樁荷載-位移雙曲線數(shù)據(jù)的離散性,文獻(xiàn)[3-5]提出了采用標(biāo)準(zhǔn)化的荷載-位移雙曲線模型去表征實(shí)測(cè)荷載-位移關(guān)系曲線,該標(biāo)準(zhǔn)化的荷載-位移雙曲線模型為

式中:Q為軸向荷載;QSTC為基樁實(shí)測(cè)極限承載力;y為樁端位移;a 和b 是雙曲線兩個(gè)參數(shù),它們具有明確的物理意義,其中a為雙曲線初始斜率的倒數(shù),b為雙曲線極限值的倒數(shù),其物理意義見(jiàn)圖1。

圖1 基樁標(biāo)準(zhǔn)化荷載-位移雙曲線模型Fig.1 Definition of the normalized hyperbolic load-settlement curve of foundation pile

考慮文獻(xiàn)[5]中4類基樁荷載-位移雙曲線參數(shù)試驗(yàn)數(shù)據(jù),這4類數(shù)據(jù)分別是無(wú)黏性土中打入樁(D-NC)、無(wú)黏性土中灌注樁(B-NC)、黏性土中打入樁(D-C)和黏性土中灌注樁(B-C),它們的樣本容量分別為28、30、59和53,可見(jiàn)這些數(shù)據(jù)都屬于小樣本容量數(shù)據(jù)。圖2給出了上述4類雙曲線參數(shù)數(shù)據(jù)a 和b 的散點(diǎn)圖。由這些數(shù)據(jù)計(jì)算的雙曲線參數(shù)的均值、標(biāo)準(zhǔn)差和相關(guān)系數(shù)見(jiàn)表1??梢钥闯觯p曲線參數(shù)具有明顯的負(fù)相關(guān)關(guān)系,它們的Kendall秩相關(guān)系數(shù)分別為-0.597、-0.750、-0.740和-0.755?;谶@些數(shù)據(jù)采用本文方法就可以模擬AIC 值的變異性并識(shí)別出擬合數(shù)據(jù)概率分布特性和相關(guān)結(jié)構(gòu)最優(yōu)的邊緣分布函數(shù)和Copula函數(shù),從而建立雙曲線參數(shù)a 和b 的聯(lián)合概率分布模型,為基樁正常使用極限狀態(tài)可靠度分析奠定基礎(chǔ)[8]。

圖2 雙曲線參數(shù)試驗(yàn)數(shù)據(jù)的散點(diǎn)圖Fig.2 Scattering plots of the measured parameters of the hyperbolic curve

表1 雙曲線參數(shù)試驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)特性Table 1 Statistical properties of the measured parameters of the hyperbolic curve

4.2 雙曲線參數(shù)最優(yōu)邊緣分布函數(shù)的識(shí)別

在采用本文方法識(shí)別雙曲線參數(shù)a 和b 的最優(yōu)邊緣分布函數(shù)之前,首先給出基于傳統(tǒng)方法的最優(yōu)邊緣分布函數(shù)識(shí)別結(jié)果。為此,表2給出了基于雙曲線參數(shù)原始觀測(cè)樣本數(shù)據(jù)(見(jiàn)圖2)計(jì)算的4種備選邊緣分布函數(shù)的單一AIC 值??梢钥闯?,除了B-C數(shù)據(jù)的參數(shù)a 和D-NC數(shù)據(jù)的參數(shù)b 最優(yōu)邊緣分布函數(shù)分別是極值I型分布和對(duì)數(shù)正態(tài)分布外,其余數(shù)據(jù)參數(shù)a 和b 的最優(yōu)邊緣分布都是威布爾分布??梢?jiàn),采用威布爾分布能夠較好地描述雙曲線參數(shù)試驗(yàn)數(shù)據(jù)的概率分布特性。

下面采用本文方法識(shí)別雙曲線參數(shù)a 和b 的最優(yōu)邊緣分布函數(shù)。在給出AIC 值的概率分布之前,首先研究小樣本數(shù)據(jù)對(duì)樣本均值和標(biāo)準(zhǔn)差的影響。圖3給出了基于Bootstrap模擬的參數(shù)a 的樣本均值和標(biāo)準(zhǔn)差概率密度函數(shù)。為了比較,圖中還給出了基于參數(shù)a 的原始觀測(cè)數(shù)據(jù)計(jì)算的樣本均值和標(biāo)準(zhǔn)差(見(jiàn)豎直線)。可以看出,小樣本巖土體參數(shù)數(shù)據(jù)的樣本均值和標(biāo)準(zhǔn)差具有較大的離散性,如D-NC、B-NC、D-C和B-C數(shù)據(jù)的樣本均值變異系數(shù)分別為0.10、0.14、0.07和0.10,它們的樣本標(biāo)準(zhǔn)差變異系數(shù)分別為0.14、0.11、0.10和0.22??偟膩?lái)說(shuō),小樣本巖土體參數(shù)數(shù)據(jù)對(duì)樣本標(biāo)準(zhǔn)差變異性的影響要大于對(duì)樣本均值的影響,這符合統(tǒng)計(jì)學(xué)理論的一般規(guī)律。此外,基于參數(shù)a 的原始觀測(cè)數(shù)據(jù)計(jì)算的樣本均值和標(biāo)準(zhǔn)差僅僅是樣本均值和標(biāo)準(zhǔn)差實(shí)際分布的單一取值,該取值能夠較好地被Bootstrap方法所模擬。因此,Bootstrap方法除了保留原始觀測(cè)數(shù)據(jù)的相關(guān)特性外,還能充分挖掘原始觀測(cè)數(shù)據(jù)所隱藏的總體信息,這也是Bootstrap方法被廣泛應(yīng)用于統(tǒng)計(jì)量變異性模擬的原因所在。同理,采用本文方法可以得出參數(shù)b 的樣本均值和標(biāo)準(zhǔn)差的概率密度函數(shù),限于篇幅,這里不再列出。小樣本巖土體參數(shù)數(shù)據(jù)樣本均值和標(biāo)準(zhǔn)差的這種變異性將直接導(dǎo)致計(jì)算的邊緣分布函數(shù)AIC 值具有較大變異性,這是因?yàn)橛?jì)算AIC 值時(shí)各備選邊緣分布函數(shù)的分布參數(shù)都是基于樣本均值和標(biāo)準(zhǔn)差確定的。

圖3 參數(shù)a 的樣本均值和標(biāo)準(zhǔn)差概率密度函數(shù)Fig.3 PDFs of mean and standard deviation of a

為了研究小樣本巖土體參數(shù)試驗(yàn)數(shù)據(jù)對(duì)AIC 值變異性的影響,圖4以參數(shù)a為例給出了4種備選邊緣分布函數(shù)AIC 值的概率密度函數(shù)。小樣本巖土體參數(shù)試驗(yàn)數(shù)據(jù)對(duì)AIC 值變異性具有重要的影響,如B-C數(shù)據(jù)計(jì)算的正態(tài)分布、對(duì)數(shù)正態(tài)分布、極值I型分布和威布爾分布AIC 值的變異系數(shù)分別為0.10、0.14、0.08和0.08。不同邊緣分布函數(shù)AIC值的概率密度函數(shù)重疊區(qū)域較大,這進(jìn)一步說(shuō)明識(shí)別最優(yōu)邊緣分布函數(shù)時(shí)4種備選邊緣分布都有可能被識(shí)別為最優(yōu)的邊緣分布函數(shù)。傳統(tǒng)方法基于單一AIC 值識(shí)別最優(yōu)的邊緣分布函數(shù)忽略了其余備選邊緣分布函數(shù)為最優(yōu)邊緣分布的概率,因此,是不合理的。此外,基于參數(shù)a 的原始觀測(cè)數(shù)據(jù)計(jì)算的邊緣分布函數(shù)AIC 值是實(shí)際分布的單一取值,該取值亦能較好地被Bootstrap方法所模擬。

為了充分考慮不同備選邊緣分布為最優(yōu)邊緣分布的概率,表3給出了104個(gè)Bootstrap子樣本中4種備選邊緣分布被識(shí)別為最優(yōu)邊緣分布的次數(shù)及權(quán)重系數(shù)。可以看出,由于小樣本巖土體參數(shù)試驗(yàn)數(shù)據(jù)的影響,沒(méi)有一種備選邊緣分布能夠被100%地識(shí)別為最優(yōu)的邊緣分布函數(shù)。除了B-C數(shù)據(jù)的參數(shù)a 和D-NC數(shù)據(jù)的參數(shù)b 權(quán)重系數(shù)最大邊緣分布分別是極值I型分布和對(duì)數(shù)正態(tài)分布外,其余數(shù)據(jù)參數(shù)a 和b 的權(quán)重系數(shù)最大邊緣分布都是威布爾分布。上述結(jié)果與傳統(tǒng)方法識(shí)別結(jié)果保持了較好的一致性。然而,傳統(tǒng)方法沒(méi)有考慮其余備選邊緣分布函數(shù)為最優(yōu)邊緣分布的概率。如對(duì)于D-NC數(shù)據(jù)的參數(shù)b 來(lái)說(shuō),除去對(duì)數(shù)正態(tài)分布后其余3種備選邊緣分布函數(shù)為最優(yōu)邊緣分布的概率達(dá)到了64.40%。因此,本文提出的基于Bootstrap的巖土體參數(shù)最優(yōu)邊緣分布函數(shù)識(shí)別方法比傳統(tǒng)方法要優(yōu)越。

圖4 不同邊緣分布計(jì)算的參數(shù)a 的AIC 值概率密度函數(shù)Fig.4 PDFs of AIC values of various margins for a

表2 基于雙曲線參數(shù)試驗(yàn)數(shù)據(jù)計(jì)算的4種備選邊緣分布函數(shù)AIC 值Table 2 AIC values associated with various margin distribution functions using the measured data for hyperbolic curve-fitting parameters

表3 10 000個(gè)Bootstrap子樣本中不同邊緣分布被識(shí)別為最優(yōu)邊緣分布的次數(shù)及權(quán)重系數(shù)Table 3 Numbers of times and weight factors being the best-fit one for different margin distribution functions over 10 000 bootstrap samples

4.3 雙曲線參數(shù)最優(yōu)Copula函數(shù)的識(shí)別

在采用本文方法識(shí)別雙曲線參數(shù)a 和b 間最優(yōu)Copula函數(shù)前,首先給出基于傳統(tǒng)方法的最優(yōu)Copula函數(shù)識(shí)別結(jié)果。為此,表4給出了基于雙曲線參數(shù)原始觀測(cè)數(shù)據(jù)計(jì)算的4種備選Copula函數(shù)的單一AIC 值??梢钥闯?,對(duì)于D-NC數(shù)據(jù)來(lái)說(shuō),Gaussian Copula函數(shù)計(jì)算的AIC 值最小,它是擬合D-NC數(shù)據(jù)間相關(guān)結(jié)構(gòu)最優(yōu)的Copula函數(shù)。而對(duì)于B-NC、D-C和B-C數(shù)據(jù)來(lái)說(shuō),最優(yōu)的Copula函數(shù)都是Plackett Copula函數(shù)。因此,大部分情況下采用Plackett Copula函數(shù)能夠較好地描述雙曲線參數(shù)試驗(yàn)數(shù)據(jù)的相關(guān)結(jié)構(gòu)。

表4 基于雙曲線參數(shù)試驗(yàn)數(shù)據(jù)計(jì)算的4種備選Copula函數(shù)AIC 值Table 4 AIC values associated with various Copula functions using measured data for hyperbolic curve-fitting parameters

下面采用本文方法識(shí)別雙曲線參數(shù)a 和b 間最優(yōu)Copula函數(shù)。在給出AIC 值的概率分布之前,首先研究小樣本巖土體參數(shù)試驗(yàn)數(shù)據(jù)對(duì)相關(guān)系數(shù)的影響。圖5給出了基于Bootstrap模擬的參數(shù)a 和b間Kendall秩相關(guān)系數(shù)的概率密度函數(shù)。圖中同時(shí)給出了基于參數(shù)a 和b 的原始觀測(cè)樣本數(shù)據(jù)計(jì)算的Kendall秩相關(guān)系數(shù)??梢钥闯觯颖編r土體參數(shù)試驗(yàn)數(shù)據(jù)的相關(guān)系數(shù)亦具有較大的離散性,如D-NC、B-NC、D-C和B-C數(shù)據(jù)的相關(guān)系數(shù)變異系數(shù)分別為0.19、0.12、0.06和0.08。此外,基于參數(shù)a 和b 的原始觀測(cè)樣本數(shù)據(jù)計(jì)算的Kendall秩相關(guān)系數(shù)僅僅是相關(guān)系數(shù)實(shí)際分布的單一取值,該取值亦能夠較好地被Bootstrap方法所模擬。Bootstrap方法不僅能夠重復(fù)原始觀測(cè)樣本數(shù)據(jù)的Kendall秩相關(guān)系數(shù),它還能模擬相關(guān)系數(shù)的變異性及其概率分布。小樣本巖土體參數(shù)試驗(yàn)數(shù)據(jù)相關(guān)系數(shù)的這種變異性將直接導(dǎo)致計(jì)算的Copula函數(shù)AIC值具有較大變異性,這是因?yàn)橛?jì)算AIC 值時(shí)各備選Copula函數(shù)的相關(guān)參數(shù)都是基于Kendall秩相關(guān)系數(shù)采用式(3)確定的。

圖5 雙曲線參數(shù)間相關(guān)系數(shù)的概率密度函數(shù)Fig.5 PDFs of correlation coefficient between a and b

圖6給出了4種備選Copula函數(shù)計(jì)算的AIC值概率密度函數(shù)??梢钥闯?,小樣本巖土體參數(shù)試驗(yàn)數(shù)據(jù)對(duì)AIC 值變異性具有重要的影響,如樣本容量最小的D-NC數(shù)據(jù)計(jì)算的Gaussian、Plackett、Frank和No.16 Copula函數(shù)AIC 值的變異系數(shù)分別為0.40、0.41、0.42和0.65??梢?jiàn)二維Copula函數(shù)AIC 值變異系數(shù)明顯大于一維邊緣分布函數(shù)AIC 值變異系數(shù)。與邊緣分布函數(shù)一樣,不同Copula函數(shù)AIC 值的概率密度函數(shù)重疊區(qū)域較大,識(shí)別最優(yōu)Copula函數(shù)時(shí)4種備選Copula函數(shù)都有可能被識(shí)別為最優(yōu)的Copula函數(shù)。傳統(tǒng)方法忽略了其余備選Copula函數(shù)為最優(yōu)Copula的概率,因此,是不合理的。同理,基于參數(shù)a 和b 的原始觀測(cè)數(shù)據(jù)計(jì)算的不同備選Copula函數(shù)AIC值是實(shí)際分布的單一取值,該取值能較好地被Bootstrap所模擬。此外,Bootstrap方法還能有效模擬AIC 值變異性及其概率分布,這是傳統(tǒng)方法所無(wú)法比擬的。

為了考慮不同備選Copula函數(shù)為最優(yōu)Copula的概率,表5給出了104個(gè)Bootstrap子樣本中4種備選Copula函數(shù)被識(shí)別為最優(yōu)Copula的次數(shù)及權(quán)重系數(shù)。由于小樣本巖土體參數(shù)試驗(yàn)數(shù)據(jù)的影響,4種備選Copula函數(shù)都不能被100%地識(shí)別為最優(yōu)的Copula函數(shù)。對(duì)于D-NC數(shù)據(jù)而言,權(quán)重系數(shù)最大的Copula函數(shù)是Gaussian Copula。對(duì)于D-C數(shù)據(jù)來(lái)說(shuō),權(quán)重系數(shù)最大的Copula函數(shù)是Frank Copula。而B-NC和B-C數(shù)據(jù)權(quán)重系數(shù)最大的Copula函數(shù)都是Plackett Copula。除了樣本容量最大的D-C數(shù)據(jù)外,上述結(jié)果與傳統(tǒng)方法識(shí)別結(jié)果亦保持了較好的一致性。由于傳統(tǒng)方法沒(méi)有考慮AIC 值變異性,由傳統(tǒng)方法識(shí)別的D-C數(shù)據(jù)最優(yōu)的Plackett Copula函數(shù)的權(quán)重系數(shù)只有17.87%,遠(yuǎn)低于非最優(yōu)的Frank Copula函數(shù)的66.14%。可見(jiàn),傳統(tǒng)方法容易給出錯(cuò)誤的識(shí)別結(jié)果。此外,傳統(tǒng)方法亦沒(méi)有考慮其余備選Copula函數(shù)為最優(yōu)Copula的概率。如對(duì)于B-NC數(shù)據(jù)來(lái)說(shuō),除去Plackett Copula函數(shù)后其余3種備選Copula函數(shù)為最優(yōu)Copula的概率達(dá)到了54.01%。因此,本文提出的基于Bootstrap的巖土體參數(shù)最優(yōu)Copula函數(shù)識(shí)別方法遠(yuǎn)比傳統(tǒng)方法優(yōu)越。

圖6 不同Copula函數(shù)計(jì)算的AIC 值概率密度函數(shù)Fig.6 PDFs of AIC values of various Copulas functions

表5 10 000個(gè)Bootstrap子樣本中不同Copula函數(shù)被識(shí)別為最優(yōu)Copula的次數(shù)及權(quán)重系數(shù)Table 5 Numbers of times and weight factors being best-fit Copula function for different Copula functions over 10 000 bootstrap samples

5 結(jié) 論

(1)Bootstrap方法能夠有效地模擬統(tǒng)計(jì)量的變異性及其概率分布,該方法只依賴于巖土體參數(shù)的原始觀測(cè)樣本數(shù)據(jù),且能夠充分挖掘原始觀測(cè)樣本所攜帶的巖土體參數(shù)總體信息,不需要對(duì)巖土體參數(shù)的實(shí)際分布作任何假設(shè)以及增加新的數(shù)據(jù)觀測(cè),它為小樣本容量巖土體參數(shù)統(tǒng)計(jì)量的變異性模擬提供了一條有效的途徑。

(2)提出的基于Bootstrap的最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)識(shí)別方法,不僅可以有效地考慮統(tǒng)計(jì)量AIC 值的變異性,而且能夠綜合地反映不同備選邊緣分布函數(shù)和Copula函數(shù)為最優(yōu)邊緣分布和最優(yōu)Copula的概率,相比傳統(tǒng)的基于單一AIC值的最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)識(shí)別方法要優(yōu)越,建議優(yōu)先采用。

(3)基于小樣本容量巖土體參數(shù)試驗(yàn)數(shù)據(jù)估計(jì)的樣本均值、標(biāo)準(zhǔn)差和相關(guān)系數(shù)具有較大的離散性,這種離散性進(jìn)一步導(dǎo)致了識(shí)別最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)時(shí)統(tǒng)計(jì)量AIC 值存在較大的變異性。為了提高巖土體參數(shù)最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)的識(shí)別精度,建議盡可能多地收集巖土體參數(shù)試驗(yàn)數(shù)據(jù)。

(4)盡管Bootstrap方法只依賴于給定的巖土體參數(shù)原始觀測(cè)樣本數(shù)據(jù),該原始觀測(cè)樣本的樣本容量以及數(shù)據(jù)質(zhì)量仍對(duì)最優(yōu)邊緣分布函數(shù)和最優(yōu)Copula函數(shù)的識(shí)別結(jié)果有重要的影響。為了使得識(shí)別結(jié)果收斂于總體情況,建議采取合理措施保證原始觀測(cè)樣本數(shù)據(jù)的代表性和準(zhǔn)確性。

[1]范明橋,盛金保.土強(qiáng)度指標(biāo)φ,c 的互相關(guān)性[J].巖土工程學(xué)報(bào),1997,19(4):100-104.FAN Ming-qiao,SHENG Jin-bao.Cross correlation of soil strength indexes φ and c[J].Chinese Journal of Geotechnical Engineering,1997,19(4):100-104.

[2]TANG X S,LI D Q,CHEN Y F,et al.Improved knowledge-based clustered partitioning approach and its application to slope reliability analysis[J].Computers and Geotechnics,2012,45:34-43.

[3]PHOON K K,KULHAWY F H.Characterization of model uncertainties for laterally loaded rigid drilled shafts[J].Geotechnique,2005,55(1):45-54.

[4]DITHINDE M,PHOON K K,DE WET M,et al.Characterization of model uncertainty in the static pile design formula[J].Journal of Geotechnical and Geoenvironmental Engineering,2011,137(1):70-85.

[5]LI D Q,TANG X S,PHOON K K,et al.Bivariate simulation using Copula and its application to probabilistic pile settlement analysis[J].International Journal for Numerical and Analytical Methods in Geomechanics,2013,37(6):597-617.

[6]PHOON K K,SANTOSO A,QUEK S T.Probabilistic analysis of soil-water characteristic curves[J].Journal of Geotechnical and Geoenvironmental Engineering,2010,136(3):445-455.

[7]NELSEN R B.An introduction to Copulas[M].New York:Springer,2006.

[8]唐小松,李典慶,周創(chuàng)兵,等.基于Copula函數(shù)的基樁荷載-位移雙曲線概率分析[J].巖土力學(xué),2012,33(1):171-178.TANG Xiao-song,LI Dian-qing,ZHOU Chuang-bing,et al.Probabilistic analysis of load-displacement hyperbolic curves of single pile using Copula[J].Rock and Soil Mechanics,2012,33(1):171-178.

[9]唐小松,李典慶,周創(chuàng)兵,等.基于Copula函數(shù)的抗剪強(qiáng)度參數(shù)間相關(guān)性模擬及邊坡可靠度分析[J].巖土工程學(xué)報(bào),2012,34(12):2284-2291.TANG Xiao-song,LI Dian-qing,ZHOU Chuang-bing,et al.Modeling dependence between shear strength parameters using Copulas and its effect on slope reliability[J].Chinese Journal of Geotechnical Engineering,2012,34(12):2284-2291.

[10]唐小松,李典慶,周創(chuàng)兵,等.不完備概率信息條件下邊坡可靠度分析方法[J].巖土工程學(xué)報(bào),2013,35(6):1027-1034.TANG Xiao-song,LI Dian-qing,ZHOU Chuang-bing,et al.Reliability analysis of slopes with incomplete probability information[J].Chinese Journal of Geotechnical Engineering,2013,35(6):1027-1034.

[11]AKAIKE H.A new look at the statistical model identification[J].IEEE Transactions on Automatic Control,1974,19(6):716-723.

[12]EFRON B.Bootstrap methods:another look at the jackknife[J].The Annals of Statistics,1979,7(1):1-26.

[13]謝桂華,張家生,劉榮桂.沉降計(jì)算經(jīng)驗(yàn)系數(shù)的Bootstrap法置信區(qū)間估計(jì)[J].中南大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,42(9):2843-2847.XIE Gui-hua,ZHANG Jia-sheng,LIU Rong-gui.Estimation of confidence interval of empirical coefficients in calculating foundation settlement by Bootstrap method[J].Journal of Central South University(Science and Technology),2011,42(9):2843-2847.

[14]LUO Z,ATAMTURKTUR S,JUANG C H.Bootstrapping for characterizing the effect of uncertainty in sample statistics for braced excavations[J].Journal of Geotechnical and Geoenvironmental Engineering,2013,139(1):13-23.

[15]陳立宏,陳祖煜,劉金梅.土體抗剪強(qiáng)度指標(biāo)的概率分布類型研究[J].巖土力學(xué),2005,26(1):37-40.CHEN Li-hong,CHEN Zu-yu,LIU Jin-mei.Probability distribution of soil strength[J].Rock and Soil Mechanics,2005,26(1):37-40.

[16]蘇永華,何滿潮,孫曉明.大子樣巖土隨機(jī)參數(shù)統(tǒng)計(jì)方法[J].巖土工程學(xué)報(bào),2001,23(1):117-119.SU Yong-hua,HE Man-chao,SUN Xiao-ming.Approach on asymptotic approximations of polynomials for probability density function of geotechnics random parameters[J].Chinese Journal of Geotechnical Engineering,2001,23(1):117-119.

[17]蔣水華,馮曉波,李典慶,等.邊坡可靠度分析的非侵入式隨機(jī)有限元法[J].巖土力學(xué),2013,34(8):2347-2354.JIANG Shui-hua,F(xiàn)ENG Xiao-bo,LI Dian-qing,et al.Reliability analysis of slope using non-intrusive stochastic finite element method[J].Rock and Soil Mechanics,2013,34(8):2347-2354.

[18]蔣水華,李典慶,周創(chuàng)兵,等.考慮參數(shù)空間變異性的非飽和土坡可靠度分析[J].巖土力學(xué),2014,35(9):2569-2578.JIANG Shui-hua,LI Dian-qing,ZHOU Chuang-bing,et al.Reliability analysis of unsaturated slope considering spatial variability[J].Rock and Soil Mechanics,2014,35(9):2569-2578.

[19]SILVA R S,LOPES H F.Copula,marginal distributions and model selection:a Bayesian note[J].Statistics and Computing,2008,18(3):313-320.

[20]HUARD D,éVIN G,F(xiàn)AVRE A C.Bayesian copula selection[J].Computational Statistics &Data Analysis,2006,51(2):809-822.

猜你喜歡
概率分布變異性雙曲線
心率變異性和NT-proBNP對(duì)冠狀動(dòng)脈病變嚴(yán)重程度評(píng)估的臨床應(yīng)用價(jià)值
孟魯司特鈉治療小兒咳嗽變異性哮喘的療效觀察
彈性水擊情況下隨機(jī)非線性水輪機(jī)的概率分布控制
概率分布問(wèn)題思路探究
關(guān)于概率分布函數(shù)定義的辨析
雙曲線的一個(gè)性質(zhì)與應(yīng)用
風(fēng)速概率分布對(duì)風(fēng)電齒輪
雙曲線的一個(gè)美妙性質(zhì)及應(yīng)用
運(yùn)動(dòng)、健康與心率變異性的研究進(jìn)展
中醫(yī)治療咳嗽變異性哮喘46例臨床觀察