国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

兩參數(shù)Weibull分布基于BLUE的異常數(shù)據(jù)檢驗(yàn)

2018-01-13 01:57王蓉華徐曉嶺顧蓓青
統(tǒng)計(jì)與決策 2017年24期
關(guān)鍵詞:次序貢獻(xiàn)率個(gè)數(shù)

王蓉華,徐曉嶺,顧蓓青

0 引言

所謂異常數(shù)據(jù)通常是指一批數(shù)據(jù)中的個(gè)別者,其值明顯地偏離該批數(shù)據(jù)中的其余值。目前,對多個(gè)異常數(shù)據(jù)的檢驗(yàn)方法有兩種:一是稱之為群組檢驗(yàn),就是一次可檢驗(yàn)多個(gè)異常數(shù)據(jù),此檢驗(yàn)的關(guān)鍵是要確定異常數(shù)據(jù)的個(gè)數(shù);二是稱之為逐步檢驗(yàn),就是每次只檢驗(yàn)一個(gè)數(shù)據(jù)是否為異常數(shù)據(jù),逐步排除,直至檢驗(yàn)到正常數(shù)據(jù)為止。鑒于兩參數(shù)Weibull分布在可靠性工程中重要的應(yīng)用地位,下面簡單介紹幾種目前常用的針對兩參數(shù)Weibull分布異常數(shù)據(jù)的檢驗(yàn)方法。

文獻(xiàn)[1]提出了一種利用G型統(tǒng)計(jì)量的檢驗(yàn)方法,文獻(xiàn)[2]對此作了改進(jìn)并提出了F型統(tǒng)計(jì)量來檢驗(yàn)異常大值。文獻(xiàn)[3]提出了均值比檢驗(yàn)方法,為確定異常數(shù)據(jù)的個(gè)數(shù),定義了跳躍度的概念。文獻(xiàn)[4]提出了一種新的檢驗(yàn)異常大值的XLD統(tǒng)計(jì)量與檢驗(yàn)異常小的XLX統(tǒng)計(jì)量。文獻(xiàn)[5]推廣了F-型檢驗(yàn),為確定異常數(shù)據(jù)的個(gè)數(shù),還定義了靈敏度的概念。Weibull分布異常數(shù)據(jù)的檢驗(yàn)方法很多。值得指出的是針對指數(shù)分布,文獻(xiàn)[6]基于樣本中位數(shù)提出一種檢驗(yàn)方法,文獻(xiàn)[7]作了進(jìn)一步推廣,但從單個(gè)樣本分量出發(fā)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,方法雖然可行,但也浪費(fèi)了許多可用的數(shù)據(jù)信息,這是因?yàn)楫惓?shù)據(jù)的個(gè)數(shù)應(yīng)該是少數(shù)幾個(gè),樣本數(shù)據(jù)中的大部分還應(yīng)該是正常數(shù)據(jù),而且如果異常數(shù)據(jù)比較多,用簡單的剔除并不合適,而應(yīng)該考慮其他模型,例如混合模型等。

本文針對兩參數(shù)Weibull分布,基于參數(shù)的最佳線性無偏估計(jì)(BLUE),給出一種新的異常數(shù)據(jù)的檢驗(yàn)方法。

其中,m稱為形狀參數(shù),η稱為刻度參數(shù)。

從產(chǎn)品中任意取n個(gè)進(jìn)行壽命試驗(yàn),到有r個(gè)失效時(shí)試驗(yàn)停止(定數(shù)截尾壽命試驗(yàn)),失效時(shí)間依次為:X(1)≤X(2)≤…≤X(r),其相應(yīng)的次序觀察值為:x(1)≤x(2)≤…≤x(r)。

由于系數(shù)C(n,r,j),j=1,2,…,r并不相等,于是對于參數(shù)σ的最佳線性無偏估計(jì)而言,各 X(1),X(2),…,X(n)對參數(shù)σ的估計(jì)所起的作用是不一樣的。為此針對參數(shù)σ的最佳線性無偏估計(jì),定義各次序統(tǒng)計(jì)量的貢獻(xiàn)率為:

1 兩參數(shù)Weibull分布參數(shù)BLUE系數(shù)的特征

設(shè)產(chǎn)品的壽命為X,其服從兩參數(shù)Weibull分布,分

其中,ρj表示次序統(tǒng)計(jì)量X(j)的貢獻(xiàn)率。

考慮到系數(shù)C(n,r,j),j=1,2,…,r的正負(fù)號,如是正號,對應(yīng)的貢獻(xiàn)率稱為正貢獻(xiàn)率;如是負(fù)號,對應(yīng)的貢獻(xiàn)率稱為負(fù)貢獻(xiàn)率。

仔細(xì)觀察系數(shù) C(n,r,j),j=1,2,…,r 發(fā)現(xiàn)有如下特且給定 n,r后系數(shù) C(n,r,j),j=1,2,…,r 中 第 一 個(gè) 大 于 0 所 對 應(yīng) 的j0,即C(n,r,j)<0,j=1,2,…,j0-1 ,而 C(n,r,j)>0,j=j0,j0+征(僅針對樣本容量n=2(1)25):

特征二:對于C(n,r,i),i=1,2,…,j0,總存在 i0<j0,是嚴(yán)格單調(diào)減少的。

特征三:對于C(n,r,i),i=j0+1,j0+2,…,r,有:

C(n,r,j0+1)<C(n,r,j0+2)<…<C(n,r,r)

其中,C(n,r,r) 比 C(n,r,i),i=j0+1,j0+2,…,r-1有大幅度提高,也即X(r)的正貢獻(xiàn)率最大。

2 異常數(shù)據(jù)檢驗(yàn)

若樣本數(shù)據(jù)僅存在極小異常值,且異常值的個(gè)數(shù)不超過 i0個(gè),即異常小數(shù)據(jù)存在于 X(1),X(2),…,X(i0)中,由于C(n,r,j)<0,j=1,2,…,i0,易見參數(shù) σ 的最佳線性無偏

如果樣本數(shù)據(jù)存在異常值,則其必將影響到參數(shù)的估計(jì)。事實(shí)上,若樣本數(shù)據(jù)僅存在極大異常值,且異常值的個(gè)數(shù)不超過r-j0+1個(gè),即異常大數(shù)據(jù)存在于X(j0),X(j0+1),…,X(r)中,由于 C(n,r,j)>0,j=j0,j0+1,…,值的個(gè)數(shù)至少為i0+1個(gè),由于X(i0)的負(fù)貢獻(xiàn)率最大,是一個(gè)轉(zhuǎn)折點(diǎn),于是可以認(rèn)為是兩個(gè)不同總體的混合,即采用混合模型處理。

若樣本數(shù)據(jù)同時(shí)存在極大異常值與極小異常值,且極大異常值的個(gè)數(shù)不超過r-j0+1個(gè),即異常大數(shù)據(jù)存在于如果異常大值的個(gè)數(shù)至少為r-j0+2個(gè),異常小值的個(gè)數(shù)至少為i0+1個(gè),于是可以認(rèn)為是三個(gè)不同總體的混合,即

步驟2:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量Tj0=采用混合模型處理。

異常數(shù)據(jù)檢驗(yàn)的關(guān)鍵問題之一是確定異常數(shù)據(jù)的個(gè)數(shù),鑒于上述討論,在此可以認(rèn)為異常數(shù)據(jù)的最多疑似個(gè)數(shù)為i0+(r-j0+1)個(gè),其中有i0個(gè)是疑似極小異常值,即X(1),X(2),…,X(i0),r-j0+1個(gè)是疑似極大異常值,即 X(j0),X(j0+1),…,X(r)。或者說非異常的樣本數(shù)據(jù)有 j0-i0-1個(gè),即 X(i0+1),X(i0+2),…,X(j0-1)。

由此,針對定數(shù)截尾兩參數(shù)Weibull分布異常數(shù)據(jù)檢驗(yàn)分為如下三種場合,其檢驗(yàn)步驟如下(給定顯著性水平α):

場合一:如果只存在極大異常值

記由次序統(tǒng)計(jì)量 X(1),X(2),…,X(k)所得的參數(shù)σ的最佳線性無偏估計(jì)(BLUE)為 σ?n,k(X(1),X(2),…,X(k)) ,即:分布與參數(shù)無關(guān)。事實(shí)上,易見Tj0的分布與參數(shù)無關(guān)。同時(shí)有Tj0對X(j0)嚴(yán)格單調(diào)增加。記統(tǒng)計(jì)量Tj0的觀察值為tj0,而記Tj0的分布的上側(cè)α分位數(shù)為Tj0(α)。給定樣本容量n以及 j0、顯著性水平α,通過10000次Monte-Carlo模擬得到統(tǒng)計(jì)量Tj0的上側(cè)α分?jǐn)?shù),結(jié)果見下頁表1。

若tj0<Tj0(α),則認(rèn)為 X(j0)不是極大異常值,檢驗(yàn)轉(zhuǎn)入步驟3。

步驟3:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量Tj0+1=,其分布與參數(shù)無關(guān),且對 X(j0)嚴(yán)格單調(diào)增加。

若 tj0+1≥Tj0+1(α),則認(rèn)為 X(j0+1)為極大異常值,進(jìn)而認(rèn)為 X(j0+2),X(j0+3),…,X(r)均為極大異常值,終止檢驗(yàn)。

若 tj0+1<Tj0+1(α),則認(rèn)為 X(j0+1)不是極大異常值,檢驗(yàn)轉(zhuǎn)入下一步驟。

如此下去,直至某一步終止檢驗(yàn)。

如果一直沒有終止檢驗(yàn),則最后所構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量為:

表1 Tj0分布的上側(cè)分位數(shù)表

若tr≥Tr(α),則認(rèn)為X(r)為極大異常值,而X(j0),X(j0+1),…,X(r-1)都不是極大異常值。

若tr<Tr(α),則認(rèn)為X(r)不是極大異常值,也就是說整個(gè)樣本數(shù)據(jù)不存在極大異常值。

場合二:如果只存在極小異常值

記由次序統(tǒng)計(jì)量X(k),X(k+1),…,X(r)所得的參數(shù)σ的最佳線性無偏估計(jì)(BLUE)為σ?n,k(X(k),X(k+1),…,X(r)),即:C(n,k,j)為左截尾的BLUE系數(shù)。

步驟 1:計(jì)算σ?n,i0(X(i0),X(i0+1),…,X(r)) ,σ?n,i0+1(X(i0+1),X(i0+2),…,X(r))

步驟2:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量Ti0分布與參數(shù)無關(guān),且對X(i0)嚴(yán)格單調(diào)減少。記統(tǒng)計(jì)量Ti0的觀察值為ti0,而記Ti0的分布的上側(cè)α分位數(shù)為Ti0(α)。

若ti0≥Ti0(α),則認(rèn)為X(i0)為極小異常值,進(jìn)而認(rèn)為X(1),X(2),…,X(i0-1)均為極小異常值,終止檢驗(yàn)。

若ti0<Ti0(α),則認(rèn)為X(i0)不是極小異常值,檢驗(yàn)轉(zhuǎn)入步驟3。

步驟3:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量Ti0-1布與參數(shù)無關(guān),且對X(i0-1)嚴(yán)格單調(diào)減少。

若ti0-1≥Ti0-1(α) ,則 認(rèn) 為X(i0-1)為極小異常值,進(jìn)而認(rèn)為X(1),X(2),…,X(i0-2)均 為 極 小 異 常值,終止檢驗(yàn)。

若ti0-1<Ti0-1(α) ,則 認(rèn) 為X(i0-1)不是極小異常值,檢驗(yàn)轉(zhuǎn)入下一步驟。

如此下去,直至某一步終止檢驗(yàn)。

如果一直沒有終止檢驗(yàn),則最后所構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量為:

若t1≥T1(α),則認(rèn)為X(1)為極小異常值,而X(2),X(3),…,X(i0)都不是極小異常值。

若t1<T1(α),則認(rèn)為X(1)不是極小異常值,也就是說整個(gè)樣本數(shù)據(jù)不存在極小異常值。

場合三:如果既存在極大異常值,又存在極小異常值

從j0-i0-1個(gè)非異常的樣本數(shù)據(jù)X(i0+1),X(i0+2),…,X(j0-1)出發(fā),分別向兩個(gè)方向檢驗(yàn)極大異常值與極小異常值。記由次序統(tǒng)計(jì)量X(k+1),X(k+2),…,X(s-1)所得的參數(shù)σ的最佳線性無偏估計(jì)(BLUE)為σ?n,k+1,s-1(X(k+1),X(k+2),…,X(s-1)),即:

而此處的C(n,k+1,s-1,j)為雙邊截尾的BLUE系數(shù)。

檢驗(yàn)極大異常值如下:

步驟1:計(jì)算 σ?n,i0+1,j0(X(i0+1),X(i0+2),…,X(j0)),σ?n,i0+1,j0-1(X(i0+1),X(i0+2),…,X(j0-1))

步驟2:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量Tj0=且對X(j0)嚴(yán)格單調(diào)增加。記統(tǒng)計(jì)量Tj0的觀察值為tj0,而記Tj0的分布的上側(cè)α分位數(shù)為Tj0(α)。

若 tj0≥Tj0(α),則認(rèn)為 X(j0)為極大異常值,進(jìn)而認(rèn)為X(j0+1),X(j0+2),…,X(r)均為極大異常值,終止檢驗(yàn)。

若tj0<Tj0(α),則認(rèn)為 X(j0)不是極大異常值,檢驗(yàn)轉(zhuǎn)入步驟3。

步驟3:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量Tj0+1=且對X(j0+1)嚴(yán)格單調(diào)增加。

若 tj0+1≥Tj0+1(α),則認(rèn)為 X(j0+1)為極大異常值,進(jìn)而認(rèn)為 X(j0+2),X(j0+3),…,X(r)均為極大異常值,終止檢驗(yàn)。

若 tj0+1<Tj0+1(α),則認(rèn)為 X(j0+1)不是極大異常值,檢驗(yàn)轉(zhuǎn)入下一步驟。

如此下去,直至某一步終止檢驗(yàn)。

如果一直沒有終止檢驗(yàn),則最后所構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量為:

若 tr≥Tr(α),則認(rèn)為X(r)為極大異常值,而X(j0),X(j0+1),…,X(r-1)都不是極大異常值。

若tr<Tr(α),則認(rèn)為 X(r)不是極大異常值,也就是說整個(gè)樣本數(shù)據(jù)不存在極大異常值。

檢驗(yàn)極小異常值如下:

步驟1:計(jì)算 σ?n,i0,j0-1(X(i0),X(i0+1),…,X(j0-1)),σ?n,i0+1,j0-1(X(i0+1),X(i0+2),…,X(j0-1))

步驟2:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量Ti0=且對X(i0)嚴(yán)格單調(diào)減少。記統(tǒng)計(jì)量Ti0的觀察值為ti0,而記Ti0的分布的上側(cè)α分位數(shù)為Ti0(α)。

若ti0≥Ti0(α),則認(rèn)為 X(i0)為極小異常值,進(jìn)而認(rèn)為X(1),X(2),…,X(i0-1)均為極小異常值,終止檢驗(yàn)。

若ti0<Ti0(α),則認(rèn)為 X(i0)不是極小異常值,檢驗(yàn)轉(zhuǎn)入步驟3。

步驟3:構(gòu)造檢驗(yàn)統(tǒng)計(jì)量Ti0-1=對X(i0-1)嚴(yán)格單調(diào)減少。

若 ti0-1≥Ti0-1(α),則認(rèn)為 X(i0-1)為極小異常值,進(jìn)而認(rèn)為 X(1),X(2),…,X(i0-2)均為極小異常值,終止檢驗(yàn)。

若 ti0-1<Ti0-1(α),則認(rèn)為 X(i0-1)不是極小異常值,檢驗(yàn)轉(zhuǎn)入下一步驟。

如此下去,直至某一步終止檢驗(yàn)。

如果一直沒有終止檢驗(yàn),則最后所構(gòu)造的檢驗(yàn)統(tǒng)計(jì)量為:

若 t1≥T1(α) ,則 認(rèn) 為 X(1)為 極 小 異 常 值 ,而X(2),X(3),…,X(i0)都不是極小異常值。

若t1<T1(α),則認(rèn)為 X(1)不是極小異常值,也就是說整個(gè)樣本數(shù)據(jù)不存在極小異常值。

3 算例分析

本文僅針對場合一(只存在極大異常值)通過算例分析來說明本文方法的應(yīng)用。

例1[6]:取 n=r=16 ,x(1),x(2),…,x(14)來自標(biāo)準(zhǔn)指數(shù)分布(這14個(gè)數(shù)據(jù)見GB8056-87),并混入另兩個(gè)數(shù)據(jù)x(15),x(16)。16個(gè)樣本數(shù)據(jù)如下:

0.0667 ,0.1381,0.2150,0.2984,0.3893,0.4893,0.6004,0.7254,0.8682,1.0349,1.2349,1.4849,1.8182,2.3182,8.0411,8.0914

當(dāng) n=r=16 時(shí),j0=12,Tj0(α)=Tj0(0.05)=1.2424 ,而Tj0的觀測值 tj0=1.0244<Tj0(α),不能說明 X(12)為極大異常值,進(jìn)入下一步檢驗(yàn)。

Tj0+1(α)=1.2113, 觀 測 值tj0+1=1.0194<Tj0+1(α)=1.2113,不能說明X(13)為極大異常值。進(jìn)入下一步檢驗(yàn),Tj0+2(α)=1.1928 ,觀測值 tj0+2=1.0267<Tj0+2(α)=1.1928 ,不能說明 X(14)為極大異常值,進(jìn)入下一步檢驗(yàn)。Tj0+3(α)=1.1887 ,觀測值 tj0+3=1.3738>Tj0+3(α)=1.1887 ,則X(15)為極大異常值,進(jìn)而X(16)也為極大異常值。

例2[9]:XXX飛機(jī)自上世紀(jì)70年代末裝備部隊(duì)以來,其飛機(jī)主要承力構(gòu)件機(jī)翼的疲勞、腐蝕等耗損問題日益突出,個(gè)別機(jī)翼或因斷裂而導(dǎo)致飛機(jī)事故,或因有裂紋而報(bào)廢。經(jīng)過多年的使用和部隊(duì)、翻修廠的普查,已經(jīng)積累一些裂紋尺寸、形狀與飛機(jī)時(shí)間相關(guān)的數(shù)據(jù)以及失效機(jī)翼主梁的壽命數(shù)據(jù)。如何分析并處理這些數(shù)據(jù),掌握它的分布情況,對確定主梁的疲勞壽命具有非常重要的意義。

航空工程上通常將材料的疲勞壽命認(rèn)為是對數(shù)正態(tài)分布或者是Weibull分布,那么針對機(jī)翼主梁壽命更接近實(shí)際情況呢?XXX在使用過程中積累的主梁斷裂數(shù)據(jù)有限,所以采用本文的小樣本場合的擬合檢驗(yàn)。文獻(xiàn)[9]給出了樣本容量為8的全樣本數(shù)據(jù)如下:

2865.28 ,2895.12,2895.2,2918.31,3077.52,3105.37,3127.12,3146.01

當(dāng) n=r=8時(shí),j0=7,Tj0(α)=Tj0(0.05)=1.5398而 Tj0常值。

4 總結(jié)

所謂異常數(shù)據(jù)通常是指一批數(shù)據(jù)中的個(gè)別者,其值明顯地偏離該批數(shù)據(jù)中的其余值。目前關(guān)于異常數(shù)據(jù)檢驗(yàn)的難點(diǎn)主要是兩個(gè),一是如何確定異常數(shù)據(jù)的個(gè)數(shù),二是構(gòu)造合適的檢驗(yàn)統(tǒng)計(jì)量。

本文針對樣本數(shù)據(jù)服從兩參數(shù)Weibull分布,定數(shù)截尾樣本中出現(xiàn)異常數(shù)據(jù)的檢驗(yàn)問題。從壽命X服從兩參數(shù)Weibull分布(形狀參數(shù)為m,刻度參數(shù)為η)的產(chǎn)品中任意取n個(gè)進(jìn)行壽命試驗(yàn),到有r個(gè)失效時(shí)試驗(yàn)停止(定數(shù)截尾壽命試驗(yàn)),失效時(shí)間依次為:X(1)≤X(2)≤…≤X(r),其相應(yīng)的次序觀察值為:x(1)≤x(2)≤…≤x(r)。參數(shù) σj)lnX(j)。由于各 X(1),X(2),…,X(n)對參數(shù) σ 的估計(jì)所起的作用是不一樣的,為此本文定義了各次序統(tǒng)計(jì)量的貢獻(xiàn)率。依據(jù)貢獻(xiàn)率的分析給出了異常數(shù)據(jù)的疑似個(gè)數(shù),在此基礎(chǔ)上,基于參數(shù)σ的最佳線性無偏估計(jì)(BLUE)構(gòu)造了異常數(shù)據(jù)的檢驗(yàn)統(tǒng)計(jì)量,為方便實(shí)際工作者的應(yīng)用,通過Monte Carlo模擬給出了檢驗(yàn)統(tǒng)計(jì)量分布的分位數(shù)。最后通過兩個(gè)應(yīng)用實(shí)例說明本文所給出的方法是切實(shí)可行的。

[2]費(fèi)鶴良,陸向薇,徐曉嶺.極值分布和威布爾分布異常數(shù)據(jù)的檢驗(yàn)方法[J].應(yīng)用數(shù)學(xué)學(xué)報(bào),1998,21(4).

[3]王蓉華,費(fèi)鶴良,徐曉嶺.異常數(shù)據(jù)檢驗(yàn)的均值比方法[J].數(shù)理統(tǒng)計(jì)與應(yīng)用概率,1998,13(1).

[4]徐曉嶺,王蓉華.Weiull分布異常數(shù)據(jù)檢驗(yàn)[J].數(shù)理統(tǒng)計(jì)與應(yīng)用概率,1996,11(2).

[5]王蓉華,徐曉嶺.全國第五屆可靠性學(xué)術(shù)會議論文集[M].北京:機(jī)械工業(yè)出版社,1995.

[6]朱宏.指數(shù)分布樣本多個(gè)異常數(shù)據(jù)的檢測[J].電子學(xué)報(bào),1994,22(12).

[7]田存志,張進(jìn),王學(xué)仁.指數(shù)分布中下異常值的逐步檢驗(yàn)的改進(jìn)[J].數(shù)理統(tǒng)計(jì)與應(yīng)用概率,1998,13(1).

[8]中國電子技術(shù)標(biāo)準(zhǔn)化研究所.可靠性試驗(yàn)用表(增訂本)[M].北京:國防工業(yè)出版社,1987.

[9]宣建光,馬康民.XXX機(jī)翼主梁的壽命分布研究[J].強(qiáng)度與環(huán)境,2000,(4).

猜你喜歡
次序貢獻(xiàn)率個(gè)數(shù)
Archimedean copula刻畫的尺度比例失效率模型的極小次序統(tǒng)計(jì)量的隨機(jī)序
漢語義位歷時(shí)衍生次序判定方法綜觀
怎樣數(shù)出小正方體的個(gè)數(shù)
一種通用的裝備體系貢獻(xiàn)率評估框架
等腰三角形個(gè)數(shù)探索
怎樣數(shù)出小木塊的個(gè)數(shù)
怎樣數(shù)出小正方體的個(gè)數(shù)
關(guān)于裝備體系貢獻(xiàn)率研究的幾點(diǎn)思考
生日謎題
В первой половине 2016 года вклад потребления в рост китайской экономики достиг 73,4 процента