祁 輝,廖逢釵,李淑婷,唐必成
(1.三明學(xué)院 信息工程學(xué)院, 福建 三明365004;2.?dāng)?shù)字福建工業(yè)能源大數(shù)據(jù)研究所, 福建 三明365004;3.工業(yè)大數(shù)據(jù)分析及應(yīng)用福建省高校重點(diǎn)實(shí)驗(yàn)室, 福建 三明365004;4.物聯(lián)網(wǎng)應(yīng)用福建省高校工程研究中心, 福建 三明365004)
Frechet 分布是一種重要的壽命分布。它是由Frechet[1]在1927年發(fā)布的一篇關(guān)于極大值的漸近分布的論文中提出。Frechet 分布在實(shí)際中有重要的應(yīng)用, 例如可以用來分析自然災(zāi)害造成地?fù)p失, 某種新型病毒的傳播速度等。對于產(chǎn)品的壽命T 服從兩參數(shù)的Frechet 分布, 其概率密度函數(shù)和分布函數(shù)表示如下:
其中α>0 稱為形狀參數(shù), β>0 稱為尺度參數(shù)。
關(guān)于Frechet 分布的性質(zhì)和應(yīng)用, 已有許多學(xué)者進(jìn)行了研究。其中Mann[2]研究了三參數(shù)模型下的Weibull 分布以及Frechet 分布的估計(jì)問題。Harlow[3]鑒于Frechet 分布在不同領(lǐng)域的應(yīng)用,提出該分布也是工程研究中是一種非常實(shí)用的分布。Nadarajah 和Kotz[4]在社會(huì)學(xué)研究模型中引入Frechet分布。Abbas 和Tang[5]研究了形狀參數(shù)已知的情況下, Frechet 分布中尺度參數(shù)的貝葉斯估計(jì)、極大似然估計(jì)和概率加權(quán)矩估計(jì)。駱正山等[6]討論了將Frechet 分布用于海底油氣管道腐蝕的評價(jià)與預(yù)測。曾林蕊等[7]討論了定數(shù)截尾樣本下Frechet 分布中參數(shù)的近似極大似然估計(jì)。何亮和徐曉嶺[8]將Frechet 分布應(yīng)用于加速壽命試驗(yàn), 并利用極大似然估計(jì)以及MPS 估計(jì)、 最小距離估計(jì)方法對參數(shù)進(jìn)行估計(jì)。
樣本數(shù)據(jù)的刪失常出現(xiàn)于壽命觀測和可靠性試驗(yàn)中, 由于樣本中的個(gè)體無法被觀測或者實(shí)驗(yàn)中途停止, 導(dǎo)致樣本數(shù)據(jù)刪失的情形。樣本數(shù)據(jù)刪失類型主要有以下3 種: Ⅰ型刪失, II 型刪失以及混合型刪失。I 型刪失的特點(diǎn)就是刪失時(shí)間是固定的, 即對所有個(gè)體的觀察停止在一個(gè)時(shí)間T, 這類刪失也稱為定時(shí)刪失。II 型刪失的特點(diǎn)事先有一個(gè)故障次數(shù)r, 若同時(shí)對n 個(gè)個(gè)體進(jìn)行觀察, 直到有r(r<n)個(gè)體死亡(故障)為止, 樣本數(shù)據(jù)被刪失。
基于混合刪失下樣本的壽命數(shù)據(jù)描述如下: 假定從總體中隨機(jī)抽取容量為n 的樣本進(jìn)行測試,當(dāng)實(shí)驗(yàn)失敗次數(shù)達(dá)到事先確定次數(shù)r(r<n)時(shí)或者實(shí)驗(yàn)時(shí)間達(dá)到事先確定的時(shí)間T 時(shí), 實(shí)驗(yàn)結(jié)束。因此, 在混合刪失情形下, 實(shí)驗(yàn)時(shí)間和實(shí)驗(yàn)失敗次數(shù)分別不會(huì)超過T 和r。令X1,X2, …,Xn為樣本中n 個(gè)個(gè)體的壽命, X1:n<X2:n<…<Xn:n為相應(yīng)的順序統(tǒng)計(jì)量, 實(shí)驗(yàn)觀察時(shí)間和實(shí)驗(yàn)失敗次數(shù)分別記為隨機(jī)變量C=min(Xr:n,T)和D, 則混合刪失下樣本為(X1:n,X2:n,…,XD:n,C,D)。特別是當(dāng)D=0 時(shí), 沒有失敗的信息會(huì)被觀察到, 但由于實(shí)驗(yàn)時(shí)間存在刪失變量, 因此個(gè)體壽命X(D+1):n,X(D+2):n,…,Xn:n一般不會(huì)被完全觀測到。
相比Ⅰ型和Ⅱ型刪失模型, 混合刪失模型在實(shí)際運(yùn)用中更靈活, 已成為眾多學(xué)者的研究對象。Chids 等[9]研究了基于混合刪失樣本下指數(shù)分布的似然估計(jì), Kundu[10]考慮了Weibull 分布在混合刪失樣本下的統(tǒng)計(jì)推斷, Kundu 和Pradhan[11]討論了混合刪失樣本下廣義指數(shù)分布的參數(shù)估計(jì), Dube等[12]研究了混合刪失樣本下對數(shù)正態(tài)分布的估計(jì)問題, Dey 和Pradhan[13]研究了混合刪失樣本下的廣義倒指數(shù)分布。鑒于Frechet 分布?jí)勖^測和自然災(zāi)害分析中的重要應(yīng)用, 為此, 研究了混合刪失樣本下的Frechet 分布的參數(shù)估計(jì)問題。
在混合刪失樣本下, 考慮Frechet 分布的極大似然估計(jì), 令c, d 分別表示隨機(jī)變量實(shí)驗(yàn)觀察時(shí)間C 和實(shí)驗(yàn)失敗次數(shù)D 的觀察值, 那么, 極大似然函數(shù)可以表示為:
由于分布函數(shù)中尺度參數(shù)做為分布類標(biāo)識(shí), 因此, 考慮尺度參數(shù)β 已知的情形下形狀參數(shù)α 的估計(jì), 不妨設(shè)β=2, 則極大似然函數(shù)可以表示為:
取對數(shù), 可得對數(shù)似然函數(shù):
兩邊同時(shí)對α 求導(dǎo), 可得:
對于似然方程:
由于上式似然方程的復(fù)雜性, 無法利用一般的求解方法得到結(jié)果。從可編程性考慮, 牛頓迭代法操作簡單, 每次迭代都是簡單的機(jī)械化運(yùn)算, 易于編寫算法程序。因此, 運(yùn)用牛頓迭代法對混合刪失下Frechet 分布的似然方程進(jìn)一步求解, 算法步驟如下:
取其中的線性部分用來作為非線性方程f(α)=0 的近似方程,則有:
設(shè)f'(α0)≠0,則其解為:
求出a1附近f(α)的泰勒展開式, 再取其線性部分作為f(α)=0 的近似方程。若f'(α1)≠0, 則得:
這樣, 得到牛頓(Newton-Rapfson)算法[14]的一個(gè)迭代的關(guān)系式:
當(dāng)達(dá)到迭代次數(shù)n 或者誤差不超過給定ε 時(shí), 迭代停止, 求出似然方程的近似解α^。
通過隨機(jī)模擬來驗(yàn)證所提出的估計(jì)方法的正確性。首先,從尺度參數(shù)β=2 的Frechet 總體中抽取容量為n=30 的簡單隨機(jī)樣本X1,X2,…,Xn,樣本的容量n 分別為30,50 以及80 不等??紤]到混合刪失的情形,假定刪失時(shí)間變量T 在每種抽樣容量下分別取大小不等3 個(gè)值,以此來逐步提高刪失率。刪失次數(shù)變量分別取不等3 個(gè)值為:0.8, 1.5, 3, 以此來區(qū)分刪失率。當(dāng)形狀參數(shù)真值α=0.8, 基于500 次的模擬結(jié)果見表1~3, 當(dāng)形狀參數(shù)真值, 基于500 次的模擬結(jié)果見表4~6。
表1 當(dāng)α=0.8、T=0.8 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
表1 當(dāng)α=0.8、T=0.8 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 0.9150410 0.8869617 0.9070617 0.8677661 0.8593394 0.8439460 0.8217997 0.8255935 0.8298795 rmse α 0.2384779 0.1946554 0.2211332 0.1602285 0.1417189 0.1321461 0.1024124 0.1042219 0.1029260
表2 當(dāng)α=0.8、T=1.5 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
表2 當(dāng)α=0.8、T=1.5 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 0.9056136 0.8885545 0.8932017 0.8396100 0.8465484 0.8450863 0.8331837 0.8323408 0.8328658 rmse α 0.2381911 0.2227183 0.2293879 0.1489262 0.1408064 0.1568668 0.1015955 0.1110191 0.1124685
表3 當(dāng)α=0.8、T=3 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
表3 當(dāng)α=0.8、T=3 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 0.8452288 0.8301479 0.8400956 0.8384349 0.8138544 0.8241999 0.8098737 0.8134814 0.8032727 rmse α 0.16797170 0.15646270 0.16193770 0.12630400 0.12010790 0.11516640 0.08853260 0.08640164 0.08404830
從表1~3 的中形狀參數(shù)估計(jì)量的統(tǒng)計(jì)指標(biāo):估計(jì)量的均值(mean),估計(jì)量的均方誤差(rmse)可以看出, 當(dāng)刪失次數(shù)變量r 固定時(shí), 隨著樣本容量n 增大, 在同等刪失率下, 估計(jì)結(jié)果越來越好; 當(dāng)刪失次數(shù)變量r 和樣本容量n 均固定時(shí), 隨著刪失時(shí)間變量T 的增大,刪失率提高, 估計(jì)量仍然表現(xiàn)良好。即使在n=30 的小樣本情形下依然成立。對比表1~3, 當(dāng)刪失次數(shù)變量r 逐漸增大, 刪失率降低, 在同等情形下, 估計(jì)量的估計(jì)結(jié)果表現(xiàn)得更好。
當(dāng)形狀參數(shù)α 真值增大到2 時(shí), 由隨機(jī)模擬的結(jié)果表4~6 可以看出, 上述情形仍然成立, 估計(jì)量的統(tǒng)計(jì)結(jié)果仍然表現(xiàn)良好。
表4 當(dāng)α=2、T=0.8 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
表4 當(dāng)α=2、T=0.8 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 1.783388 1.791919 1.789607 1.789686 1.798035 1.778554 1.833184 1.824481 1.832820 rmse α 0.2008732 0.2011010 0.2109656 0.1382963 0.1308918 0.1338026 0.1125829 0.1122783 0.1024405
表5 當(dāng)α=2、T=1.5 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
表5 當(dāng)α=2、T=1.5 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 2.226087 2.273969 2.224721 2.146189 2.137436 2.140004 2.096855 2.088440 2.081841 rmse α 0.5626685 0.5921566 0.5199464 0.3961160 0.3631685 0.3610385 0.2674839 0.2716929 0.2746031
表6 當(dāng)α=2、T=3 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
表6 當(dāng)α=2、T=3 時(shí)估計(jì)量的隨機(jī)模擬結(jié)果
n 30 50 80 r 10 15 25 20 30 40 40 50 60 mean α 2.161996 2.056156 2.029569 2.069200 2.041950 2.019589 2.024157 1.998279 1.982394 rmse α 0.4424088 0.3748913 0.3446413 0.2943757 0.2797575 0.2543793 0.2225639 0.1970202 0.1793307
對于混合刪失樣本下的Frechet 分布, 考慮尺度參數(shù)β 已知的情形下形狀參數(shù)α 的極大似然估計(jì), 隨機(jī)模擬結(jié)果顯示上述估計(jì)方法具有良好的性質(zhì)。此外, 如何在尺度參數(shù)β 和形狀參數(shù)α 均未知的情形下構(gòu)建新的算法求解似然方程組值得進(jìn)一步進(jìn)行研究。下一步,考慮構(gòu)造Frechet 分布的對數(shù)似然函數(shù)Fisher 信息矩陣, 利用迭代算法, 求解Frechet 分布尺度參數(shù)β 和形狀參數(shù)α 的估計(jì)。