肖麗麗 谷繼品 翟曉 張健鑫 郭曉嫻
摘? ?要:在實(shí)際工程應(yīng)用中,通過對設(shè)備的定期檢查維修,經(jīng)常會(huì)收集到包含區(qū)間刪失的失效時(shí)間數(shù)據(jù)。本文在總體分布為指數(shù)分布、等長區(qū)間刪失的情況下,對比分析了三種確定失效時(shí)間的方法。利用極大似然估計(jì),通過MATLAB編程實(shí)現(xiàn)算法,得到關(guān)于總體的分布參數(shù)的點(diǎn)估計(jì)值和區(qū)間估計(jì)值,在文中定義的衡量準(zhǔn)則下,給出了實(shí)際應(yīng)用中選取適合方法的依據(jù)。
關(guān)鍵詞:區(qū)間刪失? 指數(shù)分布? 參數(shù)估計(jì)? 區(qū)間估計(jì)
中圖分類號(hào):TB114.3? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? ? ? ? 文章編號(hào):1674-098X(2020)06(b)-0016-03
Abstract: In practical engineering application, through the regular inspection and maintenance of the equipment, the failure time data including interval deletion is often collected. In this paper, three methods to determine the failure time are compared and analyzed in the case of exponential distribution and equal length interval deletion. Using the maximum likelihood estimation and MATLAB programming to realize the algorithm, the point estimation and interval estimation of the overall distribution parameters are obtained. Under the measurement criteria defined in this paper, the basis for selecting the appropriate method in practical application is given.
Key Words: Interval-censored; Exponential distribution; Parameter estimation; Interval estimation
隨著科學(xué)技術(shù)的發(fā)展,產(chǎn)品可靠性得到越來越多的重視。人們對產(chǎn)品的可靠性要求也越來越高。對于高可靠性、長壽命的產(chǎn)品進(jìn)行可靠性試驗(yàn)時(shí),由于時(shí)間和經(jīng)費(fèi)的限制,未必總能實(shí)時(shí)觀測到失效或有自動(dòng)記錄失效的裝置,無法得到完全數(shù)據(jù),這樣到的數(shù)據(jù)稱為刪失數(shù)據(jù)。
如果用定時(shí)測試的方法來記錄失效個(gè)數(shù),只能知道產(chǎn)品在某一個(gè)區(qū)間內(nèi)是否失效,而無法得到具體的失效時(shí)間,即區(qū)間刪失數(shù)據(jù);在實(shí)際的工程應(yīng)用中,通過定期檢查維修比較容易收集區(qū)間刪失數(shù)據(jù)。
目前有大量關(guān)于區(qū)間刪失數(shù)據(jù)統(tǒng)計(jì)研究方面的文獻(xiàn)或綜述[1-3],在不同模型或不同假設(shè)下都有一些有意義的結(jié)果。
本文針對總體為指數(shù)分布的特殊情況,在等長間隔測試時(shí)出現(xiàn)區(qū)間刪失數(shù)據(jù)的情況下,分析比較了三種常用的確定失效時(shí)間的方法,通過Monte Carlo 模擬,利用極大似然估計(jì)(MLE)計(jì)算,給出在實(shí)際中應(yīng)用中適宜選取哪種方法的結(jié)論。
1? 模型假設(shè)
假設(shè)總體分布為指數(shù)分布,即分布函數(shù)為:
隨機(jī)抽取n個(gè)樣品進(jìn)行試驗(yàn),測試時(shí)間為,在第i個(gè)時(shí)間間隔中失效的個(gè)數(shù)為ri,,失效總數(shù)為。
2? 分析方法
目前常用的處理區(qū)間刪失數(shù)據(jù)的方法有秩回歸和MLE。作為一個(gè)經(jīng)驗(yàn)法則,小樣本并且多數(shù)都是完全數(shù)據(jù)的情況下,可用秩回歸,而MLE更適用于比較大比例的刪失、區(qū)間數(shù)據(jù)或者很多失效數(shù)據(jù)。
使用MLE時(shí),一個(gè)關(guān)鍵問題是如何確定失效時(shí)間,常用的方法有三種,分別介紹如下:
方法1:保守估計(jì),記在中失效產(chǎn)品的失效時(shí)間為 ,這樣區(qū)間刪失數(shù)據(jù)轉(zhuǎn)化為無替換定時(shí)截尾數(shù)據(jù),總試驗(yàn)時(shí)間為,利用文獻(xiàn)中關(guān)于無替換定時(shí)截尾數(shù)據(jù)參數(shù)估計(jì)的相應(yīng)結(jié)論[4],通過極大似然估計(jì)得到的估計(jì)值為
在置信水平1-α下,失效率的單側(cè)置信上限為:
在置信水平1-α下,失效率的雙側(cè)置信限為:
方法2:采用GB 2689.1-81[5]中規(guī)定的失效時(shí)間確定方法:在第i個(gè)時(shí)間間隔中第j個(gè)產(chǎn)品失效時(shí)間確定為:,同樣,將區(qū)間刪失數(shù)據(jù)轉(zhuǎn)化為無替換定時(shí)截尾數(shù)據(jù),則總試驗(yàn)時(shí)間為,用T2替代方法1中的T1,則得到的點(diǎn)估計(jì)值;在置信水平1-α下,失效率的單側(cè)置信上限;在置信水平1-α下,失效率的雙側(cè)置信限、。
方法3:采用文獻(xiàn)[4]中給出的定時(shí)間隔測試試驗(yàn)的參數(shù)估計(jì)方法,不指定各個(gè)失效產(chǎn)品的具體失效時(shí)間,直接寫出極大似然函數(shù):
在等間隔測試的特殊情況下,即,,將上面似然函數(shù)取對數(shù)后求導(dǎo),令其導(dǎo)數(shù)為0,可求得的估計(jì)值為:
在置信水平1-α下,失效率的單側(cè)置信上限為:
在置信水平1-α下,失效率的雙側(cè)置信限為:
其中,。
3? 對比分析
為了比較三種方法,首先需要定義衡量準(zhǔn)則。由于點(diǎn)估計(jì)是用一個(gè)統(tǒng)計(jì)量的樣本值去估計(jì)參數(shù)值,不同的樣本給出的點(diǎn)估計(jì)值是不同的,定義估計(jì)值與真實(shí)值之間的相對比值:,相對比值越小,估計(jì)值越接近真實(shí)值。
關(guān)于區(qū)間估計(jì),在給定的置信水平α下區(qū)間長度越短說明對參數(shù)的估計(jì)越準(zhǔn)確。單側(cè)置信區(qū)間估計(jì)只需要比較置信上限值的大小;雙側(cè)置信區(qū)間則比較區(qū)間長度:。
采用Monte Carlo 模擬方法,隨機(jī)生成50個(gè)服從參數(shù)為的指數(shù)分布的數(shù)據(jù),記為,將生成的完全數(shù)據(jù)處理成區(qū)間刪失數(shù)據(jù),在保證最后一個(gè)測試區(qū)間還有未失效產(chǎn)品的前提下(若從之前某個(gè)區(qū)間開始所有產(chǎn)品都已失效,則不需要繼續(xù)做試驗(yàn)),區(qū)間長度及區(qū)間個(gè)數(shù)可任意指定。本文采用的總測試區(qū)間為,區(qū)間個(gè)數(shù)為10。針對置信水平進(jìn)行1000次計(jì)算,每次都計(jì)算相應(yīng)的點(diǎn)估計(jì)值、單側(cè)置信上限、雙側(cè)置信限,再對1000次計(jì)算值取均值,然后求點(diǎn)估計(jì)的相對比值及雙側(cè)置信區(qū)間長度,通過MATLAB編程實(shí)現(xiàn)上面算法,計(jì)算結(jié)果如表1~3所示。
從上面3個(gè)表格可以看出:方法3的點(diǎn)估計(jì)值計(jì)算結(jié)果與真實(shí)值更接近;對于區(qū)間估計(jì),無論是單側(cè)置信上限,還是雙側(cè)置信區(qū)間長度,方法2都是最優(yōu)的;針對同一組數(shù)據(jù),方法2計(jì)算的點(diǎn)估計(jì)值都比方法3計(jì)算值偏小。
4? 結(jié)論
實(shí)際應(yīng)用中,如果關(guān)注的是未知參數(shù)的點(diǎn)估計(jì)值,推薦使用方法3,即不指定各個(gè)失效產(chǎn)品的具體失效時(shí)間,直接用MLE計(jì)算;如果關(guān)注的是區(qū)間估計(jì)值,則更推薦使用方法2,認(rèn)為產(chǎn)品的失效時(shí)間在測試間隔中平均分布。
參考文獻(xiàn)
[1] Debanjan Mitra,Ujjwal Das,Kalyan Das. Analysis of interval-censored competing risks data under missing causes[J]. Journal of Applied Statistics,2020,47(3):439-459.
[2] Jason Abrevaya,Chris Muris. Interval? censored regression with fixed effects[J]. Journal of Applied Econometrics, 2020, 35(2):198-216.
[3] Gao Fei,Chan Kwun Chuen Gary. Semiparametric regression analysis of length-biased interval-censored data[J]. Biometrics,2019,75(1):121-132.
[4] 趙宇. 可靠性數(shù)據(jù)分析 [M]. 北京:國防工業(yè)出版社,2011.
[5] GB 2689.1-81 恒定應(yīng)力壽命試驗(yàn)和加速壽命試驗(yàn)方法總則[S]. 北京:國家標(biāo)準(zhǔn)總局, 1981.
作者簡介:肖麗麗(1984—),女,漢族,黑龍江黑河人,博士,副研究員,研究方向:可靠性設(shè)計(jì)與分析。