徐穎強(qiáng),陳仙亮,曹棟波
西北工業(yè)大學(xué) 機(jī)電學(xué)院,西安 710072
在評估機(jī)電產(chǎn)品疲勞壽命及可靠性過程中,根據(jù)抽樣理論,疲勞試驗(yàn)樣本量越大越能體現(xiàn)疲勞壽命的分布特征,疲勞壽命評估的準(zhǔn)確度越高[1-2]。然而在航空航天領(lǐng)域,許多高新且昂貴的機(jī)電系統(tǒng)疲勞壽命試驗(yàn)樣本量通常極少(m=1或2),僅用試驗(yàn)數(shù)據(jù)對疲勞壽命進(jìn)行評估結(jié)果可信度非常低。
當(dāng)樣本量大于10個時國內(nèi)外多采用Bayes和Bootstrap等方法進(jìn)行參數(shù)和分布評估[3-8]。而當(dāng)樣本量極少時(m=1或2)可以利用現(xiàn)場試驗(yàn)數(shù)據(jù)對先驗(yàn)信息數(shù)據(jù)進(jìn)行相容性檢驗(yàn)將樣本擴(kuò)充到小樣本(n≥10)后再進(jìn)行處理[9-10]。航空航天產(chǎn)品試驗(yàn)前往往能夠搜集到包括數(shù)字仿真、生物仿真、非全程試驗(yàn)結(jié)果、同系列產(chǎn)品試驗(yàn)結(jié)果等數(shù)據(jù),利用灰色關(guān)聯(lián)度理論等方法進(jìn)行多源信息融合后方可作為先驗(yàn)信息數(shù)據(jù)使用[11]。常見的相容性檢驗(yàn)方法如Wilcoxon秩和檢驗(yàn)和K-S(Kolmogorov-Smirnov)檢驗(yàn)多適用于現(xiàn)場試驗(yàn)數(shù)據(jù)為小樣本的情況[12-19]。當(dāng)現(xiàn)場試驗(yàn)數(shù)據(jù)為極小樣本時,若按照小樣本檢驗(yàn)過程將先驗(yàn)信息數(shù)據(jù)和現(xiàn)場試驗(yàn)數(shù)據(jù)混合在一起檢驗(yàn),由于先驗(yàn)數(shù)據(jù)大量信息容易湮沒現(xiàn)場試驗(yàn)信息,往往檢驗(yàn)結(jié)果是接受假設(shè),體現(xiàn)不了差異。因此使用傳統(tǒng)小樣本相容性檢驗(yàn)方法處理極小樣本問題并不妥當(dāng)。文獻(xiàn)[20-21]針對總體服從正態(tài)分布的情形分別提出一種適用于樣本量為2的變尺度相容性檢驗(yàn)方法;文獻(xiàn)[22]提出現(xiàn)場試驗(yàn)數(shù)據(jù)樣本量或先驗(yàn)信息數(shù)據(jù)樣本量為l的條件下非參數(shù)檢驗(yàn)方法,并對其原理和步驟進(jìn)行了闡述。
綜合上述文獻(xiàn)的研究內(nèi)容,小樣本相容性檢驗(yàn)方法并不適用于極小樣本情況,而極小樣本相容性檢驗(yàn)方法研究較少,且大多數(shù)文獻(xiàn)只是直接采用某種方法進(jìn)行檢驗(yàn),缺乏對方法合理性的詳細(xì)說明和對不同方法檢驗(yàn)功效優(yōu)劣的比較。航空航天產(chǎn)品疲勞壽命多服從正態(tài)分布,因此本文以正態(tài)分布作為研究對象,結(jié)合Monte Carlo方法,利用兩個現(xiàn)場試驗(yàn)數(shù)據(jù)樣本對先驗(yàn)信息數(shù)據(jù)逐個進(jìn)行檢驗(yàn),提出一種適用于現(xiàn)場試驗(yàn)數(shù)據(jù)樣本量為2的相容性檢驗(yàn)方法。并就Monte Carlo仿真次數(shù)對檢驗(yàn)功效的影響、先驗(yàn)信息數(shù)據(jù)樣本量對檢驗(yàn)功效的影響以及兩個現(xiàn)場試驗(yàn)數(shù)據(jù)分布對檢驗(yàn)功效的影響與兩種文獻(xiàn)方法進(jìn)行了詳細(xì)對比和研究分析。對于樣本服從威布爾分布等其他情況,也可以參考本文思路進(jìn)行研究,由于篇幅所限,在此不再展開。
文獻(xiàn)[20]是一種變尺度的檢驗(yàn)方法,以兩個現(xiàn)場試驗(yàn)數(shù)據(jù)樣本和一個先驗(yàn)信息數(shù)據(jù)為例進(jìn)行說明。將兩個現(xiàn)場試驗(yàn)樣本x1、x2和一個先驗(yàn)信息數(shù)據(jù)x3混合排序得到次序統(tǒng)計(jì)量x(1)、x(2)、x(3),構(gòu)造統(tǒng)計(jì)量
(1)
(2)
給定顯著度水平α,當(dāng)S>α?xí)r則以1-α的概率認(rèn)為現(xiàn)場試驗(yàn)數(shù)據(jù)和先驗(yàn)分布數(shù)據(jù)相容。
文獻(xiàn)[22]是一種非參數(shù)檢驗(yàn)方法,以兩個現(xiàn)場試驗(yàn)樣本和一個先驗(yàn)信息數(shù)據(jù)為例進(jìn)行說明。將兩個現(xiàn)場試驗(yàn)樣本x1、x2和一個先驗(yàn)信息數(shù)據(jù)x3混合排序得到次序統(tǒng)計(jì)量x(1)、x(2)、x(3),其中x3在次序統(tǒng)計(jì)量中的位置為j,則在3個數(shù)據(jù)相容的情況下x(j)的分布函數(shù)為
(3)
式中:F(x)為總體分布函數(shù),當(dāng)現(xiàn)場試驗(yàn)數(shù)據(jù)樣本量較少時可利用自助法進(jìn)行估計(jì)得到,具體方法和步驟見文獻(xiàn)[22]。給定顯著度水平α,計(jì)算滿足以下條件的邊界值L1、L2。
P{xj (4) P{xj>L2}=1-Fj(L2)=α/2 (5) 當(dāng)L1 假設(shè)某個總體服從正態(tài)分布N(μ,σ2),根據(jù)3σ原則可知樣本值分布在±σ范圍內(nèi)的概率為68.26%;分布在±2σ范圍內(nèi)的概率為95.44%;分布在±3σ范圍內(nèi)的概率為99.74%;圖1為3σ范圍示意圖。 圖1 3σ示意圖Fig.1 Schematic diagram of 3σ 從而可以得到以下推論: 圖的±σ1范圍在N(μ,σ2)中位置示意圖Fig.2 Schematic diagram of ±σ1 range of shown in N(μ,σ2) 圖的±2σ1范圍在N(μ,σ2)中位置示意圖Fig.3 Schematic diagram of ±2σ1 range of shown in N(μ,σ2) 圖的±3σ1范圍在N(μ,σ2)中位置示意圖Fig.4 Schematic diagram of ±3σ1 range of shown in N(μ,σ2) 在上述推論基礎(chǔ)上,提出一種具備“自主優(yōu)化”能力的相容性檢驗(yàn)策略,檢驗(yàn)流程圖如圖5所示: 步驟1初始化篩選次數(shù)i=1。 步驟3以(μi-σi,μi+σi)為范圍篩選剩余的先驗(yàn)信息數(shù)據(jù)(第一次篩選時剩余的先驗(yàn)信息數(shù)據(jù)即為所有先驗(yàn)信息數(shù)據(jù))。 步驟4判斷本次篩選出來的先驗(yàn)信息數(shù)據(jù)是否為空,如果不為空令i=i+1并返回步驟2;若為空則進(jìn)入步驟5。 步驟5以(μi-2σi,μi+2σi)為范圍篩選剩余的先驗(yàn)信息數(shù)據(jù)。 步驟6判斷本次篩選出來的先驗(yàn)信息數(shù)據(jù)是否為空,如果不為空令i=i+1并返回步驟2;若為空則進(jìn)入步驟7。 步驟7以(μi-3σi,μi+3σi)為范圍篩選剩余的先驗(yàn)信息數(shù)據(jù)。 步驟8判斷本次篩選出來的先驗(yàn)信息數(shù)據(jù)是否為空,如果不為空令i=i+1并返回步驟2;若為空則進(jìn)入步驟9。 步驟9顯示全部被篩選出的先驗(yàn)信息數(shù)據(jù),程序結(jié)束。 圖5 相容性檢驗(yàn)策略示意圖Fig.5 Schematic diagram of strategy for compatibility test 圖6 篩選函數(shù)自主優(yōu)化示意圖Fig.6 Schematic diagram of independent optimization of filter function 為驗(yàn)證本文提出的基于3σ原則的極小樣本相容性檢驗(yàn)方法(下文簡稱為3σ方法)的實(shí)際效果,將3σ方法與文獻(xiàn)[19]提出的變尺度檢驗(yàn)方法(下文簡稱為文獻(xiàn)方法1)和文獻(xiàn)[21]提出的非參數(shù)檢驗(yàn)方法(下文簡稱為文獻(xiàn)方法2)進(jìn)行對比研究。從正態(tài)分布N(μ,σ2)中隨機(jī)抽取兩個數(shù)據(jù)x1、x2作為現(xiàn)場試驗(yàn)數(shù)據(jù),再從中隨機(jī)抽取t1個數(shù)據(jù)作為先驗(yàn)信息數(shù)據(jù)中的“真值”,在正態(tài)分布N(μ,σ2)兩側(cè)3σ范圍以外一定區(qū)間內(nèi)隨機(jī)抽取t2個數(shù)據(jù)作為先驗(yàn)信息數(shù)據(jù)中的“假值”,將t1、t2混合后分別利用3σ方法和兩種文獻(xiàn)方法對t1+t2個先驗(yàn)信息數(shù)據(jù)進(jìn)行相容性檢驗(yàn)(設(shè)定兩種文獻(xiàn)方法的顯著度水平α=0.1)。定義變量“誤差率R”作為評價指標(biāo),其中R等于棄真概率和采偽概率之和。 以某飛行器壽命為例進(jìn)行說明,已知該飛行器壽命服從正態(tài)分布N(17 000,2 0002),從中隨機(jī)抽取兩個樣本x1、x2作為現(xiàn)場試驗(yàn)數(shù)據(jù),隨機(jī)抽取t1=20個樣本作為先驗(yàn)信息數(shù)據(jù)中“真值”,在N(17 000,2 0002)3σ范圍外兩個區(qū)間[9 000,11 000]和[23 000,25 000]按照均勻分布隨機(jī)抽取t2=4個樣本作為先驗(yàn)信息數(shù)據(jù)“假值”,因此先驗(yàn)信息數(shù)據(jù)總數(shù)n=t1+t2=24,其中假值所占比例為16.7%。利用Monte Carlo方法對x1、x2進(jìn)行Nr次重復(fù)抽樣,分別計(jì)算不同仿真次數(shù)下上述3種方法的誤差率R,結(jié)果如圖7所示。 當(dāng)仿真次數(shù)少于400次時3種方法的誤差率波動較大,而當(dāng)仿真次數(shù)超過400次后誤差率逐漸趨于穩(wěn)定,在上述設(shè)定的初始條件下3σ方法誤差率最終穩(wěn)定在14.02%,文獻(xiàn)方法1為20.40%,文獻(xiàn)方法2為41.76%。因此利用Monte Carlo方法仿真時仿真次數(shù)不應(yīng)低于400次。 圖7 仿真次數(shù)與誤差率關(guān)系示意圖Fig.7 Schematic diagram of relationship between simulation times and error rate 在3.1節(jié)基礎(chǔ)上,研究先驗(yàn)信息數(shù)據(jù)樣本量對誤差率的影響。為了保證精度,給定仿真次數(shù)為1 000次。先驗(yàn)信息數(shù)據(jù)樣本量n由10逐次遞增到100,保持其中“假值”所占比例16.7%不變,分別計(jì)算不同先驗(yàn)信息數(shù)據(jù)樣本量下3種檢驗(yàn)方法的誤差率R,結(jié)果如圖8所示。 如圖8所示,隨著先驗(yàn)信息數(shù)據(jù)樣本量的不斷增加,文獻(xiàn)方法1誤差率在25%上下浮動,基本保持穩(wěn)定;文獻(xiàn)方法2誤差率在40%上下浮動,也基本保持穩(wěn)定;而3σ方法呈現(xiàn)出誤差率隨先驗(yàn)信息數(shù)據(jù)樣本量增加而不斷下降的趨勢,原因在于3σ方法利用相對保守的策略分批次甄別“真值”的同時利用已經(jīng)確認(rèn)的“真值”不斷修正自身分布函數(shù),使其不斷向總體分布函數(shù)逼近。由此說明3σ方法具備良好的“自主優(yōu)化”的能力。 圖8 先驗(yàn)信息數(shù)據(jù)樣本量與誤差率關(guān)系示意圖Fig.8 Schematic diagram of relationship between prior information data sample size and error rate 由于現(xiàn)場試驗(yàn)數(shù)據(jù)樣本量只有兩個,因此樣本的分布對檢驗(yàn)效果有較大影響。為了方便描述,將正態(tài)分布區(qū)域以±σ、±2σ、±3σ為邊界劃分成6個區(qū)域,如圖9所示。 將兩個樣本中的任意一個抽樣范圍固定在1~6區(qū)間的某個區(qū)間內(nèi),另一個樣本抽樣范圍根據(jù)上述正態(tài)分布區(qū)間劃分依次取5、3、1、2、4、6,分別計(jì)算每兩個區(qū)間組合下3種檢驗(yàn)方法的平均誤差率,仿真次數(shù)定為1 000次。(x,y)代表第一個樣本抽樣區(qū)間為x區(qū)間,第二個樣本抽樣區(qū)間為y區(qū)間。仿真結(jié)果如圖10所示。 從仿真結(jié)果可以看出,由于正態(tài)分布中1區(qū)間和2區(qū)間左右對稱,因此x=1和x=2情況下誤差率R變化圖也呈現(xiàn)左右對稱的趨勢。同理3、4區(qū)間和5、6區(qū)間也是如此。當(dāng)兩個樣本抽樣范圍位于同一個區(qū)間,即x=y時,3種檢驗(yàn)方法的誤差率R都達(dá)到峰值。具體而言,對于3σ方法,當(dāng)x=y時誤差率R達(dá)到最大,且最大值兩側(cè)隨著兩個樣本抽樣區(qū)間距離的不斷增加,誤差率R快速下降并隨后呈現(xiàn)相對穩(wěn)定的趨勢;文獻(xiàn)方法一誤差率R峰值比3σ方法略低,且隨樣本抽樣區(qū)間變化波動更小,但是總體上高于3σ方法誤差率R;文獻(xiàn)方法3當(dāng)兩個樣本位于同一個區(qū)間時誤差率R高達(dá)80%,并且誤差率R隨樣本抽樣區(qū)間變化呈現(xiàn)出較大的波動性。 圖9 正態(tài)分布區(qū)域劃分示意圖Fig.9 Schematic diagram of division of normal distribution areas 圖10 現(xiàn)場試驗(yàn)數(shù)據(jù)分布與誤差率的關(guān)系圖Fig.10 Schematic diagram of relationship between experimental data distribution and error rate 1) 當(dāng)現(xiàn)場試驗(yàn)數(shù)據(jù)樣本量等于2時,僅根據(jù)試驗(yàn)結(jié)果很難作出有實(shí)際意義的壽命評估。在已知壽命服從正態(tài)分布情況下,利用本文提出的基于3σ原則的極小樣本相容性檢驗(yàn)方法可以有效地對先驗(yàn)信息數(shù)據(jù)進(jìn)行檢驗(yàn)篩選,對樣本進(jìn)行擴(kuò)充。若樣本服從威布爾等其他分布也可以參考本文思路進(jìn)行研究。 2) 基于3σ原則的極小樣本相容性檢驗(yàn)方法與兩種文獻(xiàn)方法相比誤差率R總體上更低,檢驗(yàn)性能良好。 3) 基于3σ原則的極小樣本相容性檢驗(yàn)方法檢驗(yàn)誤差率R隨著先驗(yàn)信息數(shù)據(jù)的增加而不斷下降,具備“自主優(yōu)化”的特性,因此使用該方法時應(yīng)該盡可能多地收集先驗(yàn)信息數(shù)據(jù),當(dāng)然前提是保證先驗(yàn)信息數(shù)據(jù)的準(zhǔn)確性。 4) 當(dāng)現(xiàn)場試驗(yàn)數(shù)據(jù)樣本量為2時,兩個樣本所在區(qū)間以及樣本之間的相對距離對檢驗(yàn)誤差率R都會產(chǎn)生一定的影響,因此可以考慮利用專家意見、先驗(yàn)信息等對試驗(yàn)樣本分布進(jìn)行合理估計(jì),并針對不同分布組合采用不同的檢驗(yàn)策略。 參 考 文 獻(xiàn) [1] 周兆麟. 數(shù)理統(tǒng)計(jì)學(xué)[M]. 北京: 中國統(tǒng)計(jì)出版社, 1987: 4. ZHOU Z L. Mathematical statistics[M]. Beijing: National Bureau of Statistics of China, 1987: 4 (in Chinese). [2] 施雨. 應(yīng)用數(shù)理統(tǒng)計(jì)[M]. 西安: 西安交通大學(xué)出版社, 2006: 4. SHI Y. Introduction of applied statistics[M]. Xi’an: Xi’an Jiaotong University Press, 2006: 4 (in Chinese). [3] KIJEWSKI T, KAREEM A. Bayes estimation of a langevin mean direction[J]. Communications in Statistics-Simulation and Computation, 2017, 46(4): 2769-2783. [4] FABRICE G, BERNARD D, EMMANUEL U. Reliability estimation by Bayesian methods: Definition of prior distribution from architecture of the system[J]. Reliability Engineering and System Safety, 2013, 82: 299-306. [5] SHONOSUKE S. On bootstrap averaging empirical Bayes estimators[J]. Statistics, 2017, 55(2): 331-357. [7] LI H Y, ZUO H F, SU Y, et al. Study on segmented distribution for reliability evaluation[J]. Chinese Journal of Aeronautics, 2017, 30(1): 310-329. [8] 羅強(qiáng), 駱飛. 基于Bootstrap法的小樣本巖土參數(shù)標(biāo)準(zhǔn)值計(jì)算[J]. 華中科技大學(xué)學(xué)報(bào), 2017, 45(8): 93-98. LUO Q, LUO F. Calculating formula for standard value of small-sample geotechnical parameters based on Boot-strap method[J]. Journal of Huazhong University of Science and Technology, 2017, 45(8): 93-98 (in Chinese). [9] 郭榮化, 李勇. 小樣本試驗(yàn)中驗(yàn)前數(shù)據(jù)與現(xiàn)場數(shù)據(jù)相容性檢驗(yàn)方法研究[C]∥第十三屆中國系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會議論文集. 北京: 中國自動化學(xué)會系統(tǒng)仿真專業(yè)委員會, 2011: 1115-1121. GUO R H, LI Y. Research on checkout methods for the compatibility test between the pre-test data and the local-test data in small sample test[C]∥Proceedings of 13th Chinese Conference on System Simulation Technology & Application (CCSSTA2011). Beijing: Chinese Association of Automation and System Simulation Committee, 2011: 1115-1121 (in Chinese). [10] 蔡洪, 張士峰, 張金槐. Bayes試驗(yàn)分析與評估[M]. 長沙: 國防科技大學(xué)出版社, 2004: 73-74. CAI H, ZHANG S F, ZHANG J H. Bayes test analysis and evaluation[M]. Changsha: NUDT Press, 2004: 73-74 (in Chinese). [11] 陳濤. 小樣本條件下風(fēng)電齒輪傳動系統(tǒng)動態(tài)可靠性預(yù)測方法[D]. 大連: 大連理工大學(xué), 2012: 40-56. CHEN T. Prediction methods of dynamic reliability for wind gear transmission under the conditions of small samples[D]. Dalian: Dalian University of Technology, 2012: 40-56 (in Chinese). [12] 劉冰月, 王景芹. 低壓成套開關(guān)設(shè)備的先驗(yàn)信息相容性檢驗(yàn)技術(shù)[J]. 東北電力大學(xué)報(bào), 2013, 33(1-2): 14-19. LIU B Y, WANG J Q. Compatibility check of the prior information on low voltage switchgear[J]. Journal of Northeast China Institute of Electric Power Engineering, 2013, 33(1-2): 14-19 (in Chinese). [13] 王江元. 驗(yàn)前試驗(yàn)數(shù)據(jù)與現(xiàn)場試驗(yàn)數(shù)據(jù)相容性檢驗(yàn)方法[J]. 戰(zhàn)術(shù)導(dǎo)彈技術(shù), 2004(2): 10-12. WANG J Y. Checkout methods for compatibility of pre-test data and locale test data[J]. Tactical Missile Technology, 2004(2): 10-12 (in Chinese). [14] KESELMAN H J, OTHMAN A R, WILCOX R R. The new and improved two-sample test[J]. Psychological Science, 2004, 15: 47-51. [15] 李鵬波, 張士峰, 蔡洪. 導(dǎo)彈仿真試驗(yàn)結(jié)果靜態(tài)一致性檢驗(yàn)及其置信度[J]. 現(xiàn)代防御技術(shù), 1999, 27(6): 31-36. LI P B, ZHANG S F, CAI H. Checkout methods for compatibility of pre-test data and locale test data[J]. Modern Defence Technology, 1999, 27(6): 31-36 (in Chinese). [16] 張金槐. 多源信息的 Bayes 融合精度鑒定方法[J]. 國防科技大學(xué)學(xué)報(bào), 2001, 23(3): 93-97. ZHANG J H. Bayes fusion precision identification method for multi-source information[J]. Journal of National University of Defense Technology, 2001, 23(3): 93-97 (in Chinese). [17] MOSER B K, STEVENS G R, WATTS C L. The two-sample test versus Satterwaite’s approximate F test[J]. Communications in Statistics Theory and Methods, 1989, 18(11): 3963-3975. [18] NEUHAUSER M. Two-sample tests when variances are unequal[J]. Animal Behaviour, 2002, 63(4): 823-825. [19] KASUYA E. Mann-Whitney U-test when variances are unequal[J]. Animal Behaviour, 2001, 61: 1247-1249. [20] 唐雪梅. 小樣本場合下相容性檢驗(yàn)方法[J]. 系統(tǒng)工程與電子技術(shù), 2001, 23(10): 66-68. TANG X M. Consistency test methods in small sample situation[J]. Systems Engineering and Electronics, 2001, 23(10): 66-68 (in Chinese). [21] 王暉, 潘高田, 臧興震. 正態(tài)分布的小樣本數(shù)據(jù)的相容性檢驗(yàn)理論和方法[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識, 2005, 35(10): 131-137. WANG H, PAN G T, ZANG X Z. Theories and methods of compatibility test on normal distribution with few samples[J]. Mathematics in Practice and Theory, 2005, 35(10): 131-137 (in Chinese). [22] 張湘平, 張金槐. 驗(yàn)前信息與現(xiàn)場字樣的相容性檢驗(yàn)方法研究[J]. 飛行器測控學(xué)報(bào), 2002, 21(1): 55-59 ZHANG X P, ZHANG J H. Study on consistency test methods of pretest information and field subsamples[J]. Journal of Spacecraft TT&C Technology, 2002, 21(1): 55-59 (in Chinese).2 基于3σ原則極小樣本相容性檢驗(yàn)方法
2.1 檢驗(yàn)原理
2.2 檢驗(yàn)步驟
3 基于3σ原則相容性檢驗(yàn)方法性能研究
3.1 Monte Carlo仿真次數(shù)對檢驗(yàn)效果的影響
3.2 先驗(yàn)信息數(shù)據(jù)樣本量對檢驗(yàn)效果的影響
3.3 現(xiàn)場試驗(yàn)數(shù)據(jù)分布對檢驗(yàn)效果的影響
4 結(jié) 論