唐兆田 / TANG Zhaotian(上海飛機(jī)設(shè)計研究院,上海201210)(Shanghai Aircraft Design and Research Institute, Shanghai 201210, China)
一種基于威布爾分布的金屬疲勞試驗(yàn)異常數(shù)據(jù)判別方法
唐兆田 / TANG Zhaotian
(上海飛機(jī)設(shè)計研究院,上海201210)
(Shanghai Aircraft Design and Research Institute, Shanghai 201210, China)
金屬疲勞試驗(yàn)的數(shù)據(jù)符合威布爾分布,是非對稱的統(tǒng)計分布,而現(xiàn)有的異常數(shù)據(jù)判別方法均基于對稱性分布(正態(tài)分布、t分布)。威布爾分布與對稱性分布(正態(tài)分布、t分布)主要差異體現(xiàn)在低壽命區(qū)和高壽命區(qū),這正是異常數(shù)據(jù)出現(xiàn)的區(qū)域?;谕紶柗植纪茖?dǎo)了一種異常數(shù)據(jù)判別方法,推導(dǎo)過程中進(jìn)行了合理地工程處理。經(jīng)比較,該方法相對于基于對稱性分布的判別方法更可靠。
金屬疲勞試驗(yàn);異常數(shù)據(jù);威布爾分布;統(tǒng)計方法
處理金屬材料疲勞試驗(yàn)數(shù)據(jù)時,有時需要確定可疑數(shù)據(jù)是否為異常數(shù)據(jù),通常采用的異常數(shù)據(jù)判別方法都是以對稱性分布為前提的判別方法[1](譬如Paǔta法、Chauvenet法、Grubbs法、Dixon法、羅馬諾夫斯基準(zhǔn)則法等),但是在金屬材料疲勞試驗(yàn)中,上述方法不是總有效[2],因其均以測量數(shù)據(jù)按對稱性概率分布(正態(tài)分布、t分布)為前提,而金屬疲勞試驗(yàn)的測量數(shù)據(jù)更符合非對稱的威布爾分布,低壽命區(qū)分散性相對較小、高壽命區(qū)分散性相對較大。就金屬疲勞壽命試驗(yàn)而言,正常情況下這兩類分布模型都可以用于測量數(shù)據(jù)的統(tǒng)計分析,但是這兩類分布模型主要差異體現(xiàn)在低壽命區(qū)和高壽命區(qū),下文以一組試驗(yàn)測量數(shù)據(jù)為例進(jìn)行說明。
茲有一組試驗(yàn)中獲得的金屬材料疲勞壽命數(shù)據(jù)(單位為載荷循環(huán)次數(shù)):
164 441,243 854,151 520,510 206,170 841,200 795,150 511,182 992,
206 555,210 975,120 273,227 187,748 838,187 755?,F(xiàn)分別采用威布爾分布、正態(tài)分布對其進(jìn)行統(tǒng)計分析,獲得概率密度曲線,橫坐標(biāo)為壽命、縱坐標(biāo)為概率密度。為了清晰說明這兩類分布模型主要差異體現(xiàn)在低壽命區(qū)和高壽命區(qū)的現(xiàn)象,本文分別對橫坐標(biāo)和縱坐標(biāo)取對數(shù)。如圖1(a)、圖1(b)所示,威布爾分布、正態(tài)分布在低壽命區(qū)和高壽命區(qū)可能有一個數(shù)量級以上的差異。
這兩個區(qū)域正是統(tǒng)計意義上異常數(shù)據(jù)的發(fā)生區(qū)域,因此如果采用以對稱性分布為基礎(chǔ)的異常數(shù)據(jù)判別方法,會出現(xiàn)判別不出低壽命區(qū)的異常數(shù)據(jù)、高壽命區(qū)又容易犯“棄真”的錯誤。有文獻(xiàn)認(rèn)為如果測量數(shù)據(jù)不符合正態(tài)分布,應(yīng)采用非參數(shù)檢驗(yàn)來判別異常數(shù)據(jù),但是一般認(rèn)為非參數(shù)檢驗(yàn)沒有參數(shù)檢驗(yàn)可靠,而且通常要求樣本量大于100甚至更多[3],然而通常金屬疲勞試驗(yàn)中都不會有這么大的樣本量。
到目前為止,幾乎沒有文獻(xiàn)針對金屬疲勞試驗(yàn)研究基于威布爾分布的異常數(shù)據(jù)判別方法。本文認(rèn)為主要原因是,如果從統(tǒng)計的角度對可疑數(shù)據(jù)進(jìn)行判別,需要精確地獲得總體分布的分布參數(shù),而通常情況下金屬疲勞試驗(yàn)測量的數(shù)據(jù)量是很有限的,依據(jù)有限的樣本量,現(xiàn)有的統(tǒng)計方法很難比較精確地計算出威布爾分布的分布參數(shù),從而無法較精確地計算出可疑數(shù)據(jù)的發(fā)生概率,即不能判別可疑數(shù)據(jù)是否為異常數(shù)據(jù)。
本文將根據(jù)對兩種常見的計算威布爾分布參數(shù)的方法的研究,給出一種基于威布爾分布的異常數(shù)據(jù)判別方法,更適用于金屬材料疲勞試驗(yàn)的異常數(shù)據(jù)判別。
威布爾分布的概率密度函數(shù)為:
累積概率密度函數(shù)為:
對于分布參數(shù)α(形狀參數(shù))的確定,通常有兩種方法;至于分布參數(shù)β(位置參數(shù))的確定,則依賴分布參數(shù)α:
1)頭兩序法[4],是一種非參數(shù)統(tǒng)計方法。
將一組試驗(yàn)測量數(shù)據(jù)按照從小到大的順序排列,即x1,n 2)最大似然法[5-6]。 公式如下: 顯然,這兩種方法中頭兩序法更簡單,便于快速計算,但是頭兩序法完全依賴于最小的兩個測量數(shù)據(jù),如果最小的測量數(shù)據(jù)為異常數(shù)據(jù),那么頭兩序法將失效。為了避免上述缺點(diǎn),根據(jù)對金屬疲勞壽命試驗(yàn)數(shù)據(jù)的一般認(rèn)識,本文以距離中位數(shù)最近的兩個測量數(shù)據(jù)(xi,n,xj,n,xi,n 2.1 篩選可疑數(shù)據(jù) 假設(shè)符合威布爾分布的一組測量數(shù)據(jù)中存在一個可疑數(shù)據(jù),分布參數(shù)α和分布參數(shù)β對可疑數(shù)據(jù)的敏感性如圖2所示,圖中可疑數(shù)據(jù)的對數(shù)變化率為可疑數(shù)據(jù)與分布參數(shù)β的比值取對數(shù)。顯然,分布參數(shù)α對測量數(shù)據(jù)的變化特別敏感,而分布參數(shù)β則對測量數(shù)據(jù)的變化不敏感,即使存在異常數(shù)據(jù)也不會引起β的顯著變化。 本文將根據(jù)上述特點(diǎn),研究基于威布爾分布的異常數(shù)據(jù)判別方法。 根據(jù)α1、αn、α(1,n)的相對關(guān)系,找到可疑數(shù)據(jù)。顯然,正常情況下α(1,n)與α1、αn存在顯著差異,如果α1或αn與α(1,n)相近(根據(jù)對大量試驗(yàn)數(shù)據(jù)的觀察,本文建議?。喝籀?1,n)<α1則0.6α1<α(1,n),若α1<α(1,n)則α(1,n)<1.6α1;若<α(1,n)<αn則0.6αn<α(1,n),若αn<α(1,n)則α(1,n)<1.6αn),則認(rèn)為α1或αn對應(yīng)的測量數(shù)據(jù)為可疑數(shù)據(jù)。 2.2 判別異常數(shù)據(jù) 再以本文提到的另一組試驗(yàn)數(shù)據(jù)為例:164 441,243 854,151 520,510 206,170 841,200 795,150 511,182 992,206 555,210 975,120 273,227 187,748 838,187 755。將測量數(shù)據(jù)按照從小到大的順序排列,可計算得:α1=0.57、αn=1.19、α(1,n)=1.76,α(1,n)<1.6,故αn對應(yīng)的748 838為可疑數(shù)據(jù)。對之可算得z=3.2118,繼而算得α=1.90>1,由此判定748 838不是異常數(shù)據(jù)。 所謂其它判別方法,是指用基于對稱性分布的判別方法來判別本文列舉的兩組數(shù)據(jù)中是否存在異常數(shù)據(jù)[1]。這兩組數(shù)據(jù)均來自試驗(yàn)測量數(shù)據(jù),已確認(rèn)第一組數(shù)據(jù)中的可疑數(shù)據(jù)500 000為異常數(shù)據(jù),第二組數(shù)據(jù)中的可疑數(shù)據(jù)748 838為非異常數(shù)據(jù)。 對此兩組數(shù)據(jù)用其它方法判定結(jié)果分別見表1和表2。 第一組:42 000、45 000、48 000、52 000、55 000、60 000、500 000。判別過程略,判別結(jié)論見表1。 表1 算例1 第二組:164 441,243 854,151 520,510 206,170 841,200 795,150 511,182 992,206 555,210 975,120 273,227 187,748 838,187 755。判別過程略,判別結(jié)論見表2。 表2 算例2 本文引用的兩組試驗(yàn)數(shù)據(jù)中,第一組數(shù)據(jù)(42 000、45 000、48 000、52 000、55 000、60 000、500 000)是來自波音公司的試驗(yàn)數(shù)據(jù)[4],文獻(xiàn)[4]已判定500 000為異常數(shù)據(jù);第二組數(shù)據(jù)(164 441,243 854,151 520,510 206,170 841,200 795,150 511,182 992,206 555,210 975,120 273,227 187,748 838,187 755)取自某試驗(yàn)結(jié)果,經(jīng)試驗(yàn)人員在試驗(yàn)過程中和試驗(yàn)后對試驗(yàn)件及試驗(yàn)過程記錄仔細(xì)檢查,確認(rèn)沒有出現(xiàn)制造及試驗(yàn)偏離,不存在異常數(shù)據(jù)。第2節(jié)、第3節(jié)判別結(jié)果的比較表明,本文方法對此兩組數(shù)據(jù)的判別結(jié)論與它們的原始判定結(jié)論完全一致;然而若用基于對稱分布的諸方法來判別,分別得到不同的結(jié)論,亦即具備不確定性,容易造成誤判??梢姲幢疚姆椒ǖ玫降呐卸ńY(jié)論更加可靠,更適合處理金屬疲勞試驗(yàn)的測量數(shù)據(jù)。 值得指出,本文提供的判別異常數(shù)據(jù)的方法是基于威布爾非對稱分布的非參數(shù)統(tǒng)計法,應(yīng)用了與“頭兩序法”相同的原理,但作了合理的工程處理,使之有效地避免了“頭兩序法”高壽命區(qū)容易失真和低壽命區(qū)容易誤判的弊病。 [1] 唐兆田.判別金屬材料疲勞試驗(yàn)中異常試驗(yàn)數(shù)據(jù)的一般方法[J].民用飛機(jī)設(shè)計與研究,2017,1:77-82. [2] 何平.剔除測量數(shù)據(jù)中異常值的若干方法[J].航空計測技術(shù),1995,18(1):19. [3] National Aeronautics and Space Administration.NASA-HDBK-8739.19-3.Measurement Uncertainty Analysis Principles and Methods [S].Washington DC:NASA,2010. [4] Whittaker Ian C.,Philip M. Besuner. A Reliability Analysis Approach to Fatigue Life Variability of Aircraft Structures [R].AFML-TR-69-65,Wright-Patterson AFB:Air Force Materials Lab.1972. [5] R.B.Abernethy,J.E.Breneman,C.H.Medlin,G.L.Reinman.Weibull Analysis Handbook[R].AFWAL-TR-83-2070,West Palm Beach,F(xiàn)lorida:Pratt & Whitney Aircraft Government Products Division United Yechnologles Corporation,1983. [6] Richard L.,Hoffert B.S.A Monte Carlo Study of Composite Sequential Likelihood Ratio Tests for the Weibull Scale Parameter [D].Wright-Patterson Air Force Base,Ohio:Engineering of the Air Force Instituts of Technology Air University,1976. [7] 鄭曉玲,等.民用飛機(jī)結(jié)構(gòu)耐久性與損傷容限設(shè)計手冊(疲勞與損傷容限)[M].第1版.北京:航空工業(yè)出版社,2003:335. An Outlier Detection Method of Metal Fatigue Tests Based on Weibull Distribution Data of metal fatigue test is described with Weibull distribution which is asymmetrical. But general methods for outlier detection in metal fatigue tests are based on symmetrically statistical distribution. The difference between Weibull distribution and symmetrically statistical distribution is often found in the areas of small life and high life where outlier appears. A method of outlier detection is derived based on Weibull distribution in this paper. And some reasonable measures are used in the derivation. By comparison, the method in this paper is more reliable than those based on asymmetrical distribution. metal fatigue test; outlier; weibull distribution; statistical method 10.19416/j.cnki.1674-9804.2017.02.017 V215.5 A 唐兆田 男,碩士,高工。主要研究方向:疲勞與損傷容限技術(shù);E-mail: tangzhaotian@comac.cc2 基于威布爾分布的判別方法的介紹
3 與其它判別方法的比較
4 結(jié)論