摘 要:假設(shè)檢驗(yàn)中的方差分析法是目前檢驗(yàn)標(biāo)準(zhǔn)樣品均勻性所用到最廣泛的統(tǒng)計(jì)分析方法。在實(shí)際工作中發(fā)現(xiàn),部分研究者是用測(cè)試數(shù)據(jù)直接套用方差分析步驟進(jìn)行F值的計(jì)算,并未考慮方差分析的適用條件限制。為進(jìn)一步增強(qiáng)標(biāo)準(zhǔn)研制工作的嚴(yán)謹(jǐn)性和準(zhǔn)確性,本文主要從統(tǒng)計(jì)學(xué)角度簡(jiǎn)述方差分析模型構(gòu)造過(guò)程,從模型角度細(xì)致分析方差分析適用條件,并給出不滿足條件時(shí)的處理辦法,以供參考。
關(guān)鍵詞:標(biāo)準(zhǔn)樣品,均勻性檢驗(yàn),方差分析,適用條件
DOI編碼:10.3969/j.issn.1002-5944.2023.04.028
On the Applicable Conditions of the Standard Sample Homogeneity Test Method
YU Zhong-xiao
(Dezhou Fiber Inspection Institute)
Abstract: The analysis of variance in hypothesis testing is the most widely used statistical analysis method to test the homogeneity of standard sample. In actual work, it is found that some researchers directly apply the steps of ANOVA to calculate F value with test data, without considering the applicable conditions of ANOVA. In order to further enhance the preciseness and accuracy of the standard development work, this paper mainly describes the construction process of the ANOVA model from the perspective of statistics, carefully analyzes the applicable conditions of the ANOVA from the perspective of the model, and gives the treatment methods for reference when the conditions are not met.
Keywords: standard sample, uniformity test, analysis of variance, applicable conditions
標(biāo)準(zhǔn)物質(zhì)的均勻性是標(biāo)準(zhǔn)物質(zhì)的基本屬性,用于描述標(biāo)準(zhǔn)物質(zhì)特性的空間分布特征。測(cè)量取自不同包裝單元(如瓶、包等)或取自同一包裝單元不同位置的規(guī)定大小的樣品,測(cè)量結(jié)果落在規(guī)定不確定度范圍內(nèi),則可認(rèn)為該標(biāo)準(zhǔn)物質(zhì)對(duì)指定的特性量是均勻的。凡成批制備并分裝成最小包裝單元的標(biāo)準(zhǔn)物質(zhì),必須進(jìn)行均勻性檢驗(yàn)[1]。因此均勻性檢驗(yàn)的重要性可見(jiàn)一斑。
近年來(lái),研究者提出了許多均勻性檢驗(yàn)的數(shù)理統(tǒng)計(jì)方法,有方差分析法、平均值的一致性檢驗(yàn)和極差法等。其中,方差分析法對(duì)原始數(shù)據(jù)提供的信息利用較充分,是一種用于均勻性檢驗(yàn)的行之有效的方法[2],也是目前檢驗(yàn)標(biāo)準(zhǔn)樣品均勻性所用到最多的統(tǒng)計(jì)方法。但在進(jìn)行方差分析之前,我們需要驗(yàn)證一些假設(shè),如果任何一條假設(shè)不能得到滿足,那得出的檢驗(yàn)結(jié)果可能就是無(wú)效的。
然而,多數(shù)標(biāo)準(zhǔn)樣品制作規(guī)范或者科研論文僅僅論述了方差分析的實(shí)驗(yàn)步驟,并未闡述方差分析對(duì)樣本數(shù)據(jù)的假定,即方差分析的適用條件。這就導(dǎo)致大多數(shù)工作者在進(jìn)行標(biāo)準(zhǔn)樣品的均勻性檢驗(yàn)過(guò)程中,數(shù)據(jù)處理過(guò)后直接套用計(jì)算步驟進(jìn)行方差分析,而忽略了方差分析適用條件的驗(yàn)證,導(dǎo)致得到無(wú)效的統(tǒng)計(jì)結(jié)論。因此本文主要從統(tǒng)計(jì)學(xué)角度談一談均勻性檢驗(yàn)方法方差分析的模型構(gòu)建、適用條件以及不滿足適用條件時(shí)的處理辦法,以供大家參考。
1 數(shù)據(jù)結(jié)構(gòu)與模型
方差分析(Analysis of Variance,簡(jiǎn)稱ANOVA),又稱“變異數(shù)分析”,是R.A.Fisher發(fā)明的,通過(guò)判斷檢驗(yàn)方差相等的多個(gè)正態(tài)總體均值是否相等,進(jìn)而判斷一種或多種因素的變化對(duì)試驗(yàn)結(jié)果的觀測(cè)值是否有顯著影響。
如果試驗(yàn)只有一個(gè)因素在變化,其他因素都不變,這種情況稱為單因素方差分析。以單因素方差分析為例,給出其樣本數(shù)據(jù)結(jié)構(gòu)。假設(shè)試驗(yàn)只有一個(gè)因素A在變化,因素A有個(gè)水平,分別為A1,2 A…,r A,在水平A下進(jìn)行次獨(dú)立觀測(cè),得到試驗(yàn)數(shù)據(jù)結(jié)構(gòu)如表1所示。
其中表示在因素A的第個(gè)水平下的第次試驗(yàn)的實(shí)驗(yàn)結(jié)果。
2 適用條件與檢驗(yàn)方法
使用方差分析進(jìn)行標(biāo)準(zhǔn)樣品的均勻性檢驗(yàn),樣本數(shù)據(jù)須滿足以下三點(diǎn)假設(shè)。
(1)獨(dú)立性
方差分析模型要求各樣本數(shù)據(jù)之間相互獨(dú)立。從樣本數(shù)據(jù)的來(lái)源很容易就可以判定是否符合獨(dú)立性。一般而言,獨(dú)立觀測(cè)得到的試驗(yàn)結(jié)果,獨(dú)立性條件都能得到滿足。
(2)正態(tài)性
模型要求每個(gè)指標(biāo)的分組數(shù)據(jù)應(yīng)服從正態(tài)分布。其實(shí)不僅僅是方差分析,像很多其他常用的統(tǒng)計(jì)分析方法,如t檢驗(yàn)、相關(guān)分析以及線性回歸等,都要求數(shù)據(jù)服從正態(tài)分布或者近似正態(tài)分布。這是比較常見(jiàn)的一種假設(shè),同時(shí)也很容易被忽略。常用比較直觀的圖形判斷方法有直方圖、P-P圖、Q-Q圖等,常用的非參數(shù)檢驗(yàn)方法有Shapiro-Wilk檢驗(yàn)、Kolmogorov-Smirnov檢驗(yàn)等。
(3)方差齊性
模型要求每個(gè)指標(biāo)內(nèi)各分組數(shù)據(jù)間的方差是一致的。方差齊性是兩樣本t檢驗(yàn)和方差分析的前提假設(shè)。常用的檢驗(yàn)方法有方差比、Hartley檢驗(yàn)、Levene檢驗(yàn)、BF法、Bartlett檢驗(yàn),其中Levene檢驗(yàn)和Bartlett檢驗(yàn)是統(tǒng)計(jì)軟件中常見(jiàn)的檢驗(yàn)方法。
3 不滿足適用條件時(shí)的處理辦法
在實(shí)際分析過(guò)程中,如果樣本數(shù)據(jù)不滿足正態(tài)性或方差齊性假設(shè),首先要想到是不是有異常值的影響,故在檢驗(yàn)工作之前,對(duì)數(shù)據(jù)異常值的檢驗(yàn)和處理也是非常重要的。如果排除了異常值的影響,數(shù)據(jù)仍然不能滿足條件,我們還可以對(duì)數(shù)據(jù)進(jìn)行以下幾種處理。
(1)對(duì)數(shù)據(jù)進(jìn)行數(shù)學(xué)轉(zhuǎn)化,對(duì)轉(zhuǎn)化后滿足條件的數(shù)據(jù)進(jìn)行方差分析。常用的轉(zhuǎn)化方式有:取對(duì)數(shù)、取根號(hào)、取倒數(shù)等,對(duì)于呈現(xiàn)不同分布趨勢(shì)的數(shù)據(jù)采取不同的轉(zhuǎn)化方法,但是對(duì)于轉(zhuǎn)換后數(shù)據(jù)的結(jié)果解釋稍微復(fù)雜。
(2)使用非參數(shù)檢驗(yàn)方法,比如KruskalWallis 秩和檢驗(yàn)。如果轉(zhuǎn)化后的數(shù)據(jù)仍然無(wú)法滿足正態(tài)性或者方差齊的要求,可以放棄方差分析,使用Kruskal-Wallis 檢驗(yàn)等非參數(shù)檢驗(yàn)方法進(jìn)行標(biāo)準(zhǔn)物質(zhì)的均勻性檢驗(yàn)。使用非參方法的優(yōu)點(diǎn)在于此類方法對(duì)數(shù)據(jù)的總體分布沒(méi)有要求,缺點(diǎn)是會(huì)損失部分樣本信息,在準(zhǔn)確度上不如參數(shù)檢驗(yàn)。
(3)忽略數(shù)據(jù)的非正態(tài)性,直接進(jìn)行方差分析。有些學(xué)者認(rèn)為,在各組樣本量相等或者近似相等的情況下,方差分析對(duì)非正態(tài)分布的數(shù)據(jù)比較穩(wěn)健,此時(shí)仍然可以使用方差分析進(jìn)行均勻性檢驗(yàn),并且檢驗(yàn)結(jié)果會(huì)好于非參數(shù)檢驗(yàn)方法。此時(shí)需要注明數(shù)據(jù)對(duì)正態(tài)分布的偏離程度。
(4)對(duì)于不滿足方差齊性要求的數(shù)據(jù),還可以采用校正的方差分析方法,常用的是Welch方差分析。Welch檢驗(yàn)通過(guò)調(diào)整自由度來(lái)進(jìn)行近似的方差分析,對(duì)數(shù)據(jù)的方差齊性沒(méi)有要求,所以當(dāng)組間數(shù)據(jù)不滿足方差齊性的要求時(shí),采用Welch檢驗(yàn)比方差分析更穩(wěn)妥。
4 討論與總結(jié)
本文主要從模型構(gòu)建的角度來(lái)討論方差分析的適用條件和前提假設(shè),在使用方差分析方法進(jìn)行均勻性檢驗(yàn)之前,必須首先驗(yàn)證數(shù)據(jù)是否滿足其適用條件,即:獨(dú)立性、正態(tài)性和方差齊性。如果樣本數(shù)據(jù)不能滿足其適用條件,那么一方面首先考慮數(shù)據(jù)本身可能存在的問(wèn)題,比如異常值的影響,然后利用一些數(shù)學(xué)方法進(jìn)行數(shù)據(jù)的轉(zhuǎn)換,對(duì)轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行測(cè)試,看是否符合要求。另一方面,如果處理后的數(shù)據(jù)仍然不滿足要求,也可以使用Kruskal-Wallis 秩和檢驗(yàn)等非參數(shù)檢驗(yàn)方法來(lái)做均勻性測(cè)試。這樣得出的統(tǒng)計(jì)結(jié)論才更加嚴(yán)謹(jǐn),更有說(shuō)服力。
參考文獻(xiàn)
[1]闞瑩,張正東.標(biāo)準(zhǔn)物質(zhì)均勻性檢驗(yàn)統(tǒng)計(jì)量F的判斷[J].中國(guó)計(jì)量,2010(4):78-79.
[2]崔長(zhǎng)征,熊英,倪天陽(yáng),等.方差分析在標(biāo)準(zhǔn)物質(zhì)均勻性初檢中的應(yīng)用[J].中國(guó)計(jì)量,2016(5):3.
[3]薛毅.統(tǒng)計(jì)建模與R軟件[M].北京:清華大學(xué)出版社,2007.
作者簡(jiǎn)介
于忠蕭,碩士研究生,工程師,研究方向?yàn)槊藁?biāo)準(zhǔn)樣品研制。
(責(zé)任編輯:袁文靜)