国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

細(xì)胞毒性試驗(yàn)多孔平行數(shù)據(jù)異常值檢驗(yàn)方法的比較

2013-08-14 09:08:46夭建華朱洲海米其利曾婉俐黃海濤李雪梅
化學(xué)與生物工程 2013年9期
關(guān)鍵詞:維勒樣本量準(zhǔn)則

管 瑩,夭建華,朱洲海,米其利,曾婉俐,黃海濤,高 茜,李雪梅

(云南煙草科學(xué)研究院,云南 昆明650106)

生物實(shí)驗(yàn)中為了實(shí)現(xiàn)高通量的測定,常以多孔板作為實(shí)驗(yàn)的工具載體,其檢測體系可低至微升級樣品量,通量可擴(kuò)充至1536孔板。該檢測手段使得研究者可以在一次試驗(yàn)中獲得多個平行檢測數(shù)據(jù),但伴隨著通量的提高,檢測體系的體積相應(yīng)減小,較小的檢測體系的穩(wěn)定性也有所下降。細(xì)胞毒性試驗(yàn)作為一類重要的體外實(shí)驗(yàn),廣泛應(yīng)用于評定食品、藥品、化妝品對細(xì)胞的毒性作用[1-3]。該試驗(yàn)是將受試物加入到種植有受試細(xì)胞的96孔細(xì)胞培養(yǎng)板中,通過檢測受試物對細(xì)胞存活率的影響,來判定受試物的細(xì)胞毒性。由于在將受試細(xì)胞種植到96孔細(xì)胞培養(yǎng)板的過程中,很難保證接種到每孔中的細(xì)胞數(shù)量和狀態(tài)完全一致,可能會導(dǎo)致在同一批平行檢測的數(shù)據(jù)中有個別數(shù)據(jù)與其它數(shù)據(jù)明顯不一致,這種數(shù)據(jù)稱為異常值,也稱為異常數(shù)據(jù)或離群值[4]。實(shí)際運(yùn)用中,當(dāng)檢測數(shù)據(jù)中存在與其它檢測值差異較大的數(shù)據(jù)時,應(yīng)首先排除檢測過程中操作技術(shù)、儀器故障、數(shù)據(jù)計(jì)算、筆誤等產(chǎn)生的誤差[5]。未經(jīng)正式統(tǒng)計(jì)分析處理就將主觀上認(rèn)為異常的值任意舍棄的做法是不可取的,這樣做表面上得到了分散很小、精密度很高的結(jié)果,但實(shí)質(zhì)上可能降低了重復(fù)測量得到的平均值的準(zhǔn)確度,以相同條件再次檢測時,超過該誤差指標(biāo)范圍的“異常值”必然還會再次出現(xiàn)。

如何評估檢測數(shù)據(jù)的準(zhǔn)確性是統(tǒng)計(jì)學(xué)研究的重要課題,也是當(dāng)前檢測工作中普遍關(guān)心的問題。選取適當(dāng)?shù)漠惓V禉z驗(yàn)方法對數(shù)據(jù)進(jìn)行分析就尤為重要。鑒于此,作者對常用的5種異常值檢驗(yàn)方法的適用情況及對同一組細(xì)胞毒性試驗(yàn)數(shù)據(jù)異常值的檢出進(jìn)行了比較研究,以期為相關(guān)科研工作者選取適當(dāng)異常值檢驗(yàn)方法提供依據(jù)。

1 異常值的判別方法[6]

1.1 拉依達(dá)(Pauta)準(zhǔn)則

拉依達(dá)準(zhǔn)則又稱3σ準(zhǔn)則,該準(zhǔn)則檢驗(yàn)數(shù)據(jù)基于正態(tài)分布,根據(jù)正態(tài)分布理論|vd|≤3σ的概率為99.7%,因此在有限檢測中,某次檢測值的誤差大于3σ的幾率僅為0.3%,則認(rèn)為該檢測值為粗大誤差值的異常值,需剔除。

當(dāng)檢測次數(shù)n較大時,該準(zhǔn)則簡單易行,是比較實(shí)驗(yàn)中的常用方法。但當(dāng)n不太大時,檢測數(shù)據(jù)中即使存在誤差較大的異常值也很難被檢出,由于貝塞爾公式意味著≤3σ,異常值無法檢出。

由此表明,當(dāng)重復(fù)檢測值較少時,不宜使用拉依達(dá)準(zhǔn)則,特別是當(dāng)n≤10時,拉依達(dá)準(zhǔn)則完全無法檢出異常值。但樣本量較大時,用拉依達(dá)準(zhǔn)則對檢測數(shù)據(jù)的異常值進(jìn)行初篩最為簡便[7]。

1.2 肖維勒(Chauvenet)準(zhǔn)則

肖維勒準(zhǔn)則也是以數(shù)據(jù)呈正態(tài)分布為前提。假設(shè)多次重復(fù)測量所得的n個檢測值中,某個檢測值的殘余誤差|ΔXi|>Zcσ,則剔除此數(shù)據(jù)。其中Zc是樣本容量為n時的判別系數(shù),可以由Zc值表獲取。肖維勒準(zhǔn)則在一定程度上彌補(bǔ)了拉依達(dá)準(zhǔn)則的不足,可以用于n≤10時對異常值進(jìn)行判定。相對于拉依達(dá)準(zhǔn)則,肖維勒準(zhǔn)則更為嚴(yán)格。

1.3 格拉布斯(Grubbs)準(zhǔn)則

格拉布斯準(zhǔn)則與肖維勒準(zhǔn)則相似,但判定系數(shù)不同。格拉布斯準(zhǔn)則中假設(shè)多次重復(fù)測量所得的n個檢測值中,當(dāng)某個檢測值的殘余誤差|ΔXi|>T0σ,則剔除此數(shù)據(jù)。T0是樣本容量為n時的判別系數(shù),可以由T0(n,α)值表獲取,與肖維勒準(zhǔn)則中Zc值判定系數(shù)不同的是T0值與重復(fù)測量次數(shù)n和置信概率α均相關(guān),格拉布斯準(zhǔn)則概率意義更為明確。格拉布斯準(zhǔn)則也要求檢測數(shù)據(jù)呈正態(tài)分布。

1.4 狄克遜(Dxion)準(zhǔn)則

狄克遜準(zhǔn)則也是以數(shù)據(jù)呈正態(tài)分布為前提,通過極差比判定和剔除異常數(shù)據(jù)。假設(shè)有一組測量數(shù)據(jù),從小到大依次排列有X1≤X2≤…≤Xn,且為正態(tài)分布,則可能為異常值的檢測數(shù)據(jù)必然出現(xiàn)在兩端,即X1或Xn。與一般比較簡單極差的方法不同,狄克遜準(zhǔn)則為了提高判斷效率,對不同樣本量應(yīng)用不同的極差比公式進(jìn)行計(jì)算,見表1。

表1 不同樣本量對應(yīng)的極差比公式Tab.1 Formula of different sample sizes

在確定檢驗(yàn)水平α后查表得出臨界值D1-α(n),分別檢驗(yàn)高端值 Dn和低端值 D′n,當(dāng) Dn>D1-α(n)或D′n>D1-α(n)時判定 Xn或 X1為異常值,反之則無異常值檢出。

1.5 羅馬諾夫斯基(t檢驗(yàn))準(zhǔn)則

羅馬諾夫斯基準(zhǔn)則也是將最小檢測數(shù)據(jù)與最大檢測數(shù)據(jù)分別進(jìn)行檢驗(yàn),如|X1-|>K(n,α)σ′或|Xn-|>K(n,α)σ′則判定X1或Xn為異常值。式中X′和σ′分別為不包含X1或Xn的n-1個數(shù)據(jù)的均值和標(biāo)準(zhǔn)差;K(n,α)為臨界值,其中n為樣本容量、α為置信度,K(n,α)值可通過查表獲得。

這種檢驗(yàn)方法是將X1或Xn暫時刪去后進(jìn)行計(jì)算,這樣既保證σ′的正確性又保證了其獨(dú)立性。

2 各準(zhǔn)則檢驗(yàn)步驟及應(yīng)用實(shí)例

表2給出的測量數(shù)據(jù)為本實(shí)驗(yàn)室某次MTT細(xì)胞毒性試驗(yàn)細(xì)胞對照組的16個平行孔于490nm波長下檢測的吸光值。以下分別用拉依達(dá)準(zhǔn)則、肖維勒準(zhǔn)則、格拉布斯準(zhǔn)則、狄克遜準(zhǔn)則、羅馬諾夫斯基準(zhǔn)則對該組數(shù)據(jù)進(jìn)行檢驗(yàn),判斷是否存在異常值。

表2 細(xì)胞毒性試驗(yàn)同一劑量平行孔測量結(jié)果Tab.2 Detection results of cytotoxicity parallel

2.1 拉依達(dá)準(zhǔn)則檢驗(yàn)步驟及結(jié)果

(1)計(jì)算算術(shù)平均值:

(2)計(jì)算剩余誤差及3倍標(biāo)準(zhǔn)偏差σ:

(3)計(jì)算結(jié)果表明,16個檢測值中14#測量值剩余誤差最大,為0.7255,但仍小于3σ(0.8549),根據(jù)拉依達(dá)準(zhǔn)則該組數(shù)據(jù)中無異常值。

2.2 肖維勒準(zhǔn)則檢驗(yàn)步驟及結(jié)果

(1)計(jì)算算術(shù)平均值:

(2)計(jì)算剩余誤差及標(biāo)準(zhǔn)偏差σ:

(3)對應(yīng)Zc值表,當(dāng)樣本量n=16時對應(yīng)的Zc值為2.15,故Zcσ=2.15×0.2850=0.6127。

(4)計(jì)算結(jié)果表明,16個檢測值中14#、15#測量值剩余誤差分別為0.7255、0.6595,均大于Zcσ(0.6127),根據(jù)肖維勒準(zhǔn)則該組14#、15#測量數(shù)據(jù)1.688、0.303為可疑值,任意選擇剔除其中一個值后繼續(xù)檢測,本例中首先剔除1.688。

(5)根據(jù)上述步驟繼續(xù)對剩余15個數(shù)據(jù)進(jìn)行檢驗(yàn),檢出可疑值0.303、0.640、1.291,任意選擇剔除其中一個值后繼續(xù)檢測,本例中首先剔除0.303。

(6)根據(jù)上述步驟繼續(xù)對剩余14個數(shù)據(jù)進(jìn)行檢驗(yàn),檢出可疑值0.640、1.291,任意選擇剔除其中一個值后繼續(xù)檢測,本例中首先剔除1.291。

(7)根據(jù)上述步驟繼續(xù)對剩余13個數(shù)據(jù)進(jìn)行檢驗(yàn),檢出可疑值0.640,剔除后繼續(xù)檢測。

(8)根據(jù)上述步驟繼續(xù)對剩余12個數(shù)據(jù)進(jìn)行檢驗(yàn),無異常值檢出。

根據(jù)肖維勒準(zhǔn)則共剔除4個異常值,分別為0.303、0.640、1.291、1.688。

2.3 格拉布斯準(zhǔn)則檢驗(yàn)步驟及結(jié)果

(1)確定置信概率α為0.05。(2)計(jì)算算術(shù)平均值:

(3)計(jì)算剩余誤差及標(biāo)準(zhǔn)偏差σ:

(4)查表獲得T0(16,0.05)值并計(jì)算T0σ:對應(yīng)T0(n,α)值表,當(dāng)樣本量n=16、置信概率α為0.05時,對應(yīng)的 T0值為2.44,故 T0σ=2.44×0.2850=0.6953。

(5)計(jì)算結(jié)果表明,16個檢測值中14#測量值的剩余誤差為0.7255,大于T0σ(0.6953),根據(jù)格拉布斯準(zhǔn)則應(yīng)予以剔除。

(6)根據(jù)上述步驟繼續(xù)對剩余15個數(shù)據(jù)進(jìn)行檢驗(yàn),剔除0.303。

(7)根據(jù)上述步驟繼續(xù)對剩余14個數(shù)據(jù)進(jìn)行檢驗(yàn),剔除1.291。

(8)根據(jù)上述步驟繼續(xù)對剩余13個數(shù)據(jù)進(jìn)行檢驗(yàn),剔除0.640。

(9)根據(jù)上述步驟繼續(xù)對剩余12個數(shù)據(jù)進(jìn)行檢驗(yàn),無異常值檢出。

根據(jù)格拉布斯準(zhǔn)則共剔除4個異常值,分別為0.303、0.640、1.291、1.688。

2.4 狄克遜準(zhǔn)則檢驗(yàn)步驟及結(jié)果

(1)確定置信概率α為0.05。

(2)將 16 個數(shù)據(jù)從小到大依次排序:0.303、0.640、0.854……1.080、1.291、1.688。

(3)根據(jù)樣本量選擇極差比公式:該組數(shù)據(jù)樣本量為16,屬于14≤n≤30范圍內(nèi),故選擇公式分別對高端和低端異常值進(jìn)行檢驗(yàn)。

(4)計(jì)算Dn和D′n值,并確定較大值。

根據(jù)計(jì)算結(jié)果Dn>D′n。

(5)查表獲得D0.95值為0.547。

(6)根據(jù)狄克遜準(zhǔn)則剔除異常值:由于Dn>D0.95(16)故該組數(shù)據(jù)中最大值1.688應(yīng)予剔除。

(7)根據(jù)上述步驟繼續(xù)對剩余15個數(shù)據(jù)進(jìn)行檢驗(yàn),剔除0.303。

(8)根據(jù)上述步驟繼續(xù)對剩余14個數(shù)據(jù)進(jìn)行檢驗(yàn),剔除1.291。

(9)根據(jù)上述步驟繼續(xù)對剩余13個數(shù)據(jù)進(jìn)行檢驗(yàn),剔除0.640。

(10)根據(jù)上述步驟繼續(xù)對剩余12個數(shù)據(jù)進(jìn)行檢驗(yàn),無異常值檢出。

根據(jù)狄克遜準(zhǔn)則共剔除4個異常值,分別為0.303、0.640、1.291、1.688。

2.5 羅馬諾夫斯基準(zhǔn)則檢驗(yàn)步驟及結(jié)果

(1)確定置信概率α為0.05。

(2)將 16 個數(shù)據(jù)從小到 大依次排序:0.303、0.640、0.854……1.080、1.291、1.688。

(3)暫時去除X1后計(jì)算、σ′分別為1.0065、0.2321;|X1-|=|0.303-1.0065|=0.7035。

(4)經(jīng)查表,當(dāng)樣本容量為16時,K 值為2.22,計(jì)算得到K(n,α)σ′值為0.5153。

(5)根據(jù)判定準(zhǔn)則剔除異常值:由于|X1-|(0.7035)大于 K(n,α)σ′(0.5153),故判定0.303為異常值,予以剔除。

(6)根據(jù)上述步驟繼續(xù)對剩余15個數(shù)據(jù)進(jìn)行檢驗(yàn),剔除1.688。

(7)根據(jù)上述步驟繼續(xù)對剩余14個數(shù)據(jù)進(jìn)行檢驗(yàn),剔除1.291。

(8)根據(jù)上述步驟繼續(xù)對剩余13個數(shù)據(jù)進(jìn)行檢驗(yàn),剔除0.640。

(9)根據(jù)上述步驟繼續(xù)對剩余12個數(shù)據(jù)進(jìn)行檢驗(yàn),剔除1.080。

(10)根據(jù)上述步驟繼續(xù)對剩余11個數(shù)據(jù)進(jìn)行檢驗(yàn),無異常值檢出。

根據(jù)羅馬諾夫斯基準(zhǔn)則共剔除5個異常值,分別為0.303、0.640、1.080、1.291、1.688。

2.6 討論

以上判定準(zhǔn)則都是以數(shù)據(jù)呈正態(tài)分布為前提,當(dāng)數(shù)據(jù)偏離正態(tài)分布時檢驗(yàn)結(jié)果不一定可靠。

從樣本量的適用情況來看,拉依達(dá)準(zhǔn)則不需查表,計(jì)算最為簡便,但結(jié)果可靠性不高,尤其是在樣本量較小時,因此拉依達(dá)準(zhǔn)則通常用于樣本量較大且對檢驗(yàn)結(jié)果要求不太高時對大量檢測數(shù)據(jù)進(jìn)行初篩;樣本量較小時選擇狄克遜準(zhǔn)則、羅馬諾夫斯基準(zhǔn)則對離群值的判定功效較優(yōu),肖維勒準(zhǔn)則、格拉布斯準(zhǔn)則檢驗(yàn)樣本量適中,但這一區(qū)分并不十分嚴(yán)格。細(xì)胞毒性試驗(yàn)多孔平行數(shù)據(jù)通常屬于較小樣本量,在實(shí)際運(yùn)用中選擇拉依達(dá)準(zhǔn)則對其進(jìn)行檢驗(yàn)是不合適的。

從計(jì)算方式來看,肖維勒準(zhǔn)則、格拉布斯準(zhǔn)則、羅馬諾夫斯基準(zhǔn)則都需要計(jì)算標(biāo)準(zhǔn)偏差σ,并通過查表獲得一個系數(shù)以此來計(jì)算相應(yīng)臨界值Xσ。對這三種準(zhǔn)則分別對應(yīng)的Zc值、T0值、K值表進(jìn)行比較,羅馬諾夫斯基準(zhǔn)則最為嚴(yán)格,其次是肖維勒準(zhǔn)則,格拉布斯準(zhǔn)則相對較為寬泛[8]。除此之外,肖維勒準(zhǔn)則所對應(yīng)的Zc值大小只與樣本量n相關(guān),置信概率α對Zc值無影響,相較格拉布斯準(zhǔn)則、羅馬諾夫斯基準(zhǔn)則以及狄克遜準(zhǔn)則,肖維勒準(zhǔn)則概率意義較為模糊。

從檢出離群值的個數(shù)來看,以上5種判定準(zhǔn)則均可以通過重復(fù)使用對可疑值進(jìn)行逐一檢出,但重復(fù)使用同一檢驗(yàn)法可能犯判多為少的錯誤,重復(fù)檢驗(yàn)時狄克遜準(zhǔn)則較好,但計(jì)算相對復(fù)雜[4]。

3 結(jié)論

細(xì)胞毒性試驗(yàn)多孔平行數(shù)據(jù)屬于小樣本量數(shù)據(jù),待檢出的異常值不僅限于1個。根據(jù)細(xì)胞毒性試驗(yàn)多孔平行數(shù)據(jù)的特點(diǎn)綜合考慮這5種準(zhǔn)則的適用范圍、計(jì)算方式、嚴(yán)格程度,選用狄克遜準(zhǔn)則較為適宜,該準(zhǔn)則概率意義明確,適用于對樣本量較小的數(shù)據(jù)進(jìn)行檢驗(yàn),且在需要對1個以上異常值進(jìn)行檢出時效果較好。值得注意的是,雖然可以通過重復(fù)利用狄克遜準(zhǔn)則對數(shù)據(jù)中的多個異常值進(jìn)行逐個檢出,但在一組檢出數(shù)據(jù)中,可疑數(shù)據(jù)應(yīng)很少,若一組數(shù)據(jù)中的可疑數(shù)據(jù)較多,則提示數(shù)據(jù)測量體系可能異常,可考慮重新測量。

[1]林祥梅,王建峰,梅琳,等.用人角質(zhì)細(xì)胞評價(jià)4種化妝品的細(xì)胞毒性[J].毒理學(xué)雜志,2008,22(1):75-76.

[2]夭建華,陳輝敏,方力,等.國內(nèi)外卷煙危害性評價(jià)方法現(xiàn)狀和發(fā)展趨勢[J].煙草科技,2007,(1):50-53.

[3]蘇建青,褚秀玲,李俊霞,等.中性紅染色法檢測人參皂苷及其衍生物對CEF增殖的影響[J].安徽農(nóng)業(yè)科學(xué),2009,37(35):17523-17525.

[4]GB/T 4883-2008,數(shù)據(jù)統(tǒng)計(jì)處理和解釋 正態(tài)樣本離群值的判斷與處理[S].

[5]馬林茂.?dāng)?shù)據(jù)處理中異常值的取舍[J].疾病監(jiān)測,2010,(12):992-993.

[6]樂立利.觀測數(shù)據(jù)的異常值統(tǒng)計(jì)檢驗(yàn)方法研究[D].長沙:中南大學(xué),2008.

[7]熊萬杰,黃振中.用Origin軟件處理物理實(shí)驗(yàn)數(shù)據(jù)[J].大學(xué)物理實(shí)驗(yàn),2004,17(2):65-67.

[8]何平.剔除測量數(shù)據(jù)中異常值的若干方法[J].航空計(jì)測技術(shù),1995,(15):19-22.

猜你喜歡
維勒樣本量準(zhǔn)則
醫(yī)學(xué)研究中樣本量的選擇
具非線性中立項(xiàng)的二階延遲微分方程的Philos型準(zhǔn)則
材料星故事(一)
航空裝備測試性試驗(yàn)樣本量確定方法
Sample Size Calculations for Comparing Groups with Binary Outcomes
基于Canny振蕩抑制準(zhǔn)則的改進(jìn)匹配濾波器
格里格·維勒與他的全球互聯(lián)夢想
太空探索(2015年7期)2015-07-12 12:21:47
一圖讀懂《中國共產(chǎn)黨廉潔自律準(zhǔn)則》
混凝土強(qiáng)度準(zhǔn)則(破壞準(zhǔn)則)在水利工程中的應(yīng)用
維勒:人工合成尿素的先驅(qū)
闻喜县| 岢岚县| 夏邑县| 成武县| 白城市| 宝鸡市| 眉山市| 鞍山市| 英德市| 汉中市| 调兵山市| 中江县| 贵南县| 乡宁县| 烟台市| 新蔡县| 定西市| 涿鹿县| 孟连| 神农架林区| 新龙县| 方城县| 盐城市| 青铜峡市| 南木林县| 奉节县| 凌海市| 敦煌市| 屯昌县| 长乐市| 图木舒克市| 昌邑市| 称多县| 清水河县| 梁平县| 乃东县| 读书| 嘉荫县| 阿拉善左旗| 砀山县| 栾城县|