孫慶利
(濟(jì)南大學(xué)工程訓(xùn)練中心,山東濟(jì)南250022)
簡介水泥實(shí)驗(yàn)室常用樣本分布特征值的Excel計算
孫慶利
(濟(jì)南大學(xué)工程訓(xùn)練中心,山東濟(jì)南250022)
以水泥實(shí)驗(yàn)室常用樣本分布特征值為例,運(yùn)用Excel進(jìn)行數(shù)據(jù)分析的輔助計算,顯示了Excel運(yùn)算迅速、準(zhǔn)確的優(yōu)點(diǎn)。
樣本分布特征值Excel函數(shù)計算
研究或統(tǒng)計分析的對象的全體元素組成的集合稱為總體或母體。在統(tǒng)計工作中,可以根據(jù)產(chǎn)品的質(zhì)量管理規(guī)程或?qū)嶋H工作需要,選定總體的范圍,如每個月的出廠水泥,某一批進(jìn)廠煤或原材料,都可視為一個總體。要了解總體的性質(zhì),理論上必須對全部個體的性質(zhì)進(jìn)行測定,這在實(shí)際中往往是不可能的。在實(shí)際工作中只能從總體中抽取一定數(shù)量的、有代表性的個體組成樣本,通過對樣本的測量,并借助數(shù)理統(tǒng)計手段,對總體的分布中心和標(biāo)準(zhǔn)偏差進(jìn)行推斷,從而掌握總體的性質(zhì)。
來自總體的部分個體的集合,稱為樣本或子樣。樣本中所含樣品的個數(shù)稱為樣本容量或樣本大小。若樣本容量適當(dāng)大,并且抽樣的代表性強(qiáng),則通過檢測得到的分布特征值,就能很好地代表總體的分布特征值。在實(shí)際運(yùn)用中,為了對總體情況有一個概括了解,需要用幾個數(shù)字表達(dá)出總體情況。這少數(shù)幾個數(shù)字在數(shù)理統(tǒng)計中稱為特征值。因此,在進(jìn)行統(tǒng)計推斷前確定樣本分布的特征值,具有重要的實(shí)用價值。
常用的樣本分布特征值分為兩類:一是位置特征值;二是離散特征值。
位置特征值一般是指平均值,它是分析計量數(shù)據(jù)的基本指標(biāo)。它們表達(dá)了數(shù)據(jù)的集中位置。反映了數(shù)據(jù)共同趨向的平均水平。位置特征值一般包括算術(shù)平均值、幾何平均值、加權(quán)平均值、中位數(shù)、眾數(shù)等。
離散特征值用來表示一組測量數(shù)據(jù)波動程度或離散性質(zhì),是表示一組測定值中各測定值相對于某一確定的數(shù)而言的偏差程度。一般是把各測定值相對于平均值的差異作為出發(fā)點(diǎn)進(jìn)行分析。常用的離散特征值有平均差、極差、方差、標(biāo)準(zhǔn)偏差、變異系數(shù)等。
下面就對使用Excel工具對水泥實(shí)驗(yàn)室常用樣本分布特征值的計算進(jìn)行簡要介紹。
將一組測定值相加和,除以該組樣本的容量(測定所得到的測定數(shù)據(jù)的個數(shù)),所得的商即為算術(shù)平均值。設(shè)有一組測定數(shù)據(jù),以x1,x2,…,xn表示。這組數(shù)據(jù)共由n個數(shù)據(jù)組成,其算術(shù)平均值見式(1):
式中:x1,x2,…,xn——各測量值;
n——樣本的容量。
例1:對水泥中三氧化硫含量(%)的測定,得到10個數(shù)據(jù):2.8、2.9、2.6、2.7、2.8、2.8、2.9、2.8、2.8、2.6。
Excel計算如下:輸入各測定值;選中“B4”單元格;選擇常用函數(shù)“=AVERAGE(B3:K3)”;然后點(diǎn)擊“確定”即可得到其算術(shù)平均值為2.77,見圖1。
圖1 算術(shù)平均值的計算
加權(quán)平均值是考慮了每個測量值的相應(yīng)權(quán)的算術(shù)平均值。將各測量值乘以與其相應(yīng)的權(quán),將各乘積相加后,除以權(quán)數(shù)之和,即為加權(quán)平均值。其計算公式如下。
式中:x1,x2,…xn——各測量值;
w1,w2,…wn——各測量值相應(yīng)的權(quán);
Σwi——各相應(yīng)權(quán)的總和;
Σwixi——各測量值與相應(yīng)權(quán)乘積之和。
例2:某水泥企業(yè)有三臺回轉(zhuǎn)窯。1號窯年產(chǎn)20萬噸熟料,平均抗壓強(qiáng)度為58.5MPa;2號窯年產(chǎn)15萬噸熟料,平均抗壓強(qiáng)度為57.8MPa;3號窯年產(chǎn)12萬噸熟料,平均抗壓強(qiáng)度為59.2MPa。求全廠全年生產(chǎn)的熟料的綜合抗壓強(qiáng)度。
Excel計算如下:輸入各測定值和權(quán);選中“B5”單元格;輸入公式“=B3*B4”點(diǎn)擊“確定”再用鼠標(biāo)左鍵點(diǎn)擊“B5”單元格,B5就被黑框框住,而且在黑框的右下角有個小黑方塊,將鼠標(biāo)移動到這個小黑方塊(填充句柄)上,鼠標(biāo)變成“+”的形狀,此時按下鼠標(biāo)向右拖至D5,再釋放鼠標(biāo),其它的分子值就計算出來了。這里將這種方法稱為填充句柄法。
選中“E5”單元格,選擇常用函數(shù)“SUM(B5: D5)”;然后點(diǎn)擊“確定”即可得到整個分子之和;
選中“E4”單元格,選擇常用函數(shù)“SUM(B4: D4)”;然后點(diǎn)擊“確定”即可得到整個權(quán)之和;
選中“B6”單元格,輸入公式“=E5/E4”,然后點(diǎn)擊“確定”即可得到加權(quán)平均值。見圖2。
圖2 加權(quán)平均值的計算
中位數(shù)也是表示頻率分布集中位置的一種特征值。其意義是將一批測量數(shù)據(jù)按大小順序排列,居于中間位置的測量值,稱為這批測量值的中位數(shù)。當(dāng)測量值的個數(shù)n為奇數(shù)時,第(n+1)/2項為中位數(shù);當(dāng)測量值的個數(shù)n為偶數(shù)時,位居中央的兩項之平均數(shù)即為中位數(shù)。
例3:對出磨水泥每2小時測定一次三氧化硫含量,某日共得12個測量值:2.86、2.91、2.65、2.70、2.82、2.73、2.88、2.92、2.75、2.84、2.77、2.85。求這組測量值的中位數(shù)。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入統(tǒng)計函數(shù)“=MEDIAN(B3:M 3)”,然后點(diǎn)擊“確定”即可得到中位數(shù)。見圖3。
圖3 中位數(shù)的計算
眾數(shù)是指在一組測量數(shù)據(jù)中出現(xiàn)次數(shù)最多的測量值。
例4:某水泥企業(yè)控制出磨水泥的細(xì)度(篩余)范圍為7.0%±1.0%。每小時測定一次,某日早班的測量數(shù)據(jù)(%)如下:7.4、7.1、7.8、7.4、7.5、7.4、7.6、7.5。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入統(tǒng)計函數(shù)“=MODE(B3:I3)”,然后點(diǎn)擊“確定”即可得到眾數(shù)為7.4,見圖4。
圖4 眾數(shù)的計算
均方根平均值是各測量值平方之和除以測量值個數(shù)所得商值的平方根。計算式如下:
式中:x1,x2,…,xn——各測量值;
n——測量值的個數(shù);
Σxi2——各測量值的平方之和。
例5:某班對出磨水泥細(xì)度的測量值(篩余%)為:7.2、7.3、7.4、8.8、7.9、7.6、7.4、7.5。求該班出磨水泥的平均細(xì)度。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入公式“=POWER(B3,2)”點(diǎn)擊“確定”再用鼠標(biāo)左鍵點(diǎn)擊“B4”單元格,B4就被黑框框住,運(yùn)用填充句柄法,按下鼠標(biāo)向右拖至I4,再釋放鼠標(biāo),其它的測量值的平方就計算出來了。
選中“J4”單元格,選擇常用函數(shù)“SUM(B4: I4)”;然后點(diǎn)擊“確定”即可得到整個測量值的平方之和。
圖5 均方根平均值的計算
選中“B5”單元格,輸入公式“=SQRT(J4/8)”,然后點(diǎn)擊“確定”即可得到均方根平均值。見圖5。另外一個方法:輸入各測定值;選中“B4”單元格;輸入函數(shù)“=SQRT(SUMSQ(B3:I3)/8)”,然后點(diǎn)擊“確定”也可得到均方根平均值。
極差是最簡單、最易了解的表示測量值離散性質(zhì)的一個特征值。極差又稱全距,或范圍誤差,即在一組測量數(shù)據(jù)中最大值與最小值之差,見下式:
例6:測得三塊試體的抗壓強(qiáng)度為58.7、57.8、59.2、59.8、58.4、58.8(MPa),求此組試體的抗壓強(qiáng)度的極差。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入函數(shù)“=MAX(B3:G3)-M IN(B3:G3)”,然后點(diǎn)擊“確定”即可得到極差為2,見圖6。
圖6 極差的計算
一組測量數(shù)據(jù)中各測量值與該組數(shù)據(jù)平均值之偏差的絕對值的平均數(shù),稱為平均絕對偏差,見下式。
式中:d——平均絕對偏差;
di——某一測量值xi與平均值x之差。
例7:以氟硅酸鉀容量法測定某水泥熟料樣品中二氧化硅的含量(%),所得結(jié)果為:21.50、21.53、21.48、21.57、21.52。計算該組測量結(jié)果的平均絕對偏差。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入函數(shù)“=ABS[B3-AVERAGE($B$3:$F $3)]”,然后點(diǎn)擊“確定”即可得到x1與平均值之差。再用鼠標(biāo)左鍵點(diǎn)擊“B4”單元格,B4就被黑框框住,運(yùn)用填充句柄法,此時按下鼠標(biāo)向右拖至F4,再釋放鼠標(biāo),其它的測量值與平均值之差就計算出來了。然后點(diǎn)擊B5輸入公式“=SUM(B4:F4)/5”,再點(diǎn)擊“確定”則得到平均絕對偏差為0.024,見圖7。
圖7 平均絕對偏差的計算
另外一個方法:輸入各測定值;選中“B4”單元格;輸入統(tǒng)計函數(shù)“=AVEDEV(B3:F3)”,然后點(diǎn)擊“確定”也可得到平均絕對偏差。
方差是指各測量值與平均值的偏差平方和除以測量值個數(shù)而得的結(jié)果。采用平方可以消除正負(fù)號對差值的影響。
總體方差以δ2來表示,但在實(shí)際工作中,往往用樣本的方差s2來估計總體的方差。s2的計算式如下:
式中:xi——樣本中每個測量值(變量);
x——樣本平均值;
n——樣本容量。
例8:某廠有一臺水泥磨,在同一班里測定了出磨水泥的細(xì)度(篩余%):7.4、7.5、7.6、8.0、7.9、7.6、7.6、7.5。計算其方差。
Excel計算如下:輸入各測定值;選中“C4”單元格;輸入公式“=C3-AVERAGE($C$3:$J$3)”,然后點(diǎn)擊“確定”即可得到x1與平均值之差。再用鼠標(biāo)左鍵點(diǎn)擊“C4”單元格,C4就被黑框框住,運(yùn)用填充句柄法,此時按下鼠標(biāo)向右拖至J4,再釋放鼠標(biāo),其它的測量值與平均值之差就計算出來了(注,參考文獻(xiàn)[1]的4號數(shù)據(jù)計算有誤)。然后點(diǎn)擊C5輸入公式“=C4^2”,點(diǎn)擊“確定”即可。然后點(diǎn)擊C5,它就被黑框框住,運(yùn)用填充句柄法,此時按下鼠標(biāo)向右拖至J5,再釋放鼠標(biāo),其它的測量值與平均值之差的平方值就計算出來了。然后點(diǎn)擊C6,輸入公式“=SUM(C5:J5)/(8-1)”便得到結(jié)果為0.042679,見圖8。
圖8 方差的計算
另外一種方法:輸入各測定值;選中“B4”單元格;輸入統(tǒng)計函數(shù)“=VAR(B3:I3)”,然后點(diǎn)擊“確定”也可得到方差。
標(biāo)準(zhǔn)偏差又稱標(biāo)準(zhǔn)差或均方差、均方根差。在描述測量值離散程度的各特征值中,標(biāo)準(zhǔn)偏差是一項最重要的特征值,一般將平均值和標(biāo)準(zhǔn)偏差兩者結(jié)合起來即能全面地表明一組測量值的分布情況。
總體標(biāo)準(zhǔn)偏差以δ來表示,但在實(shí)際工作中,以樣本標(biāo)準(zhǔn)偏差s來估計總體標(biāo)準(zhǔn)偏差,這時,s的計算式如下:
式中:s——總體標(biāo)準(zhǔn)偏差估計值,簡稱樣本標(biāo)準(zhǔn)偏差,或?qū)嶒?yàn)標(biāo)準(zhǔn)偏差;
x——樣本平均值;
n-1——樣本自由度(記為f),n為樣本容量。
例9:水泥熟料中二氧化硅測定結(jié)果(%)為:21.50、21.53、21.48、21.57、21.52、21.56、21.52、21.53、21.46、21.48。計算該組數(shù)據(jù)的標(biāo)準(zhǔn)偏差。
Excel計算如下:輸入各測定值;選中“B4”單元格;輸入統(tǒng)計函數(shù)“=STDEV(B3:K3)”,然后點(diǎn)擊“確定”即可得到標(biāo)準(zhǔn)偏差為0.035355,見圖9。
圖9 標(biāo)準(zhǔn)偏差的計算
關(guān)于變異系數(shù)的計算讀者可以按照上面的計算分別計算出它的分子部分和分母部分,然后自行求出數(shù)據(jù)的變異系數(shù),這里從略。
[1]中國建筑材料檢驗(yàn)認(rèn)證中心、國家水泥質(zhì)量監(jiān)督檢驗(yàn)中心編著.水泥實(shí)驗(yàn)室工作手冊[M].第一版,北京:中國建材工業(yè)出版社,2009年.
[2]蘇華等編著.Excel2003函數(shù)在辦公中的應(yīng)用[M].第一版,北京:人民郵電出版社,2007年.
(編輯:張煢鶯)
TQ172.16 文獻(xiàn)標(biāo)識碼:B 文章編號:1007-6344(2010)03-0045-04
2009-10-20】