翟卉
(農(nóng)業(yè)部乳品質(zhì)量監(jiān)督檢驗測試中心,天津300381)
誤差理論和概率論在食品化學(xué)分析中的應(yīng)用
翟卉
(農(nóng)業(yè)部乳品質(zhì)量監(jiān)督檢驗測試中心,天津300381)
食品化學(xué)分析中的多次平行測定具有正態(tài)分布的概率分布率,測定中7種誤差具有各自特征性應(yīng)用,在規(guī)范的化學(xué)分析基礎(chǔ)上得出更高的準(zhǔn)確度和精密度。
誤差理論;概率論;食品化學(xué)分析
食品化學(xué)分析是為了獲得食品成分的真值。就食品化學(xué)分析的項目來說,可達(dá)成千上萬個,食品成分包括自然界可食用的所有動物、植物和微生物,同時還包括人為加工所添加劑的食品添加劑以及加工過程中發(fā)生的成分變化,涉及幾乎有機(jī)化學(xué)和無機(jī)化學(xué)學(xué)科的所有方面。就食品化學(xué)分析的手段來說,除了常規(guī)分析化學(xué)的重量法、容量法等外,還包括各種光譜、色譜、質(zhì)譜等儀器分析以及酶聯(lián)免疫法(ELISA)、聚合酶鏈反應(yīng)(PCR)等快速分析,這些分析結(jié)果由百分含量直至百億分之一(0.1 μg/kg)。近年來食品化學(xué)分析的迅猛發(fā)展,要求充分應(yīng)用數(shù)學(xué)工具總結(jié)、歸納分析中的規(guī)律,結(jié)合分析方法尋找科學(xué)的分析方案,得出準(zhǔn)確的分析結(jié)果。相對于化學(xué)分析技術(shù)而言,數(shù)學(xué)工具仍顯落后,甚至最基礎(chǔ)的數(shù)學(xué)工具還未普及,致使分析結(jié)果具有明顯的隨意性、不可知性,無法解釋分析結(jié)果正確與否,無法判斷可疑結(jié)果,無法改進(jìn)分析技術(shù)。因此,分析技術(shù)必須與數(shù)學(xué)工具充分結(jié)合,才能達(dá)到分析目的。
國際上在食品化學(xué)分析中應(yīng)用數(shù)學(xué)工具和起源于上世紀(jì)初,1927年大衛(wèi)·波羅特提出測定值的誤差分析,首次將誤差分為隨機(jī)誤差和系統(tǒng)誤差,解釋分析結(jié)果的準(zhǔn)確度;1929年萊勞·特·懷特在誤差理論基礎(chǔ)上提出最小二乘法,進(jìn)一步將標(biāo)準(zhǔn)差運用于分析結(jié)果的綜合判斷上;1988年馬西摩·司提出多次化學(xué)測定遵循高斯分布規(guī)律。并將概率論應(yīng)用于分析結(jié)果[1],奠定了食品化學(xué)分析中的應(yīng)用數(shù)學(xué)基礎(chǔ),直至1995年國際理論化學(xué)和應(yīng)用護(hù)額學(xué)聯(lián)合會(IUPAC)發(fā)布“分析化學(xué)實驗室內(nèi)部質(zhì)量控制指南”[2],總結(jié)了以往食品化學(xué)分析的應(yīng)用數(shù)學(xué),確定了全世界的基本原則和方法。
測定誤差是食品化學(xué)分析中不可避免的,其原因是整個分析中每個步驟的不規(guī)范因素,包括分析人員的主觀因素以及試劑、儀器和環(huán)境變化等客觀因素。依據(jù)其產(chǎn)生機(jī)理,可歸納為兩類,即隨機(jī)誤差或稱偶然誤差(random errors)和系統(tǒng)誤差(systematic errors)。前者是由分析過程上不確定因素的隨機(jī)性造成的誤差。后者是由保持恒定或以可預(yù)知方式變化造成的誤差。這兩類誤差具有不同的特點,因而在化學(xué)分析中有不同的用途。
隨機(jī)誤差的特點是:(1)由于造成的因素不可預(yù)計,它在分析過程中隨機(jī)出現(xiàn),因此無法在化學(xué)分析前估計單次分析隨機(jī)誤差的大小;(2)單次分析的隨機(jī)誤差沒規(guī)律性,可大可小,可正可負(fù)。但多次分析的隨機(jī)誤差有抵償性,其平均值趨于零。這一點為人們所利用,找到消除隨機(jī)誤差的實驗方法,也就是說,以足夠多的重復(fù)分析次數(shù)就可使隨機(jī)誤差減小到允許的程度。由于化學(xué)分析是多次重復(fù)測定,因此不能用單次測定來衡量誤差,而用多次測定的綜合性標(biāo)準(zhǔn)差(又稱標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)偏差、標(biāo)準(zhǔn)離差、均方根差 standard deviation)來衡量,標(biāo)準(zhǔn)差以貝塞爾公式為佳,即
應(yīng)用標(biāo)準(zhǔn)差就可將重復(fù)測定次數(shù)與隨機(jī)誤差大小聯(lián)系起來,這聯(lián)系是借助于多次重復(fù)測定的化學(xué)分析概率分布規(guī)律,即正態(tài)分布(高斯分布)。
系統(tǒng)誤差的特點是:(1)造成的因素可預(yù)計,在測量之前就存在,能估計其大??;(2)具有疊加性,因此它不能靠多次測量的抵償來消除,而只能靠對每個因素的校準(zhǔn)來削弱或消除。如量具雖溫度的變化、分析人員讀數(shù)的習(xí)慣誤差、儀器的響應(yīng)值誤差等。
在重復(fù)性條件下多次測定的概率分布圖為正態(tài)分布圖或稱高斯分布圖,如右圖所示。即以測定值x作橫坐標(biāo),出現(xiàn)概率P為縱坐標(biāo)的分布圖。
其概率可用下式表示:
式中:μ為平均值,s為標(biāo)準(zhǔn)差。由圖可知測定值概率具有以下性質(zhì):
1)高斯分布反映測定值的隨機(jī)誤差,具對稱性,抵償性;
3)標(biāo)準(zhǔn)差愈小,曲線愈陡,隨機(jī)誤差小,精密度高,反之,曲線緩,隨機(jī)誤差大,精密度低;
②應(yīng)用更精確的測定方法,是每次測定值與多次測定平均值更接近,減小S。例如,用25 mL滴定管時,A級滴定管比B級滴定管更精確,前者的誤差為0.04 mL,而后者為0.08 mL。
,即a至 b范圍內(nèi)曲線包含的面積。在化學(xué)分析中應(yīng)用以下三種面積:(a)μ±S測定值范圍內(nèi)出現(xiàn)的概率為68.3%;(b)μ±2S測定值范圍內(nèi)出現(xiàn)的概率為95.0%(精確地說為μ±1.96S);
(c)μ±3S測定值范圍內(nèi)出現(xiàn)的概率為99.7%。
其中第二種特別有用,它表示在μ±2S范圍內(nèi)測定值出現(xiàn)的概率為95%,僅有5%遠(yuǎn)離真值(此時以平均值表示)的測定值不在此范圍內(nèi),左右各2.5%,因此μ±2S范圍內(nèi)的測定值,在全世界被認(rèn)為是可以視為真值的允許范圍(真值為μ,允許范圍為2S)[4]。而μ±S要求太苛刻;μ±3S又太松。
為了使S更小,使測定值更接近真值μ,可采取兩個方法:
3.1 絕對誤差(absolute error),即測定值與真值之差E =R-τ,在化學(xué)分析中應(yīng)用時,反映了以下含義:
1)當(dāng)R為一次測定值,則E包含隨機(jī)誤差及系統(tǒng)誤差;
2)當(dāng)R為重復(fù)性條件下足夠多次測定的平均值時,則E僅為系統(tǒng)誤差。這在制定標(biāo)準(zhǔn)方法和科研中很重要,依此排除隨機(jī)誤差,來尋找系統(tǒng)誤差,如干擾物質(zhì)、化學(xué)反應(yīng)完全程度、消化中被測組份損失等。
3)當(dāng)進(jìn)行常規(guī)測定時,即具上崗證的分析人員應(yīng)用國家標(biāo)準(zhǔn)方法、檢定過的儀器和器皿進(jìn)行測定時,則系統(tǒng)誤差視為零(實際上是在允許范圍之內(nèi)的數(shù)值),這時在重復(fù)性條件下足夠多次測定又消除了隨機(jī)誤差,所以E=0,μ=τ,即在以上條件下測定的算術(shù)平均值μ視為真值。
所謂重復(fù)性條件即在相同測量條件下(人、儀器、方法、環(huán)境)對同一樣品同一組分連續(xù)測定。
3.2 相對誤差(relative error),即絕對誤差對真值的百分率,在化學(xué)分析中應(yīng)用時,除了與絕對誤差的三點含義相同外。它反映的不是量值大小,而是相對百分率,用來比較不同次測定、樣本或本底值等的測定誤差。
3.3 算術(shù)平均偏差(arithmetic mean of bias),即i次測定偏差的算術(shù)平均數(shù):
在化學(xué)分析中應(yīng)用時,反映了以下含義:
1)衡量隨機(jī)誤差大小,d小,隨機(jī)誤差小,如圖A、B所示,在概率分布圖上表現(xiàn)為曲線陡;而d大,隨機(jī)誤差大,如圖C、D所示,曲線緩。
3.4 相對標(biāo)準(zhǔn)差(relative standard deviation),又稱變異系數(shù)(coefficient of variation)即標(biāo)準(zhǔn)差的平均值
在化學(xué)分析中應(yīng)用時,反映了以下含義:它以相對百分率表示標(biāo)準(zhǔn)差,而不是絕對數(shù)值,因此可以比較不同測定平均值的隨機(jī)誤差大小,或精密度大小,或高斯分布曲線的陡緩。
3.5 極差R(maximum diffence),即一組測定值中最大值與最小值之差值Xmax—Xmin。在化學(xué)分析中用于數(shù)據(jù)檢驗,如目前世界通用的狄克遜檢驗(Dixon test),還可用于F檢驗。例如,當(dāng)標(biāo)定一個標(biāo)準(zhǔn)滴定溶液時,得出10個測定濃度。其=0.101 2,S=0.003 6,R=0.012,單位為mol/mL。在用于滴定(或儀器法作內(nèi)標(biāo))時,必須從樣本的實測值推斷總體的真值。推斷的方法如下:
1)將樣本的算術(shù)平均值作為總體平均值μ的估計值,該10個測定值的平均值為0.101 2;
2)選擇1個置信概率,一般γ=0.95,也稱顯著性水平0.05;
3)計算置信區(qū)間,從高斯分布圖可知積分計算很麻煩,因此創(chuàng)造了一個t檢驗(雙側(cè)檢驗)和F檢驗(單側(cè)檢驗)的表格,便于查表計算。
(a)t檢驗計算,由t檢驗表可知n=10,γ=0.95時,0.003 6=(0.101 2±0.002 6)mol/mL=0.098 6 mol/mL~0.103 8 mol/mL。
這說明盡管標(biāo)定濃度平均值為0.101 2 mol/mL,而根據(jù)10次標(biāo)定的分散性(由S、R反映)標(biāo)液的真實濃度并不是0.101 2 mol/mL(這僅是一個近似值),而應(yīng)該是(0.1012±0.0026)mol/mL范圍內(nèi)(出現(xiàn)的概率為0.95,是可值得信賴,因僅有5%的可能是不在這范圍內(nèi))。由這標(biāo)準(zhǔn)滴定溶液的置信限0.002 6 mol/mL可推斷用其滴定(如測定、加標(biāo))發(fā)生的誤差。
(b)F檢驗計算,由F檢驗表可知n=10,γ=0.95時,f=0.230置信區(qū)間x±fR=0.101 2±0.230×0.012=(0.101 2±0.002 8)mol/mL=0.098 4 mol/mL~0.1040 mol/ mL,兩種計算方法結(jié)果很一致。
[1]Massimo C,J T Chayes L.Chayes Gaussian fluctuations of Connectivities in the Subcritical Regime of Percolation[J].Probability Theory and Related Fields,1988,1:209-341
[2]IUPAC.Harmonized Guildlines for Internal Quality Control in Analitical Chemistry Laboratory[J].Pure&Appl Chem,1995,67:649-666
Error Theory and Probability Used in Food Chemical Analysis
ZHAI Hui
(Dairy Monitoring Center of Department od Agriculture,Tianjin 300381,China)
Multi-determinations of food chemical analysis are characterized by Gauss Distribution of probability. The involving seven errors of different use in chemical analysis are aimed to improve determination accuracy and precision.
error theory;probability;food chemical analysis
10.3969/j.issn.1005-6521.2014.19.041
2014-06-17
翟卉(1963—),女(漢),工程師,本科,研究方向:食品監(jiān)督及檢驗。