陳奎孚,李巖峰
(1.中國農(nóng)業(yè)大學(xué),北京 100083;2.解放軍總醫(yī)院第一附屬醫(yī)院,北京 100048)
從逐差法到對(duì)差法
陳奎孚1,李巖峰2
(1.中國農(nóng)業(yè)大學(xué),北京 100083;2.解放軍總醫(yī)院第一附屬醫(yī)院,北京 100048)
把逐差法組織成對(duì)差法,并以自變量差值平方為權(quán)系數(shù)進(jìn)行加權(quán)平均來計(jì)算比例系數(shù)。利用初等數(shù)學(xué)方法證明了所選權(quán)函數(shù)的最優(yōu)性。
逐差法;對(duì)差法;最小二乘法;偶然誤差
實(shí)驗(yàn)所探究的物理規(guī)律,尤其是大學(xué)和中學(xué)的課程學(xué)習(xí)階段的實(shí)驗(yàn),大多是比例規(guī)律,如彈力隨彈簧伸長量的變化,電壓隨電流的變化(電阻不變)。測量比例系數(shù)是該階段學(xué)習(xí)的重要任務(wù)。逐差法是處理這類實(shí)驗(yàn)數(shù)據(jù)的常規(guī)方法,它把測量數(shù)據(jù)的因變量進(jìn)行逐項(xiàng)相減,或按順序分為兩組后把對(duì)應(yīng)項(xiàng)相減,最后將所得的差值進(jìn)行平均以減小偶然誤差。在很多中學(xué)物理參考資料中,逐差法也是處理勻加速度直線運(yùn)動(dòng)實(shí)驗(yàn)數(shù)據(jù)的推薦方法。
逐差法很經(jīng)典,查中國知網(wǎng)可以找到北京大學(xué)普通物理教研組早在1953年的文章就有對(duì)學(xué)生用逐差法處理實(shí)驗(yàn)數(shù)據(jù)的要求[1]。然而隨著近年來MATLAB和ORIGIN等易用計(jì)算手段的普及,在計(jì)算已不是困難的情況下(至少就高等教學(xué)而言),逐差法與最小二乘法之間的精度差異就受到了關(guān)注[2-6]。受關(guān)注的還有逐差法的計(jì)算格式和有效性。特別是,探索計(jì)算格式易于上手,因而有很多作者對(duì)主流格式進(jìn)行縫縫補(bǔ)補(bǔ)[7-11]。
無論是鄰差法,還是分組逐差法,操作數(shù)的選取總有一定人為隨意性,這種隨意性與強(qiáng)調(diào)追求完美的物理哲學(xué)理念形成一定反差,因而總是讓人覺得心有不甘。但更遺憾的目前發(fā)表了大量反思逐差法有效性的文獻(xiàn)[12-15],有的作者干脆認(rèn)為應(yīng)徹底放棄逐差法[16-17],或至少在高中階段要放棄[18-19],或不宜過分強(qiáng)調(diào)[20-23]。當(dāng)然也有堅(jiān)持逐差法的聲音[23-26]。
本研究將報(bào)告:要達(dá)到最小二乘法的精度,無需對(duì)廣泛使用的逐差法計(jì)算框架進(jìn)行大的變動(dòng);只要把分段逐差重組成對(duì)稱相差,并進(jìn)行加權(quán)修正,也能夠?qū)崿F(xiàn)最小二乘。這就在傳統(tǒng)逐差法的手工計(jì)算與最小二乘的計(jì)算機(jī)計(jì)算之間架起了橋梁。
圖1為某一符合比例規(guī)律的物理量測量結(jié)果示意圖。
圖1 物理量測量結(jié)果示意圖
圖1中x0,x1,X2,…,x7為自變量測量值(間距d=xi+1-xi為常數(shù)),y0,y1,y2,…,y7為因變量測量值。常規(guī)實(shí)驗(yàn)條件是自變量的偶然誤差遠(yuǎn)遠(yuǎn)小于因變量的偶然誤差,因此相對(duì)因變量而言,自變量可認(rèn)為是精確的。
在計(jì)算手段比較原始的早期,我們?cè)谧鴺?biāo)紙上標(biāo)出測量值的坐標(biāo)點(diǎn),然后用直尺畫一條直線,讓直線盡可能穿過所有坐標(biāo)點(diǎn)。如果無法讓直線穿過所有數(shù)據(jù)點(diǎn),那么就讓數(shù)據(jù)點(diǎn)在直線兩側(cè)盡可能對(duì)稱分布。直線畫好后,用量角器量出直線與x軸間的夾角,查數(shù)學(xué)用表的正切表,就得到了斜率,也就是比例系數(shù)。這種方式幾乎不需要計(jì)算(顯然其精度也不可能很高)。另外對(duì)因變量偶然誤差比較大的情形,也就是數(shù)據(jù)坐標(biāo)點(diǎn)偏離直線比較明顯的情形,圖解法也無法提供客觀評(píng)價(jià)指標(biāo)來反映比例規(guī)律對(duì)數(shù)據(jù)點(diǎn)的吻合程度。
逐差法是比較精確,但計(jì)算量又相對(duì)小的數(shù)據(jù)處理方法。它把8個(gè)數(shù)據(jù)中的前四個(gè)(y0,y1, y2,y3)分為一組,后四個(gè)(y4,y5,y6,y7)分為另一組,然后逐對(duì)相差,即從下式得到斜率k,
這就是所謂的兩段逐差法。也有人建議使用所謂的鄰差法計(jì)算斜率k,即
不管式(1)還是式(2)都用上了所有的測量數(shù)據(jù),并進(jìn)行了平均,似乎很完美。但顯然,我們會(huì)有這樣的問題:究竟是式(1)合理還是式(2)合理?(有作者認(rèn)為兩段法的式(1)優(yōu)于式(2)[13,14])。既然有這兩種方式,那么是否還存在其它更合理的計(jì)算方式?
的貢獻(xiàn)呢!?當(dāng)然如果把這三項(xiàng)也包含進(jìn)去,那就得到了
按照式(3)這樣的計(jì)算,就如同文獻(xiàn)[27],只有首末兩個(gè)數(shù)據(jù)被使用了,而不是所有的測量數(shù)據(jù)。大多文章會(huì)強(qiáng)調(diào)式(3)沒有把所有的數(shù)據(jù)都用上,而且沒有平均操作,所以不宜使用。但也有實(shí)驗(yàn)數(shù)據(jù)支持支持式(3)優(yōu)于式(2)和式(1)[28]。
下面給出優(yōu)于式(1)的對(duì)差法。
式(1)還可以組織成如下對(duì)稱相差的格式
我們記
在無偶然誤差的情形下k=k1=k2=k3=k4。利用等比例性質(zhì),很容易由式(5)得到式(4)。對(duì)偶然誤差存在的情形,式(4)可看作是為了抵消誤差的某種平均。然而這個(gè)平均有改善的空間。
如果我們認(rèn)為偶然誤差分布是均勻的,那么式(5)中(y7-y0),(y6-y1),(y5-y2)和(y4-y3)的絕對(duì)誤差大小是相匹配的,因?yàn)槟銢]有理由說其中一個(gè)會(huì)比另外一個(gè)大。然而,k4誤差肯定比k1的誤差大。按照偶然誤差均勻分布的假定,前者應(yīng)該是后者的7倍。如果誤差大小明顯不同,那么等權(quán)平均的計(jì)算方式肯定不是最合理的。我們應(yīng)該對(duì)精度高者給予更高的權(quán)重。
當(dāng)然,權(quán)重選擇又帶來了隨意性。但總的原則是,誤差越大,權(quán)重越小。對(duì)k1,k2,k3,k4權(quán)重的最簡單選擇是7,5,3,1。如果這樣選,那么就得到了式(3)。下一個(gè)容易想到的方案是72,52, 32,12,這樣就有
對(duì)于任意2N個(gè)測量值的情形,式(6)擴(kuò)展成通式
我們稱式(7)為對(duì)稱相差法,簡稱對(duì)差法,它將首尾相對(duì)的數(shù)據(jù)求差,再加權(quán)平均得到比例系數(shù)。其中權(quán)系數(shù) (2N-1)2,(2N-3)2,...,12乘以就相當(dāng)于d2作對(duì)差的兩個(gè)自變量的距離平方。由于權(quán)系數(shù)只是一個(gè)比例系數(shù),所示式(7)也是以自變量差值平方為權(quán)的加權(quán)平均。
為了評(píng)估式(7)的性能,我們使用近期文獻(xiàn)發(fā)表的數(shù)據(jù)。文獻(xiàn)選擇依據(jù)是:1)原文有逐差法的處理結(jié)果;2)有公認(rèn)的可信結(jié)果;3)與物理相關(guān)。經(jīng)篩選,下面三篇文獻(xiàn)比較典型(被引用的原文結(jié)果均為逐差法所得)為了避免介紹符號(hào)的物理意義,本節(jié)的計(jì)算直接用數(shù)字。需深入了解的,請(qǐng)參閱原始文獻(xiàn)。
利用文獻(xiàn)[29]的表2數(shù)據(jù),用式(6)計(jì)算出的氬原子第一激發(fā)電位
比原文算出的U0=11.56V,更接近公認(rèn)的氬原子第一激發(fā)電位11.61 V。
利用文獻(xiàn)[30]的數(shù)據(jù),對(duì)差法計(jì)算出的電壓-電流擬合直線斜率k為
進(jìn)而得到電阻率
它與ρ=1.75×10-8(Ω·m)的相對(duì)誤差為0.53%,而原文的相對(duì)誤差1.14%。利用文獻(xiàn)[31]的表1,對(duì)差法算出的聲波波長
進(jìn)而得到水的的密度
它原文的ρ=994.9kg·m-3更接近標(biāo)準(zhǔn)值ρ0=1000.0kg·m-3。
上述三個(gè)例子表明式(6)的對(duì)差法確實(shí)有效。
對(duì)多此測量值進(jìn)行平均一般可減小偶然誤差的影響,比如k1,k2是某一物理量的兩次測量,我們認(rèn)為(y1+y2)/2誤差比y1y2小。如果兩次測量工具不一樣,就不能這樣簡單平均了,比如這里正文字體大小,用文具尺測量的長度和用全球衛(wèi)星定位系統(tǒng)測量的長度就不能進(jìn)行簡單地平均,因?yàn)槠骄蠼Y(jié)果的精度未必比單獨(dú)用文具尺量出的精度高。不能簡單平均的原因是兩種測量工具的不確定度不同。
3.1 兩測量值
首先有
其中最后一個(gè)等號(hào)利用了偶然誤差期望為0的特性了。上式表明的期望確實(shí)是真值。
因?yàn)槲覀兗俣╪1,n2相互獨(dú)立,所以E[n1n2] =0,這樣式(8)變?yōu)?/p>
即y1,y2的優(yōu)化權(quán)系數(shù)與各自的方差倒數(shù)成正比,也就是方差越大(偶然誤差越大),在平均中的貢獻(xiàn)越小。
3.2 多測量值
如果還有第三個(gè)y3=+n3,其中n3與n1,n2獨(dú)立,且方差為。如何實(shí)現(xiàn)對(duì)y1,y2,y3加權(quán)平均得到最小的方差呢?我們先對(duì)y1,y2加權(quán)平均得到,顯然的偶然誤差與n3也獨(dú)立,因而與y3平均就如同y1和y2的平均。與y3優(yōu)化權(quán)系數(shù)分別為
采用數(shù)學(xué)歸納法,容易證明對(duì)偶然誤差相互獨(dú)立的N個(gè)測量y1,y2,y3,…,yN,其優(yōu)化權(quán)系數(shù)也與各自方差倒數(shù)成正比,即優(yōu)化權(quán)系數(shù)為
回來看式(5),它給出了四個(gè)估計(jì)。由于假定了y0~y7的偶然誤差是獨(dú)立的,所以k1,k2,k3, k4的偶然誤差也相互獨(dú)立,因而可以使用式(13)的權(quán)系數(shù)平均。顯然上述四個(gè)估計(jì)式的方差倒數(shù)之比為72∶52∶32∶12。這正是從式(5)得到了式(6)的數(shù)學(xué)依據(jù)。
以上就是對(duì)差法的數(shù)學(xué)基礎(chǔ),它不涉及導(dǎo)數(shù)和偏導(dǎo)數(shù)。在高中物理階段,如果能夠把期望和方差的運(yùn)算解釋到位,那么學(xué)生應(yīng)能大體理解對(duì)差法中權(quán)系數(shù)的選擇。如果沒有期望和方差的概念,就只能讓學(xué)生定性地接受加權(quán)平均的權(quán)系數(shù)應(yīng)與不確定度的倒數(shù)成正比,即不確定度越小,測量值越可靠,在平均中貢獻(xiàn)越大。讓學(xué)生在直覺上接受這一點(diǎn)應(yīng)該不會(huì)很突兀。
本文發(fā)現(xiàn)把逐差法重組成對(duì)差法,并以自變量間距平方加權(quán),也能夠?qū)崿F(xiàn)最小二乘法。這就在逐差法和最小二乘法之間搭起了橋梁。
對(duì)差法適合這樣的數(shù)據(jù)模型:真值部分符合比例規(guī)律,誤差為獨(dú)立的偶然誤差。通常的勻加速度直線運(yùn)動(dòng)的測量值不符合這種模型,所以對(duì)差法對(duì)這種數(shù)據(jù)而言不是最優(yōu)的。對(duì)差法是否改善了逐差法,以及改善的幅度需要進(jìn)一步研究。
通過多次測量可以降低偶然誤差,但是如果多次測量的測量工具不確定度不同,那么采用簡單的平均無法減小偶然誤差。此時(shí),應(yīng)采用加權(quán)平均,即不可信數(shù)據(jù)在平均中貢獻(xiàn)要小,而可信數(shù)據(jù)的貢獻(xiàn)要大。
有些文獻(xiàn)認(rèn)為逐差法把所有數(shù)據(jù)都用上,并且做了平均,因而誤差小—這種觀點(diǎn)是不恰當(dāng)?shù)?。減小方差的嚴(yán)謹(jǐn)方法要通過對(duì)針對(duì)的誤差模型用數(shù)學(xué)方法來建立。對(duì)于不具備這方面知識(shí)的學(xué)生,老師應(yīng)該定性地介紹問題的相關(guān)因素。
有的作者因?yàn)橹鸩罘ú皇亲詈玫亩ㄗh放棄逐差,回到圖像量斜率的原始做法—這也是不可取的。物理課程對(duì)數(shù)據(jù)處理的定量培養(yǎng)還是非常有必要的。作為教師,應(yīng)該引導(dǎo)學(xué)生思考“不是最好”的影響因素,激發(fā)將來深入研究的興趣。
[1] 北京大學(xué)普通物理教研組.北京大學(xué)普通物理實(shí)驗(yàn)教學(xué)經(jīng)驗(yàn)[J].物理通報(bào),1953(11):527-534.
[2] 潘小青.逐差法及其應(yīng)用探討[J].大學(xué)物理實(shí)驗(yàn), 2010-04-26.第23(2):86-87.
[3] 夏雪琴.Matlab編程法在測量氦氖激光波長實(shí)驗(yàn)數(shù)據(jù)處理中的應(yīng)用探索[J].大學(xué)物理實(shí)驗(yàn),2015,28 (1):66-68.
[4] 李丹鳳,夏雪琴.逐差法和Origin7.0軟件在測量氦氖激光的波長實(shí)驗(yàn)數(shù)據(jù)處理中的比較[J].大學(xué)物理實(shí)驗(yàn),2014,27(6):106-109.
[5] 馮學(xué)超,吳杰,蔣逢春,等.金屬導(dǎo)體電阻溫度系數(shù)實(shí)驗(yàn)數(shù)據(jù)處理方法的比較[J].大學(xué)物理實(shí)驗(yàn), 2014,27(3):114-116.
[6] 朱國強(qiáng).處理實(shí)驗(yàn)數(shù)據(jù)——MATLAB軟件在物理教學(xué)中的應(yīng)用之四[J].物理通報(bào),2015(2):77-80.
[7] 何述平.逐差法處理打點(diǎn)紙帶數(shù)據(jù)的研究[J].物理通報(bào),2014(11):98-102.
[8] 趙懷彬,張中玉.應(yīng)用“兩段法”快速求解加速度[J].中學(xué)物理教學(xué)參考,2014,43(1-2):102-103.
[9] 單明,聶燕萍.線性擬合中的逐差法和最小二乘法的比較[J].大學(xué)物理實(shí)驗(yàn),2005,18(2):68-70.
[10]張敬德.逐差法為什么會(huì)減小誤差[J].中學(xué)物理教學(xué)參考,2009,38(6):16-17.
[11]張容.基于MATLAB的弗蘭克-赫茲實(shí)驗(yàn)數(shù)據(jù)處理[J].大學(xué)物理實(shí)驗(yàn),2015,28(2):100-102.
[12]盧煒杰,吳先球,王笑君.三種實(shí)驗(yàn)數(shù)據(jù)處理方法的誤差分析和教學(xué)探討[J].物理教學(xué),2013,35(12): 22-23.
[13]吳小娟.應(yīng)用Excel處理夫蘭克赫茲實(shí)驗(yàn)數(shù)據(jù)[J].大學(xué)物理實(shí)驗(yàn),2015,28(2):103-105.
[14]王鵬,張季謙,刁山菊.基于逐差法的測定金屬電阻率實(shí)驗(yàn)數(shù)據(jù)處理[J].物理通報(bào),2015(3):81-82.
[15]尹少英,劉軒,徐在春,等.基于超聲波的食鹽溶液物性的研究[J].大學(xué)物理實(shí)驗(yàn),2014,27(3):7-10.
From Seriatim Subtraction to Symmetrical Subtraction
CHEN Kui-fu1,LIYan-feng2
(1.China Agricultural University,Beijing 100083;2.First Affiliated Hospital of PLA General Hospital,Beijing 100048)
The seriatim subtraction form is reorganized into the symmetrical subtraction form,and the proportional coefficient is estimated by weighted averaging the symmetrical subtraction with the squared argument differences being theweight coefficients.Its optimality of the selected weight coefficients is proved by elementarymathematics.
seriatim subtraction;symmetrical subtraction;least square error approach;accidental error
241
A
10.14139/j.cnki.cn22-1228.2015.005.033
1007-2934(2015)05-0118-05
2015-06-14