尹霖+張金鳳+趙云飛+范海英
摘 要:誤差理論是測量不確定評定和一切實(shí)驗(yàn)研究的基礎(chǔ),其重要性毋庸置疑,而其本身的發(fā)展又與概率理論的發(fā)展密不可分、相互影響。
關(guān)鍵詞:誤差理論 概率論 正態(tài)分布 中心極限定理
中圖分類號:P2 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2014)02(b)-0000-00
從古人夜觀天象開始,人們在長期的觀測中很早就意識到測量不可避免會產(chǎn)生誤差;而由于真值=測量值-誤差,“得到”誤差就可以得到真值,這樣的認(rèn)識自然使得人們開始研究誤差。而縱觀誤差理論的發(fā)展史,人們會發(fā)現(xiàn)誤差理論的發(fā)展其實(shí)是與概率理論的發(fā)展密不可分、相互影響的。
較早期在著作中探討誤差各種性質(zhì)的人是近代科學(xué)及實(shí)驗(yàn)科學(xué)的奠基人伽利略(Galileo Galilei,1564-1642)。他在《關(guān)于托勒密和哥白尼:兩大世界體系的對話》(1632)中談到第谷(Tycho Brahe,1546 -1601)于1572年發(fā)現(xiàn)的一顆新星(Nova)的位置時,討論了這個問題: “薩:……首先我問你,天文學(xué)家們用他們的儀器觀測并測算諸如新星在地平線上的仰角時,是否會測算得過頭一點(diǎn),或測算得不夠一點(diǎn);這就是說,有時候把角度推算得比正確的角度高些,有時候低些?還是推算的錯誤總是朝一邊倒,以致只要發(fā)生誤差,總是過頭了一點(diǎn);或者總是不夠,而永遠(yuǎn)不會過頭?辛:毫無疑問,過與不及的兩種傾向都同樣地存在?!薄八_:……從這種地方你可以看出,所謂儀器測算上的誤差決不能從計算結(jié)果上來決定其誤差的大小,而必須根據(jù)儀器實(shí)際測量出的度和分的數(shù)目來定……”雖然伽利略當(dāng)時并沒有明確提出“隨機(jī)”和“分布”這樣的概念,但可以看出他所描述的誤差的種種性質(zhì),實(shí)際上正是我們現(xiàn)在所理解的隨機(jī)誤差的分布性質(zhì)——即所有觀測值都可以有誤差,其來源可歸因于觀測者、儀器工具以及觀測條件;觀測誤差對稱地分布在0的兩側(cè);小誤差出現(xiàn)得比大誤差更頻繁。此外他的表述中還涉及了誤差傳遞的思想。
對早期誤差理論的發(fā)展做出了重大貢獻(xiàn)的另一個人是英國數(shù)學(xué)家辛普森(Thomas Simpson,1710-1761),他的工作在他1755年寫的一封信《在應(yīng)用天文學(xué)中取若干個觀測值的平均的好處》中提出。在信里,他構(gòu)造了一個離散的誤差分布:假定在一次測量中,誤差只能取0、±1、±2、±3、±4、±5這11個值,取這些值的概率在0處最大,然后在兩邊按比例下降,直到±6處為0:即 。 根據(jù)所給的分布,可算得單次測量的誤差(絕對值)不超過1(0、±1)的概率為16/36=0.444,不超過2(0、±1、±2)的概率是24/36=0.667;為比較起見,他又計算出6次測量的平均值的誤差(即6個誤差的平均)不超過1的概率是0.725,不超過2的是0.967——易見平均值的估計優(yōu)于單個值。由此出發(fā),辛普森就首次從數(shù)學(xué)上“證明”了算數(shù)平均值的優(yōu)良性,而由于出發(fā)點(diǎn)是誤差取值的概率,辛普森也被視為是第一個將誤差理論與概率理論聯(lián)系起來的人——后面可以看到這一點(diǎn)的意義十分重大,因?yàn)檎麄€誤差理論就是建立在概率論基礎(chǔ)上的。
誤差理論發(fā)展的下一個階段就是隨機(jī)誤差的分布的確定,這眾所周知的是由大數(shù)學(xué)家高斯(Carl Friedrich Gauss,1777-1855)所完成的。1809年高斯發(fā)表了他的《繞日天體運(yùn)動的理論》一書,在此書末尾他寫了一節(jié)有關(guān)“數(shù)據(jù)結(jié)合”的問題(data combination),即:當(dāng)對同一目標(biāo)的若干次觀測結(jié)果不同時,如何處理這些數(shù)據(jù)?或如何利用觀測數(shù)據(jù)對觀測目標(biāo)的真值進(jìn)行估計?(雖然人們一直采取算術(shù)平均值的方法來處理這一問題,但并無理論根據(jù)——辛普森對此進(jìn)行了嘗試,但他所構(gòu)造的誤差分布是錯誤的)最終,高斯在書中介紹了他用來預(yù)測行星軌道的方法——最小二乘法(一維情況下即算數(shù)平均值),同時以出人意料的方法找到了隨機(jī)誤差的分布——正態(tài)分布。
設(shè)隨機(jī)誤差的概率密度函數(shù)為 , 個獨(dú)立測量值為 ,真值為 ,則對應(yīng)的 個隨機(jī)誤差為 。由于觀測是相互獨(dú)立的,因而這些誤差同時出現(xiàn)的概率為 ,對真值 的最佳估計應(yīng)使L極大(極大似然估計——由高斯首先提出,1912年被英國數(shù)學(xué)家費(fèi)歇爾所推廣)。這里高斯由最小二乘法出發(fā)認(rèn)為算數(shù)平均值 就是最佳估計——即 極大。
由
有 ,
首先令 ,并記 ,有
由于 ,因此 ;
然后令 ,其中 ,有
于是有 ;
由 的任意性(如可令 ),可推出 , 為常數(shù)。
由此可得 ,考慮到 是概率密度函數(shù),歸一化后可得正態(tài)分布表達(dá)式。
雖然正態(tài)分布的表達(dá)式最早由法國數(shù)學(xué)家棣莫弗得到,但是由于是高斯首先找到了它作為隨機(jī)誤差分布的這一重要作用,而經(jīng)過后來凱特勒(Lambert Adolphe Jacques Quetelet,1796~1874)、高爾頓(Francis Galton,1822-1911)等人的努力,使得這一認(rèn)識和正態(tài)分布的應(yīng)用廣泛滲透到了社會、經(jīng)濟(jì)和遺傳學(xué)等多個領(lǐng)域,故我們在討論對與正態(tài)分布的貢獻(xiàn)時更多的將其歸因于高斯,并稱正態(tài)分布為高斯分布,有人認(rèn)為整個19世紀(jì)的統(tǒng)計學(xué)就是正態(tài)分布應(yīng)用的擴(kuò)展。
誤差理論發(fā)展的第四個階段是著名的中心極限定理的提出和證明,它是隨機(jī)誤差正態(tài)分布的理論基礎(chǔ)。最早提出中心極限定理思想的人是發(fā)現(xiàn)了正態(tài)分布表達(dá)式的法國數(shù)學(xué)家棣莫弗(Abraham De Moivre,1667-1754),他于1733年在研究二項分布的極限情況時首先發(fā)現(xiàn)了正態(tài)分布的表達(dá)式,并由此得到了中心極限定理的最早特例,后來另外一位法國數(shù)學(xué)家拉普拉斯(Pierre-Simon de Laplace,1749-1827)于1812年完成了更一般的證明,即棣莫弗-拉普拉斯中心極限定理。而真正能夠成為誤差分布理論基礎(chǔ)的中心極限定理則是由俄國數(shù)學(xué)家李雅普諾夫(Aleksandr Mikhailovich Lyapunov,1857-1918)于1901年證明,即李雅普諾夫中心極限定理。
設(shè)隨機(jī)變量 相互獨(dú)立,且數(shù)學(xué)期望 ,方差 ,記 ,如果 滿足林德伯格條件:存在正數(shù) ,使得當(dāng) 時,有 ,則 。
中心極限定理的含義是:如果某隨機(jī)變量是由大量獨(dú)立的隨機(jī)變量綜合影響(相加)形成的,而其中每一個隨機(jī)因素對總和的影響是微小的(林德伯格條件),那么可以保證這些大量的、獨(dú)立的隨機(jī)因素的總和所形成的隨機(jī)變量總是服從正態(tài)分布。而這就很好的解釋了隨機(jī)誤差的正態(tài)分布性質(zhì):我們知道所謂(隨機(jī))誤差實(shí)際上是測量各要素的不完美所引起的各(隨機(jī))誤差因素的總和,如溫度漲落引起的隨機(jī)誤差( )、氣壓漲落引起的隨機(jī)誤差( )、視角、光線明暗、讀數(shù)時的判斷等等很多因素引起的各個隨機(jī)誤差( )……那么根據(jù)中心極限定理,總的隨機(jī)誤差( )滿足正態(tài)分布!中心極限定理被稱為概率論與數(shù)理統(tǒng)計的“首席定理”,在誤差理論中它同樣具有非常重要的作用:因?yàn)樗葟恼娼忉尯妥C明了為什么隨機(jī)誤差滿足正態(tài)分布,同時也指出很多情況下誤差合成后仍近似滿足正態(tài)分布,為誤差的合成及置信概率的確定提供了有可行性的重要指導(dǎo)。
誤差理論發(fā)展的最后一個階段是建立在現(xiàn)代概率理論建立的基礎(chǔ)上的,這是以1936年蘇聯(lián)數(shù)學(xué)家柯爾莫哥洛夫(Andrey Nikolaevich Kolmogorov,1903-1987)發(fā)表《概率論基本概念》為標(biāo)志的。因?yàn)楝F(xiàn)代概率理論不僅研究了隨機(jī)誤差所滿足的正態(tài)分布,也系統(tǒng)研究了系統(tǒng)誤差所滿足的其他各種分布如均勻分布、三角分布、反正弦分布等等。而誤差理論的基礎(chǔ)正是概率理論,核心思想就是將誤差看作隨機(jī)變量——通過研究隨機(jī)變量的各種性質(zhì)(期望、方差、方差的合成等)來研究誤差的各種性質(zhì)。
參考文獻(xiàn)
[1] 《關(guān)于托勒密和哥白尼:兩大世界體系的對話》【意】伽利略著.上海人民出版社.1974
[2] 《數(shù)理統(tǒng)計學(xué)小史》陳希儒.數(shù)理統(tǒng)計與管理.1999.1
[3] 《高斯與觀測誤差分布的發(fā)現(xiàn)》于忠義.統(tǒng)計與信息論壇.2006.11endprint
摘 要:誤差理論是測量不確定評定和一切實(shí)驗(yàn)研究的基礎(chǔ),其重要性毋庸置疑,而其本身的發(fā)展又與概率理論的發(fā)展密不可分、相互影響。
關(guān)鍵詞:誤差理論 概率論 正態(tài)分布 中心極限定理
中圖分類號:P2 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2014)02(b)-0000-00
從古人夜觀天象開始,人們在長期的觀測中很早就意識到測量不可避免會產(chǎn)生誤差;而由于真值=測量值-誤差,“得到”誤差就可以得到真值,這樣的認(rèn)識自然使得人們開始研究誤差。而縱觀誤差理論的發(fā)展史,人們會發(fā)現(xiàn)誤差理論的發(fā)展其實(shí)是與概率理論的發(fā)展密不可分、相互影響的。
較早期在著作中探討誤差各種性質(zhì)的人是近代科學(xué)及實(shí)驗(yàn)科學(xué)的奠基人伽利略(Galileo Galilei,1564-1642)。他在《關(guān)于托勒密和哥白尼:兩大世界體系的對話》(1632)中談到第谷(Tycho Brahe,1546 -1601)于1572年發(fā)現(xiàn)的一顆新星(Nova)的位置時,討論了這個問題: “薩:……首先我問你,天文學(xué)家們用他們的儀器觀測并測算諸如新星在地平線上的仰角時,是否會測算得過頭一點(diǎn),或測算得不夠一點(diǎn);這就是說,有時候把角度推算得比正確的角度高些,有時候低些?還是推算的錯誤總是朝一邊倒,以致只要發(fā)生誤差,總是過頭了一點(diǎn);或者總是不夠,而永遠(yuǎn)不會過頭?辛:毫無疑問,過與不及的兩種傾向都同樣地存在?!薄八_:……從這種地方你可以看出,所謂儀器測算上的誤差決不能從計算結(jié)果上來決定其誤差的大小,而必須根據(jù)儀器實(shí)際測量出的度和分的數(shù)目來定……”雖然伽利略當(dāng)時并沒有明確提出“隨機(jī)”和“分布”這樣的概念,但可以看出他所描述的誤差的種種性質(zhì),實(shí)際上正是我們現(xiàn)在所理解的隨機(jī)誤差的分布性質(zhì)——即所有觀測值都可以有誤差,其來源可歸因于觀測者、儀器工具以及觀測條件;觀測誤差對稱地分布在0的兩側(cè);小誤差出現(xiàn)得比大誤差更頻繁。此外他的表述中還涉及了誤差傳遞的思想。
對早期誤差理論的發(fā)展做出了重大貢獻(xiàn)的另一個人是英國數(shù)學(xué)家辛普森(Thomas Simpson,1710-1761),他的工作在他1755年寫的一封信《在應(yīng)用天文學(xué)中取若干個觀測值的平均的好處》中提出。在信里,他構(gòu)造了一個離散的誤差分布:假定在一次測量中,誤差只能取0、±1、±2、±3、±4、±5這11個值,取這些值的概率在0處最大,然后在兩邊按比例下降,直到±6處為0:即 。 根據(jù)所給的分布,可算得單次測量的誤差(絕對值)不超過1(0、±1)的概率為16/36=0.444,不超過2(0、±1、±2)的概率是24/36=0.667;為比較起見,他又計算出6次測量的平均值的誤差(即6個誤差的平均)不超過1的概率是0.725,不超過2的是0.967——易見平均值的估計優(yōu)于單個值。由此出發(fā),辛普森就首次從數(shù)學(xué)上“證明”了算數(shù)平均值的優(yōu)良性,而由于出發(fā)點(diǎn)是誤差取值的概率,辛普森也被視為是第一個將誤差理論與概率理論聯(lián)系起來的人——后面可以看到這一點(diǎn)的意義十分重大,因?yàn)檎麄€誤差理論就是建立在概率論基礎(chǔ)上的。
誤差理論發(fā)展的下一個階段就是隨機(jī)誤差的分布的確定,這眾所周知的是由大數(shù)學(xué)家高斯(Carl Friedrich Gauss,1777-1855)所完成的。1809年高斯發(fā)表了他的《繞日天體運(yùn)動的理論》一書,在此書末尾他寫了一節(jié)有關(guān)“數(shù)據(jù)結(jié)合”的問題(data combination),即:當(dāng)對同一目標(biāo)的若干次觀測結(jié)果不同時,如何處理這些數(shù)據(jù)?或如何利用觀測數(shù)據(jù)對觀測目標(biāo)的真值進(jìn)行估計?(雖然人們一直采取算術(shù)平均值的方法來處理這一問題,但并無理論根據(jù)——辛普森對此進(jìn)行了嘗試,但他所構(gòu)造的誤差分布是錯誤的)最終,高斯在書中介紹了他用來預(yù)測行星軌道的方法——最小二乘法(一維情況下即算數(shù)平均值),同時以出人意料的方法找到了隨機(jī)誤差的分布——正態(tài)分布。
設(shè)隨機(jī)誤差的概率密度函數(shù)為 , 個獨(dú)立測量值為 ,真值為 ,則對應(yīng)的 個隨機(jī)誤差為 。由于觀測是相互獨(dú)立的,因而這些誤差同時出現(xiàn)的概率為 ,對真值 的最佳估計應(yīng)使L極大(極大似然估計——由高斯首先提出,1912年被英國數(shù)學(xué)家費(fèi)歇爾所推廣)。這里高斯由最小二乘法出發(fā)認(rèn)為算數(shù)平均值 就是最佳估計——即 極大。
由
有 ,
首先令 ,并記 ,有
由于 ,因此 ;
然后令 ,其中 ,有
于是有 ;
由 的任意性(如可令 ),可推出 , 為常數(shù)。
由此可得 ,考慮到 是概率密度函數(shù),歸一化后可得正態(tài)分布表達(dá)式。
雖然正態(tài)分布的表達(dá)式最早由法國數(shù)學(xué)家棣莫弗得到,但是由于是高斯首先找到了它作為隨機(jī)誤差分布的這一重要作用,而經(jīng)過后來凱特勒(Lambert Adolphe Jacques Quetelet,1796~1874)、高爾頓(Francis Galton,1822-1911)等人的努力,使得這一認(rèn)識和正態(tài)分布的應(yīng)用廣泛滲透到了社會、經(jīng)濟(jì)和遺傳學(xué)等多個領(lǐng)域,故我們在討論對與正態(tài)分布的貢獻(xiàn)時更多的將其歸因于高斯,并稱正態(tài)分布為高斯分布,有人認(rèn)為整個19世紀(jì)的統(tǒng)計學(xué)就是正態(tài)分布應(yīng)用的擴(kuò)展。
誤差理論發(fā)展的第四個階段是著名的中心極限定理的提出和證明,它是隨機(jī)誤差正態(tài)分布的理論基礎(chǔ)。最早提出中心極限定理思想的人是發(fā)現(xiàn)了正態(tài)分布表達(dá)式的法國數(shù)學(xué)家棣莫弗(Abraham De Moivre,1667-1754),他于1733年在研究二項分布的極限情況時首先發(fā)現(xiàn)了正態(tài)分布的表達(dá)式,并由此得到了中心極限定理的最早特例,后來另外一位法國數(shù)學(xué)家拉普拉斯(Pierre-Simon de Laplace,1749-1827)于1812年完成了更一般的證明,即棣莫弗-拉普拉斯中心極限定理。而真正能夠成為誤差分布理論基礎(chǔ)的中心極限定理則是由俄國數(shù)學(xué)家李雅普諾夫(Aleksandr Mikhailovich Lyapunov,1857-1918)于1901年證明,即李雅普諾夫中心極限定理。
設(shè)隨機(jī)變量 相互獨(dú)立,且數(shù)學(xué)期望 ,方差 ,記 ,如果 滿足林德伯格條件:存在正數(shù) ,使得當(dāng) 時,有 ,則 。
中心極限定理的含義是:如果某隨機(jī)變量是由大量獨(dú)立的隨機(jī)變量綜合影響(相加)形成的,而其中每一個隨機(jī)因素對總和的影響是微小的(林德伯格條件),那么可以保證這些大量的、獨(dú)立的隨機(jī)因素的總和所形成的隨機(jī)變量總是服從正態(tài)分布。而這就很好的解釋了隨機(jī)誤差的正態(tài)分布性質(zhì):我們知道所謂(隨機(jī))誤差實(shí)際上是測量各要素的不完美所引起的各(隨機(jī))誤差因素的總和,如溫度漲落引起的隨機(jī)誤差( )、氣壓漲落引起的隨機(jī)誤差( )、視角、光線明暗、讀數(shù)時的判斷等等很多因素引起的各個隨機(jī)誤差( )……那么根據(jù)中心極限定理,總的隨機(jī)誤差( )滿足正態(tài)分布!中心極限定理被稱為概率論與數(shù)理統(tǒng)計的“首席定理”,在誤差理論中它同樣具有非常重要的作用:因?yàn)樗葟恼娼忉尯妥C明了為什么隨機(jī)誤差滿足正態(tài)分布,同時也指出很多情況下誤差合成后仍近似滿足正態(tài)分布,為誤差的合成及置信概率的確定提供了有可行性的重要指導(dǎo)。
誤差理論發(fā)展的最后一個階段是建立在現(xiàn)代概率理論建立的基礎(chǔ)上的,這是以1936年蘇聯(lián)數(shù)學(xué)家柯爾莫哥洛夫(Andrey Nikolaevich Kolmogorov,1903-1987)發(fā)表《概率論基本概念》為標(biāo)志的。因?yàn)楝F(xiàn)代概率理論不僅研究了隨機(jī)誤差所滿足的正態(tài)分布,也系統(tǒng)研究了系統(tǒng)誤差所滿足的其他各種分布如均勻分布、三角分布、反正弦分布等等。而誤差理論的基礎(chǔ)正是概率理論,核心思想就是將誤差看作隨機(jī)變量——通過研究隨機(jī)變量的各種性質(zhì)(期望、方差、方差的合成等)來研究誤差的各種性質(zhì)。
參考文獻(xiàn)
[1] 《關(guān)于托勒密和哥白尼:兩大世界體系的對話》【意】伽利略著.上海人民出版社.1974
[2] 《數(shù)理統(tǒng)計學(xué)小史》陳希儒.數(shù)理統(tǒng)計與管理.1999.1
[3] 《高斯與觀測誤差分布的發(fā)現(xiàn)》于忠義.統(tǒng)計與信息論壇.2006.11endprint
摘 要:誤差理論是測量不確定評定和一切實(shí)驗(yàn)研究的基礎(chǔ),其重要性毋庸置疑,而其本身的發(fā)展又與概率理論的發(fā)展密不可分、相互影響。
關(guān)鍵詞:誤差理論 概率論 正態(tài)分布 中心極限定理
中圖分類號:P2 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2014)02(b)-0000-00
從古人夜觀天象開始,人們在長期的觀測中很早就意識到測量不可避免會產(chǎn)生誤差;而由于真值=測量值-誤差,“得到”誤差就可以得到真值,這樣的認(rèn)識自然使得人們開始研究誤差。而縱觀誤差理論的發(fā)展史,人們會發(fā)現(xiàn)誤差理論的發(fā)展其實(shí)是與概率理論的發(fā)展密不可分、相互影響的。
較早期在著作中探討誤差各種性質(zhì)的人是近代科學(xué)及實(shí)驗(yàn)科學(xué)的奠基人伽利略(Galileo Galilei,1564-1642)。他在《關(guān)于托勒密和哥白尼:兩大世界體系的對話》(1632)中談到第谷(Tycho Brahe,1546 -1601)于1572年發(fā)現(xiàn)的一顆新星(Nova)的位置時,討論了這個問題: “薩:……首先我問你,天文學(xué)家們用他們的儀器觀測并測算諸如新星在地平線上的仰角時,是否會測算得過頭一點(diǎn),或測算得不夠一點(diǎn);這就是說,有時候把角度推算得比正確的角度高些,有時候低些?還是推算的錯誤總是朝一邊倒,以致只要發(fā)生誤差,總是過頭了一點(diǎn);或者總是不夠,而永遠(yuǎn)不會過頭?辛:毫無疑問,過與不及的兩種傾向都同樣地存在?!薄八_:……從這種地方你可以看出,所謂儀器測算上的誤差決不能從計算結(jié)果上來決定其誤差的大小,而必須根據(jù)儀器實(shí)際測量出的度和分的數(shù)目來定……”雖然伽利略當(dāng)時并沒有明確提出“隨機(jī)”和“分布”這樣的概念,但可以看出他所描述的誤差的種種性質(zhì),實(shí)際上正是我們現(xiàn)在所理解的隨機(jī)誤差的分布性質(zhì)——即所有觀測值都可以有誤差,其來源可歸因于觀測者、儀器工具以及觀測條件;觀測誤差對稱地分布在0的兩側(cè);小誤差出現(xiàn)得比大誤差更頻繁。此外他的表述中還涉及了誤差傳遞的思想。
對早期誤差理論的發(fā)展做出了重大貢獻(xiàn)的另一個人是英國數(shù)學(xué)家辛普森(Thomas Simpson,1710-1761),他的工作在他1755年寫的一封信《在應(yīng)用天文學(xué)中取若干個觀測值的平均的好處》中提出。在信里,他構(gòu)造了一個離散的誤差分布:假定在一次測量中,誤差只能取0、±1、±2、±3、±4、±5這11個值,取這些值的概率在0處最大,然后在兩邊按比例下降,直到±6處為0:即 。 根據(jù)所給的分布,可算得單次測量的誤差(絕對值)不超過1(0、±1)的概率為16/36=0.444,不超過2(0、±1、±2)的概率是24/36=0.667;為比較起見,他又計算出6次測量的平均值的誤差(即6個誤差的平均)不超過1的概率是0.725,不超過2的是0.967——易見平均值的估計優(yōu)于單個值。由此出發(fā),辛普森就首次從數(shù)學(xué)上“證明”了算數(shù)平均值的優(yōu)良性,而由于出發(fā)點(diǎn)是誤差取值的概率,辛普森也被視為是第一個將誤差理論與概率理論聯(lián)系起來的人——后面可以看到這一點(diǎn)的意義十分重大,因?yàn)檎麄€誤差理論就是建立在概率論基礎(chǔ)上的。
誤差理論發(fā)展的下一個階段就是隨機(jī)誤差的分布的確定,這眾所周知的是由大數(shù)學(xué)家高斯(Carl Friedrich Gauss,1777-1855)所完成的。1809年高斯發(fā)表了他的《繞日天體運(yùn)動的理論》一書,在此書末尾他寫了一節(jié)有關(guān)“數(shù)據(jù)結(jié)合”的問題(data combination),即:當(dāng)對同一目標(biāo)的若干次觀測結(jié)果不同時,如何處理這些數(shù)據(jù)?或如何利用觀測數(shù)據(jù)對觀測目標(biāo)的真值進(jìn)行估計?(雖然人們一直采取算術(shù)平均值的方法來處理這一問題,但并無理論根據(jù)——辛普森對此進(jìn)行了嘗試,但他所構(gòu)造的誤差分布是錯誤的)最終,高斯在書中介紹了他用來預(yù)測行星軌道的方法——最小二乘法(一維情況下即算數(shù)平均值),同時以出人意料的方法找到了隨機(jī)誤差的分布——正態(tài)分布。
設(shè)隨機(jī)誤差的概率密度函數(shù)為 , 個獨(dú)立測量值為 ,真值為 ,則對應(yīng)的 個隨機(jī)誤差為 。由于觀測是相互獨(dú)立的,因而這些誤差同時出現(xiàn)的概率為 ,對真值 的最佳估計應(yīng)使L極大(極大似然估計——由高斯首先提出,1912年被英國數(shù)學(xué)家費(fèi)歇爾所推廣)。這里高斯由最小二乘法出發(fā)認(rèn)為算數(shù)平均值 就是最佳估計——即 極大。
由
有 ,
首先令 ,并記 ,有
由于 ,因此 ;
然后令 ,其中 ,有
于是有 ;
由 的任意性(如可令 ),可推出 , 為常數(shù)。
由此可得 ,考慮到 是概率密度函數(shù),歸一化后可得正態(tài)分布表達(dá)式。
雖然正態(tài)分布的表達(dá)式最早由法國數(shù)學(xué)家棣莫弗得到,但是由于是高斯首先找到了它作為隨機(jī)誤差分布的這一重要作用,而經(jīng)過后來凱特勒(Lambert Adolphe Jacques Quetelet,1796~1874)、高爾頓(Francis Galton,1822-1911)等人的努力,使得這一認(rèn)識和正態(tài)分布的應(yīng)用廣泛滲透到了社會、經(jīng)濟(jì)和遺傳學(xué)等多個領(lǐng)域,故我們在討論對與正態(tài)分布的貢獻(xiàn)時更多的將其歸因于高斯,并稱正態(tài)分布為高斯分布,有人認(rèn)為整個19世紀(jì)的統(tǒng)計學(xué)就是正態(tài)分布應(yīng)用的擴(kuò)展。
誤差理論發(fā)展的第四個階段是著名的中心極限定理的提出和證明,它是隨機(jī)誤差正態(tài)分布的理論基礎(chǔ)。最早提出中心極限定理思想的人是發(fā)現(xiàn)了正態(tài)分布表達(dá)式的法國數(shù)學(xué)家棣莫弗(Abraham De Moivre,1667-1754),他于1733年在研究二項分布的極限情況時首先發(fā)現(xiàn)了正態(tài)分布的表達(dá)式,并由此得到了中心極限定理的最早特例,后來另外一位法國數(shù)學(xué)家拉普拉斯(Pierre-Simon de Laplace,1749-1827)于1812年完成了更一般的證明,即棣莫弗-拉普拉斯中心極限定理。而真正能夠成為誤差分布理論基礎(chǔ)的中心極限定理則是由俄國數(shù)學(xué)家李雅普諾夫(Aleksandr Mikhailovich Lyapunov,1857-1918)于1901年證明,即李雅普諾夫中心極限定理。
設(shè)隨機(jī)變量 相互獨(dú)立,且數(shù)學(xué)期望 ,方差 ,記 ,如果 滿足林德伯格條件:存在正數(shù) ,使得當(dāng) 時,有 ,則 。
中心極限定理的含義是:如果某隨機(jī)變量是由大量獨(dú)立的隨機(jī)變量綜合影響(相加)形成的,而其中每一個隨機(jī)因素對總和的影響是微小的(林德伯格條件),那么可以保證這些大量的、獨(dú)立的隨機(jī)因素的總和所形成的隨機(jī)變量總是服從正態(tài)分布。而這就很好的解釋了隨機(jī)誤差的正態(tài)分布性質(zhì):我們知道所謂(隨機(jī))誤差實(shí)際上是測量各要素的不完美所引起的各(隨機(jī))誤差因素的總和,如溫度漲落引起的隨機(jī)誤差( )、氣壓漲落引起的隨機(jī)誤差( )、視角、光線明暗、讀數(shù)時的判斷等等很多因素引起的各個隨機(jī)誤差( )……那么根據(jù)中心極限定理,總的隨機(jī)誤差( )滿足正態(tài)分布!中心極限定理被稱為概率論與數(shù)理統(tǒng)計的“首席定理”,在誤差理論中它同樣具有非常重要的作用:因?yàn)樗葟恼娼忉尯妥C明了為什么隨機(jī)誤差滿足正態(tài)分布,同時也指出很多情況下誤差合成后仍近似滿足正態(tài)分布,為誤差的合成及置信概率的確定提供了有可行性的重要指導(dǎo)。
誤差理論發(fā)展的最后一個階段是建立在現(xiàn)代概率理論建立的基礎(chǔ)上的,這是以1936年蘇聯(lián)數(shù)學(xué)家柯爾莫哥洛夫(Andrey Nikolaevich Kolmogorov,1903-1987)發(fā)表《概率論基本概念》為標(biāo)志的。因?yàn)楝F(xiàn)代概率理論不僅研究了隨機(jī)誤差所滿足的正態(tài)分布,也系統(tǒng)研究了系統(tǒng)誤差所滿足的其他各種分布如均勻分布、三角分布、反正弦分布等等。而誤差理論的基礎(chǔ)正是概率理論,核心思想就是將誤差看作隨機(jī)變量——通過研究隨機(jī)變量的各種性質(zhì)(期望、方差、方差的合成等)來研究誤差的各種性質(zhì)。
參考文獻(xiàn)
[1] 《關(guān)于托勒密和哥白尼:兩大世界體系的對話》【意】伽利略著.上海人民出版社.1974
[2] 《數(shù)理統(tǒng)計學(xué)小史》陳希儒.數(shù)理統(tǒng)計與管理.1999.1
[3] 《高斯與觀測誤差分布的發(fā)現(xiàn)》于忠義.統(tǒng)計與信息論壇.2006.11endprint