□李金昌
數(shù)據(jù)作為人們用來刻畫事物或現(xiàn)象特征的一種語言,始終受到社會的關(guān)注。作為“數(shù)據(jù)之美”的姊妹篇,我今天談一談數(shù)據(jù)之妙。如果說數(shù)據(jù)之美來自于真實(shí)之美,那么數(shù)據(jù)之妙同樣來自于真實(shí)之妙。
我們先來看一個(gè)奇妙的數(shù)據(jù),它就是圓周率π。大家都知道,圓周率π 是一個(gè)數(shù)學(xué)常數(shù),其奇妙之處在于不論圓大圓小,它始終是圓周長與直徑之比(或者圓面積與半徑平方之比)。這一特性決定了它不僅是一個(gè)常數(shù),同時(shí)也是一個(gè)客觀存在的真實(shí)數(shù)據(jù)。然而,它卻是一個(gè)無限不循環(huán)的無理數(shù)。我國古代數(shù)學(xué)家祖沖之第一個(gè)把圓周率精確到小數(shù)點(diǎn)之后的第7位,即推算出π 在3.1415926 與3.1415927 之間。據(jù)說,如今借助現(xiàn)代信息技術(shù)已經(jīng)把它推算到了小數(shù)點(diǎn)之后31 萬億多位。有人認(rèn)為,這個(gè)世界本來就是圓形(球型)的,所有的物體都是圓形或者是圓形的變體,事實(shí)上π也代表弧度180 度。那這是否意味世界萬變不離π 之宗或者說π 決定著世界的一切?我認(rèn)為不能排除這種可能性,因?yàn)槌巳呛瘮?shù),還有很多函數(shù)都與π 有關(guān),例如斯特林近似公式、伽馬函數(shù)、歐拉恒等式等。緊隨著π 的還有另一個(gè)奇妙的常數(shù),那就是e。限于篇幅,對e不展開討論。
我曾經(jīng)寫過一篇短文,“神奇的正態(tài)分布”。正態(tài)分布之所以神奇,是因?yàn)楸澈笥凶鳛橹我罁?jù)的奇妙的數(shù)據(jù):天文觀察誤差數(shù)據(jù)奇妙地展示出了以均值為中心、頻次左右對稱并依次漸進(jìn)遞減的分布特征。正態(tài)密度函數(shù)恰恰就與π、e這兩個(gè)常數(shù)有關(guān)。為什么天文觀察誤差數(shù)據(jù)會有這樣的分布?為什么現(xiàn)實(shí)生活中的許多現(xiàn)象都有類似的數(shù)據(jù)分布(例如人的身高分布、考試成績分布等)?我想,這就是由偶然性與必然性共同決定的現(xiàn)實(shí)數(shù)據(jù)的奇妙之處。正因?yàn)閿?shù)據(jù)是真實(shí)的、不是人為刻意設(shè)定的,所以它所體現(xiàn)的事物特征才是令人稱奇的。再如,我們所熟知的回歸現(xiàn)象,也同樣來源于對真實(shí)數(shù)據(jù)的觀察和研究,因?yàn)楦复c子代身高數(shù)據(jù)(還有豌豆顆粒大小實(shí)驗(yàn)數(shù)據(jù))奇妙地呈現(xiàn)出了子代身高向平均身高回歸而不是往越來越高或越來越矮方向發(fā)展的趨勢?;趯ΜF(xiàn)實(shí)數(shù)據(jù)研究得出的有意思的統(tǒng)計(jì)結(jié)論還有恩格爾系數(shù)、基尼系數(shù)等,恩格爾系數(shù)能恰如其分地刻畫出居民(家庭)的生活消費(fèi)水平,而基尼系數(shù)則能比較客觀地體現(xiàn)出居民的收入分配差距。有專家還特意對基尼系數(shù)的最佳取值進(jìn)行了研究,推導(dǎo)的結(jié)果為1/3,是一個(gè)無限循環(huán)小數(shù)。此外,黃金分割點(diǎn)0.618,二八定律、帕萊托最優(yōu)等等,都蘊(yùn)含著無窮的數(shù)據(jù)之美和神奇力量。
在現(xiàn)實(shí)中,很多數(shù)據(jù)都是人們所熱切期待的,例如希望GDP 越大越好、萬元GDP 能耗越小越好等等。但天上不會掉餡餅,所有的收獲都源于勞動(dòng)與付出。大于1 的數(shù)據(jù),哪怕再小,在n 次方以后就會變得很大;小于1 的數(shù)據(jù),哪怕再大,n 次方以后也會趨向于0。這雖然只是一個(gè)數(shù)學(xué)道理,但卻是真實(shí)的生活寫照:人們只要每天都多努力一點(diǎn),就會有越來越多的收獲;相反如果不努力,每天都多偷懶一點(diǎn),就會坐吃山空。事實(shí)上,大量統(tǒng)計(jì)數(shù)據(jù)所揭示的就是勞動(dòng)與財(cái)富、投入與產(chǎn)出之間的奇妙的關(guān)系。這樣的關(guān)系延伸開來,就是人類至死不渝所追求的事物之間的相關(guān)關(guān)系進(jìn)而因果關(guān)系,其中基于數(shù)據(jù)對此開展的研究就是統(tǒng)計(jì)學(xué)的核心任務(wù)。
有誰能否認(rèn)用于揭示事物之間內(nèi)在聯(lián)系關(guān)系的數(shù)據(jù)是如此的重要?它不僅美而且妙。也正因?yàn)槿绱?,我們要尊重?cái)?shù)據(jù)、敬畏數(shù)據(jù),不能盲目追求數(shù)據(jù)!所有的數(shù)據(jù)都有合理的區(qū)間,不存在絕對越大越好或越小越好的數(shù)據(jù)!如果數(shù)據(jù)跨越了合理的界限(符合規(guī)律的量變引起質(zhì)變除外),那么它告訴你的就不是事實(shí)的真相而是蒙蔽了我們的雙眼?;蛟S,數(shù)據(jù)的最奇妙之處就在這里!