林智海
摘 要:統(tǒng)計(jì)學(xué)是在數(shù)據(jù)的收集、加工、處理等過(guò)程后,描述客觀現(xiàn)象的數(shù)據(jù)特征和關(guān)系的方法論學(xué)科。由于統(tǒng)計(jì)學(xué)的定量和定性地研究準(zhǔn)確而客觀的特點(diǎn),所以被現(xiàn)代社會(huì)廣泛應(yīng)用于自然科學(xué)和社會(huì)科學(xué)的各個(gè)領(lǐng)域。在目前的數(shù)據(jù)時(shí)代背景下,研究統(tǒng)計(jì)學(xué)不單純只是從經(jīng)濟(jì)體系中的數(shù)字計(jì)算方面入手,研究的意義也遠(yuǎn)超過(guò)了經(jīng)濟(jì)學(xué)的定義范疇。
關(guān)鍵詞:統(tǒng)計(jì)學(xué) 架構(gòu) 實(shí)驗(yàn) 概率
本文將剖析統(tǒng)計(jì)學(xué)的知識(shí)架構(gòu),從時(shí)間性上統(tǒng)計(jì)學(xué)可分古典統(tǒng)計(jì)學(xué)和現(xiàn)代統(tǒng)計(jì)學(xué),從操作特點(diǎn)上實(shí)驗(yàn)型統(tǒng)計(jì)和計(jì)算機(jī)數(shù)據(jù)統(tǒng)計(jì),從數(shù)學(xué)角度來(lái)看可分為精確數(shù)學(xué)的“=”范疇和模糊數(shù)學(xué)的“≈”范疇,但無(wú)論何種分法,從本質(zhì)上來(lái)看,統(tǒng)計(jì)學(xué)都是屬于數(shù)學(xué)的學(xué)科體系中的一個(gè)重要組成部分。本文從現(xiàn)代數(shù)據(jù)科學(xué)的角度闡釋統(tǒng)計(jì)學(xué)為三大部分:實(shí)驗(yàn)型的概率分析、精確型統(tǒng)計(jì)分析和隨機(jī)型(模糊型)統(tǒng)計(jì)分析。
首先實(shí)驗(yàn)型的概率分析是構(gòu)建在古典概率學(xué)基礎(chǔ)之上,由排列學(xué)、組合學(xué)和條件概率部分組成,學(xué)生在完成實(shí)驗(yàn)型概率模型一般可通過(guò)傳統(tǒng)的紙質(zhì)完成分析任務(wù)。在區(qū)別排列學(xué)和組合學(xué)時(shí),應(yīng)注意排列是順序取,雙向式的數(shù)學(xué)模型,而組合學(xué)則是一把抓,單向式的數(shù)學(xué)模型,另外對(duì)有放回和無(wú)放回的模型、加法與乘法原理的實(shí)驗(yàn)也比較豐富。學(xué)生可從N雙鞋子,取M只,至少有N只配對(duì)成功概率的實(shí)驗(yàn)、拋硬幣概率實(shí)驗(yàn)、搖骰子概率實(shí)驗(yàn)、同花順概率實(shí)驗(yàn)等等進(jìn)行學(xué)習(xí)和研究。
古典概率的另外一塊重要的分支是條件型的實(shí)驗(yàn),學(xué)生先從全概率公式,條件概率的理解及貝葉斯公式的推導(dǎo)進(jìn)入學(xué)習(xí),對(duì)一些經(jīng)典條件概率實(shí)驗(yàn)如同天生日概率實(shí)驗(yàn)、三門概率實(shí)驗(yàn)、取M只,至少有N只配對(duì)成功概率的實(shí)驗(yàn)等進(jìn)行深入學(xué)習(xí),同學(xué)們分別從組合學(xué)和二項(xiàng)式定理推導(dǎo)出拋硬幣實(shí)驗(yàn)的結(jié)論,加深對(duì)概率學(xué)的理解和應(yīng)用,最后由二項(xiàng)式定理到二項(xiàng)式分布,由概率統(tǒng)計(jì)到概率分布的初步過(guò)渡。
古典概率學(xué)本質(zhì)上是精確數(shù)學(xué)的領(lǐng)域,是研究客觀存在對(duì)象在具體量化時(shí)的個(gè)體與整體之間的權(quán)重比例關(guān)系。學(xué)生學(xué)習(xí)這方面知識(shí)內(nèi)容一般可通過(guò)傳統(tǒng)教學(xué)和傳統(tǒng)學(xué)具完成,在學(xué)習(xí)過(guò)程中,可達(dá)到強(qiáng)化學(xué)生的數(shù)理邏輯思維和提高學(xué)生的動(dòng)手能力的目的。
其次,精確統(tǒng)計(jì)分析是現(xiàn)代統(tǒng)計(jì)學(xué)的雛形是以研究平均值為標(biāo)準(zhǔn)的計(jì)算機(jī)操作型的數(shù)據(jù)科學(xué),操作的載體由傳統(tǒng)紙筆書(shū)寫(xiě)升級(jí)為現(xiàn)代計(jì)算機(jī)實(shí)驗(yàn)操作,但本質(zhì)上而言,還是研究的還是數(shù)學(xué)中的精確型的數(shù)據(jù)內(nèi)容。
精確型的統(tǒng)計(jì)分析一般由統(tǒng)計(jì)中最基本的計(jì)數(shù)算法進(jìn)入,計(jì)數(shù)的導(dǎo)向可分兩個(gè)方向:
一是計(jì)數(shù)本質(zhì)上是位的運(yùn)算,配合值運(yùn)算中的求和值,平均值的意義是實(shí)現(xiàn)了數(shù)值與數(shù)位的統(tǒng)一運(yùn)算,用數(shù)形結(jié)合的雙標(biāo)法的描述是位于中線位置的值與位。由此延伸到不在中線位置的值與位的統(tǒng)一算法是:坐標(biāo)軸上“值的比例=位的比例”,這種算法就是加權(quán)算法的內(nèi)在核心,同時(shí)也指導(dǎo)了分類變量(也成組數(shù)據(jù))運(yùn)算過(guò)程。當(dāng)然值運(yùn)算的本身也包含了許多算法:求和、最大值、最小值、取整、求余等等;位運(yùn)算包含了連續(xù)變量的計(jì)數(shù)、分類變量的頻數(shù),眾數(shù)、中位、分位;位與值的統(tǒng)一運(yùn)算:算術(shù)平均值,中位值、分位值。
二是從連續(xù)變量的計(jì)數(shù)到分類變量的頻數(shù),在具體算法中,確定出頻率=當(dāng)前頻數(shù)/總頻數(shù),由頻率與概率、權(quán)重、比例的本質(zhì)關(guān)系統(tǒng)一。
上述中的計(jì)數(shù)、頻數(shù)、連續(xù)變量、分類變量、值運(yùn)算、位運(yùn)算、值與位統(tǒng)一運(yùn)算和加權(quán)計(jì)算都屬于絕對(duì)分析的范疇,還有相對(duì)分析(或稱差異分析),其中包含了極差,四分位差,全距,異眾比率,平均差(差的絕對(duì)值),方差(差的平方),標(biāo)準(zhǔn)差,離散系數(shù)等內(nèi)容,因此由絕對(duì)分析和相對(duì)分析兩大模塊內(nèi)容共同構(gòu)成了靜態(tài)平均分析的主體部分。
精確統(tǒng)計(jì)分析除了靜態(tài)的平均分析以外,另一部分則由動(dòng)態(tài)平均分析構(gòu)成,其研究的主體是以時(shí)間序列為主要對(duì)象,時(shí)間序列的算法本質(zhì)是還是加權(quán)算法,同樣可由數(shù)形結(jié)合的雙標(biāo)法完成分析過(guò)程,其中包含了以下幾個(gè)方面:時(shí)期序列的序時(shí)平均數(shù)、間隔相等的連續(xù)時(shí)點(diǎn)序列、間隔不等的連續(xù)時(shí)點(diǎn)序列、間隔相等的間斷時(shí)點(diǎn)序列、相對(duì)時(shí)間序列除此之外,動(dòng)態(tài)平均分析還通過(guò)相對(duì)減法和相對(duì)除法方式完成增長(zhǎng)分析和速度分析
第三部分,也是現(xiàn)代統(tǒng)計(jì)學(xué)的核心,建立在研究隨機(jī)變量上的模糊數(shù)學(xué)范疇,模糊數(shù)學(xué)的構(gòu)建基石是以平均值為入口點(diǎn),因此我們學(xué)習(xí)的切入點(diǎn),從隨機(jī)變量的穩(wěn)定性實(shí)驗(yàn)中,由差的絕對(duì)值(平均差)和差的平方(方差)的幾何意義開(kāi)始導(dǎo)入回歸概念,由水平線性的差的平方進(jìn)入到任意線性的差的平方,即線性回歸。
從線性回歸進(jìn)入學(xué)習(xí)回歸分析,在方差的理解上,結(jié)合回歸核心算法內(nèi)容:最小二乘法。在具體學(xué)習(xí)過(guò)程中,我們可分別通過(guò)公式法、規(guī)劃求解法、圖表展示法和線性函數(shù)法來(lái)學(xué)習(xí)最小二乘值的計(jì)算,在由一元線性回歸轉(zhuǎn)入二元線性回歸的學(xué)習(xí),其中公式法是學(xué)習(xí)重中之重,通過(guò)公式求自由度df、回歸方SSR、殘差方SSE、離差方SST、擬合度R、線性關(guān)系F檢驗(yàn),線性關(guān)系T檢驗(yàn)、、置信區(qū)間公式計(jì)算。
由擬合度R可以轉(zhuǎn)入對(duì)相關(guān)分析的具體學(xué)習(xí)模塊,由線性關(guān)系F檢驗(yàn)和線性關(guān)系T檢驗(yàn)轉(zhuǎn)入對(duì)假設(shè)檢驗(yàn)的具體學(xué)習(xí)模塊,由置信區(qū)間的計(jì)算轉(zhuǎn)入對(duì)參數(shù)估計(jì)的具體學(xué)習(xí)模塊,由回歸方SSR、殘差方SSE和離差方SST轉(zhuǎn)入對(duì)方差分析的具體學(xué)習(xí)模塊。
總體上看,統(tǒng)計(jì)學(xué)架構(gòu)在傳統(tǒng)數(shù)學(xué)和應(yīng)用數(shù)學(xué)上,載體分別由紙質(zhì)和計(jì)算機(jī)完成。傳統(tǒng)的統(tǒng)計(jì)學(xué)部分分別以組合排列學(xué)和條件概率為基礎(chǔ)的概率學(xué),案例取自傳統(tǒng)的概率經(jīng)典實(shí)驗(yàn)?,F(xiàn)代的統(tǒng)計(jì)學(xué)要基于計(jì)算機(jī)技術(shù)上的應(yīng)用型數(shù)學(xué)的研究,分別從精確和模糊數(shù)學(xué)角度進(jìn)行展開(kāi)。在精確數(shù)學(xué)角度方面,確認(rèn)以平均值為核心的研究方法,結(jié)合絕對(duì)與相對(duì)的思維,位與值的統(tǒng)一思想,加權(quán)算法、數(shù)形結(jié)合的雙標(biāo)法應(yīng)用;在模糊數(shù)學(xué)角度方面,應(yīng)用型隨機(jī)數(shù)學(xué)的開(kāi)篇從穩(wěn)定性實(shí)驗(yàn)闡釋差的絕對(duì)值和差的平方進(jìn)入,以采用最小二乘算法的回歸內(nèi)容為核心,采用了公式法,規(guī)劃法、圖形法和函數(shù)法來(lái)剖析各個(gè)參數(shù)的具體操作和意義,并由此進(jìn)入現(xiàn)代統(tǒng)計(jì)的各個(gè)模塊的學(xué)習(xí)。最后,在統(tǒng)計(jì)學(xué)的實(shí)際教學(xué)過(guò)程中,可分上下學(xué)期,上學(xué)期教授的主要內(nèi)容以概率學(xué)和精確統(tǒng)計(jì)分析為研究的主要內(nèi)容,下學(xué)期則以研究隨機(jī)變量的模糊統(tǒng)計(jì)分析進(jìn)行展開(kāi)。