陶 紅,徐耀坤,侯臣平
(國(guó)防科技大學(xué) a.理學(xué)院;b.電子科學(xué)學(xué)院,湖南 長(zhǎng)沙 410073)
概率論與數(shù)理統(tǒng)計(jì)是一門研究隨機(jī)現(xiàn)象統(tǒng)計(jì)規(guī)律的學(xué)科,研究描述不確定性的數(shù)學(xué)模型和理論方法,可以應(yīng)用于科學(xué)研究、工程實(shí)踐、經(jīng)濟(jì)管理和人文社科等各個(gè)領(lǐng)域,是各大高校理工科專業(yè)的數(shù)學(xué)基礎(chǔ)課之一。作為隨機(jī)數(shù)學(xué)這一數(shù)學(xué)分支中學(xué)生所接觸到的第一門課,“概率論與數(shù)理統(tǒng)計(jì)”肩負(fù)著引導(dǎo)學(xué)生逐漸學(xué)會(huì)利用隨機(jī)性思維解決問(wèn)題的重任。不同于以往的確定性數(shù)學(xué)課程,學(xué)生真正掌握概率統(tǒng)計(jì)的概念與思想具有一定難度。例如,很多學(xué)生難以完全理解條件概率、條件分布、協(xié)方差與相關(guān)系數(shù)等概念及其內(nèi)涵。
數(shù)學(xué)概念反映了事物在數(shù)量關(guān)系、結(jié)構(gòu)關(guān)系、空間形式等方面的本質(zhì)屬性。數(shù)學(xué)概念教學(xué)要讓學(xué)生掌握概念的內(nèi)涵和外延,理解概念間的邏輯關(guān)系。因此,數(shù)學(xué)概念教學(xué)應(yīng)注重概念的構(gòu)建過(guò)程,通過(guò)概念的構(gòu)建過(guò)程,對(duì)學(xué)生進(jìn)行思維訓(xùn)練。讓學(xué)生在體會(huì)原理的過(guò)程中,不僅學(xué)會(huì)新概念,而且學(xué)會(huì)利用數(shù)學(xué)進(jìn)行科學(xué)研究的思維方法。也就是說(shuō),數(shù)學(xué)概念教學(xué)不能僅滿足于讓學(xué)生接受、記憶、模仿和練習(xí),更要教會(huì)學(xué)生自主探究,在自主探究的過(guò)程中發(fā)展智力、提高科學(xué)研究能力。
問(wèn)題驅(qū)動(dòng)教學(xué)模式以學(xué)生為主體,教師設(shè)置一系列問(wèn)題,引導(dǎo)學(xué)生根據(jù)問(wèn)題尋找解決方案,在解決問(wèn)題的過(guò)程中達(dá)到教學(xué)目標(biāo)。采用問(wèn)題驅(qū)動(dòng)的教學(xué)模式,有助于幫助學(xué)生了解數(shù)學(xué)概念的深刻內(nèi)涵,培養(yǎng)數(shù)學(xué)思維方式,形成應(yīng)用數(shù)學(xué)解決實(shí)際問(wèn)題的能力。本文以協(xié)方差與相關(guān)系數(shù)為例,遵循問(wèn)題驅(qū)動(dòng)的教學(xué)原理,以“實(shí)例引入—提出問(wèn)題—分析問(wèn)題—解決問(wèn)題”為主線,通過(guò)國(guó)內(nèi)生產(chǎn)總值與軍費(fèi)支出的關(guān)系分析實(shí)際案例,提出隨機(jī)變量關(guān)系描述的問(wèn)題,并采用逆向推理得到協(xié)方差的定義。在此基礎(chǔ)上,進(jìn)一步深化研究如何描述隨機(jī)變量關(guān)系的強(qiáng)弱及所研究的關(guān)系是何種關(guān)系,逐步構(gòu)建協(xié)方差與相關(guān)系數(shù)的定義與內(nèi)涵。
為減少抽象感并激發(fā)學(xué)生的學(xué)習(xí)熱情,在課程開(kāi)始時(shí)通過(guò)“國(guó)內(nèi)生產(chǎn)總值與軍費(fèi)支出的關(guān)系分析”這一實(shí)例提出問(wèn)題:如何從數(shù)字特征的角度來(lái)描述兩個(gè)隨機(jī)變量之間的關(guān)系。具體地,我國(guó)2000—2013年國(guó)內(nèi)生產(chǎn)總值(GDP)與軍費(fèi)支出數(shù)據(jù)如表1所示。GDP與軍費(fèi)支出均為隨機(jī)變量,不妨分別記為和,則(,)是二維隨機(jī)變量,(,)的幾何意義是平面上的隨機(jī)點(diǎn)。通過(guò)圖1(a)所示散點(diǎn)圖發(fā)現(xiàn),14個(gè)樣本點(diǎn)散落在一條直線附近,隨著GDP逐年增長(zhǎng),軍費(fèi)支出也逐年增長(zhǎng)??梢?jiàn),隨機(jī)變量與之間存在同向變化趨勢(shì)。從而結(jié)合本章主題提出問(wèn)題:如何從數(shù)字特征的角度來(lái)描述兩個(gè)隨機(jī)變量之間的關(guān)系。
表1 我國(guó)2000—2013年GDP與軍費(fèi)數(shù)據(jù)
圖1 GDP與軍費(fèi)支出散點(diǎn)圖
提出問(wèn)題后,讓學(xué)生思考如何從數(shù)學(xué)形式角度進(jìn)行描述。通過(guò)分析,問(wèn)題轉(zhuǎn)變?yōu)檎业揭粋€(gè)依賴于,的數(shù)字量(,),滿足:(,)≠0,則表示,之間有關(guān)系。應(yīng)如何找到滿足上述條件的數(shù)字量呢?通常學(xué)生難以從正面直接得到解決方案。于是基于逆向思維,引導(dǎo)學(xué)生從反面分析。如果存在一個(gè)數(shù)字量(,),滿足:當(dāng)隨機(jī)變量,之間沒(méi)有關(guān)系時(shí)必有(,)=0,那么利用逆否命題則可以得到:當(dāng)(,)≠0時(shí),隨機(jī)變量,之間必有關(guān)系。由逆否命題的等價(jià)性,(,)所要滿足的條件轉(zhuǎn)換為“當(dāng)隨機(jī)變量,之間沒(méi)有關(guān)系時(shí)必有(,)=0”。所謂沒(méi)有關(guān)系即相互獨(dú)立,由此引導(dǎo)學(xué)生回顧已經(jīng)學(xué)習(xí)過(guò)的數(shù)學(xué)期望與方差在隨機(jī)變量相互獨(dú)立時(shí)所具有的性質(zhì)。當(dāng),相互獨(dú)立時(shí),有E(,)=E()E(),D(+)=D()+D()。
如果令(,)=E(,)-E()E(),(,)=D(+)-(D()+D()),那么(,)與(,)均滿足我們所提的要求。應(yīng)該選擇哪一個(gè)呢?由于方差本質(zhì)上是隨機(jī)變量函數(shù)的數(shù)學(xué)期望,而且計(jì)算比數(shù)學(xué)期望更復(fù)雜,因此優(yōu)先選擇(,)。
更進(jìn)一步,為了使定義更簡(jiǎn)潔,如何將(,)=E(,)-E()E()寫(xiě)成1項(xiàng)?如果寫(xiě)成1項(xiàng),其形式上必定是,的某個(gè)函數(shù)的數(shù)學(xué)期望,即需要把E(,)-E()E()變形為,的某個(gè)函數(shù)的數(shù)學(xué)期望。由于其中涉及的,交叉項(xiàng)的期望及各自期望的乘積,啟示我們變形為E{[-E()](-E()]},進(jìn)一步驗(yàn)證確實(shí)有E{[-E()](-E()]}=E(,)-E()E()。
此時(shí),詢問(wèn)學(xué)生是不是完全得到了協(xié)方差的定義。為什么要問(wèn)這個(gè)問(wèn)題,協(xié)方差是利用數(shù)學(xué)期望定義的,而數(shù)學(xué)期望的存在需要滿足絕對(duì)收斂的條件,因此協(xié)方差存在的前提是E[-E()][-E()]<∞。由Cauchy-Schwarz不等式知,當(dāng),的方差都存在時(shí),E[-E()](-E()]<∞成立。
定義1(協(xié)方差):如果隨機(jī)變量,的方差都存在,那么稱Cov(,)=E{[-E()][-E()]}為,的協(xié)方差。
當(dāng)協(xié)方差的值非0時(shí),則隨機(jī)變量之間存在關(guān)系。按照由淺到深的思路,接下來(lái)探討如何描述關(guān)系的強(qiáng)弱程度及是什么關(guān)系。向?qū)W生提問(wèn):協(xié)方差的大小能否用來(lái)度量關(guān)系的強(qiáng)弱程度,能夠反映關(guān)系強(qiáng)弱的數(shù)字量應(yīng)具有哪些特點(diǎn)?為輔助思考,以GDP與軍費(fèi)支出為例,讓學(xué)生計(jì)算單位分別為億元和億萬(wàn)元時(shí)的樣本協(xié)方差。通過(guò)計(jì)算學(xué)生將發(fā)現(xiàn)兩種情況下的樣本協(xié)方差之間相差10倍,然而實(shí)質(zhì)上GDP與軍費(fèi)支出之間的關(guān)系并不會(huì)因金額單位的變化而變化。由此得出結(jié)論:協(xié)方差不能用于度量關(guān)系的強(qiáng)弱程度。事實(shí)上,由協(xié)方差的定義可驗(yàn)證,對(duì)于常數(shù),,Cov(,)=Cov(,)。顯然,協(xié)方差是一個(gè)受量綱影響的數(shù)字量。
于是,能夠反映關(guān)系強(qiáng)弱的數(shù)字量應(yīng)具有不受量綱影響(條件1)的特點(diǎn)。除此之外,還應(yīng)具有什么特點(diǎn)?提及強(qiáng)弱實(shí)質(zhì)上是為了比較,因此數(shù)字量的取值應(yīng)該是限定在一定范圍內(nèi)(條件2),而且取值隨著關(guān)系的強(qiáng)弱單調(diào)變化(條件3)。
從構(gòu)建相關(guān)系數(shù)定義的過(guò)程可知ρ不受量綱影響且取值在[-1,1]。但仍沒(méi)有揭示ρ的大小如何反映,何種關(guān)系的強(qiáng)弱。為此以常見(jiàn)的二維均勻分布與二維正態(tài)分布為例,利用Matlab動(dòng)畫(huà)演示當(dāng)上述兩個(gè)總體的相關(guān)系數(shù)從-1增加到1時(shí)樣本點(diǎn)散點(diǎn)圖的變化趨勢(shì),以此來(lái)發(fā)現(xiàn)ρ的大小與,之間關(guān)系強(qiáng)弱的對(duì)應(yīng)關(guān)系,并探索ρ描述的是,之間的何種關(guān)系。具體地,所采用的二維均勻分布與二維正態(tài)分布的概率密度函數(shù)分別為
由此可得到如下結(jié)論:(1)|ρ|≤1。(2)|ρ|越大,則+與之間的均方誤差越小,即與之間的線性關(guān)系越強(qiáng);反之,則與之間的線性關(guān)系越弱。并且,結(jié)合圖形(圖2)可知,當(dāng)ρ>0時(shí),與整體上具有同向變化趨勢(shì);當(dāng)ρ<0時(shí),與整體上具有反向變化趨勢(shì);當(dāng)ρ=0時(shí),與之間沒(méi)有線性關(guān)系,稱為與不相關(guān)。
圖2 二維均勻分布和二維正態(tài)分布總體相關(guān)系數(shù)變化時(shí)樣本點(diǎn)的散點(diǎn)圖
數(shù)學(xué)概念在數(shù)學(xué)課程中的基礎(chǔ),為于課程體系的理解具有非常重要的作用。本文以概率論與數(shù)理統(tǒng)計(jì)中協(xié)方差與相關(guān)系數(shù)概念為例,遵循“以問(wèn)題結(jié)構(gòu)推進(jìn)教學(xué)”的原理,圍繞隨機(jī)變量之間關(guān)系描述這一主題,提出一系列層層遞進(jìn)、步步深入、具有內(nèi)在邏輯聯(lián)系的問(wèn)題,形成“問(wèn)題—解決—問(wèn)題—解決……”的問(wèn)題導(dǎo)向結(jié)構(gòu)教學(xué)過(guò)程,建構(gòu)出協(xié)方差與相關(guān)系數(shù)的概念。在此過(guò)程中,引導(dǎo)學(xué)生探索、深究,有助于學(xué)生形成自主探究的思維模式和提升發(fā)現(xiàn)問(wèn)題、分析問(wèn)題和解決問(wèn)題的能力。