戴 婷
(湖南工程學(xué)院 理學(xué)院,湖南 湘潭 411104)
數(shù)學(xué)建模思想在回歸分析中的應(yīng)用
戴 婷
(湖南工程學(xué)院 理學(xué)院,湖南 湘潭 411104)
以應(yīng)用回歸分析課程為例,探討了數(shù)學(xué)建模思想和統(tǒng)計(jì)學(xué)專業(yè)教學(xué)之間的關(guān)系.把數(shù)學(xué)建模融入統(tǒng)計(jì)學(xué)專業(yè)教學(xué),是培養(yǎng)學(xué)生應(yīng)用能力的有效途徑,也是我們當(dāng)前統(tǒng)計(jì)專業(yè)教學(xué)教改的一個(gè)方向.
回歸分析;數(shù)學(xué)建模;實(shí)踐
統(tǒng)計(jì)學(xué)是門獨(dú)立的應(yīng)用型學(xué)科.在我國(guó)統(tǒng)計(jì)學(xué)專業(yè)的發(fā)展僅有二十余年的歷史,曾有過社會(huì)統(tǒng)計(jì)與數(shù)理統(tǒng)計(jì)的分歧.就統(tǒng)計(jì)教學(xué)來說,既要打好堅(jiān)實(shí)的理論基礎(chǔ),也要把學(xué)科的應(yīng)用特色體現(xiàn)出來.以往的統(tǒng)計(jì)學(xué)教學(xué)注重理論方法的教授,而在實(shí)際應(yīng)用上略顯薄弱.學(xué)生在課后只會(huì)解答簡(jiǎn)單的習(xí)題,不能應(yīng)用到實(shí)際的案例當(dāng)中,不能將所學(xué)知識(shí)活學(xué)活用.這違背了學(xué)校培養(yǎng)應(yīng)用型人才的辦學(xué)宗旨.近年來,我們針對(duì)這一情況將數(shù)學(xué)建模思想引入統(tǒng)計(jì)學(xué)專業(yè)教學(xué),將理論方法通過實(shí)踐教學(xué)的途徑轉(zhuǎn)化為實(shí)際應(yīng)用能力.下面就以應(yīng)用回歸分析這門課程為例,談?wù)勅绾伟褦?shù)學(xué)建模思想融入專業(yè)教學(xué),如何提高學(xué)生的應(yīng)用能力.
回歸是19世紀(jì)的英國(guó)科學(xué)家高爾頓首次提出的.1870年,他在分析父代與子代的身高問題時(shí),通過數(shù)據(jù)調(diào)查并整理,發(fā)現(xiàn)無論父代身高高或矮,子代身高都有趨向平均身高的趨勢(shì),他把這種現(xiàn)象稱做回歸.而后回歸分析逐漸發(fā)展并成為現(xiàn)代統(tǒng)計(jì)重要的基礎(chǔ)方法.這門課程也是統(tǒng)計(jì)學(xué)專業(yè)一門重要的基礎(chǔ)課.經(jīng)典回歸分析的基礎(chǔ)理論分為最小二乘法、違背假設(shè)的情況、自變量的選擇和多重共線性四個(gè)部分.在課堂上,學(xué)生能夠掌握回歸方程的求解,卻往往不清楚回歸模型的建立的適用條件.在解題過程中,學(xué)生能夠按照要求順利的求解回歸方程,也能夠得到檢驗(yàn)結(jié)果,但不能解釋回歸系數(shù)的含義,甚至在面對(duì)數(shù)據(jù)時(shí)并不知運(yùn)用何種方法建模求解.對(duì)數(shù)據(jù)本身特點(diǎn)和結(jié)構(gòu)不敏感,不能自主的提出模型并解之.
統(tǒng)計(jì)學(xué)一般隸屬于理學(xué)院,因而統(tǒng)計(jì)學(xué)專業(yè)的學(xué)生經(jīng)常以數(shù)學(xué)思維看待問題,也就是任何問題只有一個(gè)最優(yōu)解或唯一解.但統(tǒng)計(jì)和數(shù)學(xué)思維不同,問題的解決方案并不唯一,任何能夠解決問題的方案都是可行的.對(duì)問題有充分認(rèn)識(shí),方能在不同模型之中找到最優(yōu)的解決方法.
二十世紀(jì)八十年代美國(guó)興起的大學(xué)生數(shù)學(xué)建模比賽,讓人們看到了數(shù)學(xué)與應(yīng)用學(xué)科之間緊密的聯(lián)系.我國(guó)也于二十世紀(jì)九十年代引入了該比賽,旨在激發(fā)我國(guó)學(xué)生對(duì)數(shù)學(xué)的熱愛和興趣,培養(yǎng)學(xué)生的實(shí)踐應(yīng)用能力.數(shù)學(xué)建模不同于課堂上學(xué)生單純接受知識(shí).在數(shù)學(xué)建模的過程中,學(xué)生面對(duì)出題者給出的實(shí)際問題及數(shù)據(jù),要根據(jù)題目本身的專業(yè)背景,結(jié)合數(shù)學(xué)知識(shí),給出基本假設(shè),設(shè)計(jì)解決方案并解之.通常需要來自不同專業(yè)的學(xué)生相互合作才能圓滿完成.整個(gè)過程對(duì)學(xué)生的知識(shí)運(yùn)用能力進(jìn)行考察,需要有全局意識(shí),能夠找到實(shí)際問題與所學(xué)知識(shí)的契合點(diǎn),查找參考文獻(xiàn)弄清問題本質(zhì),下手設(shè)計(jì)解決方案.建模的方法是千秋各異的,用到的知識(shí)也可能不同,只要能合理的解決問題,就視為建模成功.這也正是數(shù)學(xué)建模的魅力所在.這種方式能夠開拓思維,打開視野,積極尋找解決問題的方案,是理論應(yīng)用實(shí)踐的好途徑.這種思維模式對(duì)學(xué)生的鍛煉是很有好處的,是把所學(xué)知識(shí)活學(xué)活用的好方法.
近幾年來,數(shù)學(xué)建模和海量數(shù)據(jù)結(jié)合得越來越緊密.越來越多的統(tǒng)計(jì)學(xué)專業(yè)學(xué)生加入到建模隊(duì)伍中來.例如2007年的A題,中國(guó)人口增長(zhǎng)預(yù)測(cè),在題中給出了大量數(shù)據(jù),涉及到抽樣技術(shù),數(shù)據(jù)整理,數(shù)據(jù)信息提煉等基本統(tǒng)計(jì)方法,還可運(yùn)用統(tǒng)計(jì)模型對(duì)其進(jìn)行建模,進(jìn)行預(yù)測(cè)分析.再如2008年的B題,高等教育學(xué)費(fèi)標(biāo)準(zhǔn)探討.參賽者的成功方案之一就是收集數(shù)據(jù),對(duì)近年來的數(shù)據(jù)分析,建立指標(biāo)體系,運(yùn)用多元統(tǒng)計(jì)方法建模,并給出學(xué)費(fèi)標(biāo)準(zhǔn)方案.
海量數(shù)據(jù)是現(xiàn)在科技發(fā)展的一種重要媒介.以往在非計(jì)算機(jī)時(shí)代,數(shù)據(jù)量較小,科學(xué)家對(duì)技術(shù)的研究偏重理論方面,構(gòu)建的也是理論模型.而今隨著計(jì)算機(jī)的高速發(fā)展,數(shù)據(jù)的處理變得便捷,通過對(duì)相關(guān)數(shù)據(jù)的分析找到事物發(fā)展的內(nèi)在規(guī)律是一種行之有效的方法.因此數(shù)據(jù)的處理變得尤為重要.在統(tǒng)計(jì)教學(xué)中,不僅要抓好理論學(xué)習(xí),數(shù)據(jù)的處理等實(shí)踐方面愈顯重要,而數(shù)學(xué)建模提供了這樣的平臺(tái).
基本假設(shè)是統(tǒng)計(jì)模型和數(shù)學(xué)建模的首要問題,沒有基本假設(shè)就無法將一個(gè)實(shí)際問題投射到一個(gè)理論模型上去,基本假設(shè)是建模的前提,它的合理性關(guān)乎模型的合理性.回歸分析模型是成熟的模型,基本假設(shè)是課堂上首要介紹的內(nèi)容,而其中最重要的就是對(duì)隨機(jī)誤差iε的假設(shè).假設(shè)iε是等方差不相關(guān)的,以0為均值.但隨機(jī)誤差是什么?為何如此重要?下面以火災(zāi)損失為例.
表1 火災(zāi)損失表
表1是一份火災(zāi)損失的有關(guān)數(shù)據(jù).學(xué)生見到數(shù)據(jù),能夠判斷出火災(zāi)損失和據(jù)消防站距離是成正比的,卻不能得出基本假設(shè)的必要性也不能理解假設(shè)和實(shí)例的關(guān)系,我們采用圖形進(jìn)一步展示.
圖1
圖1中的散點(diǎn)是根據(jù)表1的實(shí)際測(cè)量數(shù)據(jù)繪制的二維圖.我們根據(jù)統(tǒng)計(jì)理論得出x和y具有線性依存關(guān)系的結(jié)論,x是因,y是果.y的大小主要由x的值控制.將這種客觀的內(nèi)在關(guān)系用圖中的實(shí)直線來表示,這條直線目前是未知的.直線關(guān)系是客觀存在的內(nèi)在規(guī)律,但學(xué)生發(fā)現(xiàn)實(shí)際數(shù)據(jù)并不能每次恰好分布在直線上.是否弄錯(cuò)了它們的線性關(guān)系呢?我們可以提問,若線性關(guān)系為真,誤差是如何出現(xiàn)的?由于各種隨機(jī)的偶然誤差,例如發(fā)車的快慢,風(fēng)力的大小等這些條件并不相同,會(huì)出現(xiàn)圖1中實(shí)際數(shù)據(jù)偏離直線的結(jié)果.我們把這些非決定性因素造成的偏差統(tǒng)稱為隨機(jī)誤差iε,根據(jù)這些因素的概率特性,我們合理的假設(shè)它的統(tǒng)計(jì)性質(zhì),即等方差不相關(guān)的假設(shè).
通過這樣的分析,學(xué)生對(duì)這個(gè)問題有了深刻的認(rèn)識(shí),也了解到基本假設(shè)合理的重要性.
有了基本假設(shè)之后,是建模及其求解.從以上的分析我們假定x和y的線性關(guān)系即上圖的直線是理論上客觀存在的,那么這條直線y=ax+b就是我們要找的模型.問題的焦點(diǎn)集中在系數(shù)a和b的求解上.這時(shí)可以引導(dǎo)學(xué)生思考,這樣的直線是唯一的嗎?如何才能合理的找到最佳的一條直線?隨后可簡(jiǎn)單介紹一下誤差控制思想或者方差思想在統(tǒng)計(jì)學(xué)中的重要性,自然的我們就能得出可以以達(dá)到最小誤差為控制條件來確定最優(yōu)的直線方程了.再經(jīng)過一些技術(shù)上的處理,最小二乘法的思想被引出來:
模型的驗(yàn)證在建模過程中至關(guān)重要.沒有驗(yàn)證就無法證明模型的可靠性穩(wěn)定性.統(tǒng)計(jì)方法和數(shù)學(xué)建模在這個(gè)問題上的認(rèn)識(shí)是一致的.就上例,驗(yàn)證的內(nèi)容分為幾個(gè)方面:基本假設(shè)是否滿足;數(shù)據(jù)的擬合是否理想;模型本身和兩個(gè)系數(shù)是否能在實(shí)際應(yīng)用中得到解釋等.這些涉及到統(tǒng)計(jì)中的檢驗(yàn)思想,可以以概率論中的假設(shè)檢驗(yàn)為切入點(diǎn)詳細(xì)敘述.
通過舉例可以看到數(shù)學(xué)建模與統(tǒng)計(jì)方法的構(gòu)建基本上程序是一致的,因?yàn)閿?shù)學(xué)建模和統(tǒng)計(jì)方法都是知識(shí)的應(yīng)用過程.數(shù)學(xué)建模是直面問題,學(xué)生自己按照問題的性質(zhì)提出假設(shè),建立模型,求解模型和檢驗(yàn)?zāi)P?而統(tǒng)計(jì)方法也是這么一個(gè)過程,不過統(tǒng)計(jì)方法是已成的方法,我們需要的是向?qū)W生展示這個(gè)過程.因此,在統(tǒng)計(jì)教學(xué)上,可以預(yù)先簡(jiǎn)單介紹數(shù)學(xué)建模的思想及過程,舉些簡(jiǎn)單直觀的案例加強(qiáng)理解.有條件的話也可開設(shè)這門課程.在統(tǒng)計(jì)專業(yè)中,以啟發(fā)式教學(xué)為主,以數(shù)學(xué)建模的思路探究統(tǒng)計(jì)方法,搭建一座聯(lián)系理論和實(shí)際應(yīng)用的橋梁.
我們?cè)谖幕刭|(zhì)選修課中開設(shè)數(shù)學(xué)建模課程,并針對(duì)統(tǒng)計(jì)學(xué)專業(yè)學(xué)生進(jìn)行數(shù)學(xué)建模的培訓(xùn)課程,激發(fā)了學(xué)生解決實(shí)際問題的興趣和積極性.另外一方面,鼓勵(lì)學(xué)生參加數(shù)學(xué)建模大賽.由于數(shù)學(xué)建模思維的自由,方法的靈活多變,學(xué)生的創(chuàng)新能力得到了提高,在比賽過程中得到了很好的鍛煉,也取得了一些成績(jī).
數(shù)學(xué)建模在鍛煉學(xué)生理論應(yīng)用實(shí)踐方面起到了啟發(fā)作用,也是培養(yǎng)學(xué)生對(duì)統(tǒng)計(jì)方法理論的理解和掌握,并能自主建模解決問題的良好途徑.在教學(xué)過程中,培養(yǎng)建模的思維方式,強(qiáng)化理論與實(shí)際的聯(lián)系,能夠?qū)W以致用,這才是我們教學(xué)的目標(biāo).
[1]方開泰.統(tǒng)計(jì)教育的改革與信息化[A].大學(xué)數(shù)學(xué)課程報(bào)告論壇論文集,2009
[2]譚永基.將數(shù)學(xué)建模思想融入通識(shí)教育數(shù)學(xué)核心課程[A].大學(xué)數(shù)學(xué)課程報(bào)告論壇論文集,2008
[3]肖桃鳳,羅菊蘭,柳 毅.應(yīng)用型統(tǒng)計(jì)人才培養(yǎng)教育的新模式[J].統(tǒng)計(jì)與決策,2006,(7):50~51
[4]師振華.統(tǒng)計(jì)學(xué)案例教學(xué)研究初探[J].山西統(tǒng)計(jì),2002,(5):10~11
[5]李金昌.關(guān)于統(tǒng)計(jì)學(xué)專業(yè)本科教學(xué)的幾點(diǎn)思考[J].統(tǒng)計(jì)教育,2005,(5):4~6
The Application of Mathematical Modeling in Regression Analysis
DAI Ting
(College of Mathematics and Physics,Hunan Institute of Engineering,Xiangtan 411104,China)
Taking Applied Regression Analysis as a case,this paper researches the relationship between the idea of mathematical modeling and statistical course.It is an effective way to train students' ability to practice that let the idea of mathematical modeling integrate into statistical course,which is also a direction of teaching reform on our current statistical course.
regression analysis;mathematical modeling;practice
G642.4
A
1672-5298(2011)01-0086-03
2010-10-12
戴 婷(1983- ),女,湖南茶陵人,湖南工程學(xué)院理學(xué)院講師.主要研究方向:應(yīng)用統(tǒng)計(jì)