王化琨+李春艷+陳莉莉+周亞晶
摘要:文章對統(tǒng)計學(xué)專業(yè)本科專業(yè)必修課程“應(yīng)用回歸分析”,進(jìn)行了一系列的關(guān)于教學(xué)內(nèi)容和教學(xué)方法的改革與實(shí)踐,包括理論講授內(nèi)容、實(shí)驗(yàn)課教學(xué)、案例教學(xué)、回歸建模等多個環(huán)節(jié),我們提出的這種新穎的教學(xué)方法,陸續(xù)在2011級、2012級統(tǒng)計學(xué)專業(yè)的“應(yīng)用回歸分析”教學(xué)中開展,取得了較好的教學(xué)效果。我們將在今后的教學(xué)工作中,根據(jù)教學(xué)效果,不斷地改進(jìn)和完善。
關(guān)鍵詞:回歸分析;案例教學(xué);回歸模型
回歸分析是研究多個變量間的非確定性關(guān)系的一種統(tǒng)計分析方法,它在自然科學(xué)、經(jīng)濟(jì)學(xué)和社會管理學(xué)等領(lǐng)域的定量分析中有著廣泛的應(yīng)用?!皯?yīng)用回歸分析”是高校統(tǒng)計學(xué)本科專業(yè)的必修課程,它的先修課程有高等代數(shù)、數(shù)學(xué)分析、概率論與數(shù)理統(tǒng)計等專業(yè)基礎(chǔ)課?!皯?yīng)用回歸分析”的教學(xué)目的,是使學(xué)生能夠理解和掌握基本的線性回歸模型,并了解其他常用的回歸模型,例如嶺回歸、Logistic回歸等。通過該課程的學(xué)習(xí),學(xué)生不僅對回歸分析的理論有所了解,而且能夠利用回歸的方法進(jìn)行數(shù)據(jù)分析、統(tǒng)計建模,解決實(shí)際問題。
本文作者是高校數(shù)學(xué)學(xué)院統(tǒng)計學(xué)專業(yè)的專任教師,多年來擔(dān)任“應(yīng)用回歸分析”的主講教師。我們針對該門課程的特點(diǎn),結(jié)合這些年在教學(xué)工作中發(fā)現(xiàn)的問題和積累的經(jīng)驗(yàn),對“應(yīng)用回歸分析”課程的教學(xué)內(nèi)容和教學(xué)方法做一些有益的探討。
一、理論教學(xué)內(nèi)容的改進(jìn)
根據(jù)我院統(tǒng)計學(xué)本科專業(yè)偏精算方向的實(shí)際情況,我們在講授“應(yīng)用回歸分析”時,既要對回歸分析的重要理論作嚴(yán)格的數(shù)學(xué)證明、公式推導(dǎo),使回歸分析的學(xué)習(xí)不失數(shù)學(xué)的嚴(yán)謹(jǐn)性。但是,考慮到本科生的實(shí)際情況,對一些過于復(fù)雜的理論,我們只介紹它們的意義,并不作數(shù)學(xué)推導(dǎo)。這樣一來,我們不但降低了回歸分析理論學(xué)習(xí)的難度,而且保證了回歸理論的完整性。同時,考慮到本科層次的回歸分析的教學(xué)目的,重點(diǎn)是教授學(xué)生如何利用回歸的方法來研究變量間的數(shù)量關(guān)系。因此,我們在選用教材上著重于回歸分析的應(yīng)用。綜合考慮這些情況,我們選用了何曉群、劉文卿著的《應(yīng)用回歸分析》這本書。在實(shí)際的講授中,對于作為回歸分析基礎(chǔ)的一元線性回歸和多元線性回歸內(nèi)容,我們?nèi)嫦到y(tǒng)地介紹了它的理論,包括定理證明、公式推導(dǎo)。這樣既訓(xùn)練了學(xué)生的數(shù)學(xué)思維能力,又加深了對線性回歸的理解。
另外,對于像自變量的選擇與逐步回歸、多重共線性等內(nèi)容,我們將教學(xué)重點(diǎn)放在學(xué)生對這些問題的理解上。我們在教學(xué)中發(fā)現(xiàn),將這些內(nèi)容與實(shí)際問題相結(jié)合,更能加深學(xué)生的理解,而且有助于激發(fā)學(xué)生的學(xué)習(xí)熱情。例如,在介紹變量的選擇這部分內(nèi)容時,我們舉了空氣污染研究中的變量選擇。該研究討論了某地區(qū)死亡率與氣候、社會經(jīng)濟(jì)和污染變量的關(guān)系。它列舉了15個可能影響死亡率的變量,分別是年平均降水量、一月份平均氣溫、七月份平均氣溫、65歲以上老年人口百分比、每戶人口數(shù)、接受學(xué)校教育年限的中位數(shù)、具有合理住宅的百分比、每平方英里的人數(shù)、非白種人的百分比、白領(lǐng)階層的百分比、低收入家庭的百分比、碳?xì)浠衔锵鄬撛谖廴?、氮氧化合物相對潛在污染、二氧化硫化合物相對潛在污染、相對濕度、各種原因?qū)е碌慕?jīng)過年齡修正的總死亡率等。我們不從流行病學(xué)的角度去評論,只是利用數(shù)據(jù)進(jìn)行變量選擇的示范。又如,在介紹共線性數(shù)據(jù)的變量選擇時,我們探討了槍械在底特律兇殺案件中的作用。根據(jù)Gunst和Mason收集的1961~1973年的數(shù)據(jù),響應(yīng)變量為該城市的兇殺率,預(yù)測變量是與兇殺案相關(guān)聯(lián)或?qū)礆⒙噬仙杏绊懙淖兞?,例如,?00~1000人中配備的全職警察人數(shù)、失業(yè)人口百分比、制造業(yè)人口百分比等。通過實(shí)例的講解,學(xué)生對于所學(xué)的內(nèi)容的理解更加深刻,同時也接觸到一些利用回歸的方法處理實(shí)際問題的技巧。
二、在實(shí)驗(yàn)教學(xué)中引入案例分析
回歸方法通常處理的變量的觀測數(shù)據(jù)量很大,手工計算回歸模型參數(shù)和檢驗(yàn)統(tǒng)計量很困難。因此,通常需要統(tǒng)計軟件進(jìn)行計算。在回歸分析中,常見的軟件有SAS、SPSS等。這些軟件都是收費(fèi)性質(zhì)的軟件,雖然軟件公司提供面向高等院校的免費(fèi)版本,但功能較為有限??紤]這樣的實(shí)際情況,我們在回歸分析的實(shí)驗(yàn)課教學(xué)中采用了免費(fèi)開源的統(tǒng)計軟件,R軟件。R是用于統(tǒng)計分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個自由、免費(fèi)、源代碼開放的軟件,它是一個用于統(tǒng)計計算和統(tǒng)計制圖的優(yōu)秀工具。R是一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲和處理系統(tǒng);數(shù)組運(yùn)算工具(其向量、矩陣運(yùn)算方面功能尤其強(qiáng)大);完整連貫的統(tǒng)計分析工具;優(yōu)秀的統(tǒng)計制圖功能;簡便而強(qiáng)大的編程語言:可操縱數(shù)據(jù)的輸入和輸出,可實(shí)現(xiàn)分支、循環(huán),用戶可自定義功能。我們在實(shí)際的實(shí)驗(yàn)教學(xué)中,在講解R軟件的基本操作過程中,將如何利用R語言建立并求解回歸模型融入其中。通過這種方式訓(xùn)練學(xué)生利用統(tǒng)計軟件解決實(shí)際問題的能力。同時,我們在選擇回歸模型實(shí)例時,盡量考慮社會經(jīng)濟(jì)和管理領(lǐng)域的實(shí)際問題,選擇和教學(xué)內(nèi)容相關(guān),同時又具有啟發(fā)性的案例。這樣,既訓(xùn)練了學(xué)生解決實(shí)際問題的能力,又鍛煉了學(xué)生對社會經(jīng)濟(jì)現(xiàn)象的理解分析能力。
三、以數(shù)學(xué)建模競賽為平臺,培養(yǎng)學(xué)生解決實(shí)際問題的能力
每年一屆的大學(xué)生數(shù)學(xué)建模競賽,目前已成為全國高校規(guī)模最大的基礎(chǔ)性學(xué)科競賽,它通常選擇在實(shí)際的社會生產(chǎn)生活或者經(jīng)濟(jì)現(xiàn)象中遇到的實(shí)際問題為試題,目的是考察大學(xué)生運(yùn)用所學(xué)的數(shù)學(xué)知識解決實(shí)際問題的能力。實(shí)際上,很多的競賽試題都可以通過建立合適的回歸模型加以解決。我們的回歸分析開設(shè)在每學(xué)年的上學(xué)期,恰好和數(shù)學(xué)建模競賽的時間相吻合,我們在教授回歸分析的同時,鼓勵學(xué)生報名參加該項(xiàng)賽事。我們根據(jù)學(xué)生的學(xué)習(xí)情況,將學(xué)生適當(dāng)分組,充分調(diào)動學(xué)生的積極性和創(chuàng)造性。同時,學(xué)生在數(shù)學(xué)建模競賽中也檢驗(yàn)了所學(xué)的理論知識,激發(fā)了他們的學(xué)習(xí)熱情。例如,針對建筑工程協(xié)會提供的一個由于遺漏了預(yù)測變量而造成人工的自相關(guān)現(xiàn)象的例子。該協(xié)會希望了解住房工程開工規(guī)模與人口增長的關(guān)系,其目的是為了預(yù)測建筑業(yè)的發(fā)展規(guī)模。由于客觀條件的限制,不可能知道潛在的購房者的準(zhǔn)確數(shù)據(jù),只能把當(dāng)?shù)氐木用駭?shù)量作為反映潛在購房者規(guī)模的變量。收集的數(shù)據(jù)是該地區(qū)25年的資料,包括住房開工數(shù)、人口規(guī)模等。經(jīng)過分析,一元線性回歸可以反映人口規(guī)模和住房需求的關(guān)系。但是,人口規(guī)模與開工數(shù)之間的關(guān)系較為復(fù)雜,往往是住房開工數(shù)會影響人口規(guī)模(通過人口遷移),反之不然。通過分析這個實(shí)際模型,學(xué)生接觸了現(xiàn)實(shí)生產(chǎn)生活中的變量更復(fù)雜,或許有其他的變量更好地解釋開工規(guī)模,由于忽略了這樣的變量而造成了誤差間的自相關(guān)。這些可能的潛在變量包括失業(yè)率、婚姻和家庭的社會趨向、政府的住房政策、建筑和抵押資金的供給。通過實(shí)際分析,在引入了抵押資金后,誤差的自相關(guān)性消失了,模型較好地反映了變量的關(guān)系。
四、探索科學(xué)合理的課程考試方式
應(yīng)用回歸分析是一門實(shí)踐性比較強(qiáng)的統(tǒng)計學(xué)專業(yè)課,在以理論教學(xué)為主的前提下,還應(yīng)與實(shí)踐教學(xué)和案例教學(xué)結(jié)合。針對該課程的特點(diǎn),我們改變了以期末考試的“一張卷”定分?jǐn)?shù)的傳統(tǒng)考核方式。我們以期末考試與平時能力測試相結(jié)合的考試方試。其中,期末考試主要考查學(xué)生對回歸分析的基本理論和基本方法的理解掌握程度。平時能力測試包括平時作業(yè)的完成情況、上機(jī)實(shí)踐考核、實(shí)踐報告。此外,我們還建立了回歸分析教學(xué)網(wǎng)站。我們將很多相關(guān)的參考資料放到網(wǎng)站上,包括教材、參考書、參考文獻(xiàn)、教學(xué)大綱、教學(xué)計劃、多媒體課件、實(shí)驗(yàn)案例、習(xí)題和解答、教學(xué)錄像等。這樣,極大地方便了學(xué)生在課前預(yù)習(xí)和課后復(fù)習(xí)。我們利用這個網(wǎng)站,課后與學(xué)生在網(wǎng)上交流學(xué)習(xí)情況、輔導(dǎo)答疑等。學(xué)生的平時測驗(yàn)也放到網(wǎng)站上,讓學(xué)生在網(wǎng)上提交測驗(yàn),這樣給學(xué)生充分的思考時間。在期末考試結(jié)束后,教師結(jié)合以上幾個方面的分?jǐn)?shù),給出學(xué)生的該門課程的最終成績。
參考文獻(xiàn):
[1]何曉群,劉文卿.應(yīng)用回歸分析[M].中國人民大學(xué)出版社,2011.
[2]Samprit Chatterjee.例解回歸分析[M].機(jī)械工業(yè)出版社,2013.
[3]紀(jì)躍芝,王純潔. 《應(yīng)用回歸分析》的課程改革與實(shí)踐[J]. 教育教學(xué)論壇,2014,(2).
[4]黃蕊,賀樂平. 關(guān)于《回歸分析》課程的教學(xué)思考[J].新課程研究,2014,(4).
■ ?編輯∕高 ?偉