武兆云, 楊慧娟 , 張 丹, 張小全, 丁永樂(lè), 楊鐵釗
(1.河南農(nóng)業(yè)大學(xué) 煙草學(xué)院,河南 鄭州 450002; 2.河南農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,河南 鄭州 450002)
直線回歸中回歸系數(shù)公式推導(dǎo)的教學(xué)研究
武兆云1, 楊慧娟1, 張 丹2, 張小全1, 丁永樂(lè)1, 楊鐵釗1
(1.河南農(nóng)業(yè)大學(xué) 煙草學(xué)院,河南 鄭州 450002; 2.河南農(nóng)業(yè)大學(xué) 農(nóng)學(xué)院,河南 鄭州 450002)
回歸系數(shù)的計(jì)算是直線回歸的關(guān)鍵一步,而其公式結(jié)構(gòu)復(fù)雜,因此掌握其推導(dǎo)過(guò)程尤為重要.提出了直線回歸中回歸系數(shù)公式推導(dǎo)的邏輯思路和方法,并提出了教學(xué)建議.
直線回歸;回歸系數(shù)公式;回歸截距;乘積和;離均差平方和;推導(dǎo)過(guò)程
直線回歸是農(nóng)業(yè)類高等院校生物統(tǒng)計(jì)學(xué)教學(xué)重要的一章,學(xué)生應(yīng)當(dāng)掌握回歸系數(shù)和截距的計(jì)算.因此,理解和掌握其公式推導(dǎo)過(guò)程就顯得非常重要.在一些高等院校生物統(tǒng)計(jì)教材中[1-2],對(duì)其公式的推導(dǎo)過(guò)于簡(jiǎn)單化,其推導(dǎo)過(guò)程也存在值得商榷的地方.這樣就造成了學(xué)生難以掌握公式.為此,本文在這方面進(jìn)行了一些思考,提出了更符合邏輯思維的推導(dǎo)過(guò)程.
1.1 回歸系數(shù)b和回歸截距a的定義
設(shè)有兩個(gè)變量x,y的一組觀察數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其樣本容量為n.該組數(shù)據(jù)在散點(diǎn)圖上呈現(xiàn)直線趨勢(shì),可用直線回歸方程來(lái)描述,則方程的一般式為
(1)
1.2 回歸系數(shù)b和回歸截距a的計(jì)算
得
(2)
(3)
1.3 回歸系數(shù)b的推導(dǎo)
式(3)可簡(jiǎn)寫為
(4)
SP表示為乘積和(sum of products),即x的離均差與y的離均差乘積的和,SSx表示為x的離均差平方和.
(5)
而
其中x1,x2,…,xn和y1,y2,…,yn組成了n對(duì)觀察值(x1,y1),(x2,y2),…,(xn,yn),則
(6)
(7)
而
則
(8)
將(8)和(6)代入(3),則
可以將回歸系數(shù)b推導(dǎo)過(guò)程概括為
生物統(tǒng)計(jì)學(xué)是運(yùn)用概率論與數(shù)理統(tǒng)計(jì)的原理及方法來(lái)分析解釋生物界各種現(xiàn)象和實(shí)驗(yàn)調(diào)查資料的一門學(xué)科,不僅在傳統(tǒng)生物學(xué)、醫(yī)學(xué)、藥學(xué)和農(nóng)學(xué)中被廣泛應(yīng)用,而且也是新興的生物信息學(xué)研究中不可缺少的工具[3].生物統(tǒng)計(jì)學(xué)教學(xué)內(nèi)容上包括試驗(yàn)設(shè)計(jì)方法和數(shù)據(jù)分析處理,培養(yǎng)學(xué)生如何正確科學(xué)地設(shè)計(jì)試驗(yàn)以及如何正確地收集、整理和分析數(shù)據(jù),進(jìn)而得出客觀正確的結(jié)論.
該課程的試驗(yàn)設(shè)計(jì)與數(shù)據(jù)分析思路抽象,涉及的公式眾多,因此學(xué)生普遍反映“聽(tīng)不懂”“記不住”“不會(huì)用”.這些問(wèn)題主要表現(xiàn)在對(duì)公式的理解和記憶上.我們結(jié)合學(xué)生的考試情況來(lái)看,例如有些學(xué)生應(yīng)用中學(xué)數(shù)學(xué)方法來(lái)求解直線回歸方程的回歸系數(shù)和截距,這充分說(shuō)明學(xué)生沒(méi)有掌握這些復(fù)雜的公式.可以看出公式成為該課程的攔路虎.近些年有的教師認(rèn)為應(yīng)當(dāng)減少公式的推導(dǎo)過(guò)程[4].教學(xué)經(jīng)驗(yàn)告訴我們放松對(duì)公式的推導(dǎo)會(huì)出問(wèn)題的.那些復(fù)雜的公式怎樣通過(guò)簡(jiǎn)單的推導(dǎo)來(lái)使學(xué)生充分理解公式的含義以及快速掌握,這同樣是該課程的教學(xué)重點(diǎn),教師應(yīng)當(dāng)在課前下功夫進(jìn)行推導(dǎo).只有學(xué)生掌握了公式推導(dǎo)過(guò)程,才不會(huì)產(chǎn)生畏難情緒,并隨之產(chǎn)生學(xué)習(xí)興趣.
[1] 趙選民.試驗(yàn)設(shè)計(jì)方法[M].北京:科學(xué)出版社,2006:32-33.
[2] 李云雁,胡傳榮.試驗(yàn)設(shè)計(jì)與數(shù)據(jù)處理[M].北京:化學(xué)工業(yè)出版社,2005:44-46.
[3] 李春喜.生物統(tǒng)計(jì)學(xué):3[M].北京:科學(xué)出版社,2005:1-2.
[4] 李昆太,程新.生物統(tǒng)計(jì)學(xué)教學(xué)改革初探[J].大學(xué)教育,2013(7):93-94.
Teaching Research on Formula Deduction of Regression Coefficient in Linear Regression
WU Zhaoyun1, YANG Huijuan1, ZHANG Dan2, ZHANG Xiaoquan1,DING Yongle1, YANG Tiezhao1
(1.CollegeofTobacco,HenanAgriculturalUniversity,Zhengzhou450002,China;2.CollegeofAgriculture,HenanAgriculturalUniversity,Zhengzhou450002,China)
The calculation of regression coefficient is the key step of linear regression. However, its formula structure is complex, so it is very important to master the process of derivation. A linear regression coefficient formula is derived and some teaching suggestions are put forward.
linear regression; regression coefficient formula; regression intercept; sum of products; sum of squares of mean deviation; derivation process
2016-11-04
河南農(nóng)業(yè)大學(xué)高等教育科學(xué)研究課題(20160308)
武兆云(1982—),男,安徽馬鞍山人,河南農(nóng)業(yè)大學(xué)煙草學(xué)院講師,博士.
10.3969/j.issn.1007-0834.2017.01.014
G642.0
A
1007-0834(2017)01-0062-02