楊泉
摘 要:多元線性回歸模型通常用來(lái)研究一個(gè)因變量依賴多個(gè)解釋變量的變化關(guān)系,但它有一個(gè)前提條件就是解釋變量之間不存在相關(guān)關(guān)系。在實(shí)際的應(yīng)用中,特別是計(jì)量經(jīng)濟(jì)學(xué)中,解釋變量之間一般都存在有高度相關(guān)關(guān)系或近似相關(guān)關(guān)系,從而使得模型估計(jì)不準(zhǔn)確。為此,通過(guò)協(xié)方差計(jì)算變換矩陣,提供一種變換矩陣消除隨機(jī)變量之間相關(guān)關(guān)系的方法,通過(guò)spss25進(jìn)行實(shí)證分析,最后發(fā)現(xiàn)通過(guò)矩陣變換變換后的數(shù)據(jù)t檢驗(yàn)的顯著性值明顯降低。
關(guān)鍵詞:多重共線性;協(xié)方差;顯著性;
中圖分類號(hào):O212.4 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
多重共線性是指在所構(gòu)建的模型中,解釋變量之間存在的高度相關(guān)關(guān)系或近似相關(guān)關(guān)系[1]。做模型預(yù)測(cè)時(shí),一般均是建立函數(shù)模型,其前提條件是解釋變量之間都不具有相關(guān)性、不存在多重共線性,但在實(shí)際建模過(guò)程中,拿到的數(shù)據(jù)都會(huì)存在一些多重共線性。特別是在實(shí)際計(jì)量經(jīng)濟(jì)學(xué)問(wèn)題中,由于經(jīng)濟(jì)數(shù)據(jù)的限制使得模型設(shè)計(jì)不當(dāng),解釋變量之間往往存在某種近似的相關(guān)關(guān)系,導(dǎo)致模型失去了預(yù)測(cè)的意義。
在目前的研究背景下,文獻(xiàn)[2]中介紹了三種比較常用的消除多元共線性的方法,第一種方法是手動(dòng)剔除法,自變量之間存在共線性,說(shuō)明自變量所提供的信息是重疊的,可以刪除不重要的自變量減少重復(fù)信息。但從模型中刪去解釋變量時(shí)如果刪除不當(dāng),會(huì)使模型產(chǎn)生設(shè)定誤差,使得模型失去該有的意義;第二種方法是逐步回歸法,逐步回歸方法解決解釋變量多重共線性的問(wèn)題實(shí)質(zhì)是基于解釋變量之間的相關(guān)性篩選變量,將一些變量剔除,不進(jìn)入模型建模。如果被剔除的變量在實(shí)際問(wèn)題中具有很強(qiáng)的重要性,那么就要考慮其他的方法,而且
逐步回歸中越早被刪除的解釋變量,共線性越嚴(yán)重,誤刪的可能性也就越大[2]。第三種方法是主成分分析法,文獻(xiàn)[3]中提出利用主成分分析法去消除多重共線性是一種錯(cuò)誤的觀念[3]。文獻(xiàn)[4]中舉例指出:主成分分析法無(wú)法對(duì)數(shù)據(jù)的重復(fù)信息或存在的相關(guān)關(guān)系做出改善,認(rèn)為在選取解釋變量時(shí),選的越多越好[4]。
對(duì)于上述問(wèn)題,運(yùn)用協(xié)方差和Pearson相關(guān)系數(shù)的定義及計(jì)算公式[5-6],再結(jié)合協(xié)方差的性質(zhì),計(jì)算出二階、三階和四階的可逆矩陣,將原始數(shù)據(jù)通過(guò)該矩陣變換得到一組新的數(shù)據(jù),進(jìn)而消除原始數(shù)據(jù)的多重共線性。該方法是通過(guò)變換模型中變量的形式對(duì)原設(shè)定的模型形式進(jìn)行變換,可以有效地消除模型中解釋變量之間的多重共線性。最后通過(guò)spss25進(jìn)行實(shí)證分析,最終發(fā)現(xiàn)該變換矩陣能夠在不改變?cè)紨?shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)情況下降低t檢驗(yàn)的顯著性值[7]。
2 協(xié)方差和相關(guān)系數(shù)
在概率論和統(tǒng)計(jì)學(xué)中,協(xié)方差的主要作用是用來(lái)甄別兩個(gè)隨機(jī)變量的總體誤差。
4 實(shí)證分析
為了驗(yàn)證變換矩陣的有效性,根據(jù)文獻(xiàn)[8]中地區(qū)生產(chǎn)總值與四個(gè)解釋變量的實(shí)例數(shù)據(jù)進(jìn)行分析并對(duì)比,對(duì)原始數(shù)據(jù)通過(guò)spss25進(jìn)行回歸分析得到:
5 結(jié) 論
二維、三維和四維具有一定相關(guān)性的隨機(jī)變量可以通過(guò)一個(gè)二階、三階和四階的可逆矩陣轉(zhuǎn)換成不相關(guān)的隨機(jī)變量,充分利用了協(xié)方差與相關(guān)系數(shù)。這在實(shí)際生產(chǎn)中具有重大意義,文中僅僅是對(duì)二維、三維和四維的隨機(jī)變量進(jìn)行了研究,在計(jì)量經(jīng)濟(jì)學(xué)模型中,會(huì)有更多的解釋變量出現(xiàn),因此還可以接著對(duì)高維的情況進(jìn)行更深入細(xì)致的研究。
通過(guò)上面的實(shí)證分析,可以看出四階變換矩陣在處理多重共線性問(wèn)題時(shí)的有效性,在解決更多的比如計(jì)量經(jīng)濟(jì)學(xué)、水文模擬、地質(zhì)建模等實(shí)際問(wèn)題中也能夠發(fā)揮有效的作用。
參考文獻(xiàn)
[1] 劉芳,董奮義.計(jì)量經(jīng)濟(jì)學(xué)中多重共線性的診斷及處理方法研究[J].中原工學(xué)院學(xué)報(bào),2020,31(1):44-48.
[2] 范圣崗,奚書(shū)靜.多元線性回歸模型中處理多重共線性方法對(duì)比——以人口遷移沖擊教育資源模型為例[J].科技風(fēng),2020(23):157.
[3] 王惠文,朱韻華.PLS回歸在消除多重共線性中的作用[J].數(shù)理統(tǒng)計(jì)與管理,1996(6):48-52.
[4] 陳偉.主成份分析法用于評(píng)價(jià)需注意的若干問(wèn)題[J].人類工效學(xué),2002(1):30-33.
[5] 樊嶸,孟大志,徐大舜.統(tǒng)計(jì)相關(guān)性分析方法研究進(jìn)展[J].數(shù)學(xué)建模及其應(yīng)用,2014,3(1):1-12.
[6] 臧鴻雁,傅雙雙.問(wèn)題導(dǎo)向的相關(guān)系數(shù)概念產(chǎn)生過(guò)程及應(yīng)用研究[J].大學(xué)數(shù)學(xué),2020,36(4):53-59.
[7] 張露,李永安,王崇.基于相關(guān)分析和回歸分析的能源消費(fèi)影響因素研究[J].中國(guó)能源,2020,42(6):42-47.
[8] 許露露.我國(guó)地區(qū)生產(chǎn)總值影響因素的實(shí)證分析[J].黑河學(xué)院學(xué)報(bào),2019,10(11):61-63.