王鐸
【摘 要】多元統(tǒng)計分析被廣泛應(yīng)用在各學(xué)科領(lǐng)域當中,是問題研究必不可少的手段。本文簡單介紹多元統(tǒng)計分析的發(fā)展歷程,并簡述了較為常用的4種多元統(tǒng)計分析方法。同時,本文以安徽省的R&D投入和GDP數(shù)據(jù)為研究變量,采用多元回歸方法,對3個變量進行了單位根檢驗、協(xié)整分析和回歸估計。結(jié)果表明,R&D投入與GDP之間存在長期協(xié)整關(guān)系,并且是正相關(guān)。這與大多數(shù)文獻資料研究結(jié)論相符合。
【關(guān)鍵詞】多元統(tǒng)計分析;多元線性回歸;ADF檢驗;協(xié)整分析
隨著社會經(jīng)濟的進步發(fā)展,學(xué)者發(fā)現(xiàn)利用一元回歸分析已經(jīng)滿足不了實證分析的要求。這是因為研究問題除了受到一維變量的影響,也會受到其他因素的作用。尤其是在延長樣本數(shù)據(jù)時期、增大樣本容量、引入其他影響因素之后,數(shù)據(jù)內(nèi)部之間的規(guī)律難以依靠一元回歸挖掘出來。多元統(tǒng)計分析開始被廣泛應(yīng)用在經(jīng)濟、管理、農(nóng)業(yè)、社會、生物等研究領(lǐng)域。
一、多元統(tǒng)計分析的發(fā)展
縱觀多元統(tǒng)計分析的發(fā)展進程,二位正態(tài)總體的分析方法雖然出現(xiàn)于19世紀,但多元統(tǒng)計分析的正式興起卻在20世紀。20世紀30年代,費希爾、霍特林等人為多元統(tǒng)計分析研究奠定理論基礎(chǔ)。進入40年代,心理、教育、生物等領(lǐng)域開始將多元統(tǒng)計分析作為研究手段分析問題。但由于計算工作量較為繁雜和時局的影響,多元統(tǒng)計分析并未廣發(fā)應(yīng)用在其他領(lǐng)域,得到更進一步的發(fā)展。50年代后,計算機的出現(xiàn)為其發(fā)展提供技術(shù)便利,相關(guān)理論也得以提出。時至今日,諸如SPSS、R、SAS、EVIEWS等多種計量軟件使得多元統(tǒng)計分析實際應(yīng)用在各學(xué)科領(lǐng)域。
二、多元統(tǒng)計分析的基本方法
1.多元回歸分析
多元回歸分析的基本原理與一元線性回歸分析相似,只不過是自變量為兩個或兩個以上。通過多元回歸分析,幾個變量之間是否存在的特定相關(guān)關(guān)系以及是何種關(guān)系將得到驗證。在實證研究中,則通常會引入控制變量,通過控制一些變量的取值,可以更好研究主要自變量影響程度,在此基礎(chǔ)上可以進行因素分析,厘清各因素間的相互關(guān)系。
2.主成分分析
與多元線性回歸法不同,主成分分析適用于更多個指標的數(shù)據(jù)處理。在建立多層次的指標體系后,將多個指標轉(zhuǎn)化為保留原有數(shù)據(jù)大部分信息的幾個綜合指標,并利用這幾個綜合指標來分析。將復(fù)雜的指標數(shù)據(jù)進行壓縮,變量之間不存在相關(guān)性,壓縮后得到的指標要有代表性,不能損失太多原始信息,能夠準確解釋研究問題的內(nèi)在關(guān)系。分析步驟主要包括以下幾步:標準化處理原始數(shù)據(jù)矩陣;基于標準化數(shù)據(jù)矩陣建立標準化相關(guān)系數(shù)矩陣;計算特征根、特征向量及標準正交化特征向量;依據(jù)結(jié)果確定主成分個數(shù);計算主成分和主成分值;計算研究樣本的得分值并加以評價。
3.因子分析
與主成分分析法相似,因子分析也是對多個變量的降維處理。通過研究相關(guān)陣或協(xié)方差陣的內(nèi)部關(guān)系,提取代表性的因子,以因子為新的解釋變量,計算得出個樣本的因子得分,并加以排序、評價分析。與主成分分析方法處理程序不同,因子分析在得到特征向量等數(shù)據(jù)后,需要確定公共因子個數(shù),并計算因子載荷矩陣和各樣本的因子得分、總因子得分。
4.聚類分析
聚類分析也是實證分析當中常用的一種研究方法。它是將數(shù)據(jù)按照一定的標準將以分類,同類別下的數(shù)據(jù)之間差異比較下,不同類別之間的數(shù)據(jù)則有較大的差異。具體的分析方法包括層次聚類法、非層次聚類法、智能聚類法等。
三、多元回歸分析的應(yīng)用
本文選擇多元線性回歸法加以實際應(yīng)用。本文采用時間序列方法分析安徽省R&D投入與經(jīng)濟增長之間的關(guān)系。安徽省GDP絕對值取自2001-2015年的《中國統(tǒng)計年鑒》,R&D經(jīng)費與R&D人員都則取自中國科技統(tǒng)計網(wǎng)站的中國科技統(tǒng)計數(shù)據(jù)(2001-2015年)。為了消除異方差的影響,將三變量對數(shù)化處理。同時,對數(shù)化的數(shù)據(jù)也能夠反映變量之間的彈性系數(shù),不改變變量之間的協(xié)整關(guān)系。GERD代表R&D投入經(jīng)費,GRP代表R&D人員,GDP代表經(jīng)濟增長。
1.單位根檢驗
通過EVIEWS6.0軟件估計,結(jié)果顯示,原序列l(wèi)nGDP、lnGERD、lnGRP是非平穩(wěn)時間序列。對三者進行一階差分后,D(lnGDP)、D(lnGRP)、D(lnGERD)通過ADF檢驗,拒絕原假設(shè),即差分后的序列是平穩(wěn)的。因此,lnGDP、lnGRP、 lnGERD是一階單整的。
2.協(xié)整分析
由ADF檢驗可知,lnGDP、lnGRP、lnGERD符合協(xié)整分析的條件。本文采用回歸殘差的協(xié)整檢驗方法。檢驗結(jié)果顯示,殘差序列在1%的顯著性水平下拒絕原假設(shè),可以確定殘差序列是平穩(wěn)的,變量之間存在長期協(xié)整關(guān)系。
3.回歸分析
回歸方程結(jié)果為:lnGDP = 7.6579lnGERD + 0.3510 lnGRP +C。模型可決系數(shù)為0.8767,接近于1,且F值也通過顯著性檢驗,說明回歸方程的擬合效果較好且變量之間的線性關(guān)系顯著。
參考文獻:
[1]左瑞瓊.多元統(tǒng)計分析方法介紹及在經(jīng)濟中的應(yīng)用[J].時代經(jīng)貿(mào),2007(9):27-28.
[2]烏冉.多元統(tǒng)計分析介紹及其在一些方面的應(yīng)用[J].百科論叢,2010(4):349-350.
[3]姜波.多元統(tǒng)計分析方法在實際問題中的應(yīng)用[J].沈陽師范大學(xué)學(xué)報(自然科學(xué)版),2012(4):465-467.
[4] 楊錦忠,宋希云.多元統(tǒng)計分析及其在煙草學(xué)中的應(yīng)用[J].中國煙草學(xué)報, 2014(5):134-137.
[5]鄧雪,江璐瑤,孫全德.多元統(tǒng)計分析方法的理論研究及應(yīng)用分析[J].數(shù)學(xué)的實踐與認識,2016(4):190-197.