王駿飛
(武漢理工大學(xué) 理學(xué)院,湖北 武漢 430070)
第一步,利用SPSS對已知的商品住宅價格、工資收入以及GDP的十年數(shù)據(jù)進行相關(guān)性分析,得出數(shù)據(jù)間的相關(guān)系數(shù),根據(jù)這些相關(guān)系數(shù)的大小來判斷數(shù)據(jù)間是否有強聯(lián)系,為下面進行預(yù)測模型的建立的合理性提供依據(jù)。
第二步,本文運用多元線性回歸算法進行數(shù)據(jù)預(yù)估。首先把與商品住宅有強聯(lián)系的數(shù)據(jù)類作為自變量,把商品住宅價格作為因變量,分別對強聯(lián)系的數(shù)據(jù)類和商品住宅價格進行曲線多項式擬合,大致確定商品住宅與其強聯(lián)系數(shù)據(jù)類之間的影響關(guān)系,通過分析它們之間的關(guān)系進行多元回歸數(shù)學(xué)模型的建立。
第三步,通過歷史數(shù)據(jù)對模型進行檢驗,并評價預(yù)測模型。
回歸分析(Regression)是一種應(yīng)用廣泛的統(tǒng)計分析方法,在金融、經(jīng)濟、醫(yī)學(xué)等領(lǐng)域都已成功應(yīng)用。他應(yīng)用于分析數(shù)據(jù)間的統(tǒng)計關(guān)系,側(cè)重觀察變量之間的數(shù)量變化規(guī)律,并通過回歸方程的形式描述和反映這種關(guān)系。回歸分析一般解決以下問題:確定自變量與若干因變量之間關(guān)系的定量表達式,即回歸方程式,并且確定它們關(guān)系的密切程度;運用控制可控變量的數(shù)值,借助于所求出的方程式來預(yù)測或控制自變量的取值;運行因素分析,從影響變量變化的因變量中,尋找出哪些因素對因變量產(chǎn)生了影響[5]。
相關(guān)分析用于描述兩個變量之間關(guān)系密切程度,它反映的是當(dāng)控制了其中一個變量的取值后,另一個變量的變異的程度。根據(jù)所得數(shù)據(jù),本文應(yīng)用Pearson相關(guān)系數(shù)來對數(shù)據(jù)見聯(lián)系強度進行判斷。
Pearson相關(guān)系數(shù)計算公式為:
其中,n為樣本個數(shù),xi和yi為要分析相關(guān)性的兩變量,r即為兩變量的相關(guān)系數(shù)。當(dāng)0≤|r|≤0.3時兩變量為弱相關(guān),當(dāng)0.3<|r|≤0.5時為低度相關(guān),當(dāng)0.5<|r|≤0.8時為顯著相關(guān),當(dāng)0.8<|r|≤0.1時為高度相關(guān)。
回歸算法的基本步驟:首先把與所要預(yù)測的因變量相關(guān)度最高的自變量引入到線性方程中去,再把相關(guān)性次高的自變量帶入方程,在帶入次高變量后,如果模型中的變量的F檢驗小于0.10,則后帶入的變量將不會被模型所接納。如此不斷帶入自變量進行循環(huán),不斷排除模型不需要的變量,直到所有變量都已經(jīng)被篩選過,就得出最優(yōu)回歸模型。模型形式為:
其中,F(xiàn)作為多元線性回歸顯著性檢驗統(tǒng)計量,其定義公式為:
p為多元線性回歸方程中的解釋變量的個數(shù)。F服從(p,n-p-1)個自由度的F分布。
首先分析GDP、市民收入與商品住宅價格之間的相關(guān)性。目的是觀察GDP、市民收入與商品住宅之間相關(guān)性強度。
通過相關(guān)性分析得出商品住宅價格與GDP以及市民收入的相關(guān)系數(shù)分別為03.976、0.996,皆為高度相關(guān),所以GDP與市民收入為影響商品住宅價格的主要影響因子。
下面開始建立模型。根據(jù)已知數(shù)據(jù),用Matlab分別做出GDP、市民收入與商品住宅價格的關(guān)系擬合圖,并求得擬合曲線方程。
圖1 GDP、市民收入與商品住宅價格的關(guān)系擬合圖
經(jīng)過以上曲線擬合我們得出:商品住宅價格與GDP為二次函數(shù)關(guān)系,與市民收入為一次函數(shù)關(guān)系。通過房價與GDP、市民收入之間的函數(shù)關(guān)系,我們開始建立多元回歸模型方程如下。
設(shè)商品住宅價格y與GDP為x1、市民收入x2滿足如下關(guān)系:
輸入數(shù)據(jù),利用 SPSS 計算出回歸模型方程中的參數(shù) β0、β1、β2、β3得出方程為:
根據(jù)已知武漢商品住宅數(shù)據(jù)對模型進行檢測,檢測結(jié)果如下表:
表1 模型檢測結(jié)果
通過上表可以看出檢驗結(jié)果誤差較小,最大誤差值為286.6150,最小誤差值為6.6280,平均誤差值為142.1266。所求得模型可以應(yīng)用于實際預(yù)測之中去。
本文所得多元線性回歸模型基本能夠在誤差要求范圍內(nèi)預(yù)測3年內(nèi)商品住宅價格。模型穩(wěn)定性較好。對房地產(chǎn)市場有影響的因子很多,本文只尋找出兩種相關(guān)性較高的因子,但房地產(chǎn)市場會受到一些突發(fā)性事件影響世界經(jīng)濟危機、國家政策調(diào)控等,而次模型還不具備對突發(fā)性影響的應(yīng)對機制,這有待進一步研究。
[1]張紅,李文誕.北京商品住宅價格變動實證分析[J].中國房地產(chǎn)金融,2001(3).
[2]周京奎.房地產(chǎn)價格波動與投機行為[J].當(dāng)代經(jīng)濟科學(xué),2005(7).
[3]Geoffrey Meen,Mark Andrew.Modeling Regional House Prices:A Review of the Literature by The Centre for Spatial and Real Estate Economics[D].Department of Economics,The University of Reading,1998.
[4]Stuart A Gabriel,Joe P.Mattey'William L.Wascher.House Price Differentials and Dynamics Evidence from the Los Angeles and San Francisco Metropolitan Areas[J].Real Estate Economic,2000.
[5]劉大海,李寧,晁陽.SPSS15.0統(tǒng)計分析從入門到精通[M].清華大學(xué)出版社,2008:151-211.