劉 冰 金躍強(qiáng) 李朝陽(yáng)
(1.南京工業(yè)職業(yè)技術(shù)大學(xué)公共基礎(chǔ)課部, 江蘇南京 210043;2. 河南工業(yè)大學(xué)管理學(xué)院, 河南鄭州 450001)
隨著我國(guó)經(jīng)濟(jì)持續(xù)穩(wěn)定的發(fā)展及人均收入的不斷提高,人們對(duì)住房的需求也日益增加,房?jī)r(jià)也隨之不斷攀升。以南京為例,2005年城中新房住宅均價(jià)為7851元/,到了2015年城中新房均價(jià)已漲到28 061元/,十年間房?jī)r(jià)上漲了257.4%。
近些年來(lái),許多學(xué)者對(duì)房?jī)r(jià)影響因素進(jìn)行了研究:周爾民(2016)等利用2005—2013年數(shù)據(jù),就宏觀經(jīng)濟(jì)、房地產(chǎn)行業(yè)、人口和市場(chǎng)需求水平等,利用R語(yǔ)言找到了影響房?jī)r(jià)的主要因素[1];薛建譜(2013)等利用因果檢驗(yàn)、長(zhǎng)期均衡模型和誤差修正模型,從房?jī)r(jià)泡沫問(wèn)題出發(fā)研究了我國(guó)房?jī)r(jià),得出了短期內(nèi)收入和股價(jià)變動(dòng)對(duì)房?jī)r(jià)影響顯著性較強(qiáng),長(zhǎng)期內(nèi)人均收入、造價(jià)和股價(jià)對(duì)房?jī)r(jià)影響顯著性較強(qiáng)的結(jié)論[2];王志(2014)等研究了城市人口、工資收入、城市土地供應(yīng)等因素對(duì)房地產(chǎn)供求關(guān)系的影響,得出了2002—2008年中國(guó)除幾個(gè)沿海城市外其他主要城市中供求關(guān)系的變化在實(shí)際住房?jī)r(jià)格升值的占有很大比重的結(jié)論[3];Baldi G(2014)利用房地產(chǎn)業(yè)的新凱恩斯主義動(dòng)態(tài)隨機(jī)一般均衡模型,探討了在家庭借貸約束沖擊和偏好沖擊導(dǎo)致房?jī)r(jià)上漲和住房部門的擴(kuò)張的情況下,央行通脹對(duì)房?jī)r(jià)以及自身產(chǎn)出增長(zhǎng)率的影響[4];Kieran McQuinn(2008)等分析了銀行可貸款額與房?jī)r(jià)之間的聯(lián)系,推導(dǎo)出收入、利率與房?jī)r(jià)之間的相互關(guān)系,建立了房?jī)r(jià)影響因素的模型并用愛爾蘭房地產(chǎn)市場(chǎng)數(shù)據(jù)進(jìn)行了驗(yàn)證[5]。上述的研究主要從宏觀經(jīng)濟(jì)、供求關(guān)系等方面研究了整個(gè)房地產(chǎn)行業(yè)。本文從二手房自身特征出發(fā),利用Box-Cox變換對(duì)南京市二手房數(shù)據(jù)進(jìn)行研究,通過(guò)建立南京市二手房單位面積房?jī)r(jià)影響因素模型,以便為購(gòu)房者和賣房者對(duì)二手房的估價(jià)提供理論依據(jù)。
經(jīng)典的線性回歸模型為:
y=β0+β1x1+β2x2+…+βpxp+ε
其中β0為回歸常數(shù),β1,…,βp為回歸系數(shù),ε為誤差項(xiàng)。這里對(duì)誤差項(xiàng)有著零期望、等方差、零協(xié)方差的正態(tài)分布的要求。但在建立實(shí)際問(wèn)題的模型時(shí),經(jīng)常存在誤差項(xiàng)與假設(shè)違背的情況,為使誤差項(xiàng)滿足要求,經(jīng)常對(duì)y進(jìn)行變量變換。Box-Cox變換就是一種常用的變換。Box-Cox變換是由Box和Cox在1964年提出的一種應(yīng)用廣泛的變換,具體對(duì)因變量y做如下變換:
其中λ為待定參數(shù)。此變換要求y的各分量都大于0,否則可用下面推廣的Box-Cox變換:
即先對(duì)y做平移,使得y+a各個(gè)分量都大于0后再做Box-Cox變換。它包含了對(duì)數(shù)變換、倒數(shù)變換等一些常用的變換,通過(guò)此變換尋找合適的λ,使得變換后的y(λ)~Nn(Xβ,σ2I)。
Box-Cox變換中參數(shù)λ通常可由極大似然估計(jì)給出,當(dāng)固定參數(shù)λ的取值時(shí),β,σ2的似然函數(shù)為:
L(β,σ2)分別對(duì)β,σ2求偏導(dǎo),并令其為0,可得β,σ2的最大似然估計(jì)為:
對(duì)一系列λ取值,似然函數(shù)的最大值Lmax(λ)取最大時(shí)對(duì)應(yīng)的λ,就是Box-Cox變換中參數(shù)λ的估計(jì)值。
1.變量說(shuō)明
本文數(shù)據(jù)采集時(shí)間為2018年3月,通過(guò)預(yù)處理最終選取了15 980條記錄,數(shù)據(jù)共包含11個(gè)變量、5個(gè)連續(xù)變量、6個(gè)離散變量。其中單位面積房?jī)r(jià)為因變量,其余為自變量,具體說(shuō)明如表1:
表1 數(shù)據(jù)變量說(shuō)明表
由于樓層這一定性變量有3個(gè)取值,不能簡(jiǎn)單地給3個(gè)類別直接賦值,本文以高樓層作為基準(zhǔn),引入兩個(gè)0—1變量[6]235-265:
對(duì)于區(qū)域這一8個(gè)取值的定性變量,同樣以浦口作為基準(zhǔn),引入7個(gè)0—1變量x11~x17進(jìn)行處理。
2.變量描述統(tǒng)計(jì)
不同的二手房具有不同的特征,這些特征共同決定二手房房?jī)r(jià)。在對(duì)單位面積房?jī)r(jià)影響因素模型建立之前,首先對(duì)各變量進(jìn)行描述分析,從而對(duì)單位面積房?jī)r(jià)影響因素進(jìn)行初步判斷,為后續(xù)研究做鋪墊。
圖1 單位面積房?jī)r(jià)直方圖
本文中,單位面積房?jī)r(jià)最低值為15 013元/平方米,所對(duì)應(yīng)的是江寧區(qū)江南青年城青楚門的一套非學(xué)區(qū)房,總面積49.96平方米;單位面積房?jī)r(jià)最高值為64 989元/平方米,所對(duì)應(yīng)的是鼓樓區(qū)西康新村的一套學(xué)區(qū)房,總面積38.93平方米。從圖1可以看出:?jiǎn)挝幻娣e房?jī)r(jià)呈現(xiàn)右偏分布,說(shuō)明極少數(shù)價(jià)格高的住房拉高了房?jī)r(jià)的平均水平,這點(diǎn)從單位面積房?jī)r(jià)均值為29 842.73元/平方米,中位數(shù)為27 689元/平方米也可以得到印證。
從圖2可以看出:有學(xué)區(qū)住房的單位面積房?jī)r(jià)明顯高于無(wú)學(xué)區(qū)住房的單位面積房?jī)r(jià);有地鐵住房的單位面積房?jī)r(jià)明顯高于無(wú)地鐵住房的單位面積房?jī)r(jià),因此學(xué)區(qū)和地鐵是影響單位面積房?jī)r(jià)的兩個(gè)重要因素。
圖2 學(xué)區(qū)、地鐵與單位面積房?jī)r(jià)關(guān)聯(lián)
對(duì)于其他自變量,也可以類似討論。總之,引入模型的變量都是和二手房單位面積房?jī)r(jià)有密切關(guān)系,至于對(duì)房?jī)r(jià)影響是否顯著,可以通過(guò)模型顯著性檢驗(yàn)進(jìn)行判斷。
3.二手房房?jī)r(jià)模型建立及模型診斷
首先建立簡(jiǎn)單的線性回歸模型。將所有變量錄入SPSS 20.0,得到南京二手房房?jī)r(jià)回歸模型,如表2。
表2 回歸系數(shù)及顯著性檢驗(yàn)表
模型中決定系數(shù)R2為0.497,擬合優(yōu)度尚可;并且F值為927.822,對(duì)應(yīng)的概率P值為0.000小于0.01,F(xiàn)檢驗(yàn)應(yīng)該拒絕原假設(shè),引入的17個(gè)自變量在0.01的顯著水平下總體上對(duì)因變量有顯著性影響。每個(gè)自變量對(duì)應(yīng)的概率P值均小于0.01,說(shuō)明引入的每個(gè)自變量在0.01的顯著水平下均對(duì)因變量有顯著影響。
接下來(lái)對(duì)模型進(jìn)行診斷。表2中DW值1.914在2附近,說(shuō)明模型無(wú)自相關(guān);最大VIF值3.682小于10,說(shuō)明模型無(wú)多重共線性。由圖3可知,隨著擬合值的增大,殘差和標(biāo)準(zhǔn)化殘差也隨之增大,說(shuō)明模型可能存在異方差問(wèn)題;標(biāo)準(zhǔn)化殘差和標(biāo)準(zhǔn)直線偏離較大,說(shuō)明誤差項(xiàng)可能不服從正態(tài)分布。為了解決這些問(wèn)題,本文考慮對(duì)模型進(jìn)行改進(jìn)。
圖3 線性回歸模型診斷圖
把y(-0.6)作為因變量,對(duì)自變量做線性回歸,得到Box-Cox變換下的南京市二手房房?jī)r(jià)模型,如表3。
表3 Box-Cox回歸系數(shù)及顯著性檢驗(yàn)表
模型中決定系數(shù)R2為0.513,擬合優(yōu)度有所提高;并且F值為989.285,對(duì)應(yīng)的概率P值為0.000小于0.01,F(xiàn)檢驗(yàn)應(yīng)該拒絕原假設(shè),引入的17個(gè)自變量在0.01的顯著水平下總體上對(duì)因變量有顯著性影響。每個(gè)自變量對(duì)應(yīng)的概率P值均小于0.01,說(shuō)明引入的每個(gè)自變量在0.01的顯著水平下均對(duì)因變量有顯著影響。
表3中DW值1.903在2附近,說(shuō)明模型無(wú)自相關(guān);最大VIF值3.682小于10,說(shuō)明模型無(wú)多重共線性。由圖4可知,Box-Cox回歸模型相對(duì)于線性回歸模型異方差得到了極大的改善;殘差QQ圖上的點(diǎn)也大體在一條直線附近,說(shuō)明誤差服從正態(tài)分布;Cook距離表現(xiàn)正常,說(shuō)明模型沒(méi)有異常點(diǎn)。因此,使用Box-Cox回歸模型刻畫單位面積房?jī)r(jià)與自變量之間的關(guān)系更合理。
圖4 Box-Cox回歸模型診斷圖
根據(jù)Box-Cox回歸模型結(jié)果,學(xué)區(qū)和區(qū)域會(huì)使單位面積房?jī)r(jià)存在顯著差異,所以,在Box-Cox回歸模型的基礎(chǔ)上,本文考慮學(xué)區(qū)和區(qū)域交互作用,建立Box-Cox交互回歸模型,結(jié)果如表4。
當(dāng)考慮了“區(qū)域×學(xué)區(qū)”的交互效應(yīng)時(shí),一個(gè)明顯的變化是:學(xué)區(qū)房變量系數(shù)估計(jì)成為負(fù)數(shù)。因?yàn)椤皡^(qū)域”“區(qū)域×學(xué)區(qū)”兩個(gè)變量的基準(zhǔn)組是浦口,所以對(duì)應(yīng)的結(jié)論為:在浦口區(qū),非學(xué)區(qū)房?jī)r(jià)格反而比學(xué)區(qū)房單位面積房?jī)r(jià)高(這一結(jié)論在原數(shù)據(jù)中也能得到體現(xiàn))。造成“浦口區(qū)非學(xué)區(qū)房?jī)r(jià)格反而比學(xué)區(qū)房單位面積房?jī)r(jià)高”的主要原因有二:第一,樣本中浦口學(xué)區(qū)房比例較低,只有19.5%;第二,與其他區(qū)域相比,浦口學(xué)區(qū)資源相對(duì)較差。
表4 box-cox交互回歸系數(shù)及顯著性檢驗(yàn)表
通過(guò)引入臥室數(shù)等十個(gè)變量對(duì)南京市二手房單位面積房?jī)r(jià)進(jìn)行分析,給出了單位面積房?jī)r(jià)影響因素的線性回歸模型,并利用Box-Cox變換對(duì)模型進(jìn)行改進(jìn),最終確定采用Box-Cox交互回歸模型來(lái)刻畫各因素和單位面積房?jī)r(jià)的關(guān)聯(lián)。從模型中可以看出:第一,學(xué)區(qū)和區(qū)域兩個(gè)因素對(duì)單位面積房?jī)r(jià)影響較大;地鐵、裝修、廳數(shù)、樓層、電梯、臥室數(shù)次之;面積和房齡對(duì)單位面積房?jī)r(jià)有負(fù)影響。第二,“學(xué)區(qū)優(yōu)勢(shì)”對(duì)各區(qū)域單位面積房?jī)r(jià)影響有所區(qū)別。鼓樓、雨花臺(tái)和棲霞區(qū)的學(xué)區(qū)房房?jī)r(jià)明顯高于非學(xué)區(qū)房房?jī)r(jià);但浦口區(qū)學(xué)區(qū)房?jī)r(jià)格反而比非學(xué)區(qū)房房?jī)r(jià)低。
本文建立的Box-Cox交互回歸模型,不但引入的自變量均通過(guò)了顯著性檢驗(yàn),而且誤差項(xiàng)滿足經(jīng)典回歸模型的零期望、等方差、零協(xié)方差和正態(tài)分布的要求。由于影響單位面積房?jī)r(jià)的因素有很多,比如國(guó)家政策、土地供應(yīng)、周邊配套、小區(qū)環(huán)境等,在未來(lái)的研究中可以繼續(xù)加入這些因素,使模型更精確。
江蘇第二師范學(xué)院學(xué)報(bào)2020年5期