呂思奇, 秦喜文,2*, 趙春陽(yáng), 董小剛, 李巧玲
(1.長(zhǎng)春工業(yè)大學(xué) 基礎(chǔ)科學(xué)學(xué)院, 吉林 長(zhǎng)春 130012;2.長(zhǎng)春工業(yè)大學(xué) 研究生院, 吉林 長(zhǎng)春 130012)
基于Logistic回歸房地產(chǎn)預(yù)警研究
呂思奇1, 秦喜文1,2*, 趙春陽(yáng)1, 董小剛1, 李巧玲1
(1.長(zhǎng)春工業(yè)大學(xué) 基礎(chǔ)科學(xué)學(xué)院, 吉林 長(zhǎng)春 130012;2.長(zhǎng)春工業(yè)大學(xué) 研究生院, 吉林 長(zhǎng)春 130012)
通過(guò)主成分分析對(duì)房地產(chǎn)市場(chǎng)預(yù)警模型的影響因素進(jìn)行分析,運(yùn)用線性回歸模型和Logistic回歸模型對(duì)長(zhǎng)春市房地產(chǎn)市場(chǎng)進(jìn)行預(yù)測(cè),并得出Logistic回歸模型對(duì)房地產(chǎn)市場(chǎng)進(jìn)行預(yù)警的結(jié)果優(yōu)于線性回歸模型。針對(duì)長(zhǎng)春市房地產(chǎn)運(yùn)行現(xiàn)狀,提出土地、經(jīng)濟(jì)、行政等方面的建議。
房地產(chǎn)預(yù)警; 主成分分析; Logistic回歸
我國(guó)房地產(chǎn)開(kāi)始于20世紀(jì)80年代,至今仍是“十三五”期間我國(guó)經(jīng)濟(jì)社會(huì)發(fā)展的支柱產(chǎn)業(yè)。房地產(chǎn)市場(chǎng)預(yù)警系統(tǒng)具有預(yù)測(cè)功能、監(jiān)測(cè)功能和調(diào)控與指導(dǎo)功能,對(duì)于我國(guó)房地產(chǎn)業(yè)的健康發(fā)展有重要意義。
1903年,英國(guó)學(xué)者利用“國(guó)家波動(dòng)圖”描述出英國(guó)宏觀經(jīng)濟(jì)的波動(dòng);20世紀(jì)70年代,預(yù)警方法逐步成熟,主要成果有Frankel的單位概率模型、JPMorgan的單位對(duì)數(shù)模型、Hedonic價(jià)格指數(shù)、RS指數(shù)等[1];20世紀(jì)90年代以后,在房地產(chǎn)預(yù)警理論和研究方法方面主要以房地產(chǎn)經(jīng)濟(jì)周期波動(dòng)理論為基礎(chǔ),Yoon Dokko等[2]提出了房地產(chǎn)價(jià)值周期模型、Sim G A[3]利用住宅數(shù)據(jù)對(duì)美國(guó)房地產(chǎn)市場(chǎng)周期模型做了綜合檢驗(yàn)。
對(duì)比國(guó)內(nèi)外房地產(chǎn)的發(fā)展歷程,均從宏觀經(jīng)濟(jì)預(yù)警研究到房地產(chǎn)預(yù)警。模型預(yù)警法的實(shí)質(zhì)是通過(guò)建立滯后模型進(jìn)行回歸分析。由于計(jì)算機(jī)的應(yīng)用領(lǐng)域不斷擴(kuò)大,模型方法的運(yùn)用范圍越來(lái)越廣,預(yù)警模型也逐漸成熟起來(lái)。目前,在房地產(chǎn)市場(chǎng)預(yù)警過(guò)程中出現(xiàn)不少新方法,如序貫判別法、馬爾可夫鏈等預(yù)警方法[1]。
房地產(chǎn)預(yù)警系統(tǒng)的設(shè)計(jì)應(yīng)堅(jiān)持定量化、系統(tǒng)化、明確化原則,主要從定性處理和定量處理兩方面研究。根據(jù)房地產(chǎn)市場(chǎng)預(yù)警系統(tǒng)的基本理論與預(yù)警指標(biāo)體系研究評(píng)述,文中將房地產(chǎn)預(yù)警指標(biāo)劃分為警情指標(biāo)、警兆指標(biāo)和警界區(qū)間三部分。
1.1 警情指標(biāo)
房地產(chǎn)預(yù)警系統(tǒng)警情指標(biāo)直接反映了當(dāng)前房地產(chǎn)業(yè)發(fā)展的狀況和當(dāng)前供需的平衡狀態(tài)。
1.2 警兆指標(biāo)
對(duì)影響房地產(chǎn)業(yè)指標(biāo)進(jìn)行篩選,找出與銷售率相關(guān)且先行的指標(biāo)作為警兆指標(biāo)。房地產(chǎn)業(yè)在中國(guó)處于發(fā)展初期,波動(dòng)性大,因此,我們采用定性分析與定量分析相結(jié)合的方法,選擇具有代表性的警兆指標(biāo)。
1.3 警界區(qū)間
在預(yù)警區(qū)間判斷時(shí),需要對(duì)警兆指標(biāo)值進(jìn)行處理。警界區(qū)間的選取直接決定了預(yù)警結(jié)果的準(zhǔn)確性。警界區(qū)間劃分的方法主要有:u-σ法、正態(tài)歸一化法、系統(tǒng)化方法和經(jīng)驗(yàn)數(shù)據(jù)法。由于我國(guó)房地產(chǎn)市場(chǎng)波動(dòng)比較大,所以警界區(qū)間的確定仍需要參考專家經(jīng)驗(yàn)。
一般的Logistic函數(shù)形式為:
在Logistic回歸中,用pi=P(yi=1|xi)作為因變量,得到Logistic基本回歸模型:
(1)
式中:pi----第i個(gè)案例發(fā)生事件的概率,它是由一個(gè)解釋變量xi構(gòu)成的非線性函數(shù)[3]。
Logit(pi)=α+βxi
Logistic回歸主要步驟[4]如下:
1)選擇自變量和因變量,通常因變量為二項(xiàng)反應(yīng)變量;
2)將所有數(shù)據(jù)分成分析樣本和檢驗(yàn)樣本;
3)檢查模型的假設(shè)條件,Logistic回歸模型中自變量是否相關(guān),因變量的發(fā)生概率是否符合Logistic模型;
4)用回歸估計(jì)的方法對(duì)回歸參數(shù)估計(jì),檢驗(yàn)回歸參數(shù)的顯著性,并檢驗(yàn)?zāi)P偷臄M合度;
5)解釋估計(jì)結(jié)果;
6)利用檢驗(yàn)樣本進(jìn)行檢驗(yàn)。
3.1 數(shù)據(jù)來(lái)源
通過(guò)國(guó)家統(tǒng)計(jì)局和吉林省統(tǒng)計(jì)年鑒搜集整理了長(zhǎng)春市房地產(chǎn)相關(guān)數(shù)據(jù),根據(jù)2002-2014年的指標(biāo)數(shù)據(jù)及對(duì)房地產(chǎn)運(yùn)行情況的分析,選取12個(gè)警兆指標(biāo)[5]。X1:地區(qū)生產(chǎn)總值;X2:固定資產(chǎn)投資額;X3:城鎮(zhèn)居民人均可支配收入增長(zhǎng)率;X4:房地產(chǎn)投資額;X5:竣工房屋價(jià)值;X6:房屋銷售額;X7:商品房銷售額;X8:新購(gòu)置土地面積;X9:房屋施工面積;X10:房屋竣工面積;X11:房屋銷售面積;X12:房屋空置面積。
由于搜集到的數(shù)據(jù)數(shù)值差異較大,需要將數(shù)據(jù)進(jìn)行優(yōu)化處理,即正向化處理和無(wú)量綱化處理[6]。
通過(guò)SAS軟件對(duì)所有警兆指標(biāo)進(jìn)行相關(guān)分析,可以看出各警兆指標(biāo)間存在強(qiáng)相關(guān)性,表示各警兆指標(biāo)信息嚴(yán)重重合,需要降維處理來(lái)去除多余的重合信息。對(duì)數(shù)據(jù)進(jìn)行主成分分析,得到前3個(gè)主成分的累計(jì)貢獻(xiàn)率分別為82.25%、90.95%和94.77%,故調(diào)整原變量為3個(gè)自變量,計(jì)算出3個(gè)主成分的具體數(shù)值。
根據(jù)前3個(gè)主成分的特征根,可以得到反映長(zhǎng)春市房地產(chǎn)市場(chǎng)景氣情況的綜合預(yù)警指數(shù):
(2)
代入3個(gè)主成分的數(shù)值,即可以得到綜合預(yù)警指數(shù)z的具體數(shù)值、均值及標(biāo)準(zhǔn)差。
根據(jù)這13年間長(zhǎng)春市房地產(chǎn)市場(chǎng)的綜合預(yù)警,通過(guò)3σ方法將預(yù)警系統(tǒng)劃分為五大警界區(qū)間:過(guò)冷狀態(tài)(-∞,-62.029),偏冷狀態(tài)(-62.029,-31.015),正常狀態(tài)(-31.015,31.015),偏熱狀態(tài)(31.015,62.029),過(guò)熱狀態(tài)(62.029,+∞)。
3.2 模型建立
選取長(zhǎng)春市2002-2014年的指標(biāo)數(shù)據(jù),選擇前3個(gè)主成分代表12個(gè)警兆指標(biāo)作為自變量,通過(guò)SAS軟件進(jìn)行線性回歸處理。
回歸系數(shù)的估計(jì)值見(jiàn)表1。
表1 回歸系數(shù)的估計(jì)值
根據(jù)表1可以得到線性回歸模型:
(3)
與線性回歸模型一樣,Logistic回歸模型的自變量為前3個(gè)主成分。由于因變量必須為定性變量,所以用數(shù)字1~5來(lái)表示過(guò)冷、偏冷、正常、偏熱、過(guò)熱等房地產(chǎn)市場(chǎng)運(yùn)行狀態(tài),將其作為因變量,通過(guò)SAS軟件進(jìn)行多元Logistic回歸分析[7-9]。
表2 最大似然估計(jì)
(4)
(5)
偏熱:
正常:
偏冷:
綜上,在其它因素不變的情況下,主成分z1、z2、z3的值越大,長(zhǎng)春市房地產(chǎn)市場(chǎng)的運(yùn)行狀態(tài)屬于偏熱的概率越大,屬于偏冷的概率越小,且z1對(duì)結(jié)果的影響比z2、z3對(duì)結(jié)果的影響要大。
3.3 回歸模型檢驗(yàn)
通過(guò)SAS軟件進(jìn)行多元Logistic回歸分析,采用AIC檢驗(yàn)法、SC檢驗(yàn)法、似然比檢驗(yàn)法對(duì)模型進(jìn)行擬合優(yōu)度檢驗(yàn),總體檢驗(yàn)見(jiàn)表3。
表3 總體檢驗(yàn)
由表3可見(jiàn),模型顯著性明顯。從統(tǒng)計(jì)學(xué)角度來(lái)看,此次的參數(shù)估計(jì)是比較有效的。
3.4 結(jié)果分析
因此,模型得到2015年長(zhǎng)春市房地產(chǎn)市場(chǎng)運(yùn)行狀況為偏熱狀態(tài),與實(shí)際2015年長(zhǎng)春市房地產(chǎn)市場(chǎng)情況相同,并存在房地產(chǎn)投資增速過(guò)快、房地產(chǎn)市場(chǎng)供需關(guān)系不平衡及房?jī)r(jià)上漲的幅度越來(lái)越大等問(wèn)題。
對(duì)比線性回歸模型與Logistic回歸模型得到2015年長(zhǎng)春市房地產(chǎn)市場(chǎng)情況的預(yù)測(cè),線性回歸模型得到的預(yù)測(cè)結(jié)果為過(guò)熱狀態(tài),Logistic回歸模型得到的預(yù)測(cè)結(jié)果為偏熱狀態(tài),兩者存在差異較小。根據(jù)長(zhǎng)春市2015年實(shí)際的房地產(chǎn)市場(chǎng)狀況,文中認(rèn)為L(zhǎng)ogistic回歸模型得到的結(jié)果更為準(zhǔn)確。
選取長(zhǎng)春市2002-2014年房地產(chǎn)數(shù)據(jù),對(duì)比使用線性回歸模型和Logistic回歸模型進(jìn)行預(yù)測(cè),線性回歸模型得到長(zhǎng)春市2015年房地產(chǎn)處于過(guò)熱狀態(tài),Logistic回歸模型得到長(zhǎng)春市2015年房地產(chǎn)處于偏熱狀態(tài),兩者存在差異較小。根據(jù)長(zhǎng)春市2015年實(shí)際的房地產(chǎn)市場(chǎng)狀況,認(rèn)為L(zhǎng)ogistic回歸模型得到的結(jié)果更為準(zhǔn)確。
針對(duì)長(zhǎng)春市目前房地產(chǎn)運(yùn)行狀況提出以下建議:
1)長(zhǎng)春市房地產(chǎn)管理部門可根據(jù)現(xiàn)有的房地產(chǎn)狀況,對(duì)土地的開(kāi)發(fā)、改造、規(guī)劃及價(jià)格評(píng)估做出改變,只有合理地規(guī)范土地,才能保證房地產(chǎn)處于健康的發(fā)展?fàn)顟B(tài);
2)調(diào)節(jié)房地產(chǎn)的投資方向、物業(yè)價(jià)格、稅收措施等方面的關(guān)系,合理安排房地產(chǎn)相關(guān)的所有經(jīng)濟(jì)內(nèi)容;
3)政府慎重考慮城市規(guī)劃、發(fā)展戰(zhàn)略等政策,促進(jìn)房地產(chǎn)業(yè)健康、良好、有序的發(fā)展。
[1] 郭峰.房地產(chǎn)預(yù)警系統(tǒng)研究綜述[J].貴州大學(xué)學(xué)報(bào):自然科學(xué)版,2005,22(4):380-383.
[2] Dokko Y, Edelstein R H, Lacayo A J, et al. Real estate income and value cycles: A model of market dynamics[M]. A Global Perspective on Real Estate Cycles. Springer US,2001:69-96.
[3] Sim G A, Sutton L E, Cameron A F. The mortgage meltdown, the economy, and public policy[J]. B E Journal of Economic Analysis & Policy,2009,9(3):145-151.
[4] 何曉群.多元統(tǒng)計(jì)分析[M].北京:中國(guó)人民大學(xué)出版社,2012.
[5] Huang F, Wang F. A system for early-warning and forecasting of real estate development[J]. Automation in Construction,2005,14(3):333-342.
[6] 葉宗裕.關(guān)于多指標(biāo)綜合評(píng)價(jià)中指標(biāo)正向化和無(wú)量綱化方法的選擇[J].統(tǒng)計(jì)科學(xué)與實(shí)踐,2003(4):24-25.
[7] Zhao J, Zhao Y L, Duan Q Q. Modeling of regional real estate early warning based on logistic regression[J]. China Population Resources & Environment,2013,398:80-87.
[8] 黃興柱.基于多元logistic回歸模型的房地產(chǎn)預(yù)警研究[D].濟(jì)南:濟(jì)南大學(xué),2012.
[9] 張家進(jìn),張卓勇,相玉紅,等.Logistic回歸算法結(jié)合近紅外光譜對(duì)子宮內(nèi)膜癌組織切片分類的研究[J].光譜學(xué)與光譜分析,2013,33(2):344-348.
Real estate early warning study based on Logistic regression
LYU Siqi1, QIN Xiwen1,2*, ZHAO Chunyang1,DONG Xiaogang1, LI Qiaoling1
(1.School of Basic Sciences, Changchun University of Technology, Changchun 130012, China;2.Graduate School, Changchun University of Technology, Changchun 130012, China)
We analyze the influential factors to the real estate market early warning model with Principal Component Analysis, and predict the real estate market in Changchun with both the linear regression model and Logistic regression model. It is suggested that the Logistic regression model is better than the linear regression model to give the real estate early warning. Our research can offer some references for the land, economic and administrative management based on real estate operation in Changchun.
warning of real estate; principal component analysis; Logistic regression.
2016-05-25
國(guó)家自然科學(xué)基金項(xiàng)目(11301036,11226335); 吉林省教育廳科研項(xiàng)目(2014第127號(hào); 2013第142號(hào))
呂思奇(1994-),女,回族,遼寧沈陽(yáng)人,長(zhǎng)春工業(yè)大學(xué)碩士研究生,主要從事統(tǒng)計(jì)計(jì)算方向研究,E-mail:864575427@qq.com. *通訊作者:秦喜文(1979-),男,漢族,吉林梅河口人,長(zhǎng)春工業(yè)大學(xué)教授,博士,主要從事HHT理論與應(yīng)用研究,E-mail:qinxiwen@ccut.edu.cn.
10.15923/j.cnki.cn22-1382/t.2016.6.17
O 29
A
1674-1374(2016)06-0603-04