張學(xué)新 吳凱澤
摘 要 基于武漢市二手房中介發(fā)布的數(shù)據(jù),用一種新線性模型測度了二手房個體交易價格及首付額的主要影響因素.依據(jù)二手房價的分布,按二手房所在行政區(qū)域分段建立了價格預(yù)測模型,同時給出了二手房交易價格等級的推理規(guī)則.統(tǒng)計學(xué)檢驗表明,首付額預(yù)測模型性能優(yōu)良,可用于實際二手房個戶交易價格的預(yù)測.
關(guān)鍵詞 價格學(xué);二手房價格預(yù)測;新線性模型;因素重要度;推理規(guī)則
中圖分類號 F293.3 文獻標(biāo)識碼 A
Abstract In this paper, a new linear model was used to measure the main factors that affect the individual transaction price and the down payment on a secondhand house, based on the secondhand house data obtained from some property agencies in Wuhan. in terms of the distribution of secondhand housing price, some prediction models were established piecewise corresponding to the administrative region in which secondhand houses are located, meanwhile, the inference rule model for the classification level of secondhand housing transaction price was discussed. Prediction models of down payment were excellent from the point of view of statistical test, and can be used to forecast the transaction price of real secondhand housing.
Key words Price science; Prediction of secondhand housing price; A new linear model; Factor importance; Inference rule
1 引 言
2017年商品房交易總量數(shù)據(jù)顯示,滬、京、深、福、廈、穗、津7 個城市的二手房交易已經(jīng)超過新房交易的一半.研究一個城市二手房交易狀況,尋找二手房成交價格規(guī)律,將有助于對二套房貸和二手房交易營業(yè)稅等相關(guān)政策的正確調(diào)整,為樓市管理提供科學(xué)依據(jù).
國外已有文獻研究新房價格的相關(guān)問題.Ernawati等(2016)[1]研究周邊環(huán)境質(zhì)量對住宅價值的影響及其機制,從區(qū)位、宏觀經(jīng)濟因素、人口因素、土地、產(chǎn)業(yè)等方面研究影響房價的主要因素.Gao和Kwong(2015)[2]實證研究了消費物價指數(shù)、通貨膨脹率對上海新商品房長期均衡價格的影響.
但是,關(guān)于二手房這方面的研究尚比較少見.許浩(2017)[3]使用對數(shù)回歸模型分析合肥二手房特征價格,得出面積是房屋總價的最大影響因素.郭倩蓉和張敏鋒(2017)[4] 實證研究房價和地價的關(guān)系,鄭永坤和劉春(2018)[5]利用ARIMA模型預(yù)測廣州和深圳、南寧二手房成交均價,董倩等(2014)[6]利用網(wǎng)絡(luò)搜索數(shù)據(jù),對16個城市的二手房價格和新房價格進行了擬合和預(yù)測.陳懷東(2017)[7]探討北京二手房銷售價格與房屋租賃價格之間相關(guān)的關(guān)系.劉越(2017)[8]利用可加AR模型實證研究天津市房地產(chǎn)市場二手房銷售價格指數(shù)變化趨勢.利用簡單線性回歸模型、方差分析,實證研究城市的住宅價格,獲得城市二手房住宅特征價格模型.這些方法涉及到時間序列的分布是否滿足假定的條件、不同城市的房價數(shù)據(jù)是否同質(zhì)問題,選用模型對異地混合數(shù)據(jù)的分布有較嚴(yán)格的要求.提出一種新的線性回歸模型,直接研究二手房的交易價格,給出影響(大)城市二手房個戶交易價格的主要因素可能是有其價值的.通過建立分段模型對二手房的交易價格進行精確預(yù)測,取得了較好的結(jié)果.
2 數(shù)據(jù)及變量
數(shù)據(jù)來源于武漢二手房房產(chǎn)網(wǎng)(https://wuhan.anjuke.com/sale/),首次獲取信息777條,半個月后,又采集了545條記錄,經(jīng)檢查兩批數(shù)據(jù)沒有重復(fù),共獲取二手房最新信息1322條,涉及1126個不同的中介聯(lián)系人.由中介所及二手房的地域分布看,樣本具有很好的代表性.這些信息是文本結(jié)構(gòu),需要進行復(fù)雜的處理.首先依據(jù)“業(yè)主心態(tài)”,“小區(qū)配套”等語句描述,選擇最能反映房屋周邊環(huán)境的字符建立關(guān)鍵詞詞庫(表1),提取關(guān)鍵詞.
關(guān)鍵詞主要選擇是:所在區(qū)、所在區(qū)類別(中心城區(qū)、郊區(qū)、國家級開發(fā)區(qū))、房齡、房屋類型、建筑面積平方米、房屋朝向、所在樓層層次、裝修程度、房屋戶型(室廳)、周邊商業(yè)金融、周邊休閑場所、周邊地鐵、周邊公交車、基礎(chǔ)教育設(shè)施、高等教育設(shè)施、生活配套設(shè)施、房價(元/平方米)、房價等級.
針對研究個體設(shè)置了不同的虛擬變量.如果一個研究個體具備某個屬性,則賦予它的虛擬變量值1,否則賦值為0.對房屋周邊環(huán)境,以是否具備關(guān)鍵詞庫的分條目之一為屬性設(shè)置了13個虛擬變量:中心城區(qū)否、普通住宅否、低樓層否、毛坯房否、小區(qū)配套設(shè)施、生活配套設(shè)施、周邊醫(yī)院、周邊商業(yè)金融、周邊休閑場所、周邊地鐵、周邊公交車、基礎(chǔ)教育設(shè)施、高等教育設(shè)施.
對其他變量水平的編碼.
房屋戶型:1室0廳、1室1廳=1,1室2廳=1.5,2室1廳=2,2室2廳=2.5,3室1廳=3,3室2廳、3室3廳=3.5,4室1廳、4室2廳=4,4室3廳=4.5,5室2廳=5,6室2廳=6,6室3廳、6室4廳=6.5.
房屋類型:普通住宅、其它=1,公寓=2,別墅=3.裝修等級:毛坯、簡單裝修 =1,精裝修 =2,豪華裝修 =3.
房屋朝向:東北、西南=1.5,東西=1,東南、西北=2.5,南北=2.
樓層類別:低層=1,中層=2,高層=3.
二手房價等級:1萬以下=1,[1萬, 1.5萬)=2,[1.5萬,2萬)=3,[2萬,2.5萬)=4,[2.5萬,3萬)=5,3萬及以上=6.3房屋價格分布及特征數(shù)
武漢市二手房價格(元/平方米)、首付房款(萬元)的分布極其復(fù)雜,見圖1.
房價頻率直方圖與首付額頻率直方圖均呈明顯的非對稱性,多峰態(tài).JarqueBera檢驗也證實,二手房價序列、二手房首付房款序列及它們的自然對數(shù)序列、平方根的自然對數(shù)序列等均不服從正態(tài)分布,因此通過某個數(shù)據(jù)變換建立統(tǒng)一的回歸模型非常困難.
不同房屋類型(普通住宅、公寓、別墅),不同裝修程度(毛坯、精裝修、豪華裝修)之間的房屋均價的差異是顯然的.進一步通過單因素方差分析可得以下結(jié)論.
總體看,各區(qū)平均房價16026.68元,其中武昌區(qū)二手房的均價最高.區(qū)域間的房價均值有顯著性差異.但是江岸、江漢之間,青山、洪山、硚口、漢陽之間的差異不顯著.
從房屋朝向看,不同朝向間房價均值差異顯著.東北、西南方向均價最高,南北方向均價最低.
從樓層看,低、中、高層的房價(元/平方米)均值依次為17095.28,15681.09和15665.42.中、低層間均價差異不大,但是與高層均價的差異顯著.
不同房屋戶型的平均房價(元/平方米)有顯著性差異,但是1室0廳、1室2廳、1室1廳之間,2室1廳、3室2廳、3室1廳、4室2廳、2室2廳之間差異不大.從標(biāo)準(zhǔn)差看,1室0廳、1室1廳,3室1廳的波動性最大,2室1廳波動性最小.
4 新線性回歸模型
當(dāng)分類因素較多、有協(xié)變量、各因子水平組合之下試驗次數(shù)不等時,使用方差分析模型不方便.這里提出一種新線性回歸模型,它把包含某些變量的回歸平方和與不包含這些變量的回歸平方和之差,視為這些變量的“偏”回歸平方和,把方差分析中的因子平方和變成各個效應(yīng)所對應(yīng)的回歸變量的“偏”回歸平方和.
考察各個二手房首付額預(yù)測值與實際值的偏差(殘差),可知對漢南、新洲區(qū)的預(yù)測效果最好,其平均絕對誤差2.41992萬元,最小絕對誤差0.074750萬元.對青山、洪山、硚口、漢陽區(qū)的預(yù)測效果稍差,其平均絕對誤差6.47490萬元,最小絕對誤差0.03553萬元.
7 二手房價預(yù)測
預(yù)測了首付額,如能再確定首付比例,就能預(yù)測房價總額,再除以建筑面積就是二手房價.考察全部1321戶二手房的首付比例(見圖3).
首付比例最小值0.298834251,最大值0.300218933,首付比例波動性很小,由此可以認(rèn)為武漢市二手房市場的首付比例是30%.說明武漢市二手房交易市場采用了國辦發(fā)[2006]37號文件規(guī)定的下限:個人住房按揭貸款首付款比例不得低于30%.
把用模型預(yù)測得到的首付額乘以10/3就是二手房價總額的預(yù)測值,再除以該二手房的建筑面積就是該二手房的單位面積價格.例如,對武昌、江岸、江漢區(qū),二手房的單位面積價格的預(yù)測模型是:
二手房價(萬/平方米)=1.521+(6.044 房屋朝向-0.334 房齡) /建筑面積(平方米),(15)
8 結(jié) 論
享樂定價模型(Hedonic模型)被廣泛應(yīng)用于房地產(chǎn)的定價.依據(jù)享樂定價模型的原理,價格是由在售商品的內(nèi)在特征與外部影響因素決定的.新線性模型對影響二手房價的因素分析印證了這個原理.對影響二手房價的因素重要性分析顯示,二手房所在區(qū)位、裝修程度、房屋已使用年限及房屋類型是交易雙方最看重的因素,而建筑面積、交通便捷性、高等教育與基礎(chǔ)教育環(huán)境并不受到特別關(guān)注.有些現(xiàn)象是大城市二手房價的共性,有些是武漢市二手房價的個性.建筑面積沒有排在前面重要因素里,但是在首付額預(yù)測模型里仍舊是重要的預(yù)測因子.對于武漢市而言,現(xiàn)有地鐵14條線路,主城區(qū)里平均步行500米即可到達一座地鐵站.有550余條公交線路及1條快速公交線路(BRT),四通八達的公交設(shè)施非常方便市民出行.武漢市有高等院校82所,在校大學(xué)生100多萬,居住區(qū)散布武漢各行政區(qū).武漢社區(qū)醫(yī)療服務(wù)體系較完善, 多達302家醫(yī)院與36家社區(qū)衛(wèi)生服務(wù)中心合理地分布在武漢市各行政區(qū).這些使得交通、教育、醫(yī)療保健對二手房價的影響力逐步減弱.
享樂定價模型只用于確定環(huán)境或生態(tài)系統(tǒng)因素對商品(通常是房屋)價格的影響程度,只能捕捉消費者在感知房屋環(huán)境差異及其帶來的后果后付費的意愿.相比之下,按二手房所在行政區(qū)域建立的分段回歸模型能精準(zhǔn)地預(yù)測二手房個戶交易價格.享樂定價模型能夠估計房地產(chǎn)價值的前提是必須具有現(xiàn)成的、準(zhǔn)確的數(shù)據(jù),同樣的,雖然武漢市二手房價預(yù)測模型在統(tǒng)計意義上是優(yōu)良的,但是仍有改進余地.只要獲得“當(dāng)年住房購買總額”、“周邊新房均價”等相關(guān)變量的觀測數(shù)據(jù),把它們加入到研究的模型中,預(yù)測的精度就會提高.二手房中介費是否被加在房價里,也是一個不可觀測的變量.這些關(guān)鍵信息數(shù)據(jù)很難獲得,是研究進一步完善二手房交易價格模型的困難所在.
對二手房價,如果不需要精確的數(shù)字,只粗略了解二手房價的價位等級,也可以使用推理規(guī)則.一個推理規(guī)則的基本形式是 (規(guī)則前件-規(guī)則后件),其置信度定義為規(guī)則后件發(fā)生的條件下規(guī)則前件發(fā)生的概率.把影響二手房價的全部因素納入推理是很復(fù)雜的,而且也缺乏置信度.為此,依據(jù)第3節(jié)變量重要度的分析結(jié)果,只提取最重要的前四個因素,利用樹圖歸納建立推理規(guī)則(模型).為此,先把第一批采集的777個樣品集隨機分割為85%與15%兩部分,分別用于訓(xùn)練模型與測試模型性能表現(xiàn).舍棄一些置信度較小的信息樣品,最后獲得置信度超過65%的推理規(guī)則12條,例如:
1)如果 所在區(qū) = 新洲或漢南,則二手房價在1萬以下.
2)如果 5年<房齡 <= 9年 且 裝修程度 = 毛坯,則二手房價在 1萬~1.5萬之間.
3)如果 所在區(qū) = 硚口 且 房齡 > 4年,則二手房價在 1.5萬~2萬之間.
4)如果 所在區(qū) = 洪山 且 房齡 <= 2年 且 裝修程度 = 精裝,則二手房價在2萬~2.5萬之間.
為了檢驗推理規(guī)則(模型)的表現(xiàn),再把它應(yīng)用于第二批采集數(shù)的545條記錄,預(yù)測正確率為53.26%,表明推理規(guī)則還需改進,關(guān)鍵在于找到一個對二手房價等級較為合適的劃分.
參考文獻
[1] EMAWATI M K, HASNANYWATI H, ATACYA O. Factors Influencing the Housing Price:DevelopersPerspective[J].International Scholarly and Scientific Research & Innovation, 2016,10(5):1676-1682.
[2] GAO L Z, KWONG W, CHAU.Determinants and Sustainability of House Prices: Thee Case of Shanghai, China [J].Sustainability,2015,7(4):4524-4548.
[3] 許浩.合肥市二手房市場價格研究[D].蕪湖:安徽師范大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)院,2017.
[4] 郭倩蓉,張敏鋒.我國一二三線城市房價與地價關(guān)系的實證研究[J].閩南師范大學(xué)學(xué)報:自然科學(xué)版,2017,(2):109-114.
[5] 鄭永坤,劉春.基于ARIMA模型的二手房價格預(yù)測[J].計算機與現(xiàn)代化,2018,0(4):122-126.
[6] 董倩,孫娜娜,李偉.基于網(wǎng)絡(luò)搜索數(shù)據(jù)的房地產(chǎn)價格預(yù)測[J].統(tǒng)計研究,2014,31(10):81-87.
[7] 陳懷東.基于COPULA及LPPL模型對北京二手房及租賃價格的研究[J].中國經(jīng)貿(mào)導(dǎo)刊,2017,(8):46-51.
[8] 劉越. 天津市二手房銷售價格指數(shù)走勢分析及預(yù)測[D].天津:天津商業(yè)大學(xué)理學(xué)院,2017.