李然 章政 繆華昌
摘要:房產(chǎn)在我國國民經(jīng)濟中占據(jù)重要地位。隨著深度學習算法發(fā)展,關(guān)于房價預(yù)測問題算法也有深入的研究。文章將調(diào)試Logistic、ReLu各隱含層函數(shù)來預(yù)測結(jié)果,并將結(jié)果綜合后判斷本模型的預(yù)測精度完成房價預(yù)測。
關(guān)鍵詞:房價預(yù)測;神經(jīng)網(wǎng)絡(luò);Logistic;ReLu
中國經(jīng)濟實驗研究城市生活質(zhì)量中心2019年報告顯示,整體上來看房地產(chǎn)市場仍然還是以謹慎的態(tài)度為主,且近幾年來國家住房政策的調(diào)整使得房地產(chǎn)行業(yè)將迎來新一輪的“洗牌”。房地產(chǎn)作為我國國民重要的資產(chǎn)項目,微觀層面在轉(zhuǎn)讓、售賣、租賃的時候有可靠的參考標準對消費者與產(chǎn)權(quán)擁有者意義重大。從中觀角度企業(yè)可基于房價預(yù)測判斷用多大的成本建設(shè)可獲得最高收益,能夠幫助企業(yè)做出精準的市場戰(zhàn)略,防止資金浪費在低投資回報率項目上導(dǎo)致資金鏈斷裂。宏觀角度可靠的房價預(yù)測在精準調(diào)整政策、提高政策在基層可實施性、防范系統(tǒng)性金融風險等方面有積極作用。
基于現(xiàn)狀,本文以如何構(gòu)建一個新行業(yè)背景下不動產(chǎn)定價預(yù)測這個問題進行建模,最終輔助國民涉及房產(chǎn)方面的決策。數(shù)據(jù)源于kaggle官網(wǎng)“House Prices-Advanced Regression Techniques”。
一、神經(jīng)網(wǎng)絡(luò)構(gòu)建
Logistic函數(shù)又稱sigmoid函數(shù)源自邏輯斯蒂方程。原用以描述自然界物種無天敵的理想狀態(tài)下,物種最快增長函數(shù)。其式:
求解得到以上,式中Wij是指連接權(quán)重,xj是指輸入的特征變量,δi指神經(jīng)元閾值,yi指在Logistic的激活函數(shù)下的加工后的數(shù)值。
相比sigmoid函數(shù)ReLu只需要一個閾值就可以得到激活值不必進行大量臃余計算。
式中yi指經(jīng)過ReLu加工后的數(shù)據(jù),Wij是指連接權(quán)重,xj是指輸入的特征變量,δ指神經(jīng)元閾值。
Logistic和ReLu情形下神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建各有特點,因此對兩結(jié)果取均值對預(yù)測精度的好處如表1所示。
二、神經(jīng)網(wǎng)絡(luò)運行結(jié)果
用“藍鯨”軟件建模。數(shù)據(jù)累計53個提供信息的特征列參與建模,其中10列為名義型變量其余為數(shù)值型和序列型變量。名義型變量的處理方式是轉(zhuǎn)換為編碼,序列型變量的處理方式是轉(zhuǎn)換為評分形式的數(shù)值型變量。預(yù)測結(jié)果與實測結(jié)果存在誤差的原因可能是由于數(shù)據(jù)記錄時本身就存在錯誤,導(dǎo)致記錄數(shù)與真值存在誤差?;蚴怯捎谀P捅旧硖匦詫?dǎo)致的。因此本文利用兩個不同隱藏層函數(shù)跑出的結(jié)果進行加權(quán)平均。其原理為兩個模型自身的精度較好,但是存在一些異常的數(shù)值。兩組數(shù)據(jù)如果差距不大則很有可能這個結(jié)果本身是對的。如果兩組數(shù)據(jù)的差距比較大,則取其均值以平抑其錯誤的大小。結(jié)果如表2所示。
本文以對應(yīng)真實房價為比較對象。并繪制了圖2橫軸為本模型結(jié)果縱軸為真實結(jié)果的平面圖。房價預(yù)測時應(yīng)當存在一個區(qū)間,在該區(qū)間以內(nèi)可視為有效合理定價。如果超出該區(qū)間過多將視其為噪點。圖2中的兩條箭頭線代表的是可接受合理區(qū)間上下沿分別是一個均方根誤差。RMSE=25752.16,R2=0.897648,表明預(yù)測結(jié)果與真實情況接近。
鑒于房價定價除了客觀因素影響還有個體喜好差異的因素。因此圖2中兩個雙箭頭線是個體差異導(dǎo)致的可接受的誤差,誤差值為一個均方誤差。
導(dǎo)致誤差的原因包含標準化后的數(shù)值轉(zhuǎn)回預(yù)測目標數(shù)值時較大的量綱使誤差被放大,也包含數(shù)據(jù)集本身就有錯誤數(shù)據(jù)的可能。但是從大體上來看,除去少數(shù)極端異常點多數(shù)的點落在合理區(qū)間的。其余在合理范圍邊緣的點可能是數(shù)據(jù)除噪精度低導(dǎo)致的。約97%的點在區(qū)間內(nèi),總體的精度較優(yōu)。
三、模型仿真
為進一步驗證模型效果,參考了《中國房地產(chǎn)統(tǒng)計年鑒2006》至《中國房地產(chǎn)統(tǒng)計年鑒2020》南京市商品房平均銷售價格以及南京市統(tǒng)計局對應(yīng)年份的統(tǒng)計年鑒。其中a為地區(qū)生產(chǎn)總值(億元);b為地區(qū)人口總數(shù)(人);c為城市居民人均可支配收入(元);d為城市居民人均消費支出(元);e為農(nóng)村居民人均可支配收入(元);f為農(nóng)村居民人均生活消費支出(元);g為商品房銷售面積(萬平米);h為本年完成投資額(萬元);i為商品房平均銷售價格(元/平米),數(shù)據(jù)如表3所示。
為平抑量綱對模型的影響,將數(shù)據(jù)標準化。并使用2005~2018年的數(shù)據(jù)為訓練集,2019年舍去i的數(shù)據(jù)為預(yù)測集。
最終利用以上的方法得到兩種激活函數(shù)綜合之后2019年預(yù)測結(jié)果為19472.25元/平米,誤差僅2.45%。因此本模型可用于研究近幾年我國房地產(chǎn)房價問題。
四、結(jié)語
本文基于神經(jīng)網(wǎng)絡(luò)算法解決了如何在新時代背景下對房價的合理區(qū)域的預(yù)測,并結(jié)合了本模型的均方誤差給出了相應(yīng)合理的區(qū)間,達到了便于消費者合理評估不動產(chǎn)價值、輔助房地產(chǎn)企業(yè)判讀是否購買某塊地區(qū)的土地建設(shè)、有利于國家對居民端房地產(chǎn)交易環(huán)節(jié)實施精準的宏觀調(diào)控的研究目標,為房價預(yù)測問題提供了一種新解決方式。
參考文獻:
[1]張連城,郎麗華,趙家章,王銀,郝宇彪,張自然,王鈺.城市居民生活質(zhì)量“總體穩(wěn)定、穩(wěn)中有憂”——2019年中國35個城市生活質(zhì)量報告[J].經(jīng)濟學動態(tài),2019(09):3-17.
[2]張樨樨.房價泡沫抑制了生育率復(fù)蘇嗎?——論生育率與房價的動態(tài)因果關(guān)系[J].華東師范大學學報(哲學社會科學版),2021,53(02):164-175+180.
[3]Nellis J G,Longbottom J A.An empirical analysis of the determination of house prices in the United Kingdom[J].Urban Studies,1981,18(01):9-21.
[4]Baffoe-BonnieJ.The dynamic impact of macroeconomic aggregateson housing price and stock of houses:A national and regional analysis.Dordrecht:111e Journal of Real Estate Finance and Economics,1998,17(02):179-197.
(作者單位:蘇州大學應(yīng)用技術(shù)學院。章政為通信作者)