徐瑞辰
摘要:量化北京二手房單位面積均價與房屋面積,臥室數(shù),廳數(shù),樓層數(shù),房屋所在區(qū),周邊有無地鐵或學校之間的影響關系,并且定量給出方程用以確定具體的數(shù)量關系。
關鍵詞:量化分析;異方差分析;殘差分析
在繪制房間數(shù),廳數(shù)箱線圖之前,我們有必要對其數(shù)量進行調整,由于房間數(shù)大于五間的聊聊無幾,同時廳數(shù)大于2間的也不多,所以將房間數(shù)大于五間,廳數(shù)大于2間的分別劃分為一類,顯然這樣做既不會過多的干擾結果的可靠性,也將大大較少分析負擔。
一、分析如下:
1.二手房平米均價與臥室數(shù)關系
在臥室數(shù)改變時,很明顯的發(fā)現(xiàn)0間臥室的房子均價最低,且隨著臥室數(shù)量的上升,價格逐漸上升。當臥室數(shù)為5間及以上,價格波動明顯增大,均價增高,說明大戶型房屋的調價空間更大,價格更加參差。但要特別注意,當臥室數(shù)量上升時,每類房子的最高價格下降,從一定程度上說明臥室少的房子有部分可能有特殊用途導致價格上升,這可能就是異常點的來源。
2.二手房平米均價與廳數(shù)關系
隨著廳數(shù)的不斷增加,價格波動先增加后來減少,最高價格逐漸減少,平均價格基本穩(wěn)定。零廳的房子價格高,很可能時因為這種房子地段極好所以價格高。
3.二手房平米均價與樓層關系
地下室最為便宜,而且價格相對于其他樓層價格波動最為不明顯,剩下的low,middle與high價格波動程度,最高價,中位價格基本相當。
4.二手房平米均價與城區(qū)關系
西城區(qū)靠近北京中心房價最高,這里同時也有許多高檔住宅,所以價格波動也是最大。海淀區(qū),東城區(qū)緊隨其后,兩者價格差不多,朝陽區(qū),石景山區(qū),豐臺區(qū)價格較低,且尤其是豐臺區(qū)和石景山區(qū)房屋價格波動同時也表現(xiàn)的較為緩和。
5.二手房平米均價與有無地鐵,有無學校的關系
有學校與地鐵的房屋明顯比沒有這些設施的房屋價格貴,尤其是學校,有的房屋周邊有學校價格甚至比沒有學校的類似房屋高接近兩倍,這也就側面符合北京天價學區(qū)房的事實。有地鐵的房子雖然增價幅度沒有那么大,但是價格也表現(xiàn)出了明顯的上升。這也就說明了房價與周邊是否有學校,地鐵也有關系。
綜上所述,影響房屋平米均價的內部因素有面積、臥室數(shù)、廳數(shù),影響房屋價格的外部因素有地區(qū)、樓層、有無地鐵、有無學校。下面我將建模探究這些與房價之間的定量關系。
二、結論及建議
1.結論
此次通過對16795組北京二手房數(shù)據(jù)的研究,得出北京二手房單位面積價格與內在因素(面積,臥室數(shù),廳數(shù)),外在因素(樓層數(shù),地區(qū),周邊有無學校,周邊有無地鐵)的線性相關。根據(jù)數(shù)次檢驗,分析,最終用相對“合理”的16001組數(shù)據(jù)進行方程擬合,基本符合多元線性擬合的基本假設,尤其是異方差消除最為出色,較為合理地解決了開篇提出的兩個問題。
2.建議
在北京有想了解二手房價格的可以借鑒的使用本篇論文所擬合出的方程,其方程所確定的價格有著一定的指導作用。但是兩種情況下慎用:①所估計房價與本篇論文寫作時間差距過大。北京房價變化太過于劇烈,漲勢明顯,如果時間相差不遠,推薦使用2倍的當年通貨膨脹率進行終值計算。②所估計房產比較“特別”,比方說黃金地段的一室一廳,貴賓區(qū)的房子(原因:計算時,上述數(shù)據(jù)我認為大多它們構成異常值,離群值去除,所以模型沒有辦法表現(xiàn)出這些值的特點)。
三、未來研究方向
我未來的研究方向主要是三個方面:
1.尋找其他可能影響房價的因素,比方說地區(qū)綜合交通情況,地區(qū)環(huán)境狀況,地區(qū)文化氛圍狀況,以及找出指標來專門刻畫那些貴賓專用的房間,使其不會成為異常值,或者離群點被剔除出去;
2.改善擬合方法,這次擬合我主要的目的就是消除異方差,但是忽略了其他因素,比方說偏度,峰度,尋找更加合理的連結函數(shù),找出更精確的刻畫擬合“合理性”的方法;
3.這也是本次模型建立最失誤的地方,我沒有充分運用老師所提供的數(shù)據(jù)。未來我進行研究時結合經(jīng)緯度,小區(qū)名字,小區(qū)規(guī)模進行分析,得出適合更加廣泛,盡可能精準的模型。
參考文獻:
[1]王華麗.多元線性回歸實例分析[J].科技資訊,2014,(29):22.
[2]費宇.郭民之等著.多元統(tǒng)計分析[M].中國人民大學出版社.