摘要:如今房地產(chǎn)市場(chǎng)容易出現(xiàn)暴漲暴跌的情況,很多大城市的房?jī)r(jià)已經(jīng)達(dá)到了普通人不能接受的程度,如何高效地解決房地產(chǎn)的問(wèn)題,一個(gè)較好的方案是準(zhǔn)確地預(yù)測(cè)出未來(lái)的房地產(chǎn)市場(chǎng)行情。本文利用神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)房?jī)r(jià)的走勢(shì),優(yōu)勢(shì)在于神經(jīng)網(wǎng)絡(luò)類(lèi)似于人腦的結(jié)構(gòu),具有仿生的特點(diǎn),能夠擬合出復(fù)雜的模型結(jié)構(gòu),對(duì)房?jī)r(jià)預(yù)測(cè)的任務(wù)會(huì)有比較好的效果。房?jī)r(jià)預(yù)測(cè)模型可以有效地解決當(dāng)今房地產(chǎn)市場(chǎng)所存在的一些問(wèn)題,幫助人們理性的投資,切實(shí)地解決人們買(mǎi)房難的問(wèn)題,創(chuàng)造更加和諧美滿(mǎn)的社會(huì)。
關(guān)鍵詞:神經(jīng)網(wǎng)絡(luò);房?jī)r(jià)預(yù)測(cè);機(jī)器學(xué)習(xí);人工智能;大數(shù)據(jù)
中圖分類(lèi)號(hào):F299.23;TP183 文獻(xiàn)識(shí)別碼:A文章編號(hào):
2096-3157(2020)03-0128-03
一、引言
1.房?jī)r(jià)預(yù)測(cè)的目的
目前房地產(chǎn)市場(chǎng)有很多違規(guī)的建筑,價(jià)格不透明,為了獲利不擇手段導(dǎo)致房屋質(zhì)量下降,商品房的價(jià)格上漲過(guò)快,很多人面臨買(mǎi)房難的問(wèn)題,為了有效地緩解目前房地產(chǎn)所存在的問(wèn)題,本文提出了一種基于神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)房?jī)r(jià)的模型結(jié)構(gòu)。通過(guò)房?jī)r(jià)預(yù)測(cè)可以更好地觀(guān)察未來(lái)的房地產(chǎn)市場(chǎng)走向,以降低房地產(chǎn)投資風(fēng)險(xiǎn);利用房?jī)r(jià)預(yù)測(cè)的能力獲得更大的財(cái)富,更加規(guī)范房地產(chǎn)市場(chǎng)行情,避免出現(xiàn)暴漲暴跌。
2.當(dāng)今相關(guān)領(lǐng)域的現(xiàn)狀和弊端
當(dāng)今仍有許多的房?jī)r(jià)預(yù)測(cè)不夠精準(zhǔn),導(dǎo)致人們?cè)谫?gòu)房,買(mǎi)房時(shí)遇到很大的困難,如資金不足、地段不理想等問(wèn)題。除此之外,炒房這一行為越來(lái)越風(fēng)靡。部分商品房漲價(jià)的速度非常之快,導(dǎo)致普通人的購(gòu)買(mǎi)力不足以支付此類(lèi)房產(chǎn)。隨著科技的快速發(fā)展、人們生活質(zhì)量的提高,越來(lái)越多的因素決定著房?jī)r(jià)的高低。所以在預(yù)測(cè)房?jī)r(jià)時(shí),精準(zhǔn)把握影響房?jī)r(jià)的因素是十分關(guān)鍵的,但由于影響因素非常之多,所以常常難以準(zhǔn)確地預(yù)測(cè)出房?jī)r(jià)。同時(shí)。在眾多影響房?jī)r(jià)的因素里面,也有主次關(guān)系之分,能夠辨別出影響房?jī)r(jià)的主要因素,在進(jìn)行房?jī)r(jià)預(yù)測(cè),可以更實(shí)際的反映房?jī)r(jià)。但是影響因素非常之多,難以準(zhǔn)確地找出影響房?jī)r(jià)的主導(dǎo)因素。
3.預(yù)測(cè)系統(tǒng)的優(yōu)點(diǎn)
該系統(tǒng)可以處理多種多樣的程序,并且進(jìn)行大規(guī)模的計(jì)算。如今有大量可使用的數(shù)據(jù),這些數(shù)據(jù)是在過(guò)去幾年、幾十年中收集的。隨著科技的快速發(fā)展,使得神經(jīng)網(wǎng)絡(luò)能夠真正發(fā)揮其作用,因?yàn)樯窠?jīng)網(wǎng)絡(luò)獲得的數(shù)據(jù)越多,表現(xiàn)越好。而且神經(jīng)網(wǎng)絡(luò)的計(jì)算能力可以讓我們處理相對(duì)于傳統(tǒng)計(jì)算方法的更多數(shù)據(jù)。
二、利用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)房?jī)r(jià)
1.神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是一種計(jì)算量大的算法。由于近年來(lái)計(jì)算機(jī)的迅速發(fā)展,它才可以進(jìn)行大規(guī)模的運(yùn)算。神經(jīng)網(wǎng)絡(luò)算法來(lái)源于人腦的結(jié)構(gòu),由于人腦是可以處理多種任務(wù)的,所以也許有一種學(xué)習(xí)算法可以同時(shí)處理視覺(jué)、聽(tīng)覺(jué)和觸覺(jué),而不是運(yùn)行數(shù)千個(gè)不同的程序。因此,我們需要做的是找到近似的人腦學(xué)習(xí)算法,然后讓該算法學(xué)習(xí)如何處理這些不同類(lèi)型的數(shù)據(jù)。
2.房?jī)r(jià)數(shù)據(jù)集的介紹
由于本研究需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練和學(xué)習(xí),但是一般情況下,交易中心都將房?jī)r(jià)數(shù)據(jù)保密,所以本文使用的數(shù)據(jù)來(lái)自于1970年美國(guó)波士頓的房地產(chǎn)相關(guān)信息,這些數(shù)據(jù)包括樓間距、小區(qū)環(huán)境、是否處于市中心等。通過(guò)運(yùn)轉(zhuǎn)下面兩個(gè)代碼①print(train_data.shape)②print(test_data.shape),從而測(cè)出訓(xùn)練集的大小。之后得到結(jié)果為(404,13)(102,13)。本文的數(shù)據(jù)單位是千美元,訓(xùn)練集對(duì)應(yīng)的結(jié)果如圖1。
圖1顯示,這一年波士頓的房?jī)r(jià)中位數(shù)在一萬(wàn)到一萬(wàn)五美元之間。但是,如果把不同格式、不同單位的數(shù)據(jù)雜糅一起輸入網(wǎng)絡(luò)會(huì)影響結(jié)果的準(zhǔn)確度。因此,本研究需要把數(shù)據(jù)的格式統(tǒng)一起來(lái),將數(shù)據(jù)歸一化處理。歸一化可以利用如下的方式:將該數(shù)據(jù)減去這個(gè)屬性所有數(shù)據(jù)的最小值,然后除以該屬性最大值與最小值的差值,這樣就可以把該屬性的所有數(shù)據(jù)壓縮到[0,1]之間。
理解房?jī)r(jià)以及對(duì)房?jī)r(jià)影響較大的變量,對(duì)重要數(shù)據(jù)及影響方向有明確認(rèn)知,以保證建模的合理性,降低被數(shù)據(jù)帶偏的風(fēng)險(xiǎn),可能的房?jī)r(jià)主要影響因素有房子地段、交通、面積、配套設(shè)施等。確認(rèn)數(shù)據(jù)變量構(gòu)成、含義及對(duì)因變量影響力,用神經(jīng)網(wǎng)絡(luò)處理后得到房?jī)r(jià)與主導(dǎo)因素的關(guān)系。
3.前向傳播算法
前向傳播算法也就是利用深度網(wǎng)絡(luò)中的若干的權(quán)重系數(shù)矩陣、偏置向量來(lái)和輸入值向量進(jìn)行一系列線(xiàn)性運(yùn)算和激活運(yùn)算,從輸入層開(kāi)始,一層層地向前計(jì)算,一直到輸出層,得到輸出結(jié)果為止。
當(dāng)用前向傳播算法從上一層算到下一層時(shí),要使用激活函數(shù),避免多次線(xiàn)性的運(yùn)算導(dǎo)致使用多層的神經(jīng)網(wǎng)絡(luò)和使用一層直接算出的方法沒(méi)有區(qū)別。常用的激活函數(shù)一共有四個(gè),分別如圖2所示。
函數(shù)1的表達(dá)式為:y=11+e-x
函數(shù)2的表達(dá)式為:y=ex-e-xex+e-x
函數(shù)3的表達(dá)式為:y=x;x≥00;x<0