国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于神經(jīng)網(wǎng)絡衡量公園可達性對房價的影響

2020-11-30 08:08:06李蔚民牛卓穎張英杰
價格月刊 2020年9期
關鍵詞:房價公園神經(jīng)網(wǎng)絡

李蔚民牛卓穎張英杰

(1.北京林業(yè)大學 理學院,北京 100083;2.北京林業(yè)大學 經(jīng)濟與管理學院,北京 100083)

一、研究背景

準確的房價預測模型能更好地表示出各因素對房價的影響程度,提高房地產(chǎn)市場的效率。隨著城市化的推進,城市公園成為人們平時休閑散步的好去處。由于城市公園美化環(huán)境、提供休閑場所等原因,對其周圍房價具有一定的影響。

特征價格模型是房地產(chǎn)價格評估常用的方法之一。該模型從城市經(jīng)濟學的角度,將影響房價的固定因素如房屋年代、房屋面積等作為影響因子進行房屋定價,避免了人為因素的干擾。很多文獻使用特征價格模型來研究某一特定因素對住房價格的影響,例如基礎教育資源[1]、濕地生態(tài)[2]、純郊區(qū)軌交線[3]對房價的影響。特征價格模型也被用來衡量房屋相對位置對房價的影響[4],并且在城市綠地的經(jīng)濟價值研究中也有應用。[5]

雖然特征價格模型普遍地用于估計房價和房地產(chǎn)價值,且該模型使用簡單,可以得到各因素與房價的關系,但是傳統(tǒng)的特征價格模型主要是線性模型、對數(shù)模型,其中線性模型并不能非常有效地解決非線性多變量的情況,對數(shù)模型在較大數(shù)據(jù)集下容易受到異常值影響,在精確度方面還有所欠缺。近幾年興起的人工神經(jīng)網(wǎng)絡技術在非線性多變量的預測上大放異彩,在房價預測方面也有突出的貢獻,部分研究者對比過神經(jīng)網(wǎng)絡模型和特征價格模型的預測效果。國內(nèi)較多研究[6-8]用神經(jīng)網(wǎng)絡來解決特征價格模型在處理非線性多變量情況時結果準確度低的問題,并通過比較預測結果相對真實值的誤差大小證明了神經(jīng)網(wǎng)絡模型的預測效果要優(yōu)于特征價格模型。國外的一些研究也將特征價格模型和人工神經(jīng)網(wǎng)絡結合起來對比分析,比較兩種方法的預測效果。[9]

但大部分針對神經(jīng)網(wǎng)絡的研究只是單一地用一個地區(qū)的二手房數(shù)據(jù)來比較神經(jīng)網(wǎng)絡模型和特征價格模型的預測效果,沒有將神經(jīng)網(wǎng)絡模型發(fā)揮出和特征價格模型一樣的作用,即沒有將神經(jīng)網(wǎng)絡模型用于評估單個因素對房價的影響。有少部分研究采用了神經(jīng)網(wǎng)絡并且利用平均影響值(MIV)算法量化影響因素的影響程度[10],但研究側重的影響因素為商品住宅供給面積、商品住宅銷售面積、土地增值稅、商業(yè)貸款利率、城市居民消費價格指數(shù)、地區(qū)生產(chǎn)總值、城鎮(zhèn)居民人均可支配收入。

筆者將分別采用特征價格模型和神經(jīng)網(wǎng)絡模型預測房價,比較兩種預測結果的決定系數(shù)(R2)和絕對誤差(MAD),驗證了神經(jīng)網(wǎng)絡模型預測結果相比特征價格模型預測結果的精確度要高。使用根據(jù)平均影響值(MIV)算法原理改進的方法確保在不出現(xiàn)異常值的情況下量化到公園距離對房價的影響程度,拓寬了神經(jīng)網(wǎng)絡模型在變量影響程度量化中的應用范圍。

二、模型介紹

(一)特征價格模型

特征價格模型將商品分解為各個特征,商品的價格由所有特征帶給人們的效用決定。比如房地產(chǎn)商品的特征包括年代、朝向和面積等,所有這些特征的綜合效用決定了商品價格。一般來說,分解出的特征越多,模型預測的房價準確度越高。

特征價格模型在很多方面均有應用,如在探究城市鄰避型服務設施對住宅價格的影響[11]、藝術品拍買價格評估[12]、藥品價格[13]等方面。

線性形式的特征價格模型表示為:

其中,P表示房價,α0是常數(shù)項,表示除特征變量對房價的影響外其他所有影響價格的常量之和,βn和Xn分別表示第n個特征與房價關系的系數(shù)和第n個特征的值,ε表示隨機誤差變量,N表示樣本的數(shù)量。

雖然傳統(tǒng)的特征價格模型在房價預測方面表現(xiàn)尚可,但由于其線性模型的局限性十分明顯,模型最后的擬合效果不是十分準確。之后的研究者對此進行改進,設計出非線性形式的特征價格模型。

對數(shù)形式(Log-Log):

公式(2)中λn表示第 n個特征 Xn取為 lnXn后與lnP的系數(shù),公式(3)中μn表示第n個特征Xn與lnP關系的系數(shù),公式(4)中 γn表示lnXn與房價關系的系數(shù)。

除此之外,為了得到更精確的結果,有學者提出了更為復雜的函數(shù)形式,比如Translog Production Function。[14]

其中,ηij表示第i個特征Xi和第j個特征Xj均取為e的對數(shù)后的乘積與lnP關系的系數(shù)。

盡管有很多非線性模型被構造了出來,但是由于研究問題的多樣性,未必能夠從眾多的模型中找到適合的模型,而且尋找合適模型的過程比較繁瑣。

另外由于各因素之間可能存在多重共線性、自變量相互作用、非線性、異常數(shù)據(jù)點等因素導致特征價格模型擬合效果較差,很難找到適合的模型。而最近幾年興起的人工神經(jīng)網(wǎng)絡在非線性擬合方面效果顯著,也逐漸被運用在房價預測方面,例如對南京、唐山等地房價的研究。[15,16]

(二)神經(jīng)網(wǎng)絡模型

隨著科學技術的發(fā)展及計算機運算能力的大幅提高,神經(jīng)網(wǎng)絡技術飛速發(fā)展,主要的應用范圍也從原來的二分類問題擴展到計算機視覺(Computer Vision)[17]、自然語言處理(Natural Language Processing)[18]等多個方面,其中最主要的結構就是BP神經(jīng)網(wǎng)絡。

BP神經(jīng)網(wǎng)絡首先是輸入層,然后是與輸入層相連的隱藏層,其中隱藏層可以有多層,每層包含很多神經(jīng)元。每層的神經(jīng)元和其前后相鄰層神經(jīng)元之間建立一種連接,其中每一層神經(jīng)元的狀態(tài)變化只會對下一層中與它相連神經(jīng)元的狀態(tài)造成影響,通過改變這種連接來調(diào)整輸入和輸出之間的關系。網(wǎng)絡的計算過程先是輸入正向傳播計算,然后根據(jù)輸出的結果再進行誤差的反向傳播計算。各個特征數(shù)據(jù)從輸入層輸入后,在隱藏層中逐層傳遞,最終從輸出層輸出結果。如果最終輸出結果與真實值的損失值過大超出閾值,則進行誤差反向傳播,沿原來的連接路徑逐層返回誤差信號,通過梯度下降法修改各神經(jīng)元之間的連接狀態(tài),直到輸入的正向傳播計算結果與真實值的損失函數(shù)值小于閾值。根據(jù)該網(wǎng)絡計算原理,只要在隱藏層加入非線性激活函數(shù)(例如tanh函數(shù)),保證訓練次數(shù)足夠,最后的輸出結果將會具有非線性。

筆者采用的神經(jīng)網(wǎng)絡模型結構包含一個輸入層、三個隱藏層、一個輸出層,每層之間均為全連接結構,每層的輸出結果均采用tanh激活函數(shù)。模型結構的簡單示意圖如圖1。

圖1 本研究中神經(jīng)網(wǎng)絡模型結構

文中,變量分為數(shù)值變量和因子變量兩種,因子變量在導入模型之前都需要經(jīng)過初步處理,為了避免人為賦值造成的影響,將其轉化為one-hot數(shù)據(jù)集的形式。轉化后的數(shù)據(jù)維度是103維,故輸入層的節(jié)點個數(shù)為103,隱藏層1設置的節(jié)點個數(shù)為128,隱藏層2設置的節(jié)點個數(shù)為64,隱藏層3設置的節(jié)點個數(shù)為16,輸出層節(jié)點數(shù)為1,每層節(jié)點之間均采用全連接結構。

其中每個節(jié)點的計算方式見圖2。圖中f0代表的函數(shù)為tanh函數(shù)。

圖2 每個節(jié)點的計算過程結構示意圖

三、實證研究

(一)數(shù)據(jù)說明

1.數(shù)據(jù)來源及變量說明

筆者選取2014年4月到2019年10月北京兩大城市公園(奧林匹克森林公園、朝陽公園)周邊地區(qū)的二手房交易記錄及其區(qū)位特征,其中奧林匹克森林公園周邊有效二手房數(shù)據(jù)7043條,朝陽公園周邊有效二手房數(shù)據(jù)5023條。所有二手房交易數(shù)據(jù)均為北京市住房和城鄉(xiāng)建設委員會官方發(fā)布,區(qū)位特征基于百度地圖統(tǒng)計得來,其中二手房到公園的距離通過百度地圖按直線距離計算所得,保證數(shù)據(jù)的真實性和準確性。

在本研究中,將二手房的交易價格作為被解釋變量,解釋變量中數(shù)值型變量包括成交日期、房屋年代、物業(yè)費、周邊醫(yī)院數(shù)、周邊地鐵站數(shù)、到公園的距離、小區(qū)綠化率,因子型變量包括戶型、朝向、樓層、裝修狀況。

2.解釋變量的數(shù)值化處理方法

對于數(shù)值型變量,為了減小模型訓練時的計算量以及避免部分變量值過大對模型權重的影響較大,將每一條數(shù)值型變量均進行0-1歸一化處理,對各變量數(shù)據(jù)進行如下變換:

其中,xi表示該變量第 i個的值,xmin,xmax分別表示該變量中最小值和最大值。通過該計算后,所有變量的值均控制在0,1之間。對于因子變量,當選定其中某一個子因子后,將其設為1,其他因子所表征的設為0,對每個變量包含的子因子進行遍歷,形成此變量下的矩陣。

(二)模型評估

對預測結果評估好壞最直觀的就是預測結果與真實值的偏差大小,采用決定系數(shù)(R2)和絕對誤差(MAD)來評估模型預測結果的好壞。具有較高R2和較低MAD的模型被認為是相對優(yōu)越的模型。

其中,Pi是第i個樣本的每平方米實際房價,是第i個樣本的每平方米估計房價,是所有樣本每平方米平均房價,n是預測的樣本數(shù)。

對兩個公園周圍的二手房交易數(shù)據(jù),分別采用線性模型、半對數(shù)形式(Semi-Log)、對數(shù)形式(Log-Log)、對數(shù)線性模式(Log-Linear)、神經(jīng)網(wǎng)絡模型來預測房價,并分別計算其MAD和的值,結果見表1。

表1 五種模型預測結構得到的MAD和R2

從表1的結果可以發(fā)現(xiàn),神經(jīng)網(wǎng)絡模型的MAD要明顯低于特征價格模型的MAD,R2明顯高于特征價格模型的R2,可見神經(jīng)網(wǎng)絡模型的預測效果要明顯優(yōu)于特征價格模型。對于更加復雜的非線性特征價格模型,需要研究者逐個嘗試,比較耗時并且不一定能找到適合的非線性模型。反觀神經(jīng)網(wǎng)絡模型,只需研究者設計好網(wǎng)絡結構,預處理好數(shù)據(jù),便可把數(shù)據(jù)導入訓練,讓模型自己去尋找預測效果最優(yōu)的網(wǎng)絡參數(shù),不僅省去了模型的探索過程,而且預測效果還有很大提高。因此,神經(jīng)網(wǎng)絡模型在房地產(chǎn)定價的模擬中更為優(yōu)越,不失為一種較優(yōu)的適用于房地產(chǎn)估價的數(shù)值方法。

(三)影響程度量化

神經(jīng)網(wǎng)絡模型雖然對模型探索和預測效果方面有很大提升,但由于網(wǎng)絡的復雜度以及參數(shù)眾多,導致單一自變量對單位面積房價的影響程度的衡量變得比較困難。根據(jù)網(wǎng)絡的設計結構可知網(wǎng)絡的計算公式:

其中的乘積運算均為矩陣乘法,X表示輸入的矩陣,W1、W2、W3、W4分別表示輸入層與隱藏層 1、隱藏層1與隱藏層2、隱藏層2與隱藏層3、隱藏層3 與輸出層之間的連接矩陣。 b1、b2、b3、b4分別表示輸入層與隱藏層1、隱藏層1與隱藏層2、隱藏層2與隱藏層3、隱藏層3與輸出層之間的偏置矩陣。

奧森公園的數(shù)據(jù)經(jīng)過預處理后還有7043條,朝陽公園的數(shù)據(jù)經(jīng)過預處理后還有5023條,兩個公園的神經(jīng)網(wǎng)絡模型中各矩陣的維度大小見表2。

表2 神經(jīng)網(wǎng)絡模型中各參數(shù)的維度大小

其中矩陣 b1、b2、b3、b4會通過python中和numpy中array數(shù)據(jù)類型的自動廣播機制將行數(shù)擴充到與對應的 W1、W2、W3、W4行數(shù)相同。

單一變量的變化將導致后續(xù)網(wǎng)絡各節(jié)點的全部更新,很難直接從公式中得出其影響程度,需要量化神經(jīng)網(wǎng)絡模型中單一變量對單位面積房價的影響程度。

采用根據(jù)MIV算法原理改進的量化方法,將原始數(shù)據(jù)的單一自變量每個增加一個標準差A,得到一個新的訓練數(shù)據(jù)自變量,用原始數(shù)據(jù)和新的數(shù)據(jù)預測兩組結果,假設兩組預測結果的均值為B0和B1,求出B1和B0的差值,然后除以標準差A就得到了影響程度。

到公園距離對單位面積房價的影響程度量化結果如表3。

表3 神經(jīng)網(wǎng)絡模型計算得到的彈性系數(shù) (元/米)

圖3 奧森公園預測結果均值隨著距公園距離增加的變化曲線

圖4 朝陽公園預測結果均值隨著距公園距離增加的變化曲線

進一步計算原數(shù)據(jù)集每條數(shù)據(jù)中到公園距離增加0km~3km對最終預測結果均值的影響,并繪制最終預測結果均值的變化曲線見圖3、圖4。

由圖3、圖4和表3的結果可以直觀發(fā)現(xiàn):隨著距公園距離的增加,每單位面積的房價在降低,即距離公園越遠單位面積房價越低。

(四)實證結果分析

筆者通過神經(jīng)網(wǎng)絡模型,以北京市奧森公園和朝陽公園周邊住宅價格為研究對象,實證了到公園距離對房地產(chǎn)價格走勢的影響作用,結果表明:到公園距離越遠則房價越低,并且奧森公園對房價的影響程度高于朝陽公園。

公園綠地不僅可以美化環(huán)境,還可以凈化城市空氣、增加空氣濕度、降低熱島效應、給人們提供活動場所。奧森公園和朝陽公園的實證研究表明它們對房價的影響是正向的,說明居民希望居住在公園附近,而且希望離公園越近越好,意味著他們將從公園獲得更高的隱性價值。另外奧森公園的公園面積為680平方千米,綠化率為95.61%,朝陽公園面積為288.7平方千米,綠化率為87%。相比之下,奧森公園的面積和綠化率均高于朝陽公園,根據(jù)公園面積對房價的影響研究[19],公園面積和房價是正相關,說明了奧森公園對房價的影響要高于朝陽公園,另外表3中奧森公園的彈性系數(shù)絕對值要高于朝陽公園??梢?,面積越大的公園宜人性越好,離其越近的居民所能得到的宜人性價值也就越高。

從圖3、圖4發(fā)現(xiàn),朝陽公園的變化曲線一開始并沒有像奧森公園那樣直接下降,其原因可能是由于朝陽公園位于四環(huán)以內(nèi),周邊商圈、中小學校眾多,小幅增加距公園的距離將使得房區(qū)更加靠近某一商圈或某一重點學校,同時房屋到公園的距離適中,使得二手房價格不會有太大減幅。并且物業(yè)價值隨著距市中心距離的增加而下降[20],而筆者收集的數(shù)據(jù)中并沒有包含到商圈和到學校的距離。這是在之后研究中可以提升的地方,一般來說收集影響房價的屬性因子越全面,預測的效果就越好。

四、結語

筆者將傳統(tǒng)的特征價格模型和神經(jīng)網(wǎng)絡模型預測效果進行比較,發(fā)現(xiàn)神經(jīng)網(wǎng)絡模型的MAD明顯低于特征價格模型,R2明顯高于特征價格模型,驗證了神經(jīng)網(wǎng)絡模型的預測效果更優(yōu)于特征價格模型。將到公園的距離添加到房價影響因子的范疇,探究其距離遠近變化對房價的影響,并使用基于MIV算法改進后的方法量化到公園的距離對房價的影響,保證在不出現(xiàn)異常值的情況下量化影響程度。相比使用特征價格模型,神經(jīng)網(wǎng)絡預測結果更準確,量化的影響程度也更具有說服力。由于收集到的數(shù)據(jù)不夠全面,導致一些潛在因素的影響無法消除,使得到公園距離對房價的影響程度的量化受到一些影響。對房價有影響的因素收集得越全面,將能夠進一步削弱潛在因素的影響,并提高預測的準確性。

猜你喜歡
房價公園神經(jīng)網(wǎng)絡
我家門前的小公園
軍事文摘(2022年14期)2022-08-26 08:15:26
兩大手段!深圳土地“擴權”定了,房價還會再漲?
在公園里玩
小太陽畫報(2020年4期)2020-04-24 09:28:22
神經(jīng)網(wǎng)絡抑制無線通信干擾探究
電子制作(2019年19期)2019-11-23 08:42:00
防范未然 “穩(wěn)房價”更要“穩(wěn)房租”
中華建設(2019年8期)2019-09-25 08:26:04
去庫存的根本途徑還在于降房價
公民與法治(2016年8期)2016-05-17 04:11:34
2016房價“漲”聲響起
基于神經(jīng)網(wǎng)絡的拉矯機控制模型建立
重型機械(2016年1期)2016-03-01 03:42:04
復數(shù)神經(jīng)網(wǎng)絡在基于WiFi的室內(nèi)LBS應用
一見如故
新兴县| 高邑县| 上林县| 双桥区| 茂名市| 涞水县| 雷州市| 凉城县| 河源市| 宝坻区| 云和县| 鹤壁市| 武威市| 金溪县| 花垣县| 松滋市| 望城县| 固始县| 梁山县| 汝南县| 天门市| 鱼台县| 沅陵县| 本溪市| 武威市| 双城市| 牟定县| 松滋市| 盐山县| 射洪县| 海盐县| 安龙县| 吴江市| 上思县| 景东| 永春县| 中江县| 乐都县| 呼图壁县| 左云县| 柯坪县|