江濟強,王斌,王明建,楊毅
(1.廣東省國土資源測繪院,廣東 廣州 510500; 2.淮海工學(xué)院測繪與海洋信息學(xué)院,江蘇 連云港 222005)
住宅價格問題是目前社會討論的焦點之一,研究城市區(qū)域間住宅價格分布差異很有必要。而城市不同地區(qū)住宅價格一般是分區(qū)域聚集的,說明城市住宅價格分布差異是有規(guī)律的[1],具體來講,就是距離學(xué)校、醫(yī)院、公園、購物中心等地的距離決定了對住宅價格影響的大小[2]。隨著地理信息、互聯(lián)網(wǎng)等技術(shù)的進(jìn)步,越來越多的分析方法相繼涌現(xiàn)。陳震[3]收集昆明城市各小區(qū)住宅價格,用GIS進(jìn)行數(shù)據(jù)分析建模,結(jié)果表明,昆明城市住宅價格由中心向四周遞減,教育、交通、容積率等因素作為次要因素影響著住宅價格。張媛[4]通過報刊等媒介收集銀川市商品房數(shù)據(jù),綜合GIS分析城市的交通、環(huán)境、教育、結(jié)構(gòu)等都是影響城市住宅價格的因素。熊海璐,吳曉燕等[5]通過最小二乘法分析武漢住宅價格表明住宅周圍的環(huán)境和位置是決定住宅價格的最重要因素。
對于未來住宅價格的預(yù)測分析以及規(guī)律尋找,最合適的方法就是借助互聯(lián)網(wǎng)大數(shù)據(jù)建立回歸預(yù)測模型來進(jìn)行分析預(yù)測。陳向陽、陳日新等[6]利用多元線性模型研究2003年~2010年廣州市住宅小區(qū)價格分布趨勢,發(fā)現(xiàn)廣州市住宅小區(qū)價格由市中心CBD向四周呈遞減趨勢,一線城市離CBD的距離是影響住宅價格的主要因素。付益松[7]通過構(gòu)建南昌市2015年3月~10月的住宅價格數(shù)據(jù)庫,利用GIS克里格插值法進(jìn)行分析得出影響住宅價格因子的重用大小依次為:區(qū)位、交通、公共設(shè)施、環(huán)境。
多元線性回歸模型和最小二乘法模型參數(shù)與位置弱相關(guān),預(yù)測的精確性和可靠性較難滿足分析需求,地理加權(quán)回歸模型由于其在某些非平穩(wěn)性問題研究上具有上述模型所沒有的優(yōu)勢[8],近年來得到較快發(fā)展。本文提出一種地理加權(quán)回歸模型算法,通過互聯(lián)網(wǎng)采集研究區(qū)內(nèi)住宅小區(qū)價格及綠化率、購物中心、公園、中小學(xué)、大學(xué)、醫(yī)院等分布數(shù)據(jù),并納入該模型中,全面分析住宅價格受綠化、交通、學(xué)校、醫(yī)院、公園等影響大小,揭示小區(qū)住宅價格的空間分異和不同因子的相關(guān)系數(shù)。
多元線性回歸模型是用描述多個變量對一個變量產(chǎn)生影響的計算模型,一般難以處理變量數(shù)據(jù)實時改變的情況,主要在系統(tǒng)事故數(shù)值研究,系統(tǒng)故障提供預(yù)測以及用于海洋各成分元素研究[8]。為有效分析空間多個平穩(wěn)性變量之間相互影響關(guān)系,并且有效消除非平穩(wěn)性所帶來的誤差,本文采用地理加權(quán)回歸計算模型(Geographically weighted regression,GWR),表達(dá)式為:
(1)
其中,(ui,vi)為第i個樣本點的坐標(biāo),βk(ui,vi)為第i個樣本點的第k個回歸系數(shù),εi為第i個樣本點的隨機誤差,服從數(shù)學(xué)期望為0,方程為σ2的正態(tài)分布。不同樣本點i和j的隨機誤差相互獨立,協(xié)方差為0。即滿足:
εi∝N(0,σ2);Cov(εi,εj)=0(i≠j)
按照加權(quán)最小二乘準(zhǔn)則對式(1)進(jìn)行最優(yōu)估計,建立目標(biāo)函數(shù)表達(dá)式為:
(2)
其中,wij為第i個樣本點與樣本點j之間的核函數(shù),與距離dij相關(guān)。
(3)
(4)
利用地理加權(quán)回歸模型做出的住宅價格分析,有效考慮了影響住宅價格的眾多要素,消除了非平穩(wěn)性因素的影響,若將式(1)中,βk(ui,vi)=βk(uj,vj)(i,j=1,2…n),回歸系數(shù)不隨空間位置變化而變化,則退化為多元線性回歸模型,兩種模型比較如表1所示。
兩者模型比較 表1
通過互聯(lián)網(wǎng)手工及自動抓取研究區(qū)住宅價格并記錄小區(qū)位置及均價,將綠化率、公園、小學(xué)等學(xué)區(qū)以及醫(yī)院、購物中心等納入主要影響因素,分析該區(qū)住宅價格高低區(qū)位變化。通過建立特征價格模型,把影響因素分為內(nèi)部因素、外部因素兩大類別,內(nèi)部因素研究直接可以進(jìn)行建模分析,外部因素通過坐標(biāo)計算距離,通過距離間的關(guān)系來研究。
Yi Yang等指出外部因素對住宅價格影響范圍研究在 1.5 km內(nèi)結(jié)果最佳[8]。按照小區(qū) 1.5 km范圍內(nèi)小學(xué)、中學(xué)、大學(xué)、醫(yī)院、公園、購物中心個數(shù)為依據(jù)來研究各因素對住宅價格影響大小。采集了該轄區(qū)124個小區(qū)的住宅價格和其他自變量的坐標(biāo)數(shù)據(jù),并將變量統(tǒng)一取對數(shù)值,如表2所示(部分?jǐn)?shù)據(jù)):
住宅銷售特征價格變量計算方法和說明 表2
(1)坐標(biāo)轉(zhuǎn)換
由于互聯(lián)網(wǎng)地圖抓取的點經(jīng)緯度為球坐標(biāo),為計算小區(qū)與各因子的距離,需把球坐標(biāo)轉(zhuǎn)換成平面坐標(biāo),本文利用ArcGIS軟件進(jìn)行坐標(biāo)轉(zhuǎn)換,如表3所示(部分?jǐn)?shù)據(jù)):
小學(xué)球面坐標(biāo)轉(zhuǎn)換為平面坐標(biāo)表 表3
(2)計算變量
統(tǒng)計小區(qū)1.5 km范圍內(nèi)綠化率、小學(xué)、中學(xué)、大學(xué)、公園、醫(yī)院、購物中心數(shù)量,對各變量取ln值,如表4所示(部分?jǐn)?shù)據(jù)):
變量分布表 表4
續(xù)表4
利用式(3)、式(4),結(jié)合互聯(lián)網(wǎng)采集預(yù)處理后成果,對各影響因素進(jìn)行計算并輸出制圖,如表5及圖1所示:
各因子熱度分析成果表 表5
總體上看,上述影響因素與住宅價格都具有相關(guān)性,但影響程度并不一致,有些甚至表現(xiàn)一定的負(fù)相關(guān)。在老城區(qū),綠化率、購物中心、公園、小學(xué)與住宅價格總體呈正相關(guān),綠化率越高、購物中心分布越廣、公園數(shù)越多,具備小學(xué)學(xué)區(qū),小區(qū)住宅價格一般越高。其中綠化率、購物中心、公園、小學(xué)相關(guān)系數(shù)最大分別為0.75、0.35、0.51、0.35,可能原因在于老城區(qū)具有住宅密集、人流量大、活動空間緊湊、學(xué)位資源緊張等特征有關(guān)。在新城區(qū),綠化率和住宅價格有負(fù)相關(guān)關(guān)系,說明在新城區(qū)綠化率和住宅價格沒有必然的聯(lián)系,原因可能在于新建小區(qū)環(huán)境相近且相對較好。
同時,可以看出公園對住宅價格的影響由西向東遞增,從老城區(qū)到新城區(qū)對住宅價格的影響越來越大,原因在于新城區(qū)范圍內(nèi)公園數(shù)量不足造成的。醫(yī)院、大學(xué)、中學(xué)對住宅價格幾乎不產(chǎn)生影響,相關(guān)系數(shù)分布沒有規(guī)律可循。特別是城市周邊的小區(qū),醫(yī)院距離對其住宅價格的影響可以忽略不計,交通便利是造成這一現(xiàn)象的主要原因。考慮選取樣本所在轄區(qū)高校數(shù)量較少,人數(shù)總量偏低以及中考不存在就近入讀等因素,大學(xué)、中學(xué)與周圍小區(qū)住宅價格影響極小。
圖1城市住宅價格各因子熱度分析圖
本文通過采集某轄區(qū)124個小區(qū)的住宅價格數(shù)據(jù),通過構(gòu)建地理加權(quán)回歸模型,揭示小區(qū)住宅價格的空間分異和不同因子的影響,解決了回歸系數(shù)隨空間位置變化而變化的問題,但尚未解決回歸系數(shù)隨時間變化效應(yīng)。目前,已有部分學(xué)者提出時空地理加權(quán)回歸模型(GTWR),但構(gòu)建最優(yōu)時空帶寬及時空核函數(shù)等關(guān)鍵技術(shù)以減少模型的位置參數(shù)、降低擬合的計算量等方面,需要進(jìn)一步研究。