祁 煒
(北京師范大學(xué) 地理科學(xué)學(xué)部,北京 100875)
住宅的異質(zhì)性問題是房價(jià)指數(shù)編制中需要面對的重要問題。構(gòu)成不同住宅價(jià)格的各個(gè)特征,如位置、樓層、朝向、小區(qū)環(huán)境、所在區(qū)域的交通狀況、教育資源等,因缺乏統(tǒng)一的價(jià)格標(biāo)準(zhǔn),無法直接進(jìn)行比較,需要客觀準(zhǔn)確的方法對住宅價(jià)格進(jìn)行合理評估。特征價(jià)格法較好地克服了市場比較法等傳統(tǒng)方法中存在的問題,有較好的評估效果。國際上從20世紀(jì)80年代已經(jīng)在房地產(chǎn)價(jià)格評估中采用這一方法,我國仍處于理論研究和實(shí)踐的探索階段。
本文以非線性Hedonic模型為基本模型。在影響住宅價(jià)格的各種因素中廣泛地選擇特征變量,進(jìn)行顯著性檢驗(yàn),通過顯著性檢驗(yàn)的特征作為特征價(jià)格模型的自變量保留,建立房價(jià)與特征變量之間的關(guān)系。選取足夠的樣本,運(yùn)用傳統(tǒng)的參數(shù)回歸方法進(jìn)行回歸分析,檢驗(yàn)?zāi)P偷慕忉屇芰ΑMㄟ^對線性、半對數(shù)、對數(shù)等形式特征價(jià)格模型的對比分析,選取擬合度較好的模型,并采用Box-Cox變換進(jìn)行優(yōu)化,建立特征價(jià)格模型,并以武漢市新建商品住宅為例進(jìn)行住宅價(jià)格指數(shù)編制。
基于國內(nèi)外研究經(jīng)驗(yàn)及武漢市的城市特點(diǎn),結(jié)合數(shù)據(jù)獲取的難易程度,本文從住宅的區(qū)位特征、建筑特征、環(huán)境特征三方面綜合選取了22個(gè)特征因素,加上時(shí)間變量,共量化為26個(gè)特征變量。具體解釋如下頁表1所示:
(1)網(wǎng)簽數(shù)據(jù)。房管部門備案登記的武漢市2015年1月至2016年5月期間的網(wǎng)簽數(shù)據(jù)。網(wǎng)簽數(shù)據(jù)中包含的特征變量有:住房價(jià)格、住房區(qū)位、所在樓層、層高類別和建筑結(jié)構(gòu)。(2)國家統(tǒng)計(jì)局房價(jià)信息管理系統(tǒng)數(shù)據(jù)。包含的特征變量主要有:綠化率、容積率、車位比、開盤時(shí)間。(3)實(shí)地調(diào)查取得的補(bǔ)充數(shù)據(jù)。網(wǎng)簽數(shù)據(jù)只能提供部分特征變量值,考慮到數(shù)據(jù)搜集的可操作性和數(shù)據(jù)的可獲得性,通過抽樣調(diào)查的方法補(bǔ)充網(wǎng)簽和房價(jià)信息管理系統(tǒng)無法直接提供的特征值。主要包括樓盤交通情況、教育資源、休閑環(huán)境、商業(yè)環(huán)境等。
1.3.1 分層抽樣選取實(shí)地調(diào)查樣本
采用精度控制下分層簡單隨機(jī)抽樣的方法,在有網(wǎng)簽數(shù)據(jù)的1707個(gè)樓盤中抽選94個(gè)樣本樓盤。抽樣方法如下:①精度控制:以1707個(gè)樓盤17個(gè)月網(wǎng)簽數(shù)據(jù)為總體,控制總量指標(biāo)的抽樣精度,要求在95%的概率保證程度下,樓盤價(jià)格的最大相對誤差控制在5%以內(nèi)。②數(shù)據(jù)清理:在抽樣之前,剔除網(wǎng)簽數(shù)據(jù)中保障性住宅、存在明顯登記錯(cuò)誤的記錄、累計(jì)銷售套數(shù)在200以下和每月均價(jià)4000元以下的樓盤。③樣本抽選:以各樓盤17個(gè)月成交均價(jià)為依據(jù),采用累計(jì)平方根法確定分層界限,共分為5層,確定出本文所需樣本數(shù)為94個(gè)。分配結(jié)果如下頁表2所示。采用“永久隨機(jī)數(shù)”方法抽取樣本。
1.3.2 實(shí)地調(diào)查收集數(shù)據(jù)
根據(jù)建模指標(biāo)設(shè)置需要,設(shè)計(jì)調(diào)查問卷,通過到有關(guān)部門走訪和樣本樓盤實(shí)地調(diào)研,了解商品住宅樓盤特征值。
1.3.3 數(shù)據(jù)整理和補(bǔ)缺
整合多渠道獲得的數(shù)據(jù),形成規(guī)范、統(tǒng)一、準(zhǔn)確的數(shù)據(jù)庫。由于部分樓盤在17個(gè)月的時(shí)間跨度中存在少數(shù)月份無銷售的現(xiàn)象,造成該月價(jià)格缺失。在所抽取的94個(gè)樓盤17個(gè)月共1598個(gè)價(jià)格值中,缺失價(jià)格81個(gè),占總量的5%,使用整理后的標(biāo)準(zhǔn)化未缺失房價(jià)數(shù)據(jù)和對應(yīng)的特征值數(shù)據(jù),運(yùn)用人工神經(jīng)網(wǎng)絡(luò)方法進(jìn)行建模。
1.3.4 數(shù)據(jù)標(biāo)準(zhǔn)化處理
對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理主要為了避免數(shù)據(jù)性質(zhì)不同和數(shù)據(jù)不可比的問題。不同性質(zhì)和不可比指標(biāo)直接加總不能正確反映不同作用力的綜合結(jié)果,須先考慮改變逆指標(biāo)數(shù)據(jù)性質(zhì),使所有指標(biāo)對模型的作用力同趨化。代表異質(zhì)性商品的基本功能;X為住房的n個(gè)特征;β為各個(gè)特征所對應(yīng)的特征價(jià)格;t為反映住房價(jià)格中時(shí)間影響的系數(shù);Dt為住房在t期的啞元變量;ε為隨機(jī)誤差項(xiàng)。
表1 特征價(jià)格模型常用解釋變量
表2 分層抽樣每層所需樣本數(shù)
1.4.1 模型形式選取
本文首先構(gòu)建Hedonic模型的線性、對數(shù)和半對數(shù)形式。由表3可知,總體來看,半對數(shù)形式的Hedonic模型最優(yōu),因此,本文選擇半對數(shù)Hedonic模型繼續(xù)進(jìn)行指數(shù)測算。
半對數(shù)Hedonic模型的擬合優(yōu)度檢驗(yàn):方程的相關(guān)系數(shù)為0.928,調(diào)整后的判定系數(shù)R2為0.859,模型能夠解釋因變量差異的85.9%。該模型在特征價(jià)格擬合程度上具有良好的解釋能力。
回歸模型總體顯著性檢驗(yàn):方差分析的檢驗(yàn)統(tǒng)計(jì)量F值為407.434,在概率小于0.01拒絕自變量系數(shù)均為0的原假設(shè)下,表明進(jìn)入模型的自變量對因變量的共同影響具有顯著性,回歸方程總體有效。
1.4.2 特征變量顯著性檢驗(yàn)
基于構(gòu)建的半對數(shù)形式Hedonic模型,對選取的26個(gè)變量進(jìn)行顯著性檢驗(yàn),結(jié)果見下頁表4。
表3 三種形式的Hedonic模型統(tǒng)計(jì)量對比
除“學(xué)校個(gè)數(shù)”、“休閑得分”、“生活得分”和“離最近公交站點(diǎn)距離”外,其他特征變量的回歸系數(shù)在10%顯著水平下均
一般而言,Hedonic模型有線性、半對數(shù)、對數(shù)和Box-Cox變換等多種形式,在構(gòu)建模型過程中,通過測算選出擬合度較好的模型形式。特征價(jià)格法基本模型如下:
其中,p為異質(zhì)性商品的市場價(jià)格;c為模型常數(shù)項(xiàng),能通過t檢驗(yàn),表明模型中所選的特征變量具有較好的顯著性。
多重共線性檢驗(yàn):各特征變量的方差膨脹因子VIF均小于5,絕大多數(shù)小于2,可以認(rèn)為模型中不存在明顯的多重共線性問題。
由半對數(shù)形式模型運(yùn)算得到殘差圖,模型的殘差近似正態(tài)分布,構(gòu)建的半對數(shù)Hedonic模型對武漢市的住宅價(jià)格具有較高的擬合優(yōu)度和較好的解釋能力,可以解釋該市樓盤特征變量對住宅價(jià)格的影響。
表4 半對數(shù)Hedonic模型系數(shù)的顯著性檢驗(yàn)
1.4.3 分月價(jià)格指數(shù)的計(jì)算
(1)確定標(biāo)準(zhǔn)住宅。標(biāo)準(zhǔn)住宅代表著市場上住宅的普遍水平,標(biāo)準(zhǔn)住宅的選取,是消除住宅異質(zhì)性的關(guān)鍵。樣本樓盤在選取時(shí)充分考慮了代表性,本文以考察的17個(gè)月中各個(gè)特征變量的平均值作為市場存在的普遍水平,代表本區(qū)域房地產(chǎn)市場的標(biāo)準(zhǔn)住宅。
(2)測算指數(shù)對比。把標(biāo)準(zhǔn)住宅的各個(gè)特征值代入17個(gè)分月半對數(shù)Hedonic模型,得到各月的標(biāo)準(zhǔn)住宅價(jià)格。17個(gè)標(biāo)準(zhǔn)住宅價(jià)格消除了住宅價(jià)格的異質(zhì)性(特征差異),具有同質(zhì)可比性,當(dāng)月價(jià)格比上月價(jià)格即可得到當(dāng)月房地產(chǎn)價(jià)格環(huán)比指數(shù),見表5。
表5 2015年1月至2016年5月武漢市商品住宅特征價(jià)格指數(shù)計(jì)算結(jié)果
圖1半對數(shù)Hedonic模型編制環(huán)比與國家公布指數(shù)對比
通過半對數(shù)Hedonic模型測算,所得環(huán)比指數(shù)呈震蕩上行態(tài)勢,幅度在-5.7%~6.9%之間波動(dòng)。國家統(tǒng)計(jì)局每月公布環(huán)比指數(shù)處于溫和上漲態(tài)勢,漲幅在0%~2.3%之間。對比發(fā)現(xiàn)(見圖1)半對數(shù)Hedonic模型測算結(jié)果與國家公布數(shù)據(jù)總體趨勢一致,17個(gè)月測算環(huán)比指數(shù)圍繞國家統(tǒng)計(jì)局公布指數(shù)上下波動(dòng),少數(shù)月份與公布指數(shù)完全吻合,超五成月份與公布指數(shù)漲跌趨勢存在一定差異。對于存在的這種差異,將進(jìn)一步通過Box-Cox變換進(jìn)行優(yōu)化,以達(dá)到更優(yōu)的效果。
將半對數(shù)形式的因變量進(jìn)行Box-Cox變換,運(yùn)用R軟件,可以得到λ最優(yōu)值,其最優(yōu)值為λ=-0.15?;貧w結(jié)果顯示,Box-Cox變換的半對數(shù)形式模型回歸結(jié)果中,各特征變量系數(shù)基本與預(yù)期影響相符,在10%的顯著性水平下,26個(gè)變量中除“周圍1公里軌道交通條數(shù)”、“總層高”和“平均每戶車位個(gè)數(shù)”三個(gè)特征變量外,其余特征變量均具有較好的顯著性。
擬合優(yōu)度檢驗(yàn)結(jié)果表明,回歸模型的相關(guān)系數(shù)為0.89,調(diào)整后的判定系數(shù)R2=0.789,表明模型能夠解釋因變量差異的78.9%,擬合程度較好。
回歸模型的總體顯著性檢驗(yàn)表明,方差分析檢驗(yàn)統(tǒng)計(jì)量F值為260,在概率小于0.01拒絕自變量系數(shù)均為0的原假設(shè)下,表明進(jìn)入模型的自變量對因變量的共同影響具有顯著性,回歸方程總體有效。
多重共線性檢驗(yàn)結(jié)果表明,各自變量的方差膨脹因子均小于5,表明模型中不存在明顯的多重共線性。模型殘差近似正態(tài)分布。
綜上所述,構(gòu)建的武漢市商品住宅Box-Cox變換的半對數(shù)形式特征價(jià)格模型具有良好的擬合優(yōu)度和較高的解釋能力,各特征變量的回歸系數(shù)具有統(tǒng)計(jì)意義上的顯著性,通過統(tǒng)計(jì)檢驗(yàn),可以用來分析住宅特征變量對住宅價(jià)格的影響。
按照上述各步驟,可以得出武漢市17個(gè)月的分月住宅特征價(jià)格模型。
下頁圖2是采用半對數(shù)和Box-Cox變換的半對數(shù)模型編制出的住宅價(jià)格指數(shù)與國家公布指數(shù)的比較。通過Box-Cox變換的半對數(shù)模型測算所得環(huán)比指數(shù)呈震蕩上行態(tài)勢,幅度在-3.92%~5.14%之間波動(dòng),與之前的半對數(shù)模型相比變化幅度縮小,17個(gè)月環(huán)比指數(shù)據(jù)中超五成月份與國家公布指數(shù)漲跌趨勢一致,整體來看更接近國家公布的環(huán)比指數(shù)趨勢。
圖2不同方法編制的住宅價(jià)格指數(shù)比較
(1)數(shù)據(jù)來源更加全面準(zhǔn)確有效。本模型以武漢市房管局提供的網(wǎng)簽數(shù)據(jù)為基礎(chǔ),比網(wǎng)絡(luò)搜索和網(wǎng)絡(luò)爬蟲方法獲取的數(shù)據(jù)更為準(zhǔn)確。通過實(shí)地采訪調(diào)研的方式獲取樓盤特征值,補(bǔ)充網(wǎng)簽數(shù)據(jù)無法提供的房地產(chǎn)特征,構(gòu)建了較為完整的住宅價(jià)格特征變量體系。采用在一定精度控制保證下分層抽樣方法抽取樓盤樣本,確保了實(shí)地調(diào)查樣本的代表性。
(2)對特征價(jià)格模型的線性、半對數(shù)、對數(shù)、Box-cox變換模型形式進(jìn)行對比分析。在真實(shí)的市場交易中,住宅價(jià)格受多方面因素共同影響,與各個(gè)特征變量之間并不是簡單的線性關(guān)系,因此,本文在線性模型的基礎(chǔ)上引進(jìn)了半對數(shù)、對數(shù)和Box-Cox變換模型,更全面地考量了住宅價(jià)格和各個(gè)特征變量之間的關(guān)系。
(3)以樓盤為樣本單位,避免了以個(gè)體住宅為樣本的缺陷。樓盤均價(jià)能較好地反映住宅價(jià)格分布結(jié)構(gòu)。當(dāng)前,國內(nèi)外研究多以住宅為樣本單位,這種做法存在一定缺陷。一是住宅的朝向、景觀等特征值收集困難;二是若某研究時(shí)間段內(nèi),具有同一特征因素的住宅銷售量占比過大時(shí),該特征值會(huì)產(chǎn)生較大影響,造成這些特征值相關(guān)度過大。以樓盤為研究對象可以平滑影響。
本文為研究城市住宅價(jià)格提供了一種統(tǒng)計(jì)技術(shù)上的有益探索,但離全面深入運(yùn)用Hedonic模型編制住宅價(jià)格指數(shù)還有一段距離,因此對Hedonic模型及其應(yīng)用的研究還得繼續(xù)。第一,本文在建模時(shí)樓盤價(jià)格仍使用混合平均價(jià),沒有實(shí)現(xiàn)用樓盤標(biāo)準(zhǔn)價(jià)進(jìn)入模型,在后續(xù)研究中,將進(jìn)一步探索用樓盤標(biāo)準(zhǔn)價(jià)進(jìn)行建模測算;第二,可嘗試非參數(shù)、半?yún)?shù)等多種參數(shù)估計(jì)方法在模型中的運(yùn)用;第三,進(jìn)一步探索對大數(shù)據(jù)的匹配、篩選、挖掘等預(yù)處理的有效方法。
參考文獻(xiàn):
[1]Case B,Pollakowski H O,Wachter S M.On Choosing Among House Price Index Methodologies[J].AREUEA Journal,1991,19(3).
[2]程亞鵬.基于住房子市場的Hedonic住房價(jià)格指數(shù)[J].經(jīng)濟(jì)問題,2010,(10).
[3]李占風(fēng),周歆毅.我國房地產(chǎn)價(jià)格的統(tǒng)計(jì)方法研究[J].統(tǒng)計(jì)與決策,2012,(8).
[4]孫玉環(huán).基于海量交易數(shù)據(jù)的房地產(chǎn)特征價(jià)格模型的構(gòu)建[J].統(tǒng)計(jì)與決策,2011,(10).
[5]程亞鵬.我國城市住宅價(jià)格測試—Hedonic方法與實(shí)證[M].北京:光明日報(bào)出版社,2013.