劉洪玉,楊振鵬
(清華大學 房地產(chǎn)研究所,北京 100084)
2011年新年伊始,房地產(chǎn)稅改革成為人們熱議的話題。在“十二五”規(guī)劃建議中,將“加快財稅體制改革”放到了重要位置上,并明確提出“研究推進房地產(chǎn)稅改革”。重慶、上海決定自2011年1月28日開始對部分個人住房征收房產(chǎn)稅,開創(chuàng)了我國住房制度改革以來向個人擁有住房征收財產(chǎn)稅的先河,是我國房地產(chǎn)稅改革歷程中的重要進展。在這樣的背景下,房地產(chǎn)計稅價值評估問題得到越來越多的關(guān)注。不少學者提出,由于房地產(chǎn)稅應(yīng)以財產(chǎn)的評估價值作為計稅依據(jù),因此住房價格的評估技術(shù)是房地產(chǎn)稅具體實施過程中的關(guān)鍵問題之一[1]。
在以往的文獻中,計算機輔助批量評估法(CAMA)常被認為是在數(shù)據(jù)充足情況下行之有效的實用方法[2][3][4],其中,又以多元回歸分析(MRA)最為常用。例如,紀益成、傅傳銳(2005)使用EViews軟件的線性回歸功能,給出了一個對30套住房進行批量評估的范例[5];喬治敏等(2009)采用SPSS軟件多元線性回歸模型對北京4個城區(qū)400多套住房的批量評估進行實證研究[6];龔科等(2010)使用MATLAB軟件和LS-SVMLAB工具包,以最小二乘支持向量機的方法進行了小規(guī)模的實驗[7]。
本文采用方法與以往文獻的主要區(qū)別,在于利用主體變量代替小區(qū)層次的特征變量引入多元回歸模型。這一方法既可以減少收集住宅小區(qū)層次屬性信息的工作量,還能在一定程度上改善模型的評估效果,在未來的實踐中具有較好的推廣價值。
住房特征價格理論與房價的多元回歸分析(簡稱MRA)經(jīng)常有著密切的聯(lián)系,不過特征價格理論是一種解釋房價形成機制的經(jīng)濟學模型,而MRA是一種統(tǒng)計分析方法。住房特征價格理論(或稱Hedonic理論)假設(shè)住房由一組特征組成,人們對每一個特征都會具有一定的支付意愿,因此每一個特征實際上都有對應(yīng)的隱含價格,而人們?yōu)橘徺I一套房屋支付的總價,就是這些隱含的“特征價格”的總和[9]。
舉例來說,假設(shè)在某個市場中,住房包括m個關(guān)鍵的特征,用X1、X2、…、Xm表示某套住房包含每個特征的量,C1、C2、…、Cm分別是這些特征的“單價”(即特征價格)。那么住房價格HP應(yīng)當為:
在式(1)中,μ是一個隨機干擾項,它反映了房屋交易價格還會受到其它不確定因素的影響。
由于特征是不能單獨交易的,因此特征價格C1~Cm都是隱含的屬性。不過房屋交易價格HP和特征X1~Xm的取值是能直接觀測到的,因此,當觀測到足夠多的交易樣本后,就可以通過MRA方法反求HP關(guān)于X1~Xm的回歸表達式。
圖1 MRA法批量評估的流程
1.2.1 流程
將MRA方法用于住房價格批量評估,一般包括以下步驟。
在進行批量評估之前,首先需要收集足夠數(shù)量的住房可比交易案例,將這些可比案例的價格和房屋信息整理成標準格式的數(shù)據(jù)庫。同時,還需要整理待評估住房的特征信息,按照同樣的格式錄入數(shù)據(jù)庫。完成數(shù)據(jù)整理后,即可運用多元回歸分析求取房價關(guān)于住房特征的回歸表達式。最后,依據(jù)回歸表達式和需要評估住房的特征數(shù)據(jù),完成房屋價格評估值的計算。
1.2.2 常用的房屋特征
常用的房屋特征可分為區(qū)位屬性、鄰里屬性和物理屬性3大類。區(qū)位屬性是房屋所在區(qū)位的性質(zhì),如交通可達性(是否靠近地鐵、到市區(qū)距離等)、周邊配套設(shè)施齊全程度、自然環(huán)境條件等。鄰里屬性是更細區(qū)域的性質(zhì),結(jié)合我國居住社區(qū)的特點,可理解為小區(qū)(樓盤)或街道的屬性,如物業(yè)管理水平、容積率、綠化率、車位數(shù)量等。物理屬性即房屋自身的特征,如房齡、樓層(建筑的總層數(shù)以及房屋所在層)、朝向、建筑面積、臥室數(shù)量等等。
1.2.3 回歸模型的設(shè)定
應(yīng)用MRA方法,要求因變量和自變量都是實數(shù)數(shù)值。對于因變量,通常選用的是房屋總價或單價的自然對數(shù)。對于反映房屋特征的自變量,其構(gòu)造方法則有一定技巧。
有一部分房屋特征本身可以被量化(如建筑面積等),這類特征可以直接作為自變量引入模型,或者將它們的Box-Cox變換形式引入模型。
還有一些房屋特征只可能有若干種固定的取值(后文簡稱字典型變量),如所在行政區(qū)、土地等級、產(chǎn)權(quán)性質(zhì)等,這類房屋特征通常要以虛變量組的形式引入回歸模型。以“所在行政區(qū)”為例,假設(shè)所有考察樣本來自4個行政區(qū)——城東區(qū)、城西區(qū)、城南區(qū)、城北區(qū),那么只需要“是否屬于城東區(qū)”、“是否屬于城西區(qū)”和“是否屬于城南區(qū)”3個虛變量就可以確定一套房屋所在的行政區(qū)。每個虛變量都是在條件成立的時候取值為1,不成立的時候取值為0。這樣,就可以用實值變量組代替字典型變量。
最后,模型中一般還包括常數(shù)項。計量模型如式(2)所示。
其中,HPi是樣本i的房價,X1i~Xmi是依據(jù)樣本 i的房屋特征轉(zhuǎn)化的自變量組。
主體變量是反映房屋是否屬于某個特定小區(qū)的虛變量。如果考察范圍內(nèi)有N個小區(qū),依次是小區(qū)1、小區(qū)2、…小區(qū)N,那么可以用N-1個虛變量P1~PN-1確定房屋所屬的小區(qū)。
在多元回歸分析中,將主體變量P1至PN-1引入回歸模型,就可以得到每個小區(qū)的主體變量系數(shù),即該小區(qū)的價格調(diào)整系數(shù)。
傳統(tǒng)MRA方法使用小區(qū)層面的特征變量(如綠化率、容積率等)反映房屋所在小區(qū)的屬性。在評估過程中,這種模型需要根據(jù)小區(qū)屬性的取值進行價格調(diào)整。引入主體變量的MRA則采用了更為直接的思路,對每個小區(qū)單獨設(shè)置一個調(diào)整系數(shù)。在評估中,只需要知道房屋屬于哪一個小區(qū)以及該小區(qū)的調(diào)整系數(shù),就可以計算評估價格,而不需要知道這個小區(qū)的屬性。圖2顯示了這種思路和傳統(tǒng)MRA評估的區(qū)別。
圖2 引入主體變量的MRA評估過程與傳統(tǒng)過程的差異
在非MRA的批量評估中,一般會采用更直接的方式處理小區(qū)因素對價格的影響。例如在基于“市場比較法”的評估中,會選取同一個小區(qū)(或周邊檔次相近的小區(qū))的房屋交易作為可比案例。耐人尋味的是,在基于MRA的批量評估中,已有文獻往往放棄直接設(shè)立小區(qū)調(diào)整系數(shù)的方法,而是間接地在模型中引入小區(qū)屬性[6][7]。本文后續(xù)部分將討論是否可以通過引入主體變量,使MRA評估也能直接地反映小區(qū)因素對價格的影響。
在小區(qū)數(shù)目眾多的情況下,向回歸模型中加入主體變量,會大幅增加自變量的數(shù)目。這對于MRA模型的影響主要體現(xiàn)在以下三個方面。
2.3.1 自變量意外線性相關(guān)
當模型中引入了多組虛變量,有可能意外地出現(xiàn)自變量完全線性相關(guān)的情況。例如,在引入主體變量的同時還引入了“所在環(huán)線位置”的特征,各小區(qū)“所在環(huán)線位置”如表1所設(shè)定。
表1 造成自變量線性相關(guān)的示例
在MRA模型中,設(shè)定P1~P6共6個主體變量,用于標記房屋所在的小區(qū)。用兩個虛變量R1、R2代替“所在環(huán)線位置”這個字典型特征——R1表示房屋處于二環(huán)以內(nèi)、R2表示房屋處于二環(huán)至三環(huán)之間。
不難推導出,對于任何房屋樣本,下列關(guān)系永遠成立:
由于R1、R2可以被主體變量線性表出,因此不能將它們加入到回歸模型中。更一般地,任何小區(qū)層面上的特征變量都不應(yīng)與主體變量同時出現(xiàn)。
2.3.2 多重共線性
即便消除了完全線性相關(guān)的自變量,多重共線性問題仍有可能存在。特別是在使用新房數(shù)據(jù)時,應(yīng)注意主體變量和由交易時點轉(zhuǎn)化而來的月份虛變量往往高度相關(guān)。這是因為新房的銷售期往往較為集中,已知一條樣本所屬的小區(qū),就能基本確定它的交易時點大致在某幾個月份之間。雖然單純的多重共線性問題不會影響系數(shù)估計量和評估結(jié)果的無偏性,但是模型給出評估值的置信區(qū)間會更大,對于使用者而言,只能更保守地看待評估結(jié)果。因此,對新房進行批量評估時,需謹慎使用主體變量。
2.3.3 模型自由度降低
在樣本量不足的情況下,引入較多主體變量會降低模型的自由度。因此,在使用主體變量時必須注意樣本量是否顯著多于自變量的數(shù)目。
本文通過實地調(diào)研采集了403條二手房出售數(shù)據(jù)。樣本分布在北京市4個居住項目較密集的地區(qū),分別是豐臺區(qū)的青塔地區(qū)、光彩路地區(qū),石景山區(qū)的魯谷地區(qū),以及位于豐臺、海淀、石景山交界處的玉泉路地區(qū)。選擇上述地段的原因之一是,作者對這些區(qū)域有一定的了解,容易分辨房源信息的真實性。403套房源來自于46個住宅小區(qū),建筑年代從80年代到2010年不等。其中兩個小區(qū)按經(jīng)濟適用住房管理(交易過戶時補交3%土地出讓金),其余小區(qū)均可作為商品住房交易。
數(shù)據(jù)主要通過經(jīng)紀機構(gòu)門店采集,時間從2011年3月上旬開始至4月初結(jié)束。其中價格信息為各經(jīng)紀機構(gòu)信息系統(tǒng)中的業(yè)主真實報價,標的房屋均經(jīng)過經(jīng)紀人實地踏勘并拍照,具有較好的真實性。此外,數(shù)據(jù)還由經(jīng)紀人進行一輪篩選,去除根據(jù)其經(jīng)驗認定不可能在一個月內(nèi)售出的高報價樣本,以及采取了明顯低報價策略的樣本。
反映房屋特征的變量包括以下幾項。在小區(qū)層面上,作者收集了小區(qū)建筑年代、所屬行政區(qū)、環(huán)線位置、容積率、綠化率、物業(yè)服務(wù)費率等數(shù)據(jù),以及“是否按經(jīng)濟適用住房管理”、“1公里內(nèi)是否有地鐵站”等2項虛變量。對于房屋的物理屬性,數(shù)據(jù)集包含建筑面積、所在樓層、建筑總層數(shù)、朝向、臥室數(shù)量等5個變量。
在研究中,將樣本分為“建模樣本”和“評估樣本”兩個部分①對每一條樣本生成一個0-1之間的隨機數(shù),如果數(shù)值大于0.25,則設(shè)定該樣本為“建模樣本”,否則為“評估樣本”。抽樣后確定了302條“建模樣本”和101條“評估樣本”。。首先,使用“建模樣本”進行回歸計算,生成批量評估模型;然后利用模型對“評估樣本”的價格進行評估,并與實際價格比較,從而對評估效果進行評價。
傳統(tǒng)MRA模型引入小區(qū)層面的特征變量,模型初始自變量列表如表2所示。
本文利用清華大學開發(fā)的批量評估軟件CFMA完成回歸計算。CFMA內(nèi)置的算法采用OLS回歸,自變量首先全部引入,之后按t-統(tǒng)計量絕對值由小到大排序,逐一進行多余變量檢驗,刪除多余變量。最終保留了24個自變量,回歸結(jié)果如表3所示。
模型的擬合優(yōu)度達0.952。隨機擾動項的方差為9.55%,由于被解釋變量是房價的對數(shù),據(jù)此可以推算,評估價格的1倍標準誤差區(qū)間是(-9.10%,+10.02%)。對參與建模的302個樣本而言,平均絕對預測誤差(MAPE)為6.71%。上述數(shù)據(jù)說明,使用該模型進行評估,誤差水平在10%左右,具有一定的實用性。
表2 傳統(tǒng)MRA批量評估模型初始自變量列表
表3 傳統(tǒng)MRA批量評估模型回歸結(jié)果
回歸模型自變量的系數(shù)還可以揭示影響房價的因素。從表3中可以看到,房屋建筑面積、小區(qū)容積率對房價的影響最為顯著,且影響程度呈二次變化規(guī)律。其他顯著水平達到5%的影響因素還有:物業(yè)費率與房價正向相關(guān);一居室的價格水平低于其他戶型;東北朝向房屋價格低于默認戶型(南北通透);3環(huán)~4環(huán)之間小區(qū)的價格更高;海淀區(qū)(只包含玉泉路的兩個小區(qū))價格偏低;建筑年代為“2010年”的小區(qū)價格最高,“2005年”次之,其他更早年代的小區(qū)價格更低。
得到評估模型后,用其余沒有參與建模的101個樣本檢驗評估效果。每個樣本的實際價格記為Si,評估價格記為Ai,評估價格與實際價格之比記為ARi。采用下述國際評估師協(xié)會(IAAO)建議的評價標準衡量評估效果。
表4 傳統(tǒng)MRA模型評估效果
平均AR和中位數(shù)AR衡量評估的準確程度。IAAO在1999年的《Standard on Ratio Studies》中要求評估比率在0.9~1.1之間。價格相關(guān)差PRD衡量按價格加權(quán)平均的評估比率,與簡單平均的評估比率是否一致。如果PRD低于0.98,說明評估模型將明顯高估高價住房、低估低價住房(激進);如果PRD高于1.03,說明出現(xiàn)相反的情況(保守)。離散系數(shù)COD衡量評估誤差的分布,它與MAPE類似,區(qū)別在于COD衡量相對于AR中位數(shù)的偏差。如果AR的中位數(shù)恰好是1,COD與MAPE將完全一致。
表5 各小區(qū)編號和樣本量
從表4可以看到,傳統(tǒng)MRA模型的評估效果滿足IAAO提出的標準。
3.3 引入主體變量的MRA模型
將樣本覆蓋的46個居住小區(qū)編為1~46號,各小區(qū)樣本量如表5所示。
表6 引入主體變量的MRA批量評估模型初始自變量列表
選取樣本量最大的小區(qū)(彩虹城)作為默認小區(qū),對其余45個小區(qū)設(shè)置主體變量。由于引入了主體變量,不再引入小區(qū)層次的特征,初始自變量列表如表6所示。
同樣,使用CFMA批量評估軟件完成變量篩選和回歸計算,最終保留了46個自變量。回歸結(jié)果如表7所示。
可以看到,使用主體變量的MRA模型比使用小區(qū)屬性的模型具有更高的擬合優(yōu)度。同時,赤池信息量準則(AIC)統(tǒng)計量也得到減小,說明增加的自變量帶來了有用的信息。評估價格的1倍標準誤差區(qū)間縮小為(-8.48%,9.26%),樣本內(nèi)預測的平均絕對誤差(MAPE)降低至5.51%。
應(yīng)用這一模型,對其余樣本進行評估,效果如表8所示。
從表8中可以看到,引入主體變量的模型在評估的準確度和一致性上都有一定提升。但是,評估誤差超過±10%的案例數(shù)增加了1例。
綜合考慮上述實證研究結(jié)果,可以發(fā)現(xiàn):引入主體變量的MRA模型在不使用小區(qū)層面特征信息的情況下,評估效果能夠等同于甚至超過使用小區(qū)信息的傳統(tǒng)模型。
本文設(shè)計了一種基于主體變量的房價批量評估模型。該方法與傳統(tǒng)多元回歸分析(MRA)模型的主要區(qū)別在于,使用小區(qū)虛變量(主體變量)代替所有小區(qū)層面的特征變量。本文進行這一調(diào)整背后的原因是,傳統(tǒng)MRA模型通過小區(qū)的各項屬性間接確定該小區(qū)的價格調(diào)整系數(shù),本文認為直接從回歸中獲取小區(qū)價格調(diào)整系數(shù)更能有效地利用信息。
使用引入主體變量的MRA模型,不但能夠減少收集小區(qū)屬性信息的工作量,評估效果也并未降低。實證研究顯示,引入主體變量的模型在大多數(shù)統(tǒng)計量和評價指標上優(yōu)于傳統(tǒng)MRA模型。
表7 引入主體變量的MRA批量評估模型回歸結(jié)果
表8 引入主體變量的MRA模型評估效果與傳統(tǒng)模型的對比
本文研究成果對于在我國開展住房價格批量評估具有一定現(xiàn)實指導意義。特別是在數(shù)據(jù)收集方面,提示評估機構(gòu)應(yīng)當將工作重心放在采集價格信息和房屋的物理屬性上,而不必投入大量的人力、財力整理小區(qū)層次的信息,也沒有必要過分依賴地理信息系統(tǒng)。通過簡單地添加主體變量進入回歸模型,就可以獲得更好的評估效果。
[1]高云才.積極穩(wěn)妥推進房地產(chǎn)稅改革[N].人民日報,2010-12-06(17版).
[2]任作風,廖俊平.計算機輔助批量評估法(CAMA)在物業(yè)稅估價中的應(yīng)用[J].中國房地產(chǎn)估價師,2005,(1).
[3]紀益成,王誠軍,傅傳銳.國外AVM技術(shù)在批量評估中的應(yīng)用[J].中國資產(chǎn)評估,2006,(3).
[4]劉洪玉.計算機輔助批量評估:國際經(jīng)驗與我國的應(yīng)用前景[J].中國房地產(chǎn)估價與經(jīng)紀,2007,(6).
[5]紀益成,傅傳銳.批量評估:從價稅的稅基評估方法[J].中國資產(chǎn)評估,2005,(11).
[6]喬志敏,李德峰,鄒文軍,周戰(zhàn)強.基于財產(chǎn)稅征收的不動產(chǎn)價值評估——對北京市4個內(nèi)城區(qū)的實證分析[J].城市發(fā)展研究,2009,(3).
[7]龔科,肖智,李丹.基于支持向量機的物業(yè)稅稅基批量評估[J].涉外稅務(wù),2010,(5).
[8]John D.Benjamin,Randall S.Guttery,C.F.Sir?mans.Mass Appraisal:An Introduction to Multiple Regression Analysis for Real Estate Valuation[J].Journal of Real Estate Practice and Education,2004,(7).
[9]S.Rosen.Hedonic Prices and Implicit Markets:Product Differentiation in Pure Competition[J].The Journal of Political Economy,1974,82(1).