胡 大 國(guó),張 嘉
(1.廣州市房地產(chǎn)測(cè)繪院,廣東 廣州 510030;2.中國(guó)土地勘測(cè)規(guī)劃院,北京 100035)
?
基于地址匹配的城市行業(yè)用地調(diào)查研究與實(shí)踐
胡 大 國(guó)1,張 嘉2
(1.廣州市房地產(chǎn)測(cè)繪院,廣東 廣州 510030;2.中國(guó)土地勘測(cè)規(guī)劃院,北京 100035)
選取廣州市越秀區(qū)作為試點(diǎn)區(qū)域,利用數(shù)據(jù)庫(kù)規(guī)范地名地址數(shù)據(jù),以地址匹配為核心實(shí)現(xiàn)宗地?cái)?shù)據(jù)與經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)的融合,調(diào)查行業(yè)用地利用狀況、用地類型、面積與分布,形成顧及地名地址數(shù)據(jù)特點(diǎn)的越秀區(qū)行業(yè)用地調(diào)查數(shù)據(jù)庫(kù),開(kāi)展行業(yè)經(jīng)濟(jì)、用地、從業(yè)人員情況統(tǒng)計(jì)與分析。研究與實(shí)踐表明:利用行業(yè)基本單位詳細(xì)地址與地名地址數(shù)據(jù)匹配開(kāi)展城市行業(yè)用地調(diào)查是一有效方法;持續(xù)性開(kāi)展城市行業(yè)用地調(diào)查有助于政府的經(jīng)濟(jì)、用地宏觀決策。
土地利用;城市行業(yè)用地調(diào)查;地址匹配;SQL;空間分析;越秀區(qū)
行業(yè)用地是指用于產(chǎn)業(yè)活動(dòng)的土地,是開(kāi)展產(chǎn)業(yè)經(jīng)濟(jì)活動(dòng)的空間載體。以城鎮(zhèn)地籍調(diào)查數(shù)據(jù)為基礎(chǔ),開(kāi)展城市行業(yè)用地利用狀況調(diào)查,掛接宗地內(nèi)的行業(yè)用地類型以及相關(guān)經(jīng)濟(jì)指標(biāo),形成包含各類行業(yè)信息的城鎮(zhèn)地籍調(diào)查數(shù)據(jù)成果,對(duì)于摸清不同行業(yè)用地類型、面積、強(qiáng)度等情況,掌握重點(diǎn)行業(yè)用地的利用水平、潛力規(guī)模與分布,為產(chǎn)業(yè)結(jié)構(gòu)調(diào)整提供基礎(chǔ)支撐,為經(jīng)濟(jì)社會(huì)全面協(xié)調(diào)和可持續(xù)發(fā)展提供保障[1],具有重要意義。為此,國(guó)土資源部在全國(guó)范圍內(nèi)開(kāi)展了批次城市行業(yè)用地調(diào)查試點(diǎn)工作,第一批試點(diǎn)城市包括吉林省通化市、山東省德州市、福建省龍巖市、陜西省渭南市、江蘇省鎮(zhèn)江市和廣東省廣州市越秀區(qū),力圖探索并形成適應(yīng)不同地域、不同經(jīng)濟(jì)社會(huì)發(fā)展水平的行業(yè)用地調(diào)查技術(shù)體系。
廣州市越秀區(qū)作為首批6個(gè)行業(yè)用地調(diào)查試點(diǎn)城市之一,是廣州市最繁華的中心城區(qū),下轄22條行政街道,面積約33.8 km2,地籍區(qū)22個(gè),法人單位和產(chǎn)業(yè)活動(dòng)單位3.4萬(wàn)多個(gè),戶籍人口為115萬(wàn)人,在土地利用現(xiàn)狀調(diào)查及年度土地利用變更調(diào)查中均為城市建設(shè)用地,地類代碼為201[2]。
1.1 數(shù)據(jù)分析及技術(shù)流程
行業(yè)用地調(diào)查的核心是建立行業(yè)基本單位(法人單位、產(chǎn)業(yè)活動(dòng)單位)與宗地空間數(shù)據(jù)的關(guān)聯(lián),解決行業(yè)經(jīng)濟(jì)信息“落地”即空間化問(wèn)題,從而實(shí)現(xiàn)經(jīng)濟(jì)統(tǒng)計(jì)數(shù)據(jù)與地籍調(diào)查數(shù)據(jù)兩種異構(gòu)數(shù)據(jù)的有效融合。結(jié)合廣州市試點(diǎn)區(qū)情況,行業(yè)用地調(diào)查基礎(chǔ)數(shù)據(jù)主要從國(guó)土、統(tǒng)計(jì)、公安等相關(guān)部門(mén)收集,包括1∶500地形地籍圖、地籍區(qū)數(shù)據(jù)、行業(yè)基本單位、行業(yè)經(jīng)濟(jì)匯總數(shù)據(jù)、行業(yè)從業(yè)人口匯總數(shù)據(jù)等信息。上述數(shù)據(jù)存儲(chǔ)介質(zhì)各異,格式不一,空間數(shù)據(jù)的坐標(biāo)參考也不盡一致,雖然行業(yè)基本單位和宗地?cái)?shù)據(jù)都具有空間坐落的表達(dá),但兩者對(duì)同一對(duì)象的表達(dá)方式和語(yǔ)義描述存在較大差異,導(dǎo)致行業(yè)基本單位與其所坐落的宗地實(shí)體難以直接關(guān)聯(lián)。
行業(yè)基本單位數(shù)據(jù)和地名地址數(shù)據(jù)中均有地址信息,利用行業(yè)基本單位的詳細(xì)地址與地名地址數(shù)據(jù)進(jìn)行地址匹配,可使行業(yè)基本單位具有空間坐標(biāo)[3,4],然后與宗地進(jìn)行空間疊加分析,即可實(shí)現(xiàn)行業(yè)基本單位經(jīng)濟(jì)數(shù)據(jù)與宗地的用地范圍、用地面積等情況的關(guān)聯(lián)。對(duì)于地名地址數(shù)據(jù)無(wú)法查找到的行業(yè)基本單位,實(shí)地調(diào)查測(cè)繪該行業(yè)基本單位,并在1∶500地形地籍圖上采集地名地址點(diǎn),補(bǔ)充完善地名地址數(shù)據(jù)庫(kù),再進(jìn)行地址匹配。主要技術(shù)流程如圖1所示。
圖1 行業(yè)用地調(diào)查技術(shù)流程
行業(yè)基本單位與地名地址數(shù)據(jù)中的地址信息有如下特點(diǎn):1)地名地址數(shù)據(jù)為結(jié)構(gòu)化數(shù)據(jù),由街道、街坊、街路巷、門(mén)牌前綴、門(mén)牌號(hào)、門(mén)牌后綴6個(gè)字段組合表示,定義明確、統(tǒng)一,可以利用結(jié)構(gòu)化查詢語(yǔ)言(SQL)批量處理。2)行業(yè)基本單位的詳細(xì)地址呈現(xiàn)半結(jié)構(gòu)化特征,以唯一文本信息記錄,內(nèi)容龐雜,描述不規(guī)范,存在錯(cuò)別字、中文數(shù)字與阿拉伯?dāng)?shù)字混用、信息冗余等情況,難以進(jìn)行批量處理。為實(shí)現(xiàn)兩類數(shù)據(jù)的高效管理與快速語(yǔ)義匹配,需對(duì)其進(jìn)行數(shù)據(jù)建庫(kù)與規(guī)范化。
1.2 數(shù)據(jù)處理
1.2.1 數(shù)據(jù)庫(kù)設(shè)計(jì) 利用實(shí)體(Entity)-聯(lián)系(Relationship)模型設(shè)計(jì)行業(yè)用地調(diào)查數(shù)據(jù)庫(kù),實(shí)體主要有行業(yè)基本單位(點(diǎn))、宗地(面)、門(mén)樓牌(點(diǎn))和房屋(面);聯(lián)系主要有多棟“房屋”坐落在一個(gè)“宗地”,一棟“房屋”擁有多個(gè)“門(mén)樓牌”,多個(gè)“行業(yè)基本單位”具有一個(gè)“門(mén)樓牌”,其比例關(guān)系為1∶N,利用空間關(guān)系關(guān)聯(lián),無(wú)需設(shè)計(jì)單獨(dú)的聯(lián)系表。
1.2.2 數(shù)據(jù)規(guī)范化處理
(1)地名地址數(shù)據(jù)規(guī)范化。以實(shí)施行業(yè)用地調(diào)查試點(diǎn)項(xiàng)目為目標(biāo),與文獻(xiàn)[3,4]所述的地址標(biāo)準(zhǔn)化類似,但不進(jìn)行地址解析處理,只對(duì)核心地址要素的含義、字段類型、長(zhǎng)度及其組合進(jìn)行統(tǒng)一規(guī)定,要求簡(jiǎn)潔明了且易于操作。地名地址數(shù)據(jù)是具有地理坐標(biāo)信息的矢量數(shù)據(jù),其屬性由行政區(qū)、街道、街坊、街路巷、門(mén)牌前綴、門(mén)牌號(hào)、門(mén)牌后綴、X、Y字段組成。為便于與行業(yè)基本單位的詳細(xì)地址含義相匹配,綜合相關(guān)屬性設(shè)計(jì)“組合地址(ZHDZ)”字段,組合地址由“街路巷”、“門(mén)牌前綴”、“門(mén)牌號(hào)”、“門(mén)牌后綴”組成。
(2)行業(yè)基本單位詳細(xì)地址規(guī)范化。主要通過(guò)人機(jī)交互手工或半手工方式實(shí)現(xiàn),以原始詳細(xì)地址為基礎(chǔ),新增“提取地址(TQDZ)”字段作為“詳細(xì)地址”字段的派生字段,以期與“組合地址”進(jìn)行匹配。派生“提取地址”的主要方法有:1)舍棄詳細(xì)地址的“廣東省、廣州市、越秀區(qū)”等冗余信息;2)修改詳細(xì)地址中的錯(cuò)別字;3)將詳細(xì)地址中的中文數(shù)字改為阿拉伯?dāng)?shù)字;4)刪除詳細(xì)地址中多余的字;5)補(bǔ)充大地名或刪除多余的街路巷、樓宇名稱、房號(hào)。
地址匹配以數(shù)據(jù)規(guī)范和含義一致為基礎(chǔ),在Access數(shù)據(jù)庫(kù)中利用SQL語(yǔ)句匹配,主要步驟如下:1)查詢符合條件的記錄數(shù),將行業(yè)基本單位的 “提取地址(TQDZ)”與地名地址數(shù)據(jù)庫(kù)中的“組合地址(ZHDZ)”匹配,查詢相匹配的數(shù)據(jù);2)更新行業(yè)基本單位數(shù)據(jù),將“提取地址”與地名地址數(shù)據(jù)庫(kù)中的“組合地址”匹配,并將X、Y坐標(biāo)信息賦值給行業(yè)基本單位;3)核查數(shù)據(jù)更新情況,保證數(shù)據(jù)更新的內(nèi)容和數(shù)量無(wú)差錯(cuò)。
地址匹配完成后,行業(yè)基本單位具有X、Y坐標(biāo)信息,通過(guò)ArcGIS的“增加X(jué)、Y數(shù)據(jù)”功能[5],將行業(yè)基本單位轉(zhuǎn)換為點(diǎn)狀空間數(shù)據(jù)。在ArcGIS中,行業(yè)基本單位、宗地分別為點(diǎn)和面兩層數(shù)據(jù),利用空間疊加分析[6]實(shí)現(xiàn)行業(yè)基本單位與宗地1∶N的關(guān)聯(lián),然后導(dǎo)入Access中進(jìn)行統(tǒng)計(jì)分析。
3.1 行業(yè)用地分類
在開(kāi)展城鎮(zhèn)地籍調(diào)查時(shí),土地分類通常按土地的批準(zhǔn)用途、主要實(shí)際用途劃分和歸類,即一宗地只調(diào)查一個(gè)主要的利用類別,忽略了同一宗地的多種用地類型?!兜丶{(diào)查規(guī)程》中雖顧及國(guó)民經(jīng)濟(jì)行業(yè)分類調(diào)查,但是只填寫(xiě)到大類名稱及編碼[7],不能反映同一宗地多種經(jīng)濟(jì)活動(dòng)的情況。為解決上述問(wèn)題,行業(yè)用地調(diào)查試點(diǎn)依據(jù)國(guó)民經(jīng)濟(jì)行業(yè)分類進(jìn)行用地劃分,采用經(jīng)濟(jì)活動(dòng)的同質(zhì)性原則定義行業(yè)用地類型,調(diào)查同一宗地的多種經(jīng)濟(jì)活動(dòng)及多種用地類型。國(guó)民經(jīng)濟(jì)行業(yè)分類分為4個(gè)層次,即門(mén)類20個(gè)、大類96個(gè)、中類432個(gè)、小類1 094個(gè)。行業(yè)用地調(diào)查以小類為基礎(chǔ),統(tǒng)計(jì)分析以門(mén)類為主。
3.2 行業(yè)用地分析
越秀區(qū)行業(yè)經(jīng)濟(jì)數(shù)據(jù)[8]與用地信息關(guān)聯(lián),形成空間經(jīng)濟(jì)用地信息,可以進(jìn)行三大產(chǎn)業(yè)用地分析、行業(yè)用地面積比重分析、單位面積營(yíng)業(yè)收入分析、人均營(yíng)業(yè)收入分析等。
(1)產(chǎn)業(yè)用地分析。越秀區(qū)無(wú)第一產(chǎn)業(yè),第二產(chǎn)業(yè)地區(qū)生產(chǎn)總值為57.8億元,用地面積為0.9 km2,用地面積比例為5.3%;第三產(chǎn)業(yè)地區(qū)生產(chǎn)總值為1 839.3億元,用地面積為16.0 km2,用地面積比例為94.7%,第二、三產(chǎn)業(yè)單位面積地區(qū)生產(chǎn)總值分別為64.6億元/km2、115.1億元/km2,比例為1∶1.8(表1)。從經(jīng)濟(jì)總量、單位用地面積產(chǎn)出量可以看出,第三產(chǎn)業(yè)對(duì)越秀區(qū)經(jīng)濟(jì)的貢獻(xiàn)最大,居經(jīng)濟(jì)行業(yè)的核心地位。
表1 產(chǎn)業(yè)用地情況統(tǒng)計(jì)
(2)按產(chǎn)業(yè)營(yíng)業(yè)收入、從業(yè)人數(shù)統(tǒng)計(jì)分析。從門(mén)類單位面積營(yíng)業(yè)收入看,每平方米營(yíng)業(yè)收入最高行業(yè)為金融業(yè)(J門(mén)類,40.9萬(wàn)元/m2),其次為建筑業(yè)(E門(mén)類,12.1萬(wàn)元/m2)、交通運(yùn)輸、倉(cāng)儲(chǔ)和郵政業(yè)(G門(mén)類,8.4萬(wàn)元/m2)、批發(fā)和零售業(yè)(F門(mén)類,8.2萬(wàn)元/m2)等。結(jié)合整個(gè)產(chǎn)業(yè)的營(yíng)業(yè)收入、從業(yè)人員數(shù)和用地面積比例看,越秀區(qū)第二、三產(chǎn)業(yè)營(yíng)業(yè)收入比例分別為10.5%、89.5%,從業(yè)人員數(shù)比例分別為12.5%、87.5%,用地面積比例分別為5.3%、94.7%,作為廣州市的行政、商貿(mào)、金融、文化中心,越秀區(qū)第三產(chǎn)業(yè)用地所占比例相當(dāng)高,其營(yíng)業(yè)收入、從業(yè)人員所占比例均超過(guò)85%,用地面積近95%,可見(jiàn)越秀區(qū)第三產(chǎn)業(yè)發(fā)展水平很高(表2)。
表2 產(chǎn)業(yè)營(yíng)業(yè)收入及從業(yè)人員數(shù)現(xiàn)狀
城市行業(yè)用地調(diào)查試點(diǎn)中,采用行業(yè)基本單位詳細(xì)地址與地名地址數(shù)據(jù)匹配,具有準(zhǔn)確性高、速度快的特點(diǎn)。精心設(shè)計(jì)城市行業(yè)用地調(diào)查試點(diǎn)項(xiàng)目數(shù)據(jù)庫(kù),組合運(yùn)用Access數(shù)據(jù)庫(kù)的查詢統(tǒng)計(jì)功能和ArcGIS的空間分析功能,有助于行業(yè)用地調(diào)查試點(diǎn)工作的完成。持續(xù)性開(kāi)展城市行業(yè)用地調(diào)查[1],與統(tǒng)計(jì)部門(mén)年度經(jīng)濟(jì)普查保持同步,有助于政府的經(jīng)濟(jì)、用地宏觀決策支撐。
[1] 路曉明,付治河,張高,等.行業(yè)用地調(diào)查成果應(yīng)用研究[J].河南科技,2011,10(上):20-21.
[2] TD/T 1014-2007,第二次全國(guó)土地調(diào)查技術(shù)規(guī)程[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2007.
[3] 宋子輝.自然語(yǔ)言理解的中文地址匹配算法[J].遙感學(xué)報(bào),2013,17(4):795-801.
[4] 胡青,徐建華,王志海.GIS數(shù)據(jù)庫(kù)中地址自動(dòng)匹配方法研究[J].測(cè)繪與空間地理信息,2008,31(6):50-52.
[5] 黨安榮,賈海峰.ArcGIS 8地理信息系統(tǒng)應(yīng)用指南[M].北京:清華大學(xué)出版社,2003.54-55,291-293.
[6] 陳述彭,魯學(xué)軍,周成虎.地理信息系統(tǒng)導(dǎo)論[M].北京:科學(xué)出版社,2001.125-126.
[7] TD/T 1001-2012,地籍調(diào)查規(guī)程[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2012.
[8] 廣州市越秀區(qū)統(tǒng)計(jì)局.2011越秀區(qū)國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展統(tǒng)計(jì)資料[EB/OL].http://#yuexiu.gov.cn/inc/op_win.jsp?id=12509.2013-12-31.
2014-08-06;
2014-11-05
國(guó)土資源部試點(diǎn)地區(qū)行業(yè)用地調(diào)查項(xiàng)目(DCPJ121702-02)
胡大國(guó)(1972-),男,高級(jí)工程師,注冊(cè)測(cè)繪師,主要從事土地調(diào)查和測(cè)繪技術(shù)管理工作。E-mail:daguoh@21cn.com