毛海亞,何正國,程國榮,黃 鐸
(1. 廣州市規(guī)劃和自然資源自動化中心,廣東 廣州 510030;2. 廣州邦城信息技術(shù)有限公司,廣東 廣州 510640;3. 華南理工大學(xué)建筑學(xué)院,廣東 廣州 510641;4.亞熱帶建筑科學(xué)國家重點實驗室,廣東 廣州 510641)
“實有”人房數(shù)據(jù)在城市細(xì)微空間粒度的地理實體,特別是個體人口的表達(dá)方面,是對傳統(tǒng)意義上城市基礎(chǔ)數(shù)據(jù)的一次創(chuàng)新,也是推動城市精細(xì)化管理的重要基礎(chǔ)。本文從“實有”人房數(shù)據(jù)應(yīng)用需求出發(fā),著重分析了面向地理實體的“實有”人房數(shù)據(jù)庫建設(shè)中數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn)建設(shè)、地理實體空間化、多尺度實體數(shù)據(jù)管理、數(shù)據(jù)更新等方面的內(nèi)容?;谥贫ā皩嵱小比朔繑?shù)據(jù)處理方法及規(guī)則,構(gòu)建數(shù)據(jù)庫中的對象關(guān)系,設(shè)計“實有”人房數(shù)據(jù)庫結(jié)構(gòu),形成以地理實體為核心的多粒度數(shù)據(jù)庫,為下一步“實有”人房數(shù)據(jù)庫應(yīng)用提供了規(guī)則與范例[1-3]。
建設(shè)面向地理實體的“實有”人房數(shù)據(jù)庫的前提,是基于具有獨立編碼的人、房等地理實體單元,構(gòu)建實體單元之間的規(guī)則。在此基礎(chǔ)上,建立地理實體單元的數(shù)據(jù)質(zhì)量及清洗標(biāo)準(zhǔn),以及數(shù)據(jù)庫的多尺度建庫與“實有”數(shù)據(jù)更新規(guī)則。以此,建立統(tǒng)一數(shù)據(jù)質(zhì)量標(biāo)準(zhǔn),人、房多實體關(guān)聯(lián)、多粒度數(shù)據(jù)集成以及定期更新的地理實體數(shù)據(jù)庫。
由于地理實體單元的最小粒度劃分,其數(shù)據(jù)采集具有數(shù)據(jù)量大,數(shù)據(jù)精度控制在計算和成本上都有著較大的難度[4]。在廣州市“實有”人房數(shù)據(jù)采集過程中,市域?qū)用嫣貏e是“實有人口”數(shù)據(jù)量巨大,且采集與處理過程中存在標(biāo)準(zhǔn)不一,數(shù)據(jù)錄入缺乏審核等導(dǎo)致數(shù)據(jù)質(zhì)量存在問題。同時,由于“實有人口”基于個體居民的數(shù)據(jù)采集,有別于傳統(tǒng)人口數(shù)據(jù)采集中以行政單元的人口統(tǒng)計為數(shù)據(jù)采集單元,其數(shù)據(jù)質(zhì)量和標(biāo)準(zhǔn)化成為“實有”人房數(shù)據(jù)采集與處理中需要首先解決的問題。依據(jù)“實有”人房數(shù)據(jù)質(zhì)量評估所存在的問題,主要從數(shù)據(jù)完整性、一致性、準(zhǔn)確性等方面構(gòu)建“實有”人房數(shù)據(jù)地理實體單元的清洗標(biāo)準(zhǔn),以提高“實有”人房數(shù)據(jù)的可用性,如圖1 所示。
圖1 “實有”人房數(shù)據(jù)清洗標(biāo)準(zhǔn)構(gòu)建
地理實體是能夠進(jìn)行編碼且有關(guān)聯(lián)位置和屬性信息的獨立實體[3],其中獨立的編碼是“實有”人房數(shù)據(jù)作為地理實體的前提,同時統(tǒng)一的實體編碼能夠作為“實有”人房數(shù)據(jù)之間連接的橋梁。地理實體是由其幾何形態(tài)、語義特征和屬性信息加以描述的[1],在“實有”人房數(shù)據(jù)地理實體的構(gòu)建中對地理實體的描述(包括空間位置、幾何形態(tài)、屬性特征、要素關(guān)系及時態(tài)特征),從不同的角度來強化對地理實體的描述,如圖2 所示。
圖2 以人口實體單元為中心的數(shù)據(jù)處理與空間化
“實有”人房原始數(shù)據(jù)表達(dá)了每個地理實體單元的獨立編碼以及對應(yīng)社會與經(jīng)濟(jì)屬性信息?;谶@一關(guān)聯(lián)表構(gòu)建關(guān)系鏈與空間映射,“實有人口”通過“實有房屋”空間化來獲取空間屬性。其中“實有房屋”包括“實有房屋棟”和“實有房屋套”兩部分。“實有房屋”空間化的過程,是以地名地址引擎作為空間信息與其他非空間信息的橋梁[5],首先將“實有房屋棟”的空間地址通過地名地址引擎產(chǎn)生標(biāo)準(zhǔn)地址代碼,然后“實有房屋棟”通過地址代碼關(guān)聯(lián)到標(biāo)準(zhǔn)門牌地址庫獲取空間屬性,“實有房屋套”通過房屋棟和房屋套間的從屬關(guān)系間接獲取空間屬性,實現(xiàn)“實有房屋”的空間化并進(jìn)而實現(xiàn)“實有人口”的空間化。
“傳統(tǒng)”測繪向“新型”測繪轉(zhuǎn)變的核心特征之一,是以地物類型化到地理實體獨立化的轉(zhuǎn)變,這一過程中需要處理海量數(shù)據(jù)的屬性表達(dá)與獨立實體可視化這一挑戰(zhàn)[6]。應(yīng)用實踐中,單一空間粒度與比例尺的地理實體表達(dá)不能滿足地理實體表達(dá)模式的需求,需要構(gòu)建多粒度的時空實體[7]?!皩嵱小比朔繑?shù)據(jù)中,特別是“實有人口”數(shù)據(jù)在廣州市數(shù)據(jù)量巨大,難以單一尺度處理,需要建立人口數(shù)據(jù)的多尺度的空間數(shù)據(jù)模型。
多尺度實體數(shù)據(jù)創(chuàng)建及管理是在“實有人口”實現(xiàn)空間化的基礎(chǔ)上開展,首先聚合特定空間單元中的原始人口點數(shù)據(jù)作為聚合點的屬性信息(包括各性別人數(shù)、各人口類型人數(shù)、各年齡階段人數(shù)、勞動人口、育齡婦女人口等),實現(xiàn)原始尺度基礎(chǔ)上下一尺度的空間變換與屬性聚合。在新的尺度數(shù)據(jù)基礎(chǔ)上,以該尺度人口聚合點重新劃分規(guī)則格網(wǎng)生成更小比例尺聚合點圖層,以此規(guī)則在新的聚合點圖層中重復(fù)以上過程,生成從大到小比例尺下對應(yīng)的聚合點圖層,如圖3所示。
圖3 多尺度實體人口數(shù)據(jù)生成
形成不同尺度人口聚合點圖層是求解聚合點空間位置及屬性信息的過程,在每個格網(wǎng)單元中,聚合點的空間坐標(biāo)采用加權(quán)平均數(shù)的方式,權(quán)重為該點人口總數(shù),聚合點的屬性字段為格網(wǎng)單元中所有點對應(yīng)字段之和,計算公式如下:
式(1)、(2)中,X、Y表示聚合點的坐標(biāo);xn、yn為一個抽稀單元中第n個點的原始點坐標(biāo);mn為抽稀單元中第n個人口點人口總數(shù);mi為當(dāng)前格網(wǎng)中所有點的總?cè)藬?shù)的算數(shù)平均數(shù)。(3)式中f為聚合點中字段f對應(yīng)的值,fi為該抽稀單元中第i個原始人口點對應(yīng)的f字段值,即聚合點f字段的值為格網(wǎng)單元中所有原始人口點f字段之和。依據(jù)不同比例尺將聚合每一層聚合點數(shù)據(jù)保存為庫中的空間表,每條空間表的中的記錄表示某一數(shù)據(jù)尺度下對應(yīng)規(guī)則格網(wǎng)中所有地理實體的統(tǒng)計信息。形成了多粒度的人口數(shù)據(jù),能夠為不同尺度下的數(shù)據(jù)訪問提供快速的響應(yīng)。
在“實有”人房數(shù)據(jù)中,“實有人口”處于流動狀態(tài),因而同時具有時態(tài)性??紤]數(shù)據(jù)特別是人口數(shù)據(jù)的海量規(guī)模,“實有”人房數(shù)據(jù)更新模式為以一定周期為時間節(jié)點的定時增量更新策略?;谠肌皩嵱小比朔勘韱螖?shù)據(jù)生成初始空間數(shù)據(jù)庫基礎(chǔ)上,以定時更新模式對“實有”人房空間數(shù)據(jù)庫進(jìn)行增量更新。更新過程以更新腳本的方式運行,按照數(shù)據(jù)處理規(guī)則,經(jīng)過更新數(shù)據(jù)抽取、數(shù)據(jù)清洗、空間落地、更新地理實體及相關(guān)等步驟對原始采集數(shù)據(jù)進(jìn)行處理得到空間化的“實有人口”及“實有房屋”數(shù)據(jù),并更新到“實有”人房空間數(shù)據(jù)庫,同時將當(dāng)前現(xiàn)勢庫通過更新時間標(biāo)簽存儲到歷史庫中。在具體的更新周期控制方面,依據(jù)數(shù)據(jù)本體的時態(tài)特征并考慮數(shù)據(jù)推送及采集的實際情況,確定“實有”人房應(yīng)用數(shù)據(jù)庫的更新周期為一周。
更新過程中,原始“實有”人房數(shù)據(jù)庫中存儲著“實有人口”及“實有房屋”中所有時間序列的表單數(shù)據(jù),當(dāng)原始“實有”人房數(shù)據(jù)庫更新完成后,觸發(fā)“實有”人房數(shù)據(jù)庫的更新程序。首先通過更新數(shù)據(jù)對應(yīng)的更新時間戳對比當(dāng)前數(shù)據(jù)庫查找更新要素,將更新的地理實體寫入到歷史庫中,并對提取的更新數(shù)據(jù)按照數(shù)據(jù)清洗流程以及已更新的對象關(guān)系進(jìn)行空間化,最后進(jìn)行多尺度實體數(shù)據(jù)生成,完成數(shù)據(jù)的時態(tài)更新,如圖4 所示。
圖4 “實有”人房數(shù)據(jù)庫更新機(jī)制
廣州市“實有”人房數(shù)據(jù)中地理實體的基礎(chǔ)屬性,主要包括實體標(biāo)識信息和屬性信息這兩部分,用來標(biāo)志地理實體和表示實體相關(guān)屬性,如在“實有人口”中,用人口ID 作為“實有人口”的唯一標(biāo)識,人口類型、年齡、戶籍等信息表述人口實體的相關(guān)屬性,實體的空間屬性存儲著實體對象的空間幾何信息及位置信息,通過對象標(biāo)識信息映射到空間幾何信息上。表1列舉了廣州市“實有”人房數(shù)據(jù)庫中的表單內(nèi)容,圖 5用ER 圖來表示數(shù)據(jù)庫中的實體及其關(guān)系。
圖5 “實有”人房實體數(shù)據(jù)庫ER 模型
表1 “實有”人房數(shù)據(jù)庫表單內(nèi)容
以廣州市“實有”人房數(shù)據(jù)庫中人口信息表中“人口ID”作為主鍵,其他字段如人口類型、年齡、性別等為屬性字段,同時包括空間屬性用來存儲人口的空間信息;關(guān)系信息表包括人房關(guān)系,在人房關(guān)系中使用人口ID 字段和房屋棟ID 字段的關(guān)聯(lián)來存儲人口與房屋之間的關(guān)系,統(tǒng)計信息表包括基于門牌的人口統(tǒng)計信息表;空間信息表是在屬性信息表和統(tǒng)計信息表的基礎(chǔ)上通過添加空間字段,該字段存儲著地理實體的空間位置信息。在每個地理實體對應(yīng)的屬性表中保存著該地理實體的更新時間。
在空間信息表中存在不同粒度的人口統(tǒng)計數(shù)據(jù),不同的比例尺對應(yīng)著數(shù)據(jù)庫中不同的數(shù)據(jù)粒度的空間表,在該表中格網(wǎng)標(biāo)號為該數(shù)據(jù)的唯一標(biāo)識符,代表抽稀時的格網(wǎng),表名表示某一數(shù)據(jù)粒度下相對應(yīng)的比例尺,除此之外的屬性為該粒度下人口的基本屬性?;诓煌男姓吔鐚θ丝跀?shù)據(jù)進(jìn)行統(tǒng)計,生成不同等級行政區(qū)域的人口數(shù)據(jù)統(tǒng)計表,提供基于行政邊界人口數(shù)據(jù)的快速查詢,如圖6 所示。
圖6 “實有”人房數(shù)據(jù)庫物理結(jié)構(gòu)
在上述數(shù)據(jù)處理方法和數(shù)據(jù)庫模型的支撐下,建立廣州市“實有”人房地理實體數(shù)據(jù)庫,該數(shù)據(jù)庫整合了人口、房屋,同時通過數(shù)據(jù)庫中統(tǒng)一的實體編碼,實現(xiàn)廣州市以人、房為核心數(shù)據(jù)展示及分析平臺。如圖7、8 所示為人口信息熱力圖功能及建筑物查詢功能。
圖7 基于“實有人口”的人口熱力圖生成功能
1)實現(xiàn)快速查詢分析某個區(qū)域中的人口結(jié)構(gòu)及分布情況,支持通過行政區(qū)劃邊界、自定義空間范圍來快速生成人口的數(shù)據(jù)統(tǒng)計。
2)實現(xiàn)快速查詢地理實體的空間位置,并通過統(tǒng)一的實體編碼實現(xiàn)以人查房、以房查人等關(guān)聯(lián)查詢。
3)實現(xiàn)建筑物查詢功能,通過房屋套與房屋棟之間的從屬關(guān)系來生成房屋套組成的樓盤表。
4)實現(xiàn)服務(wù)設(shè)施人口均等化分析功能,借助現(xiàn)有道路數(shù)據(jù),快速生成服務(wù)設(shè)施服務(wù)范圍,并對服務(wù)設(shè)施覆蓋的人口進(jìn)行統(tǒng)計分析。
5)實現(xiàn)多比例尺下人口信息熱力圖的顯示,并通過多粒度數(shù)據(jù)集成的方式提供快速的數(shù)據(jù)響應(yīng)與分析。
圖8 基于“實有房屋”的房屋棟查詢功能
本文基于廣州“實有”人房數(shù)據(jù)庫建設(shè)的研究,從數(shù)據(jù)質(zhì)量、地理實體空間化、多尺度實體數(shù)據(jù)管理、數(shù)據(jù)更新這4 個方面來闡述“實有”人房實體數(shù)據(jù)庫建設(shè)需求,分析了數(shù)據(jù)庫建設(shè)過程中的數(shù)據(jù)處理及更新方法,實現(xiàn)“實有人口”及“實有房屋”以個體為單位的空間落點。并基于此,闡述了“實有”人房數(shù)據(jù)庫的邏輯結(jié)構(gòu)及物理結(jié)構(gòu),建立了“實有”人房數(shù)據(jù)庫的具體應(yīng)用支撐。在后續(xù)的研究工作中,針對應(yīng)用實踐中不斷增加的“實有”人房數(shù)據(jù)需求,需要持續(xù)優(yōu)化數(shù)據(jù)庫結(jié)構(gòu)模型并據(jù)此構(gòu)建創(chuàng)新應(yīng)用數(shù)據(jù)模型,為更好地發(fā)揮“實有”人房數(shù)據(jù)庫應(yīng)用實踐提供支撐。