董晶
(遼寧省自然資源事務(wù)服務(wù)中心,遼寧 沈陽 110032)
2013至2015年,國務(wù)院開展了第一次全國地理國情普查工作,要求各省基于地理國情普查成果數(shù)據(jù),依據(jù)統(tǒng)一的規(guī)范和標準建立完整的、空間連續(xù)、主要要素時點統(tǒng)一的省級地理國情普查數(shù)據(jù)庫,并設(shè)計開發(fā)地理國情普查數(shù)據(jù)庫管理和應(yīng)用服務(wù)系統(tǒng)。
根據(jù)遼寧省地理國情普查工作的實際情況,論述省級地理國情普查數(shù)據(jù)庫的建設(shè)目標、關(guān)鍵技術(shù)、邏輯設(shè)計、功能設(shè)計、數(shù)據(jù)庫運行環(huán)境等幾個方面。
地理國情普查數(shù)據(jù)由各省和國家分別建庫,各省完成的普查數(shù)據(jù)在開展初步建庫(主要是數(shù)據(jù)預處理)工作后匯交到國普辦進一步構(gòu)建全國數(shù)據(jù)庫。因此,在設(shè)計省級地理國情普查數(shù)據(jù)庫時,要滿足國家的一些基本要求。
(1)省級地理國情普查數(shù)據(jù)建庫應(yīng)參考《第一次全國地理國情普查數(shù)據(jù)庫建設(shè)技術(shù)設(shè)計》,并根據(jù)本省普查實際情況制定相應(yīng)的地理國情普查數(shù)據(jù)庫設(shè)計方案。
(2)省級地理國情普查數(shù)據(jù)庫僅覆蓋本省范圍。除包含全國數(shù)據(jù)庫規(guī)定的數(shù)據(jù)集、數(shù)據(jù)層和數(shù)據(jù)表外,還應(yīng)包含各省擴展的省情普查數(shù)據(jù)成果和相關(guān)專題數(shù)據(jù)。
(3)省級地理國情普查數(shù)據(jù)庫應(yīng)設(shè)計各要素層的增量格式,同時設(shè)計數(shù)據(jù)庫的生成增量功能以實現(xiàn)地表覆蓋和地理國情要素數(shù)據(jù)從省級數(shù)據(jù)庫到全國數(shù)據(jù)庫的增量更新。
(4)省級地理國情普查數(shù)據(jù)庫管理與分析系統(tǒng)、數(shù)據(jù)庫運行環(huán)境等根據(jù)本省實際情況、參考全國數(shù)據(jù)庫進行設(shè)計和選擇。
(5)各省數(shù)據(jù)庫與全國庫保持數(shù)據(jù)一致,因此,應(yīng)統(tǒng)一下發(fā)或開發(fā)數(shù)據(jù)入庫檢查工具和預處理工具。
利用數(shù)據(jù)庫、地理信息系統(tǒng)、虛擬化、云存儲和并行計算等技術(shù),設(shè)計地理國情普查數(shù)據(jù)建庫與更新的技術(shù)路線與工藝流程,完成地理國情普查各類成果數(shù)據(jù)的對象化建模與集成建庫,并構(gòu)建地理國情普查數(shù)據(jù)庫管理與應(yīng)用服務(wù)系統(tǒng),在涉密生產(chǎn)網(wǎng)絡(luò)環(huán)境下,實現(xiàn)地理國情普查成果數(shù)據(jù)集成管理、快速制圖、成果應(yīng)用服務(wù)、數(shù)據(jù)庫更新維護、綜合統(tǒng)計分析等方面的功能。
矢量數(shù)據(jù)如地表覆蓋矢量數(shù)據(jù)、地理國情要素數(shù)據(jù)以要素為單位進行更新。為提高數(shù)據(jù)庫統(tǒng)計分析的效率,當前數(shù)據(jù)與歷史數(shù)據(jù)分開存放,即分為當前空間數(shù)據(jù)庫和歷史空間數(shù)據(jù)庫。在當前數(shù)據(jù)庫中存儲圖層的最新基態(tài)數(shù)據(jù),而在歷史數(shù)據(jù)庫中則保存圖層的歷史基態(tài)數(shù)據(jù)序列。
數(shù)據(jù)更新插件安裝在內(nèi)業(yè)作業(yè)人員的機器上,基于ArcMap開發(fā),操作對象為從數(shù)據(jù)庫更新維護子系統(tǒng)中提取出來用于更新的數(shù)據(jù)包。具體的更新操作依靠ArcMap的現(xiàn)有編輯功能完成,插件只做對變更狀態(tài)(增、刪、改)進行監(jiān)控和保存,同時提供導出增量更新包的功能。
云存儲架構(gòu)可以針對非結(jié)構(gòu)化數(shù)據(jù)提供專有的數(shù)據(jù)存儲和數(shù)據(jù)保護機制。可以實現(xiàn)數(shù)據(jù)量和性能成正比增長,并針對海量地理信息數(shù)據(jù)無法備份保護的特點,提供節(jié)點間的RAID保護功能,實現(xiàn)節(jié)點損壞業(yè)務(wù)不停、數(shù)據(jù)不丟失。
在實際工作中,遼寧省地理國情普查數(shù)據(jù)庫基于ORACLE 11g與ArcSDE環(huán)境下的GeoDatabase模型進行邏輯設(shè)計,數(shù)據(jù)庫中數(shù)據(jù)分矢量數(shù)據(jù)集、柵格數(shù)據(jù)集、普通表格、文檔數(shù)據(jù)等幾種形式進行管理??臻g數(shù)據(jù)以ST-Geometry格式保存在Oracle數(shù)據(jù)庫中,統(tǒng)計分析采用Hadoop+Hive分布式計算框架,文檔數(shù)據(jù)采用NAS形式存儲(圖1)。
為方便數(shù)據(jù)庫更新維護,系統(tǒng)需要具備數(shù)據(jù)入庫、路網(wǎng)與水網(wǎng)構(gòu)建、數(shù)據(jù)分發(fā)處理、數(shù)據(jù)交換、歷史數(shù)據(jù)管理、變化發(fā)現(xiàn)與對比分析和發(fā)布數(shù)據(jù)處理等功能。
系統(tǒng)最基本的需求是各種成果數(shù)據(jù)集成管理與顯示,為此需要在建庫環(huán)境下開發(fā)對地理國情空間數(shù)據(jù)和非空間數(shù)據(jù)的資源管理、集成顯示與查詢檢索等方面功能。
地理國情普查的重要應(yīng)用之一就是以專題圖圖件的形式對外展示成果,需要一套以普查成果數(shù)據(jù)庫為核心的圖庫一體化的方法,快速批量生產(chǎn)出符合普查成果制圖要求的系統(tǒng),形成省、市、縣各級區(qū)域范圍的制圖成果。
基于地理國情普查數(shù)據(jù),深度融合其它專業(yè)部門普查(調(diào)查)數(shù)據(jù)和經(jīng)濟社會統(tǒng)計數(shù)據(jù),從資源分布與利用、生態(tài)協(xié)調(diào)性、基本服務(wù)均等化、區(qū)域經(jīng)濟潛能、城鎮(zhèn)發(fā)展等5個方面進行統(tǒng)計分析。
該系統(tǒng)基于天地圖·遼寧地圖網(wǎng)站,提供地理國情普查成果數(shù)據(jù)的展示以及統(tǒng)計成果的在線服務(wù),包括普查成果及統(tǒng)計成果數(shù)據(jù)的無縫、快速瀏覽顯示、查詢檢索、統(tǒng)計成果下載等方面的在線服務(wù)功能。系統(tǒng)采用B/S結(jié)構(gòu)開發(fā),要求反應(yīng)速度快,操作方便。
圖1 數(shù)據(jù)庫總體邏輯結(jié)構(gòu)
省級地理國情普查數(shù)據(jù)庫系統(tǒng)平臺應(yīng)采用基于虛擬化的GIS部署模式,通過虛擬化管理軟件將計算資源、網(wǎng)絡(luò)資源、存儲資源等虛擬化,構(gòu)建數(shù)據(jù)庫服務(wù)器集群、GIS服務(wù)器集群等提供系統(tǒng)運行所需服務(wù)器和存儲環(huán)境,具有高性能、高可靠性、高可靠擴展力等特點(圖2)。
圖2 物理連接拓撲示意圖
兩臺數(shù)據(jù)庫服務(wù)器雙機部署數(shù)據(jù)庫軟件(Oracle),以增加普查數(shù)據(jù)庫的容災能力。利用備份一體機的備份機制定期備份普查數(shù)據(jù)庫和歷史數(shù)據(jù)庫,保障普查成果安全?;谏婷苌a(chǎn)網(wǎng)絡(luò),GIS服務(wù)器通過ArcGIS Server提供普查數(shù)據(jù)訪問接口,三臺GIS服務(wù)器負載均衡,確保各個部門對數(shù)據(jù)的訪問得到及時快速的響應(yīng)。
采用FC-SAN結(jié)構(gòu)存儲,滿足基于關(guān)系型數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)據(jù)存儲、Oracle高可用性部署的需要,采用云架構(gòu)NAS存儲,滿足基于文件系統(tǒng)的非結(jié)構(gòu)化數(shù)據(jù)的訪問需求。
地理國情普查數(shù)據(jù)真實反映地表植被覆蓋、地形地貌、水域分布、交通網(wǎng)絡(luò)、居民地與設(shè)施等,以及國情要素的分布情況。但是與基礎(chǔ)地理信息數(shù)據(jù)庫相比,地理國情普查數(shù)據(jù)庫有幾個特點,一是國家?guī)炫c省級庫要保持一致,相互之間要設(shè)計數(shù)據(jù)接口,并且強制進行增量更新,這也要求數(shù)據(jù)生產(chǎn)和質(zhì)檢單位今后要改變作業(yè)方式和質(zhì)檢方式;二是基于普查數(shù)據(jù)庫開展統(tǒng)計分析工作,目前設(shè)計的統(tǒng)計分析功能只是粗淺的嘗試,需要進一步地研究提煉;三是要將當前數(shù)據(jù)與歷史數(shù)據(jù)分開存放,形成當前空間數(shù)據(jù)庫和歷史空間數(shù)據(jù)庫;四是如果有條件,運行環(huán)境可采用云存儲方式。目前,遼寧省地理國情普查數(shù)據(jù)庫建設(shè)已進入實施階段,在建設(shè)過程中還會遇到設(shè)計中沒有考慮到的技術(shù)問題,應(yīng)逐步加以解決。