張大騫,郭昌達,陶 旸 ,劉善磊
(1.江蘇省基礎地理信息中心,江蘇 南京 210013;2.江蘇省自然資源廳,江蘇 南京 210017)
自然資源時空信息管理是提升自然資源管理水平、推動自然資源治理體系現(xiàn)代化建設的一項重要研究課題[1-2]。2021年2月8日,自然資源部專門印發(fā)了《自然資源三維立體時空數(shù)據(jù)庫建設總體方案》(以下簡稱“國家三維方案”),提出建設由1個主庫、9個分庫組成的國家級自然資源三維立體時空數(shù)據(jù)庫,作為支撐自然資源各項管理的重要數(shù)據(jù)基礎。自然資源監(jiān)測數(shù)據(jù)庫是9個分庫之一,負責自然資源常規(guī)監(jiān)測、專題監(jiān)測、應急監(jiān)測等數(shù)據(jù)成果的集成建庫管理[3]。
2021 年以來,監(jiān)測工作得到了常態(tài)化的制度支撐[4]。在國家監(jiān)測工作要求基礎上,為提升江蘇自然資源精細化管理水平,加快構建省級自然資源統(tǒng)一監(jiān)測體系,形成可復制、可推廣的自然資源監(jiān)測技術方法、工作流程和指標體系,江蘇省自然資源廳部署多家單位全面開展耕地資源監(jiān)測、城市要素監(jiān)測、林草濕監(jiān)測等各類試點監(jiān)測工作。在全省監(jiān)測及各項試點工作基礎上,開展了自然資源監(jiān)測數(shù)據(jù)庫建設研究,提煉關鍵技術并形成研究成果,為集成管理省級自然資源監(jiān)測數(shù)據(jù)成果、全面納入自然資源三維立體時空數(shù)據(jù)庫體系提供支持。
目前,自然資源監(jiān)測工作主要是掌握地表自然資源分布,綜合參考自然資源數(shù)據(jù)的立體分層劃分、數(shù)據(jù)來源及類型,其數(shù)據(jù)成果由管理層、空間基底、地表覆蓋三大類數(shù)據(jù)集構成[5-6],各大類數(shù)據(jù)集由若干數(shù)據(jù)子集構成。
自然資源三維立體時空數(shù)據(jù)模型是自然資源在時間、空間、語義、管理、服務等方面一體化表達的實體模型?!皣胰S方案”提出的模型集成了實體表達模型、時空演變模型、地球空間網格模型、業(yè)務關系模型,可準確反映自然資源實體的時態(tài)、位置、數(shù)量、質量、生態(tài)五位一體的時空-屬性關系,實現(xiàn)自然資源的一體化表達,達到橫向上匯聚多種要素,縱向上融合多種尺度,時間上連續(xù)動態(tài)拓展[3]。
省級三維數(shù)據(jù)庫通過具體的實體分級分層編碼,實現(xiàn)面向自然資源管理需求的數(shù)據(jù)實體生產。在實體分級分類基礎上,通過擴展時間標簽實現(xiàn)自然資源實體生命周期跟蹤管理。通過添加建立語義關聯(lián)標簽、空間關聯(lián)標簽,表達在一定的空間區(qū)域內,不同空間實體之間存在語義、空間聯(lián)系。
自然資源監(jiān)測工作是系統(tǒng)性工程,數(shù)據(jù)來源多樣,且近年來工作要求不斷變化,內容、結構變動較大。為便于建庫工作的順利開展,特別是歷史數(shù)據(jù)成果的銜接集成,各監(jiān)測數(shù)據(jù)集原則上保持原有數(shù)據(jù)結構和字段屬性,歷史數(shù)據(jù)暫時只進行統(tǒng)一坐標系統(tǒng)、高程基準、存儲結構等標準化處理?,F(xiàn)狀數(shù)據(jù)通過添加唯一標識碼、時間、三調關聯(lián)標識、備注等字段,便于數(shù)據(jù)成果與三調底版數(shù)據(jù)掛接、成果時序動態(tài)管理。通過模型擴展表用于描述自然資源實體間的邏輯關聯(lián)、空間關聯(lián)關系,提升數(shù)據(jù)快速應用、精準服務價值。通過實體分級分類編碼,表達實體間存在層級關聯(lián)。通過梳理實體和實體之間存在各類關系,通過建立關聯(lián)表,實現(xiàn)相關關系的快速索引查詢。通過建立實體變更關系表,記錄實體生命周期變化,進行動態(tài)時空回溯。
矢量數(shù)據(jù)采用ArcGIS進行加工處理,形成的中間成果格式為Geodatabase格式,最終通過入庫工具將數(shù)據(jù)成果物理存入監(jiān)測分庫中。
為響應監(jiān)測數(shù)據(jù)動態(tài)管理與更新需求,借鑒參考測繪地理信息相對成熟的時空數(shù)據(jù)庫建設經驗,本文對監(jiān)測數(shù)據(jù)庫組織結構做出相應變動,將數(shù)據(jù)庫劃分為匯交庫、現(xiàn)勢庫、工作庫、歷史庫四類子庫,分別存儲匯交數(shù)據(jù)、最新成果數(shù)據(jù)、過程數(shù)據(jù)和歷史數(shù)據(jù)[7-9]。
1)匯交庫。匯交庫用于存儲通過數(shù)據(jù)質量檢查的監(jiān)測數(shù)據(jù)成果及其相關元數(shù)據(jù)。數(shù)據(jù)匯交后,匯交庫將數(shù)據(jù)及文檔以文件形式存儲在磁盤陣列中的特定目錄下,統(tǒng)一管理。
2)現(xiàn)勢庫?,F(xiàn)勢庫用于存儲最新的數(shù)據(jù)成果及相關元數(shù)據(jù)?,F(xiàn)勢庫中的矢量按要素集、要素類分級存儲在空間數(shù)據(jù)庫中。三維數(shù)據(jù)模型、影像以文件形式存儲在磁盤陣列中的特定目錄下,按數(shù)據(jù)類型、時段、分辨率或模型精度等分級存儲。
3)工作庫。工作庫主要存儲建庫過程數(shù)據(jù)及相關質檢數(shù)據(jù),將相關數(shù)據(jù)存儲在本地。工作庫組織方式完全遵循現(xiàn)勢庫中的數(shù)據(jù)組織,并可根據(jù)數(shù)據(jù)處理需要添加相應字段;質檢規(guī)則、質檢記錄及結果以Table格式存儲。
4)歷史庫。歷史庫用于存儲歸檔數(shù)據(jù)和變更數(shù)據(jù)。歸檔數(shù)據(jù)中的數(shù)據(jù)集分別存放。為了便于識別各時段的數(shù)據(jù),在數(shù)據(jù)集名和要素類名前加版本號進行標識,表結構不變。如2021 年年度版本號為V2021,2021 年具體日期后面按日期增加V20210102。數(shù)據(jù)集命名規(guī)則為:版本號+數(shù)據(jù)集名稱。要素類命名規(guī)則為:版本號+數(shù)據(jù)集名稱+要素類名。
5)邏輯關系。數(shù)據(jù)匯交后,首先檢查匯交數(shù)據(jù)的完整性,然后進行基本的數(shù)據(jù)檢查,同時將檢查結果存入工作庫;將檢查合格的匯交數(shù)據(jù)導入?yún)R交庫備份,并導入工作庫以便進行數(shù)據(jù)入庫處理。工作庫中的數(shù)據(jù)經入庫處理后,再次進行數(shù)據(jù)質量檢查,將質檢結果存入工作庫,便于輸出入庫數(shù)據(jù)質量檢查問題記錄;最后將工作庫中的數(shù)據(jù)導入現(xiàn)勢庫,將變更數(shù)據(jù)導入歷史庫。
數(shù)據(jù)建庫處理包括數(shù)據(jù)分析與準備,數(shù)據(jù)整合,數(shù)據(jù)質檢,數(shù)據(jù)入庫4個過程:
1)數(shù)據(jù)分析與準備。省級監(jiān)測數(shù)據(jù)庫數(shù)據(jù)主要來源于國家數(shù)據(jù)的下發(fā)、省級數(shù)據(jù)的更新、市縣數(shù)據(jù)的匯交等途徑。根據(jù)原始匯集數(shù)據(jù)的數(shù)據(jù)標準、數(shù)據(jù)內容、數(shù)據(jù)格式、空間參考信息、屬性結構、分類編碼、數(shù)據(jù)質量等具體情況,確定數(shù)據(jù)的整合處理方案。此外,通過監(jiān)測試點項目實踐分析,基礎測繪、自然資源確權登記、耕地保護等其他自然資源數(shù)據(jù)成果,以及生態(tài)、環(huán)保、住建、交通、水利等其他行業(yè)專題資料,經融合處理后,可以作為重要數(shù)據(jù)來源補充完善各類監(jiān)測數(shù)據(jù),提升數(shù)據(jù)精度[10-13]。
2)數(shù)據(jù)整合與融合。數(shù)據(jù)整合處理應依據(jù)統(tǒng)一的技術規(guī)范、統(tǒng)一的對象編碼、統(tǒng)一的元數(shù)據(jù)組織要求進行,以數(shù)據(jù)模型設計為依據(jù),對照映射關系,利用整合處理軟件進行自動化處理,實現(xiàn)數(shù)據(jù)字段結構統(tǒng)一、內容值域統(tǒng)一、數(shù)學基礎規(guī)范、文件命名規(guī)范、目錄組織規(guī)范、元數(shù)據(jù)組織規(guī)范、數(shù)據(jù)關系建立等要求。
針對其他數(shù)據(jù)成果與監(jiān)測數(shù)據(jù)成果因采集標準和數(shù)據(jù)處理要求不同造成難以綜合利用這一現(xiàn)狀,以要素的幾何類型為基準,基于語義匹配和幾何匹配等關鍵技術,對空間要素進行關聯(lián)構建和分析,分析不同要素間差異,找出要素間最大的切合點,減少數(shù)據(jù)融合工作整體工作量、提高工作效率[14-15]。
3)數(shù)據(jù)質檢。依照相關的數(shù)據(jù)庫設計和質量控制規(guī)定,對整合融合后的文件名稱、文件內容、數(shù)據(jù)內容、元數(shù)據(jù)結構與內容等進行處理。
4)數(shù)據(jù)入庫。按要求完成質量檢查后,根據(jù)數(shù)據(jù)結構框架,將各類數(shù)據(jù)通過開發(fā)的入庫工具,分層導入到標準數(shù)據(jù)庫中,完成數(shù)據(jù)的初始化建庫工作。
數(shù)據(jù)庫建設單位接收到匯交的更新數(shù)據(jù)后,在匯交庫中創(chuàng)建更新質檢任務進行數(shù)據(jù)字段與格式的基本質量檢查,生成檢查記錄存入工作庫,若存在問題,則反饋給數(shù)據(jù)匯交方修改,質量檢查通過后則提交至匯交庫。
質檢完成后進行增量提取,首先按照要素的唯一標識碼建立索引,基于同一性疊置分析技術進行逐一比對分析[16],按照變化類型進行歸類,對提取的變化數(shù)據(jù)進行標記,如圖1所示。
數(shù)據(jù)檢查無誤則數(shù)據(jù)庫建設單位將新增數(shù)據(jù)提交至現(xiàn)勢庫,變更數(shù)據(jù)提交至歷史庫,完成數(shù)據(jù)更新。
1)基于身份標識碼的全生命周期管理。數(shù)據(jù)更新是一個動態(tài)持續(xù)的過程。要素的新增、變化、刪除等信息都必須記錄下來,以便于數(shù)據(jù)庫的管理、回溯與分析。身份標識碼(如國土調查監(jiān)測中的BSM 碼)技術,可有效實現(xiàn)數(shù)據(jù)的全生命周期管理。通過標識碼的管理分析,可實現(xiàn)監(jiān)測數(shù)據(jù)在各作業(yè)單位的狀態(tài)傳遞和生命狀態(tài)信息記錄。首先,建庫時,所有要素應包含唯一身份標識碼,待開展更新工作時,將相關更新區(qū)域帶有唯一身份標識碼的數(shù)據(jù)下發(fā)至作業(yè)單位,作業(yè)單位應該根據(jù)數(shù)據(jù)變化情況,動態(tài)維護(增加或刪除)各類要素的唯一身份標識碼。匯交更新數(shù)據(jù)時,需統(tǒng)一提交帶有唯一身份標識碼的更新數(shù)據(jù)。在質檢流程中,唯一身份標識碼作為質檢要素的唯一標識,并參與到質檢結果的顯示識別中。在質檢流程中涉及編輯等操作時,通過唯一身份標識碼確保數(shù)據(jù)同步,直至數(shù)據(jù)入庫。
2)按需更新的增量更新模式。采用增量更新入庫的方式進行數(shù)據(jù)入庫。一方面,相較于傳統(tǒng)入庫方式需要對數(shù)據(jù)庫所有數(shù)據(jù)進行質檢和入庫,增量更新入庫方式僅需對增量數(shù)據(jù)包進行檢查和處理,能夠大大提高數(shù)據(jù)質檢和入庫效率;另一方面,采用增量更新入庫,能夠突破傳統(tǒng)采用版本建庫模式無法實現(xiàn)數(shù)據(jù)可回溯的制約,建立可動態(tài)維護的時空數(shù)據(jù)庫,滿足對不同時期數(shù)據(jù)的時空回溯、分析挖掘等需求。增量提取功能可作為獨立模塊實現(xiàn)。增量包中包含有變更前后的要素信息,可用來做數(shù)據(jù)對比更新。增量提取接口可以針對指定圖層、指定區(qū)域進行提取。待提取的要素類型為點要素,線要素和面要素,提取操作根據(jù)要素類型分類。
3)空間數(shù)據(jù)多時態(tài)管理技術。在實際管理應用中不但需要瀏覽數(shù)據(jù)庫中的現(xiàn)勢數(shù)據(jù),也需回溯過去某一時刻某一區(qū)域歷史狀態(tài)。在數(shù)據(jù)庫生產基礎上,以圖斑、單體模型等最小基元為實體建立時間索引,時間標簽的變更以實體的變化為事件觸發(fā)。在數(shù)據(jù)庫中將實體的所有變化信息存儲,使用戶能以時間軸上的時間段過濾空間數(shù)據(jù),做到任意時間點數(shù)據(jù)快速回放。記錄自然資源實體產生時間、消亡時間,以及在各時間點的空間形態(tài)和屬性信息,沿時間維度可動態(tài)展現(xiàn)自然資源實體從產生到消亡全生命周期的時空演變過程。
4)多源矢量數(shù)據(jù)關聯(lián)融合技術。準確高效地發(fā)現(xiàn)和提取多源矢量空間數(shù)據(jù)關聯(lián)信息,提升自然資源監(jiān)測數(shù)據(jù)的準確性。針對點、線、面不同類型實體,基于GIS 圖形空間關系和語義分析等技術,形成了多源矢量空間數(shù)據(jù)間同名實體匹配方案[14]。
區(qū)別于傳統(tǒng)的點實體匹配方法只是片面的強調位置或屬性的限制,新方法綜合利用要素的位置、屬性及環(huán)境特征,實現(xiàn)基于距離、屬性與環(huán)境等多特征組合的點實體數(shù)據(jù)匹配;在獲取候選檢測數(shù)據(jù)集的基礎上構建線實體模型,實現(xiàn)基于Fréchet距離的線實體數(shù)據(jù)匹配;綜合利用實體的空間相似度、距離相似度、形狀相似度等多個相似特征結合拓撲關系進行面實體數(shù)據(jù)的匹配。
數(shù)據(jù)整合融合處理工作完成后,還應校驗處理后的數(shù)據(jù)是否符合規(guī)范,進行整體質量控制,滿足數(shù)據(jù)完整性、邏輯一致性、空間定位準確度、數(shù)據(jù)正確性、數(shù)據(jù)時相及精度等數(shù)據(jù)成果質量要求,并使用軟件形成質量評價結果和質量檢查報告,最終保證基礎信息整合結果的準確無誤。
在方法研究的基礎上,開發(fā)相關軟件,將自然資源監(jiān)測數(shù)據(jù)增量提取處理過程進行封裝,簡化自然資源監(jiān)測數(shù)據(jù)增量提取處理過程,同時系統(tǒng)化數(shù)據(jù)處理流程,使數(shù)據(jù)入庫處理更便捷,實現(xiàn)對自然資源監(jiān)測數(shù)據(jù)的標準化處理與增量提取、快速入庫。
同時,本文基于江蘇省基礎地理信息中心采購的FME(feature manipulate engine)軟件設計了一套集數(shù)據(jù)讀取、增刪改判斷、變化信息輸出的自動化處理模板,實現(xiàn)了監(jiān)測圖斑時序數(shù)據(jù)關聯(lián)的一鍵化處理,便于后續(xù)圖斑的歷史回溯管理。
為驗證FME模板的效率,本文選取了徐州市銅山區(qū)8 個鄉(xiāng)鎮(zhèn)(街道)2 a 地類監(jiān)測圖斑作為實驗數(shù)據(jù),并通過BSM 自動輸出2 a 圖斑之間的變遷關系,整個過程耗時僅116 s、95 s。
目前,在本文技術流程支撐下,通過遷移全覆蓋、現(xiàn)勢性好、準確度高的全省地理國情數(shù)據(jù)、國土調查變更及省級基礎測繪相關數(shù)據(jù),已初步形成全面涵蓋耕地、林草濕資源、水資源、城市空間等各類地表自然資源現(xiàn)狀的監(jiān)測數(shù)據(jù)底版,并通過不斷匯集試點監(jiān)測數(shù)據(jù),逐步完善數(shù)據(jù)庫的更新技術方法與流程。
下一步將加強市縣數(shù)據(jù)匯集、歷史數(shù)據(jù)整合、知識圖譜、主分庫聯(lián)動以及成果數(shù)據(jù)應用服務[1-2,12,17]等方面研究,促進全省自然資源統(tǒng)一監(jiān)測體系構建,為服務全省生態(tài)文明建設和高質量發(fā)展提供基礎數(shù)據(jù)支撐。