張敏
(遼寧宇鑫建設(shè)工程有限公司,遼寧沈陽 110000)
現(xiàn)階段,在大數(shù)據(jù)的影響下,我國社會經(jīng)濟與科學(xué)技術(shù)得以快速發(fā)展進步,同時,大數(shù)據(jù)處理技術(shù)的優(yōu)勢開始在各個領(lǐng)域得以展現(xiàn)。特別是在數(shù)據(jù)的存儲和分析方面表現(xiàn)的尤為突出,通過大數(shù)據(jù)處理技術(shù)可有效解決測繪地理信息檔案管理問題。
現(xiàn)階段,相對專業(yè)的資料檔案管理部門主要負責(zé)地理信息檔案的管理工作。在檔案管理過程中主要存在以下幾方面的問題。
其一,檔案數(shù)據(jù)量過大,現(xiàn)如今的檔案管理還是紙質(zhì)文檔和電子文檔相結(jié)合的方式進行存儲。就本單位而言,已存檔的省內(nèi)地理信息相關(guān)的文檔就有400TB,有與項目相關(guān)的一些矢量數(shù)據(jù)、相關(guān)的影像數(shù)據(jù)、元數(shù)據(jù)和相關(guān)的紙質(zhì)版資料等等,并且數(shù)據(jù)量還在以每天100GB的速度增長[1]。
其二,檔案數(shù)據(jù)結(jié)構(gòu)過于復(fù)雜,測繪地理信息數(shù)據(jù)不僅包含結(jié)構(gòu)化數(shù)據(jù)還包含非結(jié)構(gòu)化數(shù)據(jù),比如測繪項目的DOM(數(shù)字正射影像圖)數(shù)據(jù)、DEM(數(shù) 字高程 模型)數(shù)據(jù)、DRG(數(shù)字柵格地圖)數(shù)據(jù)、DLG(數(shù)字線劃地圖)數(shù)據(jù)和三維立體模型等等,從而對數(shù)據(jù)的檢索帶來一定難度。
其三,為數(shù)據(jù)安全性較低,由于數(shù)據(jù)量大且格式不統(tǒng)一,而且有的矢量數(shù)據(jù)還涉及到保密,不能進行集中存儲,因此只能進行分散管理,數(shù)據(jù)安全也無法得以保障,很容易出現(xiàn)數(shù)據(jù)孤島。
上述問題對測繪地理信息管理工作帶來了一定的困擾,借助于大數(shù)據(jù)處理技術(shù)方能解決這些問題。
1.大數(shù)據(jù)處理技術(shù)應(yīng)用于地理信息檔案管理的重要性
當前,測繪地理信息服務(wù)需求爆發(fā)式增長,大數(shù)據(jù)處理技術(shù)的使用優(yōu)勢,已廣泛應(yīng)用于自然資源、水利水電、城市交通、電力電網(wǎng)、管線管網(wǎng)、軍事和許多其他領(lǐng)域,并發(fā)揮著更重要的作用,給測繪地理信息檔案管理部門帶來了重大挑戰(zhàn)和更大的發(fā)展機遇。大數(shù)據(jù)處理技術(shù)在測繪地理信息檔案管理中的廣泛應(yīng)用,有利于促進地理信息檔案管理部門的不斷進步和高效運作,隨著地理信息技術(shù)突飛猛進的發(fā)展,越來越多的地理信息數(shù)據(jù)檔案需要存儲,而且地理信息數(shù)據(jù)檔案具有數(shù)據(jù)量大、生產(chǎn)成本高、技術(shù)含量高和涉密性的特點,它不僅是國民經(jīng)濟建設(shè)所必需的基礎(chǔ)數(shù)據(jù),而且還具有很高的應(yīng)用價值和廣泛的應(yīng)用需求,這是目前我國地理信息檔案管理部門應(yīng)該廣泛關(guān)注的問題。在測繪事業(yè)轉(zhuǎn)型升級的今天,大數(shù)據(jù)技術(shù)應(yīng)用于地理信息檔案管理的檢索引擎中,取得了首戰(zhàn)告捷的應(yīng)用效果,它不僅可以為各行各業(yè)快速準確的提供有實用價值的信息,而且大數(shù)據(jù)技術(shù)也增強了自身的靈活運用,為今后的地理信息檔案管理部門高效的工作提供更強的技術(shù)支持[2]。
2.省級地理信息檔案資源大數(shù)據(jù)處理平臺的創(chuàng)建
測繪地理信息檔案包含的內(nèi)容琳瑯滿目,如全國土地利用現(xiàn)狀數(shù)據(jù)庫成果、各類工程測量成果、大地測量成果、無人機航測成果、地形圖制圖成果、地理國情普查與監(jiān)測數(shù)據(jù)庫成果、海洋地理信息數(shù)據(jù)采集成果、行政區(qū)劃數(shù)據(jù)成果、房產(chǎn)測量成果以及其他地理信息檔案等等。在這之中,除了比如坐標成果信息和坐標系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)外,還有大量的非結(jié)構(gòu)化數(shù)據(jù),例如:文本、表格、圖片、光盤、硬盤和HTML等[3]。特別對于歷史地理信息檔案而言,由于年代久遠,有大量的紙質(zhì)版檔案和紙質(zhì)版地形圖等,由于測繪地理信息檔案具有保密性和完整性,測繪地理信息檔案還包含屬性特性、空間特性、精度特性和時間特性等,因此有的測繪地理信息檔案基本不具備數(shù)字化程度,在這之中勢必存在大量非結(jié)構(gòu)化數(shù)據(jù)。因此,針對大量非結(jié)構(gòu)化地理信息檔案數(shù)據(jù)可以選擇借助于大數(shù)據(jù)處理技術(shù)構(gòu)建出省級地理信息檔案資源管理大數(shù)據(jù)技術(shù)處理平臺。
3.深入挖掘測繪地理信息檔案資源數(shù)據(jù)
現(xiàn)階段,在科學(xué)技術(shù)快速發(fā)展的推動下,測繪地理信息業(yè)務(wù)檔案利用正在發(fā)生著根本的改變,人們對相關(guān)測繪地理信息數(shù)據(jù)的需要日益旺盛,很多塵封已久的先進測繪技術(shù)得以廣泛應(yīng)用,能夠獲取到地理信息數(shù)據(jù)的途徑越來越多,相關(guān)聯(lián)的測繪地理信息檔案管理也就越來越多,加之多年來日益積累的數(shù)據(jù)檔案。若要在這些測繪地理信息檔案中通過人工查找的方式挖掘出有價值的信息數(shù)據(jù)是很難實現(xiàn)的,借助于大數(shù)據(jù)處理技術(shù)則能夠?qū)崿F(xiàn)[4]。在大數(shù)據(jù)處理技術(shù)廣泛應(yīng)用的過程中,其核心為數(shù)據(jù)分析,靈活多維度的分析,不同數(shù)據(jù)多層次下鉆,滿足多領(lǐng)域數(shù)據(jù)的分析需要,比如:地圖數(shù)據(jù)可視化、宏觀房地產(chǎn)商圈智能分析、城市地名和道路名稱實時更新等。在測繪地理信息檔案管理部門服務(wù)過程中,可利用大數(shù)據(jù)應(yīng)用技術(shù)的數(shù)據(jù)挖掘和知識發(fā)現(xiàn)對數(shù)據(jù)進行深入分析。在大數(shù)據(jù)相關(guān)技術(shù)的共同作用下,對測繪地理信息所存在的多元異構(gòu)數(shù)據(jù)進行采集、集成、清洗、分析和存儲,從而形成一種便于分析的數(shù)據(jù)模式,進而將其應(yīng)用在數(shù)據(jù)文件系統(tǒng)的倉庫中,逐步形成完整的測繪地理信息檔案大數(shù)據(jù)處理平臺后,可以對地理信息檔案進行不同層次的加工重組,以達到最有效地開發(fā)利用信息資源的目的,使其具備數(shù)據(jù)挖掘能力。最后,利用相關(guān)知識圖譜,應(yīng)用ES搜索引擎,實現(xiàn)數(shù)據(jù)的高質(zhì)量搜索,為用戶提供出更加有深度且更加準確的信息。
綜上所述,大數(shù)據(jù)處理技術(shù)的優(yōu)勢能夠在測繪地理信息檔案管理中被充分展現(xiàn)出來,不僅因為大數(shù)據(jù)處理技術(shù)在測繪地理信息檔案管理中應(yīng)用的重要性,還借助于大數(shù)據(jù)處理技術(shù)能夠創(chuàng)建省級地理信息檔案資源大數(shù)據(jù)處理平臺并深入挖掘測繪地理信息檔案資源數(shù)據(jù),推動提升測繪地理信息檔案管理工作的質(zhì)量和效率。