徐進達,葛佩佩
(1.山東省地質(zhì)測繪院,山東 濟南 250002;2.濱州市自然資源和規(guī)劃局,山東 濱州 256603)
21世紀以來,隨著全球信息化和互聯(lián)網(wǎng)的推進,人類已經(jīng)進入大數(shù)據(jù)時代[1-4]。地質(zhì)數(shù)據(jù)具有大數(shù)據(jù)的基本屬性,即體量大而完整(volume)、類型多且關聯(lián)(variety)、聚集快卻雜亂(velocity)和價值大但稀疏(value)[5],同時又具有自己的特點,具體表現(xiàn)在多元(源)異構與多模態(tài)、高度時空性、大容量、高相關、低價值密度、復雜性與模糊不確定性等方面[6-7]。地質(zhì)資料是國家重要的檔案資料,是國民經(jīng)濟建設和進一步開展地質(zhì)工作、科學研究等的依據(jù)和基礎,是國家的寶貴財富,基于大數(shù)據(jù)時代下開展地質(zhì)資料信息化建設,充分發(fā)揮其作用顯得尤為重要。中國地質(zhì)調(diào)查局按照“統(tǒng)一規(guī)劃、統(tǒng)一標準、統(tǒng)一平臺、統(tǒng)一窗口”的原則,以消除數(shù)字鴻溝,實現(xiàn)互聯(lián)互通為目標,開展了“地質(zhì)云”建設工作[8-10]。
本文通過借鑒“地質(zhì)云”的建設模式,結合山東省60余年來積累的海量地質(zhì)資料,開發(fā)了地質(zhì)資料管理系統(tǒng)。該系統(tǒng)包括地質(zhì)資料數(shù)據(jù)管理系統(tǒng)和地質(zhì)資料檢索及借閱管理系統(tǒng)兩個子系統(tǒng),可實現(xiàn)地質(zhì)資料的信息化、可視化管理,有效地提升地質(zhì)資料的利用價值。
本地質(zhì)資料管理系統(tǒng)的建設目標是建立地質(zhì)檔案資料數(shù)據(jù)庫,開發(fā)地質(zhì)資料管理系統(tǒng)(包括地質(zhì)資料數(shù)據(jù)管理系統(tǒng)和地質(zhì)資料檢索及借閱管理系統(tǒng))。實現(xiàn)地質(zhì)檔案資料網(wǎng)絡化管理和網(wǎng)絡化服務。
系統(tǒng)總體技術架構如圖1所示。
圖1 地質(zhì)資料管理系統(tǒng)的總體技術架構Fig.1 Overall technical architecture of geological data management system
基礎設施層是地質(zhì)資料管理系統(tǒng)運行的軟件和硬件環(huán)境。包括系統(tǒng)運行所需的存儲資源、計算資源、網(wǎng)絡資源和安全防護設備等,提供計算處理服務、網(wǎng)絡應用服務、資源業(yè)務應用服務和其他服務。本系統(tǒng)共安裝服務器設備32臺,包括數(shù)據(jù)庫服務器、GIS服務器、應用服務器、備份服務器、基礎服務及運維管理系統(tǒng)服務器等;根據(jù)各類應用的不同特點,并結合處理速度、存儲容量、可靠性、系統(tǒng)開放性等因素來進行配置不僅滿足當前應用需求,也具備高擴展能力,以便將來應用增加、負載增強之需。
地質(zhì)資料數(shù)據(jù)庫是整個系統(tǒng)建設的核心。山東省地礦局自成立以來,在礦產(chǎn)勘查、水文地質(zhì)、環(huán)境地質(zhì)、農(nóng)業(yè)地質(zhì)、城市地質(zhì)、海洋地質(zhì)、工程勘察、測繪等多個方面積累了海量地質(zhì)圖、地形圖、鉆孔信息、遙感影像、礦產(chǎn)資源等資料。由于2005年之前的資料絕大部分以紙質(zhì)圖件、報告、數(shù)據(jù)表、多媒體等形式存放,因此按照數(shù)據(jù)規(guī)范、標準和工作流程,要通過紙質(zhì)掃描電子化、圖件矢量化、數(shù)據(jù)格式轉(zhuǎn)換、空間參考轉(zhuǎn)換等手段,進行電子化、數(shù)字化和空間化加工處理。經(jīng)過數(shù)據(jù)提取、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)清理、數(shù)據(jù)裝載等過程,已將歷史數(shù)據(jù)和動態(tài)數(shù)據(jù)集成到地質(zhì)資料數(shù)據(jù)庫,并按照數(shù)據(jù)庫方式進行存貯和管理。
地質(zhì)資料數(shù)據(jù)庫建庫成果以及地圖服務動態(tài)或者切片服務的空間參考,統(tǒng)一采用2000國家大地坐標系(CGCS2000),同時兼顧國家及自然資源部相關數(shù)據(jù)標準以及“一張圖”數(shù)據(jù)瀏覽的需求。
地質(zhì)資料數(shù)據(jù)管理系統(tǒng)基于CS模式開發(fā),是集礦產(chǎn)、水、工、環(huán)、大地質(zhì)服務數(shù)據(jù)及檔案資料于一體的管理信息系統(tǒng),涉及區(qū)調(diào)、化探、重砂、航磁、重力數(shù)據(jù)、礦產(chǎn)成果報告、水工環(huán)成果報告等圖文資料和文件檔案資料,便于查詢、檢索、統(tǒng)計和管理。使相關人員能快速建立、管理地質(zhì)資料,方便快捷地查詢應用這些資料,切實發(fā)揮其作用,更好地為生產(chǎn)服務。
對已有的地質(zhì)檔案資料,進行元數(shù)據(jù)錄入,包括基本信息及描述信息的錄入。其中,基本信息包括地質(zhì)資料名稱、原始檔案號、資料編號、序號;描述信息包括作者、資料類型、完成單位、完成時間、保存形式、坐標范圍、比例尺、存放單位、關鍵詞、內(nèi)容簡介等信息。元數(shù)據(jù)的錄入可為后期地質(zhì)資料的查詢檢索功能提供支撐。
對于相互關聯(lián)的地質(zhì)檔案資料,通過關聯(lián)屬性、檔案類型、檔案編號,進行不同類型檔案間的關聯(lián)。關聯(lián)關系可以配置,在檔案詳情里增加鏈接,進行地質(zhì)檔案資料的屬性關聯(lián),考慮遞歸循環(huán)查找關聯(lián)關系,能進行正反兩個方向設置關聯(lián)關系;如果關聯(lián)多個,則顯示多個鏈接。如果遞歸查找過程中,根據(jù)屬性值沒查到檔案,那么就終止,并且這個關聯(lián)關系不顯示在檔案詳情里。
提供地質(zhì)檔案資料的導入功能,按照數(shù)據(jù)存在的格式提供多種導入方式。
2.3.1屬性數(shù)據(jù)導入
提供地質(zhì)信息數(shù)據(jù)表格的數(shù)據(jù)維護,包括文檔資料導入、圖件數(shù)據(jù)導入、地圖庫管理、影像庫管理、鉆探、物探、化探、監(jiān)測信息、礦產(chǎn)資源數(shù)據(jù)(礦區(qū)基本信息、基本地質(zhì)信息、礦山基本信息、測量信息編錄、分析數(shù)據(jù)編錄、儲量計算數(shù)據(jù)編錄)、地質(zhì)災害(地面塌陷等)樣點數(shù)據(jù)等屬性數(shù)據(jù)的導入,實現(xiàn)Access、Oracle、SQL Server、Excel格式的屬性數(shù)據(jù)之間的互導。
2.3.2文檔資料導入
提供Word、PDF等格式的資料入庫,包括有文檔號和無文檔號資料的導入。
2.3.3圖件數(shù)據(jù)導入轉(zhuǎn)換
1)遙感影像數(shù)據(jù)轉(zhuǎn)換:將遙感影像輸出為常用的影像格式,如jpg和tif等格式。
2)文件格式轉(zhuǎn)換:實現(xiàn)MapGIS矢量文件與ArcInfo、AutoCAD文件之間的轉(zhuǎn)換功能,并可按照條件從Oracle數(shù)據(jù)庫中查詢出一部分數(shù)據(jù)導出到Excel、Access、文本文件中。
3)數(shù)據(jù)庫格式轉(zhuǎn)換:提供數(shù)據(jù)轉(zhuǎn)換接口和導入工具,可以導入其他數(shù)據(jù)格式(如理正、華寧、RGMapping等)的數(shù)據(jù),并將它們轉(zhuǎn)換成系統(tǒng)所用的Oracle數(shù)據(jù)格式。
2.3.4資料掃描件入庫
支持jpg、tif等多種格式的資料掃描件入庫。
用于記錄每個分類存放的庫房的位置,主要有:檔案分類、子類名稱、目錄、開始案卷、結束案卷、庫房號、排架號、庫格號等,并能夠添加、修改、刪除這些信息。
地質(zhì)檔案資料中會有許多涉密信息,本功能可以針對某些地質(zhì)檔案資料中涉密信息進行屏蔽隱藏處理。對已經(jīng)錄入的地質(zhì)檔案電子資料,可以通過檢索查詢到涉密的地質(zhì)檔案資料信息,能夠查看涉密地質(zhì)檔案資料電子檔案,并對其中涉密的某些圖文部分進行處理,例如將其刪除或者遮蓋,并對涉密檔案資料的處理進行保存。
系統(tǒng)支持自動備份和手動備份兩種方式:自動備份可以選擇備份周期和存儲路徑(含本地磁盤和遠程服務器)等;手動備份可以提供檔案數(shù)據(jù)邏輯導出功能,將檔案條目數(shù)據(jù)或者部分檔案原文數(shù)據(jù)通過系統(tǒng)提供的功能導出為Excel、Word、PDF等可供用戶閱讀的文檔。
地質(zhì)資料檢索及借閱管理系統(tǒng)以BS模式開發(fā),系統(tǒng)采用Java語言進行開發(fā),利用SpringBoot框架和MyBatis框架進行開發(fā)實現(xiàn),考慮到以后國產(chǎn)化升級的需要,后臺數(shù)據(jù)庫采用MySQL開源數(shù)據(jù)庫。整體架構采用多層扁平架構,采用微服務架構進行設計和實現(xiàn),應用系統(tǒng)只需要布署到服務器,就可以同時滿足多用戶使用,借閱系統(tǒng)提供在線地質(zhì)資料借閱和查看功能,方便用戶使用。
系統(tǒng)提供多種查詢方式,可以按關鍵字進行查詢,也支持按條件進行查詢,滿足不同的查詢需求,如圖2所示。
圖2 關鍵字查詢Fig.2 Keyword query
地質(zhì)資料管理系統(tǒng)的建設,通過對地質(zhì)資料的數(shù)字化、標準化處理,建立了地質(zhì)資料數(shù)據(jù)庫,針對地質(zhì)資料管理人員和借閱人員開發(fā)了不同的應用系統(tǒng),既能滿足對地質(zhì)資料的信息化管理又能方便地質(zhì)資料的共享。目前,業(yè)務內(nèi)網(wǎng)已經(jīng)建設完畢,保障了地質(zhì)資料數(shù)據(jù)庫和局內(nèi)部用戶的互聯(lián)互通,業(yè)務內(nèi)網(wǎng)和互聯(lián)網(wǎng)完全物理隔離,為地質(zhì)資料共享提供了強有力的安全保障。地質(zhì)資料管理系統(tǒng)必將為管理人員和專業(yè)人員提供信息化、可視化的平臺工具。
本文充分借鑒“地質(zhì)云”建設的先進經(jīng)驗,立足于解決地質(zhì)資料管理難、共享難、價值體現(xiàn)難等問題,結合山東省現(xiàn)有地質(zhì)資料積累及利用現(xiàn)狀,基于同一套數(shù)據(jù)庫,開發(fā)完成了地質(zhì)資料數(shù)據(jù)管理系統(tǒng)和地質(zhì)資料檢索及借閱管理系統(tǒng),既保障了地質(zhì)數(shù)據(jù)的存儲安全,又最大限度地實現(xiàn)了地質(zhì)資料的共享和利用。下一步,在大數(shù)據(jù)時代下,將圍繞如何實現(xiàn)從數(shù)據(jù)到信息、從信息到知識、從知識再到智慧的地質(zhì)資料大數(shù)據(jù)轉(zhuǎn)換進行深入研究。