摘 要:據(jù)全國潛力評(píng)價(jià)項(xiàng)目辦要求,為高效利用湖南省礦產(chǎn)資源潛力評(píng)價(jià)專題屬性數(shù)據(jù)庫等成果,湖南信息集成專題組開展并完成礦產(chǎn)資源潛力評(píng)價(jià)成果集成數(shù)據(jù)庫。本文通過對工作實(shí)踐回顧,摸索總結(jié)出一套以多礦種、多專業(yè)海量地學(xué)資料為基礎(chǔ)的關(guān)系型數(shù)據(jù)庫建設(shè)流程,開拓出信息技術(shù)為地質(zhì)學(xué)科服務(wù)的新途徑。
關(guān)鍵詞:潛力評(píng)價(jià);集成數(shù)據(jù)庫;建庫流程;湖南
0 前言
2013年夏,湖南省礦產(chǎn)資源潛力評(píng)價(jià)成果集成數(shù)據(jù)庫(以下簡稱“集成數(shù)據(jù)庫”)完成且驗(yàn)收通過。它是以湖南省礦產(chǎn)資源潛力評(píng)價(jià)專題屬性數(shù)據(jù)庫(以下簡稱“專題屬性數(shù)據(jù)庫”)和省級(jí)專題匯總綜合研究成果為基礎(chǔ)建立的關(guān)系型數(shù)據(jù)庫,該數(shù)據(jù)庫涵蓋湖南省22個(gè)重要礦種(煤炭、鈾、鐵、錳、鎢、錫、鉬、銅、鉛、鋅、銻、鎳、金、銀、稀土、鋰、磷、硫、螢石、重晶石、硼、鋁)在地質(zhì)背景、成礦規(guī)律、礦產(chǎn)預(yù)測、重力、磁測、化探、重砂、遙感8個(gè)地質(zhì)專業(yè)領(lǐng)域的最新研究成果。集成數(shù)據(jù)庫的建成實(shí)現(xiàn)了對已有成果的科學(xué)管理和高效利用,開辟了GIS技術(shù)服務(wù)地學(xué)領(lǐng)域的新途徑,為湖南省乃至全國的地質(zhì)工作提供了堅(jiān)實(shí)的信息支撐。
1 數(shù)據(jù)基礎(chǔ)
1.1 建庫軟件(GeoPEX)簡介
GeoPEX(省級(jí)礦產(chǎn)資源潛力評(píng)價(jià)資料性成果匯總建庫管理系統(tǒng)軟件)主要應(yīng)用于省級(jí)集成數(shù)據(jù)庫的建設(shè)。該系統(tǒng)支持基于本地、局域網(wǎng)、廣域網(wǎng)的分布式管理,提供省級(jí)潛力評(píng)價(jià)圖件、報(bào)告、編圖說明書、元數(shù)據(jù)等一體化管理功能。
主要功能包括:
(1)數(shù)據(jù)庫注冊、查詢方案配置、環(huán)境設(shè)置 ;
(2)用戶管理、權(quán)限分配;
(3)投影轉(zhuǎn)換(批量轉(zhuǎn)換等);
(4)圖件入庫;
(5)圖件、圖層、圖元及屬性瀏覽、查詢、檢索;
(6)檢索結(jié)果導(dǎo)出;
(7)數(shù)據(jù)維護(hù)(包括編圖說明書、元數(shù)據(jù)、質(zhì)量檢查文檔、柵格圖像、遙感圖像、匯報(bào)材料、表、其他等文檔);
(8)數(shù)據(jù)庫備份、數(shù)據(jù)庫恢復(fù)、數(shù)據(jù)庫遷移等。
1.2 數(shù)據(jù)整理
集成數(shù)據(jù)庫的數(shù)據(jù)整理按三部分分別實(shí)施。
1.2.1 第一類資料的整理
即屬于全國礦產(chǎn)資源潛力評(píng)價(jià)數(shù)據(jù)模型(以下簡稱數(shù)據(jù)模型)規(guī)定的成果[1](包括規(guī)定要提交的圖件及其屬性庫、遙感影像、各類輔助文檔等)。這類資料以專題屬性數(shù)據(jù)庫為主,在整理時(shí)應(yīng)嚴(yán)格依照數(shù)據(jù)模型要求,運(yùn)用GEOMAG、GEOTOK等各類GIS軟件檢查數(shù)據(jù),制定統(tǒng)一的錯(cuò)誤處理方案(見表1),確保數(shù)據(jù)質(zhì)量。
1.2.2 第二類資料整理
不屬于數(shù)據(jù)模型規(guī)定但屬于各專業(yè)需要提交的成果(包括各專業(yè)匯總組規(guī)定需要提交的資料、各種過渡性圖件、各類輔助文檔等)。這類資料的整理應(yīng)首先檢查種類是否齊全,同時(shí)還須檢查其內(nèi)容是否符合匯總工作技術(shù)規(guī)范。
1.2.3 其他資料整理
這類資料應(yīng)檢查是否符合匯總工作技術(shù)規(guī)范。對于建有數(shù)據(jù)庫的部分,還應(yīng)檢查是否符合全國礦產(chǎn)資源潛力評(píng)價(jià)項(xiàng)目辦2010年35號(hào)文規(guī)定(以下簡稱“全國項(xiàng)目辦2010年35號(hào)文”)。
2 集成數(shù)據(jù)庫組織模式
2.1 數(shù)據(jù)庫分組
根據(jù)《省級(jí)礦產(chǎn)資源潛力評(píng)價(jià)資料性成果集成建庫實(shí)施技術(shù)指南》,統(tǒng)一規(guī)范MS SQL SERVER2008軟件數(shù)據(jù)庫文件命名(見表2)。
3 集成數(shù)據(jù)庫系統(tǒng)實(shí)施方案
3.1 編訂建庫流程
依照技術(shù)規(guī)范并遵循數(shù)據(jù)庫原理[2],編訂統(tǒng)一的數(shù)據(jù)建庫流程(見圖1)。
3.2 配置查詢方案
湖南省集成數(shù)據(jù)庫還配置了五類基本查詢方案(見表4)。方案是檢索數(shù)據(jù)的空間約束條件,同時(shí),還可以作為檢索結(jié)構(gòu)信息的底圖使用。查詢方案中,圖層采用MapGIS6.7文件格式,選擇北京54地理坐標(biāo)系(單位為度),并建立有空間拓?fù)洹?/p>
3.3 數(shù)據(jù)轉(zhuǎn)換
3.3.1轉(zhuǎn)換前檢查
在導(dǎo)入數(shù)據(jù)庫之前,運(yùn)用MapGIS平臺(tái)認(rèn)真檢查圖件投影正確性、圖形參數(shù)正確性,尤其需要統(tǒng)一工程自身與各圖元文件的投影參數(shù)。
3.3.2投影轉(zhuǎn)換
根據(jù)技術(shù)規(guī)范,數(shù)據(jù)必須用GeoPEX軟件從投影平面直角坐標(biāo)轉(zhuǎn)換到地理經(jīng)緯坐標(biāo)。對于大多數(shù)按數(shù)據(jù)模型規(guī)范后的MapGIS工程,可采取GeoPEX批量導(dǎo)入方式。但對于遙感影像圖等未規(guī)范的工程,則須逐一手動(dòng)設(shè)置當(dāng)前投影參數(shù)。
3.3.3 轉(zhuǎn)換后檢查
可以通過GeoPEX軟件投影轉(zhuǎn)換模塊中“查詢投影參數(shù)”和導(dǎo)入模中“預(yù)覽選中圖件”功能檢查數(shù)據(jù)投影參數(shù)正確性。導(dǎo)致投影參數(shù)不正確原因及處理方法如下:
(1)操作失誤。沒勾選“自動(dòng)獲取當(dāng)前投影參數(shù)”或目標(biāo)投影參數(shù)錯(cuò)誤所致。
(2)工程投影參數(shù)不統(tǒng)一。這種情況導(dǎo)致預(yù)覽數(shù)據(jù)顯示不正常。導(dǎo)入前須統(tǒng)一工程投影參數(shù)。
(3)未壓縮數(shù)據(jù)存盤。這種情況能查詢到正確投影參數(shù),預(yù)覽圖件卻顯示不正常。導(dǎo)入前應(yīng)壓縮數(shù)據(jù)存盤。
(4)投影帶號(hào)錯(cuò)。這種情況能查詢到投影參數(shù),也能預(yù)覽,但數(shù)據(jù)空間位置顯示不正常。導(dǎo)入前應(yīng)修正投影帶號(hào)。
(5)TIC點(diǎn)錯(cuò)誤。這種情況和上一情況表現(xiàn)一致,但投影帶號(hào)正確。導(dǎo)入前應(yīng)修正TIC點(diǎn)。
3.4 數(shù)據(jù)導(dǎo)入
3.4.1 圖件導(dǎo)入
對已按數(shù)據(jù)模型規(guī)范的工程,在“圖件導(dǎo)入”模塊中,須手動(dòng)設(shè)置“數(shù)據(jù)庫”、“成果類型”、“礦種”、“所屬專題”、“圖件種類”,其他入庫信息可自動(dòng)獲取。核實(shí)信息后,選擇“批量檢查”、“批量導(dǎo)入”即可。對于如遙感影像圖這類未按數(shù)據(jù)模型規(guī)范的工程,所有入庫信息須人工輸入,點(diǎn)擊“導(dǎo)入當(dāng)前圖件”后入庫。
3.4.2 附件導(dǎo)入
按要求,專題屬性數(shù)據(jù)庫已做到“一圖、一庫、一說明”的數(shù)據(jù)完整性[1]。集成數(shù)據(jù)庫也應(yīng)保持?jǐn)?shù)據(jù)完整,所以每類圖件對應(yīng)的編圖說明書、元數(shù)據(jù)、質(zhì)量檢查文檔須在“附件導(dǎo)入”模塊中,批量導(dǎo)入。
3.4.3 其他文檔導(dǎo)入
在專題屬性數(shù)據(jù)庫中還存在大量報(bào)告、報(bào)表、統(tǒng)計(jì)數(shù)據(jù)、掃描件等文檔,它們不屬于附件,此類數(shù)據(jù)在“報(bào)告導(dǎo)入”模塊中實(shí)現(xiàn)入庫。
3.4.4 數(shù)據(jù)導(dǎo)入出錯(cuò)處理
(1)圖件導(dǎo)入出錯(cuò)處理:
在導(dǎo)入過程中,如果是圖元文件存在嚴(yán)重錯(cuò)誤,可能會(huì)提示出錯(cuò)而中斷入庫。須根據(jù)前敘表1修改,再通過GEOMAG、GEOTOK軟件檢查后,重新投影導(dǎo)入。如果是工程名、圖層名稱等入庫信息錯(cuò)誤,則可以在“圖件維護(hù)”模塊中快速修改。
(2)文檔導(dǎo)入出錯(cuò)處理
在導(dǎo)入文檔時(shí)報(bào)錯(cuò),則一般是文件名過長所致。改短文件名后即可順利入庫。此外,對高版本OFFICE文件,須另存為OFFICE2003及其以前的版本格式后導(dǎo)入。如果是導(dǎo)入后發(fā)現(xiàn)附件錯(cuò)誤,則可以利用GeoPEX“附件導(dǎo)入”模塊中“更新附件”功能實(shí)現(xiàn)糾錯(cuò);但對于通過“報(bào)告導(dǎo)入”模塊導(dǎo)入的數(shù)據(jù),因不提供更新功能,所以需刪除已入庫的數(shù)據(jù)后,再重新導(dǎo)入正確的文檔。
3.5 數(shù)據(jù)備份
為便于管理,建成的集成數(shù)據(jù)庫按表2分組備份數(shù)據(jù)。各工作平臺(tái)先本地完整備份,而后統(tǒng)一歸檔后再采用異地完整備份。集成數(shù)據(jù)庫備份過程分三步:首先在MS SQL SERVER2008中,將對應(yīng)數(shù)據(jù)庫脫機(jī);而后同時(shí)拷貝數(shù)據(jù)庫主文件“*.mdf”和日志文件“*.ldf”到備份文件夾下;最后回到SQL窗口,將備份的數(shù)據(jù)庫重新聯(lián)機(jī)[4]。
4 數(shù)據(jù)庫質(zhì)量檢查
依循相關(guān)數(shù)據(jù)庫驗(yàn)收規(guī)范[5],集成數(shù)據(jù)庫質(zhì)量檢查內(nèi)容分兩部分,首先是作為關(guān)系型數(shù)據(jù)庫本身所應(yīng)確保的質(zhì)量,其次是集成數(shù)據(jù)庫查詢結(jié)果的質(zhì)量。
4.1 數(shù)據(jù)庫自身質(zhì)量檢查
利用已有網(wǎng)絡(luò)資源,對集成數(shù)據(jù)庫本身做了下述檢查工作(見表5)。
4.2查詢結(jié)果質(zhì)量檢查
利用查詢方案,對集成數(shù)據(jù)庫進(jìn)行大批量的空間查詢,并通過GEOMAG、GEOTOK等軟件對查詢結(jié)果進(jìn)行質(zhì)量檢查(見表6)。
通過上述兩方面質(zhì)量檢查,集成數(shù)據(jù)庫質(zhì)量符合技術(shù)要求。雖存在不適用其他非Windows系統(tǒng)的瑕疵,但達(dá)到了既能對省級(jí)潛力評(píng)價(jià)資料性成果入庫,又能分專業(yè)、分礦種、根據(jù)空間范圍和屬性條件檢索入庫數(shù)據(jù),并輔助相關(guān)專業(yè)開展綜合編圖的建庫目標(biāo)。
5 結(jié)論
隨著近年來地質(zhì)事業(yè)發(fā)展,地學(xué)領(lǐng)域積累了相當(dāng)豐富的研究成果。如何通過信息工具實(shí)現(xiàn)對已有成果的跨專業(yè)綜合利用,是我國當(dāng)前地質(zhì)工作面臨的一個(gè)新課題。湖南省礦產(chǎn)資源潛力評(píng)價(jià)成果集成數(shù)據(jù)庫的建成——這種利用數(shù)據(jù)庫管理系統(tǒng)建庫,管理海量地學(xué)信息的方式——開拓出信息技術(shù)為地質(zhì)學(xué)科服務(wù)的新途徑。
參考文獻(xiàn):
[1]左群超,楊東來.全國礦產(chǎn)資源潛力評(píng)價(jià)技術(shù)要求礦產(chǎn)資源潛力評(píng)價(jià)數(shù)據(jù)模型叢書[M] .北京:地質(zhì)出版社,2012.
[2]雷景生等.數(shù)據(jù)庫原理及應(yīng)用[M].北京:清華大學(xué)出版社,2012.
[3]王珊.數(shù)據(jù)庫系統(tǒng)概論[M].北京:高等教育出版社,2006.
[4]劉智勇,劉徑舟等.SQL Server 2008寶典[M].北京:電子工業(yè)出版社.2011.
[5]國土資源部信息中心.國土資源數(shù)據(jù)庫數(shù)據(jù)質(zhì)量檢查驗(yàn)收規(guī)范.2009.