張明霞
安徽省地質(zhì)資料館,安徽 合肥 230000
地質(zhì)資料是地質(zhì)工作價(jià)值的集中體現(xiàn),其所承載的信息資源可以長期反復(fù)地開發(fā)利用[1-2]。隨著互聯(lián)網(wǎng)+地質(zhì)大數(shù)據(jù)時(shí)代的到來,推進(jìn)地質(zhì)資料信息化建設(shè),迅速、有效地為社會(huì)提供地質(zhì)資料信息,充分發(fā)揮地質(zhì)資料在礦產(chǎn)資源保障和地質(zhì)技術(shù)服務(wù)中的作用[2-3],是地質(zhì)資料館藏機(jī)構(gòu)和地勘單位刻不容緩的重要任務(wù),而建立信息全面的地質(zhì)資料目錄檢索數(shù)據(jù)庫正是快捷提供查詢服務(wù)、全面實(shí)現(xiàn)信息共享的前提與基礎(chǔ)。
2019年初,自然資源部印發(fā)了“關(guān)于進(jìn)一步加強(qiáng)地質(zhì)資料社會(huì)化服務(wù)的指導(dǎo)意見”[4],文件在深入推進(jìn)地質(zhì)資料信息開放共享方面要求全面公開地質(zhì)資料目錄。隨后,自然資源部辦公廳下發(fā)了任務(wù)分工表[5],進(jìn)一步細(xì)化了全面公開地質(zhì)資料目錄的工作任務(wù)與完成時(shí)間,按照要求,全面公開資料目錄包括成果、原始、實(shí)物三大類地質(zhì)資料的案卷級目錄與文件級目錄。由于原始、實(shí)物地質(zhì)資料是近幾年才開始館藏,數(shù)量還很少,公開資料目錄的工作主要集中在館藏成果地質(zhì)資料[6](以下論述均指成果地質(zhì)資料)。案卷級目錄可在原有目錄數(shù)據(jù)庫基礎(chǔ)上進(jìn)行補(bǔ)充完善,文件級目錄為新建的目錄數(shù)據(jù),包括正文、審批、附表、附圖、附件、數(shù)據(jù)庫、軟件、多媒體等其他九大類[7](2017年以前上述文件歸為八大類[6],其中數(shù)據(jù)庫、軟件合為一類)的目錄。
為確保目錄完善工作按時(shí)完成,必須充分利用現(xiàn)有各類管理系統(tǒng)中的數(shù)據(jù)庫,主要包括目錄數(shù)據(jù)庫與涉密數(shù)據(jù)庫。
該數(shù)據(jù)庫是全國各省級館藏機(jī)構(gòu)案卷級目錄管理的基礎(chǔ)數(shù)據(jù)庫,由全國地質(zhì)資料館在本世紀(jì)初統(tǒng)一部署建設(shè),該數(shù)據(jù)庫數(shù)據(jù)項(xiàng)側(cè)重于地質(zhì)資料案卷本身屬性,主要數(shù)據(jù)項(xiàng)[8]16 個(gè)(表1)。
表1 目錄數(shù)據(jù)庫數(shù)據(jù)項(xiàng)列表Table 1 List of data items in the directory database
此次案卷級目錄完善要求增加兩個(gè)方面信息,一是地質(zhì)工作項(xiàng)目(或礦業(yè)權(quán))屬性,二是資料匯交管理屬性,共新增26 個(gè)數(shù)據(jù)項(xiàng),具體增加詳見表2。
表2 案卷級目錄中新增數(shù)據(jù)項(xiàng)列表Table 2 List of new data items in the volume directory
該數(shù)據(jù)庫是由涉密清理工作形成[9]。2006年國土資源部與國家保密局下發(fā)“關(guān)于開展涉密地質(zhì)資料清理工作的通知”[10],在全國各省級地質(zhì)資料館藏機(jī)構(gòu)、地勘單位開展地質(zhì)資料的涉密清理工作,利用清理登記軟件建立地質(zhì)資料涉密數(shù)據(jù)庫,按件登記。該數(shù)據(jù)庫在案卷級管理基礎(chǔ)上擴(kuò)展到了文件級管理,案卷級包括了目錄數(shù)據(jù)庫信息,文件級按照成果地質(zhì)資料的八大類[6](正文、審批、附表、附圖、附件、數(shù)據(jù)庫、多媒體、其他)進(jìn)行建庫。2010年前后各省級館藏機(jī)構(gòu)均完成了本省行政區(qū)劃范圍內(nèi)的館藏成果地質(zhì)資料的涉密清理工作,建立了涉密數(shù)據(jù)庫。該數(shù)據(jù)庫側(cè)重對各類文件涉密屬性的標(biāo)記[11](表3)。
表3 涉密數(shù)據(jù)庫文件級數(shù)據(jù)項(xiàng)列表Table 3 List of file-level data items in confidential database
此次完善文件級目錄,是在上述基礎(chǔ)上,再增加對文件形成屬性的描述,包括形成單位、形成人等數(shù)據(jù)項(xiàng)(表4)。
表4 文件級目錄中新增數(shù)據(jù)項(xiàng)列表Table 4 List of new data items in the file-level directory
需要說明的是,涉密清理工作結(jié)束后,一直未開展各省級館之間清理成果的交換工作,所以很多省級館對外省行政區(qū)劃范圍的地質(zhì)資料沒有清理成果,涉密數(shù)據(jù)庫里也沒有這部分信息。
館藏機(jī)構(gòu)現(xiàn)用的目錄數(shù)據(jù)庫僅包括部分案卷級信息,由于軟件開發(fā)時(shí)代較早,后期也未進(jìn)行升級改造,只能利用其另存功能,將目錄數(shù)據(jù)庫保存為DBF 文件,再利用數(shù)據(jù)庫管理軟件(如Visual FoxPro)將該文件轉(zhuǎn)換成EXCEL 表格,然后直接在該電子表格中補(bǔ)充缺少的案卷級數(shù)據(jù)項(xiàng)。
3.2.1 利用涉密數(shù)據(jù)庫初步形成文件級目錄
涉密數(shù)據(jù)庫的八大類表在結(jié)構(gòu)上基本相同,以正文的表結(jié)構(gòu)為例,主要數(shù)據(jù)項(xiàng)參見表5,另外涉密數(shù)據(jù)庫還有一個(gè)案卷級與文件級關(guān)聯(lián)的主表,主要數(shù)據(jù)項(xiàng)參見表6[11]。
表5中數(shù)據(jù)項(xiàng)3~8可直接作為正文類文件級目錄的數(shù)據(jù)項(xiàng),數(shù)據(jù)項(xiàng)[YDMJ]是涉密清理工作需要設(shè)置的,此次建立文件級目錄不再保留。
表6中數(shù)據(jù)項(xiàng)[ZLBH]是地質(zhì)資料案卷檢索的關(guān)鍵字,通過表5 中[ZBID]與表6 中[ID]的關(guān)聯(lián),即可把導(dǎo)出的文件級目錄數(shù)據(jù)與地質(zhì)資料案卷對應(yīng)起來。數(shù)據(jù)項(xiàng)3~7 是涉密清理工作需要設(shè)置的,此次不再保留。
表5 涉密數(shù)據(jù)庫中正文表的數(shù)據(jù)項(xiàng)列表Table 5 List of data items in the text table in the confidential database
表6 涉密數(shù)據(jù)庫中主表的數(shù)據(jù)項(xiàng)列表Table 6 List of data items in the main table in the confidential database
涉密數(shù)據(jù)庫的管理平臺(tái)是SQL Server,因此可以利用SQL Server 2000 的“查詢分析器”(SQL Server 2005 以上版本的可用SQL Server Management Studio),通過SQL 查詢語句查出各表數(shù)據(jù),將查詢結(jié)果另存成EXCEL 表,形成文件級目錄的基礎(chǔ)數(shù)據(jù)表。
下面以在SQL Server 2000平臺(tái)上導(dǎo)出正文表的數(shù)據(jù)為例,操作步驟如下:
(1)啟動(dòng)SQL Server→運(yùn)行[查詢分析器]→登錄服務(wù)器(本機(jī)直接用Windows 身份驗(yàn)證);
(2)在[查詢分析器]的[對象瀏覽器]中選擇涉密數(shù)據(jù)庫(數(shù)據(jù)庫名:HGICC,圖1 中紅色(1)所示)→選擇[用戶表](圖1 中紅色(2)所示)→選擇要導(dǎo)出的正文表(正文表名:dbo.ZLQLDJ_ZW)(圖1 中紅色(3)所示);
(3)在選中的正文表上點(diǎn)右鍵,彈出菜單后選擇[在新窗口中編寫對象腳本](圖1 中紅色(4)所示)→選擇[選擇](圖1 中紅色(5)所示)→出現(xiàn)查詢窗口及SQL 語句;
圖1 SQL 查詢分析器中對象瀏覽器窗口的操作圖示Fig 1 Operation show of object browser window in SQL query analyzer
(4)在查詢窗口的SQL 語句中選出要導(dǎo)出的數(shù)據(jù)項(xiàng)(包括ID、ZBID、XH、ZW_MC、ZW_SMZL、ZW_SMSX、SMYM、ZW_XDMJ,數(shù)據(jù)項(xiàng)含義見表5 說明,參見圖2)→執(zhí)行SQL查詢→彈出查詢結(jié)果窗;
圖2 查詢窗口的操作圖示Fig 2 Operation show in the query window
(5)在查詢結(jié)果窗的左上角點(diǎn)右鍵(圖2中紅色鍵頭所示位置)→彈出菜單后選擇[另存為…]→將結(jié)果另存出來,形成EXCEL 表。
用同樣方法依次導(dǎo)出審批等其它七類表及主表中的數(shù)據(jù),各自形成EXCEL 表。之后,可借助ACCESS 數(shù)據(jù)庫軟件的查詢功能,建立各類表[ZBID]與主表[ID]的關(guān)聯(lián)查詢,形成帶[ZLBH](資料編號)的EXCEL 表,初步建立起成果地質(zhì)資料的文件級目錄(數(shù)據(jù)表)。
在導(dǎo)出各表保存時(shí)要注意低版本的EXCEL總行數(shù)是65536 行,高版本的(如office2007、2010、2013,、2016)總行數(shù)都達(dá)到了1048576 行。由于附圖文件數(shù)量巨大,可能超過EXCEL 的總行數(shù),這時(shí)候可以根據(jù)[ID]分成幾個(gè)區(qū)間查詢,形成幾個(gè)電子表格,避免數(shù)據(jù)丟失。在實(shí)際工作中建議即使附圖文件數(shù)未超過總行數(shù),也應(yīng)將附圖拆分成幾個(gè)電子表格,因?yàn)榭傂袛?shù)太大的電子表格存貯起來非常慢,直接影響工作效率。一般建議每個(gè)表的總行數(shù)控制在5~6 萬以下,以安徽館為例,附圖文件數(shù)量達(dá)21.8 萬條記錄,所以可均分成4 個(gè)電子表格。
3.2.2 利用案卷級目錄數(shù)據(jù)補(bǔ)充文件級目錄數(shù)據(jù)
從涉密數(shù)據(jù)庫導(dǎo)出的文件級目錄數(shù)據(jù)有些是簡稱,如正文表中的正文名稱、附圖表中的附圖名稱等[12],這種不完整的信息不利于按文件級公開的地質(zhì)資料服務(wù),需要將信息補(bǔ)全;另外導(dǎo)出的文件級數(shù)據(jù)與要求的目錄數(shù)據(jù)還是有一定差距,數(shù)據(jù)項(xiàng)空值較多,也需要補(bǔ)充。
由于已有的案卷級目錄數(shù)據(jù)項(xiàng)如正題名(也就是正文的名稱)、編著者、形成單位、形成時(shí)間、審批單位、審批時(shí)間均采自該檔資料的正文、審批,因此可以利用[資料編號]作為關(guān)鍵字,建立起案卷級目錄數(shù)據(jù)表與文件級正文表、審批表的關(guān)聯(lián)查詢,將案卷級目錄數(shù)據(jù)表中的正題名、編著者、形成單位、形成時(shí)間關(guān)聯(lián)到正文表里,替換正文表中的正文簡名、補(bǔ)充正文表中缺少的編著者(即形成人)、形成單位、形成時(shí)間;將案卷級目錄數(shù)據(jù)表中的審批單位(即審批文件的形成單位)、審批時(shí)間(即審批文件的形成時(shí)間)關(guān)聯(lián)到審批表里,補(bǔ)充審批表中缺少的形成單位、形成時(shí)間。
3.2.3 其它數(shù)據(jù)的采集
除以上可以利用的數(shù)據(jù)外,其它文件級目錄數(shù)據(jù)均需從地質(zhì)資料中手工采集。對于已開展圖文數(shù)字化[13]工作的地質(zhì)資料,可從附圖文件目錄(.ml)中采集完整圖名、比例尺;對于電子匯交的地質(zhì)資料,可從早期的電子文件登記表[14]或現(xiàn)在的匯交匯總表[15]中采集完整圖名、比例尺、附圖規(guī)格等相關(guān)信息,進(jìn)一步補(bǔ)充、完善文件級目錄數(shù)據(jù)。
通過利用已有的目錄數(shù)據(jù)庫與涉密數(shù)據(jù)庫建立起按規(guī)定要求公開的案卷級目錄與文件級目錄數(shù)據(jù)框架,再根據(jù)實(shí)際情況進(jìn)行個(gè)別補(bǔ)充的工作方法,一是可以最大限度利用已有目錄數(shù)據(jù),避免一切從頭開始,有效節(jié)省寶貴時(shí)間;二是轉(zhuǎn)換成EXCEL 表格形式便于錄入,只要會(huì)簡單電腦操作的人員即可參與,解決專業(yè)人手不夠難題;三是此方法形成的成果可以直接提供信息交換與共享;四是地勘單位均開展了涉密清理工作,從涉密數(shù)據(jù)庫中提取文件級目錄數(shù)據(jù)的方法同樣適用于地勘單位。