楊夢(mèng)梅,黃 波,謝三五,曹利俠,朱仁義
(1.自然資源部第一地理信息制圖院,陜西 西安 710054)
元數(shù)據(jù)是指關(guān)于數(shù)據(jù)的數(shù)據(jù),用以描述數(shù)據(jù)的內(nèi)容、特征、制作過(guò)程等多樣信息[1]?,F(xiàn)代測(cè)繪生產(chǎn)的產(chǎn)品均有對(duì)應(yīng)的元數(shù)據(jù)附件。在測(cè)繪軟硬件技術(shù)飛速發(fā)展的新形勢(shì)下,重大測(cè)繪項(xiàng)目眾多,各類(lèi)成果數(shù)據(jù)的數(shù)據(jù)體量也呈幾何級(jí)增長(zhǎng),以往邊作業(yè)邊記錄元數(shù)據(jù)相關(guān)信息的方式已無(wú)法滿足需要,且該方式難免由于人為因素產(chǎn)生一些質(zhì)量缺陷。針對(duì)這些問(wèn)題,目前已有一些學(xué)者進(jìn)行了元數(shù)據(jù)計(jì)算機(jī)輔助制作的研究[2],解決了大部分耗費(fèi)人力的工作,但大多只實(shí)現(xiàn)了數(shù)據(jù)范圍、數(shù)據(jù)屬性信息的自動(dòng)記錄,未實(shí)現(xiàn)元數(shù)據(jù)記錄項(xiàng)的全覆蓋。本文從信息覆蓋度和功能適應(yīng)性出發(fā),制定解決方案,進(jìn)行技術(shù)研發(fā)并制作元數(shù)據(jù)系統(tǒng),開(kāi)展生產(chǎn)試驗(yàn)驗(yàn)證,并分析成果質(zhì)量和制作效率。
元數(shù)據(jù)記錄的信息一般分為固定內(nèi)容(如制作單位等)、數(shù)據(jù)信息(如坐標(biāo)范圍等)、生產(chǎn)信息(如檢查者等)3類(lèi)。元數(shù)據(jù)制作可通過(guò)設(shè)置模板、采集成果數(shù)據(jù)基本信息[3]、收集生產(chǎn)過(guò)程信息、自動(dòng)匹配填寫(xiě)等步驟實(shí)現(xiàn)。具體技術(shù)方案如圖1所示。
圖1 總體技術(shù)路線
元數(shù)據(jù)的內(nèi)容涉及成果數(shù)據(jù)坐標(biāo)等空間信息和分辨率等屬性信息。要實(shí)現(xiàn)元數(shù)據(jù)內(nèi)容的完全填寫(xiě),需對(duì)這些信息進(jìn)行最大程度地全面提取。具體實(shí)踐時(shí),利用ArcObject組件庫(kù)的眾多接口來(lái)實(shí)現(xiàn)計(jì)算機(jī)程序的自動(dòng)提取,如在提取標(biāo)準(zhǔn)分幅產(chǎn)品的角點(diǎn)坐標(biāo)記錄時(shí),首先根據(jù)數(shù)據(jù)的標(biāo)準(zhǔn)圖號(hào)計(jì)算一套理論角點(diǎn)坐標(biāo)值,然后讀取成果數(shù)據(jù),獲取其數(shù)據(jù)有效范圍,作為真實(shí)角點(diǎn)坐標(biāo)值。通過(guò)兩套坐標(biāo)值來(lái)滿足不同項(xiàng)目對(duì)于坐標(biāo)記錄方式的要求。
項(xiàng)目的多樣性導(dǎo)致元數(shù)據(jù)的內(nèi)容要求不盡相同。因此,在實(shí)際開(kāi)發(fā)中,需要設(shè)計(jì)一套可配置體系,使用戶可自定義進(jìn)行信息的對(duì)應(yīng)填入,方便用戶操作,提高了軟件的可擴(kuò)展性和靈活性。在程序設(shè)計(jì)時(shí),將提取的信息項(xiàng)名稱(chēng)和元數(shù)據(jù)的內(nèi)容名稱(chēng)進(jìn)行列表可視化,使用自定義對(duì)照的形式,完成名稱(chēng)匹配,并對(duì)匹配方案實(shí)現(xiàn)本地存儲(chǔ),隨時(shí)調(diào)用。
本文根據(jù)總體技術(shù)路線,開(kāi)發(fā)對(duì)應(yīng)軟件系統(tǒng)來(lái)實(shí)現(xiàn)元數(shù)據(jù)的自動(dòng)制作。軟件開(kāi)發(fā)采用ArcEngine嵌入式組件庫(kù)[4]和Office二次開(kāi)發(fā)組件,ArcEngine主要提供空間數(shù)據(jù)的讀取接口,Office二次開(kāi)發(fā)組件則提供對(duì)于Word、Excel等格式文檔的讀寫(xiě)接口。軟件為獨(dú)立應(yīng)用程序形式,設(shè)計(jì)為交互式操作模式。根據(jù)元數(shù)據(jù)的制作業(yè)務(wù)流程和需求,軟件分為模板管理、信息準(zhǔn)備、元數(shù)據(jù)制作、圖歷簿制作、信息提取5個(gè)模塊,實(shí)現(xiàn)完整的元數(shù)據(jù)/圖歷簿的自動(dòng)制作。軟件總體功能框架如圖2所示。
圖2 總體功能框架設(shè)計(jì)
由于具體生產(chǎn)項(xiàng)目的不同,元數(shù)據(jù)的內(nèi)容差異較大。軟件以模板為單元進(jìn)行區(qū)分管理,設(shè)計(jì)了新建模板、修改模板、管理模板等功能,在元數(shù)據(jù)批量制作前,先行完成模板制作。
1)從數(shù)據(jù)獲取信息。測(cè)繪成果數(shù)據(jù)包含了豐富的空間和屬性信息,很多信息均能與元數(shù)據(jù)的內(nèi)容對(duì)應(yīng)。該功能可獲取的信息項(xiàng)如表1所示。
表1 從數(shù)據(jù)獲取的信息項(xiàng)
2)其他信息內(nèi)容。根據(jù)圖號(hào)獲取標(biāo)準(zhǔn)坐標(biāo),根據(jù)空間格式的接合表獲取數(shù)據(jù)接邊情況等,用于補(bǔ)充元數(shù)據(jù)所需的一些信息。
元數(shù)據(jù)一般分為常規(guī)文本格式(xls、Access等)和ArcGIS MDB數(shù)據(jù)庫(kù)格式。對(duì)元數(shù)據(jù)進(jìn)行信息寫(xiě)入時(shí)的工作流程是一致的,即首先批量生成空元數(shù)據(jù),再根據(jù)前期準(zhǔn)備好的信息表進(jìn)行匹配填入,最后填入一些統(tǒng)一的內(nèi)容。
1)按圖號(hào)生成初始元數(shù)據(jù)。根據(jù)文本或shape格式的接合表,讀取圖號(hào)字段,再依據(jù)指定的模板批量按圖幅生成初始元數(shù)據(jù)。
2)信息填入。該元數(shù)據(jù)軟件在前期已得到一些所需信息的列表,現(xiàn)將信息通過(guò)字段對(duì)應(yīng)的方式填入元數(shù)據(jù)中。該功能可列出信息列表和元數(shù)據(jù)的所有字段,用戶自行選擇對(duì)應(yīng)的匹配方式,軟件將根據(jù)圖號(hào)填入內(nèi)容。該功能的實(shí)現(xiàn)界面如圖3所示。
圖3 信息填入界面
圖歷簿一般為Office Word格式,制作工作流程與元數(shù)據(jù)基本一致。其區(qū)別在于,圖歷簿的信息填入是用戶指定對(duì)應(yīng)的單元格;圖歷簿需要填寫(xiě)一個(gè)封面信息。該模塊設(shè)計(jì)了相應(yīng)功能來(lái)完成填寫(xiě)。
該模塊包括批量提取元數(shù)據(jù)、圖歷簿的指定內(nèi)容和提取元數(shù)據(jù)的模板結(jié)構(gòu)兩個(gè)部分。信息提取可用于附件成果的質(zhì)量檢查。
本文利用研發(fā)的軟件,結(jié)合陜西省1∶1萬(wàn)基礎(chǔ)地理信息更新工程、地理國(guó)情監(jiān)測(cè)正射影像生產(chǎn)兩個(gè)典型案例進(jìn)行實(shí)驗(yàn)和效率分析。本文利用該軟件參與了完整的產(chǎn)品生產(chǎn),并對(duì)各工序進(jìn)行了時(shí)間效率統(tǒng)計(jì),具體如表2所示,可以看出,傳統(tǒng)按圖幅進(jìn)行人工生產(chǎn)的方式,需逐內(nèi)容逐一獲取、效率低下;而軟件通過(guò)信息整合和批量化匹配填寫(xiě)的方式極大地提高了效率。
表2 元數(shù)據(jù)填寫(xiě)效率對(duì)比/h
本文通過(guò)分析元數(shù)據(jù)內(nèi)容的特征,提出了自動(dòng)制作的技術(shù)路線;并通過(guò)多個(gè)測(cè)繪應(yīng)用項(xiàng)目實(shí)踐進(jìn)行了驗(yàn)證。該軟件能很好地提高生產(chǎn)成果附件的生產(chǎn)效率,降低人工參與生產(chǎn)的出錯(cuò)率,保障成果質(zhì)量,節(jié)省生產(chǎn)成本。軟件功能具有較靈活的通用性,適用于常見(jiàn)格式的元數(shù)據(jù)和圖歷簿制作,能很好地服務(wù)于各生產(chǎn)項(xiàng)目。