張 亮,周志誠,厲芳婷,趙 鵬
(1.湖北省測繪工程院,湖北 武漢 430074;2.地理國情監(jiān)測國家測繪地理信息局重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430072,3.湖北省航測遙感院,湖北 武漢 430074)
基礎(chǔ)測繪是基準(zhǔn)體系建設(shè)與維護(hù)、基礎(chǔ)航攝遙感影像獲取、基本比例尺地圖測制和更新的統(tǒng)稱,其成果對促進(jìn)各行各業(yè)高質(zhì)量發(fā)展起到了基礎(chǔ)性、保障性和先導(dǎo)性作用[1]。隨著我國經(jīng)濟(jì)的發(fā)展,現(xiàn)有基礎(chǔ)測繪成果形式固化、社會經(jīng)濟(jì)和人文信息不全、現(xiàn)勢性不足、聯(lián)動(dòng)更新困難等問題突顯[2],逐漸難以適應(yīng)當(dāng)前信息化社會和產(chǎn)業(yè)發(fā)展的需求,加上互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能等高新技術(shù)的深入應(yīng)用,促進(jìn)了測繪技術(shù)體系的升級換代,倒逼基礎(chǔ)測繪轉(zhuǎn)型升級,建立起適應(yīng)新時(shí)代要求的新型基礎(chǔ)測繪體系。
國家測繪地理信息“十三五”規(guī)劃的整體思路中強(qiáng)調(diào),應(yīng)加快推進(jìn)基礎(chǔ)地理信息數(shù)據(jù)庫建設(shè)的轉(zhuǎn)型,逐步建立基于最詳細(xì)的地理實(shí)體的成果采集和管理模式[3],因此探索按地理實(shí)體分級的非尺度基礎(chǔ)時(shí)空數(shù)據(jù)庫建設(shè)具有很強(qiáng)的現(xiàn)實(shí)意義。
建設(shè)地理實(shí)體數(shù)據(jù)庫,首先要弄清地理實(shí)體與地理要素之間的異同,地理實(shí)體是現(xiàn)實(shí)世界中具有空間位置、獨(dú)立語義屬性或功能的自然或人工地物[4],其與傳統(tǒng)4D 產(chǎn)品中的地理要素既有聯(lián)系,又有區(qū)別。從本質(zhì)上說,它們都是對現(xiàn)實(shí)世界一種現(xiàn)象的抽象,但在數(shù)據(jù)組織形式和表達(dá)上又有差別。
傳統(tǒng)4D 產(chǎn)品中的地理要素,將現(xiàn)實(shí)世界抽象成點(diǎn)、線、面要素構(gòu)成的圖層,能很好地展示各要素之間的空間關(guān)系,但卻將一個(gè)完整的地理實(shí)體切割為多個(gè)空間目標(biāo)。由于未建立相互之間的唯一性標(biāo)識關(guān)聯(lián),使得表達(dá)同一實(shí)體的空間目標(biāo)碎片化,難以按照實(shí)體提取相關(guān)空間目標(biāo),并維護(hù)其與相關(guān)專題信息的掛接關(guān)系[5]。另外,以往采集的要素屬性未加入時(shí)間戳,因此無法完整描述地理實(shí)體在時(shí)間和空間上的語義關(guān)系。因此,按要素采集建庫的方式已難以滿足當(dāng)前地理信息應(yīng)用的需求,如一條道路,以傳統(tǒng)的幾何要素表達(dá),其只能包含道路中心線或道路邊線或道路面,它們之間并無關(guān)聯(lián);而以地理實(shí)體來表達(dá),則可同時(shí)包含道路中心線、道路邊線和道路面等多個(gè)圖元,且有唯一的地理實(shí)體編碼作為標(biāo)識,對其賦予產(chǎn)生和消亡時(shí)間屬性,能完整描述地理實(shí)體的時(shí)空關(guān)系語義。這種按實(shí)體對象建庫的表達(dá)無疑更符合人們認(rèn)識現(xiàn)實(shí)世界的模式,在應(yīng)用上也更加靈活便捷。
在地理實(shí)體建庫過程中,地理實(shí)體編碼和通用屬性設(shè)計(jì)是關(guān)鍵環(huán)節(jié),直接決定了庫體的組織結(jié)構(gòu)。
地理實(shí)體編碼是為每個(gè)地理實(shí)體賦予唯一的身份標(biāo)識,目前的基礎(chǔ)地理數(shù)據(jù)分類代碼尚不支持新的時(shí)空模型,不能標(biāo)識地理實(shí)體的位置[6],因此不能滿足地理信息時(shí)空大數(shù)據(jù)的應(yīng)用需求。針對該問題,本文設(shè)計(jì)了分類碼+位置碼+時(shí)間碼+順序碼的地理實(shí)體編碼方式。
2.1.1 地理實(shí)體產(chǎn)品分類碼
哪些地理要素需作為實(shí)體進(jìn)行采集是地理實(shí)體生產(chǎn)首先需要解決的問題。目前,對于地理實(shí)體產(chǎn)品的采集和分類,尚未形成統(tǒng)一的規(guī)范規(guī)定,本文結(jié)合基礎(chǔ)地理信息數(shù)據(jù)、自然資源和其他行業(yè)部門的應(yīng)用需求來確定分類。在兼容傳統(tǒng)地理要素分類標(biāo)準(zhǔn)的基礎(chǔ)上,本文對地理實(shí)體的覆蓋范圍進(jìn)行了拓展,主要涵蓋基礎(chǔ)實(shí)體、專業(yè)實(shí)體和綜合實(shí)體3 個(gè)方面的內(nèi)容,劃分定位基礎(chǔ)、水系、居民地與設(shè)施、交通、植被與土質(zhì)、管線與設(shè)施、境界與區(qū)域、地貌等8 個(gè)門類,并在各門類的基礎(chǔ)上進(jìn)一步劃分出48 個(gè)大類,對應(yīng)創(chuàng)建107 個(gè)圖層。
分類碼采用10 位十進(jìn)制數(shù)字碼,實(shí)體要素的分類代碼結(jié)構(gòu)是在國標(biāo)代碼(門類、大類、中類和小類)后加圖形碼和細(xì)分碼。具體代碼結(jié)構(gòu)如圖 1 所示。
圖1 要素分類代碼結(jié)構(gòu)
1)第一、二位為門類碼,根據(jù)地理實(shí)體的門類劃分,編碼為“01”~“08”。
2)第三、四位為大類碼,是在門類的基礎(chǔ)上細(xì)分形成的實(shí)體類,是已有各分類編碼體系的一級類編碼。
3)第五、六位為中類碼,是在大類的基礎(chǔ)上細(xì)分形成的實(shí)體類,是已有各分類編碼體系的二級類編碼,無此級別的,則中類碼補(bǔ)“0”。
4)第七、八位為小類碼,是在中類的基礎(chǔ)上細(xì)分形成的實(shí)體類,是已有各分類編碼體系的三級類編碼;如有四級類編碼的情況,則將其并入三級類編碼中;無此級別的,則小類碼補(bǔ)“0”。
5)圖形碼采用1 位數(shù)字碼,0 為注記、1 為點(diǎn)、2 為線/中心線、3 為面、4 為邊線。
6)細(xì)分碼是對國標(biāo)代碼中子類碼的進(jìn)一步劃分,按 1~9 順序添加,如沒有細(xì)分類,則為0。
2.1.2 位置碼
位置碼采用GeoSOT 剖分網(wǎng)格[7]的一位四進(jìn)制變長編碼,不同層級對應(yīng)不同的格網(wǎng)大小劃分,反映地理實(shí)體幾何中心點(diǎn)大地坐標(biāo)所在的地理網(wǎng)格編碼。編碼包含網(wǎng)格的定位信息和級信息,編碼長度等于該網(wǎng)格的級數(shù)。編碼以G 開頭,最長編碼為32 級,由32 位四進(jìn)制數(shù)字組成,分為9 位度級編碼、6 位分級編碼、6 位秒級編碼和11 位秒以下編碼4 段,具體形式為“Gddddddddd-mmmmmm-ssssss.uuuuuuuuuuu”,其中,d、m、s、u 取值均為0、1、2、3。
2.1.3 時(shí)間碼
時(shí)間碼采用8 位數(shù)字定長編碼,以地理實(shí)體首次采集、調(diào)查或建庫等的公元紀(jì)年時(shí)間為內(nèi)容,如2020 年7 月27 日,則時(shí)間碼為20200727。
2.1.4 順序碼
順序碼采用7 位定長數(shù)字,從1 開始,根據(jù)地理實(shí)體分類碼、位置碼和時(shí)間碼相同的地理實(shí)體產(chǎn)生的先后順序依次編碼,不得重復(fù)使用,順序碼不足7 位的,則補(bǔ)“0”。
地理實(shí)體的通用屬性項(xiàng)是指所有地理實(shí)體都具備的屬性項(xiàng),應(yīng)體現(xiàn)地理實(shí)體的時(shí)空性,能滿足聯(lián)動(dòng)更新的需求。本文對地理實(shí)體數(shù)據(jù)通用屬性項(xiàng)的規(guī)定如表1 所示。
表1 地理實(shí)體數(shù)據(jù)通用屬性項(xiàng)
地理實(shí)體數(shù)據(jù)建庫主要是在基礎(chǔ)測繪成果數(shù)據(jù)的基礎(chǔ)上進(jìn)行整合加工,首先對已有基礎(chǔ)測繪成果進(jìn)行轉(zhuǎn)換,然后按地理實(shí)體的方式進(jìn)行全新采集和更新。其過程主要包括預(yù)處理、實(shí)體化、屬性賦值、質(zhì)量檢查、數(shù)據(jù)入庫等。
1)預(yù)處理工作負(fù)責(zé)統(tǒng)一數(shù)據(jù)格式、數(shù)據(jù)基準(zhǔn),按本文描述的數(shù)據(jù)分類和分層規(guī)則對原基礎(chǔ)測繪成果進(jìn)行對照,建立映射關(guān)聯(lián);對原有要素屬性進(jìn)行擴(kuò)充,實(shí)現(xiàn)實(shí)體分類碼的編碼轉(zhuǎn)換和錄入;對于新增和更新的實(shí)體,按照分類和分層的規(guī)則進(jìn)行要素的分類采集。
2)實(shí)體化工作即為判斷哪些圖元為同一實(shí)體的過程[8],建立圖元與實(shí)體的對應(yīng)關(guān)系,用以實(shí)現(xiàn)地理對象在時(shí)空維度的唯一性。將具有相同名稱、空間連通的圖元構(gòu)成一個(gè)實(shí)體,而沒有名稱的圖元為一個(gè)單獨(dú)的實(shí)體。當(dāng)圖元屬于多個(gè)實(shí)體時(shí),則對其進(jìn)行地理實(shí)體編碼的擴(kuò)充。
3)屬性賦值。按照地理實(shí)體通用屬性項(xiàng)的要求進(jìn)行屬性的采集與完善,通過軟件工具生成地理實(shí)體編碼,以保證其唯一性。
4)質(zhì)量檢查。對圖元的拓?fù)潢P(guān)系、實(shí)體編碼的唯一性、實(shí)體邏輯的一致性、屬性結(jié)構(gòu)的完整性和正確性等進(jìn)行檢查,檢查合格方可入庫。
5)數(shù)據(jù)入庫。開發(fā)和利用相應(yīng)的入庫軟件工具將空間數(shù)據(jù)存儲于關(guān)系數(shù)據(jù)庫中。
地理實(shí)體數(shù)據(jù)庫具有對象化的數(shù)據(jù)組織、自由的專題屬性掛接、靈活的按需組裝、高效的空間分析、便捷的聯(lián)動(dòng)更新等優(yōu)勢,相較于傳統(tǒng)的按要素分類組織的數(shù)據(jù)庫,其有著更加廣闊的應(yīng)用前景。地理實(shí)體數(shù)據(jù)庫建設(shè)的關(guān)鍵問題是地理實(shí)體編碼的設(shè)計(jì)和ETL技術(shù)(數(shù)據(jù)的抽取、轉(zhuǎn)換和加載)的應(yīng)用。地理實(shí)體數(shù)據(jù)庫建設(shè)是新型基礎(chǔ)測繪體系建設(shè)的重要一環(huán),如何從各類基礎(chǔ)數(shù)據(jù)、專題數(shù)據(jù)中按地理實(shí)體的分類融合圖形和屬性,實(shí)現(xiàn)自動(dòng)化實(shí)體構(gòu)建是今后繼續(xù)研究的方向。