吳芳華,曹亞妮,吉國(guó)杰,3
1.西安測(cè)繪研究所,陜西 西安,710054;2.地理信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西 西安,710054;3.信息工程大學(xué)地理空間信息學(xué)院,河南 鄭州,450052
?
地圖數(shù)據(jù)缺陷識(shí)別規(guī)則表達(dá)模型
吳芳華1,2,曹亞妮2,3,吉國(guó)杰1,2,3
1.西安測(cè)繪研究所,陜西 西安,710054;2.地理信息工程國(guó)家重點(diǎn)實(shí)驗(yàn)室,陜西 西安,710054;3.信息工程大學(xué)地理空間信息學(xué)院,河南 鄭州,450052
地圖數(shù)據(jù)缺陷識(shí)別規(guī)則是缺陷自動(dòng)識(shí)別的基礎(chǔ),影響著缺陷自動(dòng)識(shí)別的查全率和查準(zhǔn)率。本文對(duì)地圖數(shù)據(jù)缺陷自動(dòng)識(shí)別規(guī)則進(jìn)行了系統(tǒng)的研究,論述了地圖數(shù)據(jù)缺陷識(shí)別規(guī)則建立的依據(jù);以空間關(guān)系沖突檢測(cè)規(guī)則為例,分析了現(xiàn)有缺陷自動(dòng)識(shí)別規(guī)則研究中存在的不足;研究了地圖數(shù)據(jù)缺陷識(shí)別規(guī)則的表達(dá)形式和測(cè)試條件,提出了地圖數(shù)據(jù)缺陷自動(dòng)識(shí)別規(guī)則表達(dá)的五元組模型,并論述了該模型的特點(diǎn);基于五元組模型建立了水系與等高線要素的空間關(guān)系缺陷識(shí)別規(guī)則。
矢量地圖數(shù)據(jù);缺陷自動(dòng)識(shí)別;識(shí)別規(guī)則;五元組模型
信息科學(xué)技術(shù)的飛速發(fā)展與廣泛應(yīng)用帶動(dòng)了全社會(huì)對(duì)地理信息的需求,地理信息成為國(guó)家或全球信息流中的重要組成部分,并逐漸發(fā)展成為當(dāng)今社會(huì)最基本的信息服務(wù)之一。地圖數(shù)據(jù)是地理信息系統(tǒng)的血液,是地理信息系統(tǒng)運(yùn)行和應(yīng)用的基礎(chǔ)。地圖數(shù)據(jù)的規(guī)范性、完整性和精確性決定了地理信息應(yīng)用的廣度和深度。地圖數(shù)據(jù)的質(zhì)量問(wèn)題是一個(gè)關(guān)系到數(shù)據(jù)庫(kù)可靠性和地理信息服務(wù)可信性的重要問(wèn)題[1],與規(guī)劃決策任務(wù)的成敗密切相關(guān)。在地圖數(shù)據(jù)采集、空間數(shù)據(jù)更新的過(guò)程中,由于種種原因,會(huì)造成數(shù)據(jù)中空間目標(biāo)的幾何結(jié)構(gòu)破壞、屬性項(xiàng)和屬性值缺失或錯(cuò)誤、要素關(guān)系發(fā)生改變、數(shù)據(jù)形式不正確等,從而破壞了空間數(shù)據(jù)的完整性或違反了生產(chǎn)作業(yè)規(guī)范的約束,導(dǎo)致地圖數(shù)據(jù)對(duì)現(xiàn)實(shí)世界空間實(shí)體及其間關(guān)系的表達(dá)錯(cuò)誤,產(chǎn)生了數(shù)據(jù)沖突或數(shù)據(jù)缺陷。對(duì)這些缺陷進(jìn)行檢測(cè)與處理,才能保證地理空間信息的質(zhì)量。
近十多年來(lái),學(xué)術(shù)界對(duì)地理信息產(chǎn)品質(zhì)量控制與評(píng)估的理論和方法進(jìn)行了大量的研究,取得了豐碩的成果[2-9]。對(duì)地理信息產(chǎn)品質(zhì)量元素、缺陷分類、缺陷自動(dòng)識(shí)別方法、質(zhì)量評(píng)估模型、空間關(guān)系描述、空間關(guān)系沖突檢測(cè)等進(jìn)行研究建模,解決生產(chǎn)與工程實(shí)踐中的數(shù)據(jù)質(zhì)量控制問(wèn)題,已成為當(dāng)前的一個(gè)重要發(fā)展趨勢(shì)。
矢量地圖數(shù)據(jù)主要由幾何數(shù)據(jù)、屬性數(shù)據(jù)、拓?fù)鋽?shù)據(jù)、描述數(shù)據(jù)和元數(shù)據(jù)組成。矢量地圖數(shù)據(jù)缺陷識(shí)別規(guī)則實(shí)際上是一種集語(yǔ)義關(guān)系、拓?fù)潢P(guān)系、方向關(guān)系和度量關(guān)系于一體的空間和語(yǔ)義約束,是制圖規(guī)范和細(xì)則的形式化描述,是矢量地圖數(shù)據(jù)缺陷自動(dòng)識(shí)別的基礎(chǔ),直接影響缺陷自動(dòng)識(shí)別的查全率和查準(zhǔn)率。本文論述了地圖數(shù)據(jù)缺陷識(shí)別規(guī)則的建立依據(jù),分析了現(xiàn)有地圖數(shù)據(jù)缺陷自動(dòng)識(shí)別規(guī)則研究中存在的不足,研究了地圖數(shù)據(jù)缺陷識(shí)別規(guī)則的表達(dá)形式和測(cè)試條件,提出了地圖數(shù)據(jù)缺陷自動(dòng)識(shí)別規(guī)則表達(dá)的五元組模型,并對(duì)其特點(diǎn)進(jìn)行了分析;以等高線與水系缺陷自動(dòng)識(shí)別規(guī)則建立為例,提出了基于五元組模型的等高線與水系缺陷自動(dòng)識(shí)別的8條規(guī)則。
規(guī)則的獲取是一個(gè)與領(lǐng)域?qū)<?、知識(shí)系統(tǒng)建造者以及知識(shí)系統(tǒng)自身都密切相關(guān)的復(fù)雜問(wèn)題,是建造規(guī)則系統(tǒng)中的關(guān)鍵問(wèn)題。規(guī)則獲取的基本任務(wù)是從生產(chǎn)作業(yè)規(guī)范、制圖專家經(jīng)驗(yàn)等中獲取規(guī)則,以建立起健全、完善、有效的規(guī)則庫(kù)。對(duì)于矢量地圖數(shù)據(jù)缺陷自動(dòng)識(shí)別來(lái)說(shuō),其規(guī)則的來(lái)源有以下幾個(gè):
(1)生產(chǎn)作業(yè)規(guī)范。為了使地圖數(shù)據(jù)的生產(chǎn)、編輯和轉(zhuǎn)換等有章可循、有據(jù)可依,從而便于數(shù)據(jù)的統(tǒng)一生成、管理、共享、更新和應(yīng)用,制圖人員對(duì)地圖數(shù)據(jù)的采集、編輯、轉(zhuǎn)換和出版過(guò)程中的技術(shù)要求作出具體的規(guī)定,制定出生產(chǎn)作業(yè)標(biāo)準(zhǔn)或規(guī)范,如《1∶25000、1∶50000、1∶100000地形圖圖式》、《1∶50000數(shù)字地形圖編輯出版作業(yè)細(xì)則》、《數(shù)字地圖產(chǎn)品檢查驗(yàn)收要求》等。生產(chǎn)作業(yè)規(guī)范是衡量地圖數(shù)據(jù)質(zhì)量的重要依據(jù),依據(jù)生產(chǎn)作業(yè)細(xì)則,通過(guò)對(duì)相應(yīng)規(guī)定的抽象、提取和轉(zhuǎn)換,能夠得到可用的自動(dòng)識(shí)別規(guī)則。
(2)制圖專家的經(jīng)驗(yàn)。在長(zhǎng)期的生產(chǎn)作業(yè)過(guò)程中,形成了專家經(jīng)驗(yàn)。在某些情況下,由于無(wú)法直接感知現(xiàn)實(shí)世界的空間關(guān)系,而生產(chǎn)作業(yè)細(xì)則也很難將生產(chǎn)中遇到的所有狀況全部列舉,一些復(fù)雜情況可能會(huì)缺乏一個(gè)明確、量化的標(biāo)準(zhǔn),此時(shí)就需要依據(jù)專家經(jīng)驗(yàn)對(duì)其進(jìn)行判斷。例如,在小比例尺地形圖中,一些等級(jí)低的橋梁和涵洞一般不表示,如果發(fā)現(xiàn)鄉(xiāng)村路和河流互相纏繞,很難確定是否合理。此時(shí),就需要制圖人員依據(jù)道路和河流的等級(jí)、交點(diǎn)距離、相交區(qū)域面積以及研究對(duì)象所屬地域的氣候、地形、水文等特征進(jìn)行綜合判斷[9]。生產(chǎn)作業(yè)一線的專家,具有豐富的實(shí)踐經(jīng)驗(yàn)和大量知識(shí),對(duì)缺陷識(shí)別規(guī)則的制定具有重要意義。
(3)客觀現(xiàn)實(shí)世界。無(wú)論是制圖規(guī)范的制定,還是專家依據(jù)經(jīng)驗(yàn)對(duì)地理要素之間的空間關(guān)系進(jìn)行判斷,符合現(xiàn)實(shí)世界中的客觀存在是其基本原則,因?yàn)榈貓D數(shù)據(jù)庫(kù)中目標(biāo)間的空間關(guān)系是對(duì)現(xiàn)實(shí)世界地理要素關(guān)系的映射[10],其根本目的是如何更好、更準(zhǔn)確地表達(dá)現(xiàn)實(shí)世界。
(4)教材書籍。與地圖制圖學(xué)和地理信息系統(tǒng)相關(guān)的教科書、研究論文等也是缺陷自動(dòng)識(shí)別規(guī)則的一個(gè)主要來(lái)源。由于認(rèn)識(shí)事物的角度和觀念不同,僅通過(guò)作業(yè)細(xì)則和專家經(jīng)驗(yàn)很難獲取到完備、嚴(yán)密的規(guī)則。教科書的系統(tǒng)性、科學(xué)性能夠?yàn)樽鳂I(yè)細(xì)則的制定提供很多參考;研究論文其實(shí)也是專家經(jīng)驗(yàn)的一種梳理、總結(jié)和提煉,通過(guò)研究論文也可獲取規(guī)則制定的大量有用信息。
(5)邏輯推理。數(shù)據(jù)庫(kù)中的一些屬性信息相互之間、或與相應(yīng)地理要素的幾何信息之間存在一定的關(guān)聯(lián)性,通過(guò)這種關(guān)聯(lián)性可以建立一定的規(guī)則來(lái)輔助缺陷自動(dòng)識(shí)別。如屬性項(xiàng)中的目標(biāo)類型與參數(shù)值域存在關(guān)聯(lián)、圖形特征碼與圖形類型存在關(guān)聯(lián)、道路的屬性長(zhǎng)度與其量測(cè)長(zhǎng)度存在關(guān)聯(lián)、相鄰等高線之間的高程值遵循一定的規(guī)律等。
(6)基于案例的統(tǒng)計(jì)分析。有學(xué)者通過(guò)對(duì)關(guān)系正確的圖幅中空間關(guān)系的統(tǒng)計(jì)和分析,確定目標(biāo)間合理的空間關(guān)系類型[11]。此種方法存在一定的不確定性,對(duì)規(guī)則的嚴(yán)密性會(huì)造成一定的影響。
(7)知識(shí)系統(tǒng)自身的運(yùn)行實(shí)踐。規(guī)則的另一個(gè)來(lái)源是系統(tǒng)的運(yùn)行實(shí)踐。其需要從實(shí)踐中學(xué)習(xí)、總結(jié)出新的知識(shí)和規(guī)則。一個(gè)知識(shí)系統(tǒng)剛建立時(shí)很難完美無(wú)缺,只有運(yùn)行后才會(huì)發(fā)現(xiàn)規(guī)則不夠健全,需要補(bǔ)充。此時(shí),除了通過(guò)上述方法進(jìn)行補(bǔ)充完善規(guī)則外,還可以根據(jù)系統(tǒng)的運(yùn)行經(jīng)驗(yàn)從已有的規(guī)則、實(shí)例或數(shù)據(jù)中演繹、歸納出新規(guī)則。
上述方法只是獲取缺陷識(shí)別的相關(guān)知識(shí),這些知識(shí)是零亂的、瑣碎的,應(yīng)對(duì)其進(jìn)行系統(tǒng)地整理、總結(jié),形成清晰的理論體系。此外,還應(yīng)采取適當(dāng)?shù)男问綄⑵涑橄?、轉(zhuǎn)換為計(jì)算機(jī)可以識(shí)別的形式化語(yǔ)言,形成規(guī)則,才能進(jìn)行應(yīng)用,這就需要對(duì)規(guī)則的表示方法進(jìn)行研究。一種好的規(guī)則表示方法應(yīng)當(dāng)有較強(qiáng)的表達(dá)能力和足夠的精細(xì)程度,可用性要強(qiáng),可以從以下三個(gè)方面考慮[12-15]:
(1)表示能力:要求能夠正確、有效地將問(wèn)題求解所需的各類知識(shí)都表示出來(lái)。
(2)可理解力:所表示的知識(shí)應(yīng)易懂、易讀、易于表示。
(3)通用性:即表示方式要自然,盡量適用于不同的環(huán)境和不同的用途,易于檢查、修改和維護(hù)。
3.1 五元組模型的提出
目前在人工智能領(lǐng)域,規(guī)則的表示方法主要有以下幾種[12]:經(jīng)典邏輯表示法、產(chǎn)生式表示法、層次結(jié)構(gòu)表示法、網(wǎng)絡(luò)結(jié)構(gòu)表示法和其他表示方法。其中,產(chǎn)生式表示法是人工智能中應(yīng)用最廣泛的一種知識(shí)表示形式,它具有以下特點(diǎn):
(1)以規(guī)則作為形式單元,格式固定、易于表示,且知識(shí)單元相互獨(dú)立,易于建立規(guī)則庫(kù)。
(2)推理方式單純,適于模擬強(qiáng)數(shù)據(jù)驅(qū)動(dòng)特點(diǎn)的智能行為。當(dāng)一些新的數(shù)據(jù)輸入時(shí),系統(tǒng)的行為就會(huì)發(fā)生改變。
(3)便于規(guī)則庫(kù)的修改,可增加新的規(guī)則去適應(yīng)新的情況,而不會(huì)破壞系統(tǒng)的其他部分。
(4)易于對(duì)系統(tǒng)的推理路徑作出解釋。
從文獻(xiàn)查詢和分析看[9,10,11,12,16],在空間沖突檢測(cè)領(lǐng)域,絕大多數(shù)學(xué)者也采用產(chǎn)生式來(lái)表示空間關(guān)系沖突檢測(cè)規(guī)則,主要有四元組、三元組以及擴(kuò)展四元組三種。三元組模型用(E,C,A)來(lái)定義,其中E表示觸發(fā)事件,C為測(cè)試條件,A為滿足測(cè)試條件時(shí)所發(fā)生的行為。判斷過(guò)程可表示為:when E if C then A。SERVIGNE[16]等提出采用四元組(O1,R,O2,S)來(lái)定義規(guī)則,其中O1表示第一類目標(biāo),O2表示第二類目標(biāo),R表示兩類目標(biāo)之間的關(guān)系,S為定義說(shuō)明。四元組和三元組模型在本質(zhì)上是一樣的??紤]到四元組和三元組方法只涵蓋了目標(biāo)之間的拓?fù)潢P(guān)系,沒(méi)有涵蓋目標(biāo)之間的方向和度量關(guān)系,因此,劉萬(wàn)增等采用擴(kuò)展四元組(O1,(RT,RD,RM),O2,S)來(lái)定義規(guī)則,其中O1,O2為觸發(fā)事件,RT,RD,RM分別為拓?fù)潢P(guān)系、方向關(guān)系和度量關(guān)系測(cè)試條件,S為滿足條件時(shí)發(fā)生的行為[9]。
實(shí)際上,規(guī)則的建立有兩個(gè)關(guān)鍵環(huán)節(jié):規(guī)則的表達(dá)形式和規(guī)則的測(cè)試條件。前者決定了規(guī)則的可用性,后者決定了規(guī)則的可靠性。規(guī)則的測(cè)試條件方面,目前的方法主要有三種:必須關(guān)系規(guī)則、禁止關(guān)系規(guī)則、混合關(guān)系規(guī)則。KUFONIYI[17]認(rèn)為目標(biāo)之間應(yīng)當(dāng)保持一種合理的空間關(guān)系,由此建立了基于目標(biāo)間合理拓?fù)潢P(guān)系的規(guī)則(必須關(guān)系規(guī)則),并將目標(biāo)空間語(yǔ)義約束轉(zhuǎn)化為目標(biāo)間應(yīng)維護(hù)的拓?fù)潢P(guān)系集合。SERVIGNE[16]等認(rèn)為目標(biāo)間的空間沖突是一種禁止的拓?fù)潢P(guān)系(禁止關(guān)系規(guī)則),其采用9交模型定義了目標(biāo)間禁止的拓?fù)潢P(guān)系約束。劉萬(wàn)增等采用真關(guān)系集合和偽關(guān)系集合對(duì)數(shù)據(jù)庫(kù)中的空間沖突規(guī)則進(jìn)行定義,本質(zhì)上是將必須規(guī)則和禁止規(guī)則結(jié)合起來(lái)應(yīng)用[9]。
但以上空間關(guān)系沖突檢測(cè)規(guī)則表示方法還存在以下不足:
(1)規(guī)則的定義缺乏層次性,大大影響了空間關(guān)系缺陷識(shí)別的速度和效率。為了提高缺陷識(shí)別的速度和效率,本文認(rèn)為可以從不同層次上對(duì)規(guī)則進(jìn)行定義,如按照缺陷粗查、缺陷細(xì)查、缺陷確認(rèn)三個(gè)層次來(lái)定義識(shí)別規(guī)則。
(2)規(guī)則的定義沒(méi)有考慮缺陷的等級(jí),即沒(méi)有考慮該缺陷對(duì)地圖數(shù)據(jù)質(zhì)量的影響程度,不利于地圖數(shù)據(jù)質(zhì)量的評(píng)估。
(3)規(guī)則中缺乏對(duì)規(guī)則本身不確定性的描述。即對(duì)利用該規(guī)則檢測(cè)出的缺陷,其可靠性缺乏描述。
因此,本文提出采用以下五元組形式來(lái)定義矢量地圖數(shù)據(jù)缺陷識(shí)別規(guī)則:
(O1,(RT,RD,RM),O2,(L,(j,k,I)),P):when O1,O2if(RT,RD,RM) then P(L,(j,k,I))。
其具體含義如下:
(1)O1,O2為觸發(fā)事件,從屬于相應(yīng)的屬性集。
(2)對(duì)于空間關(guān)系缺陷識(shí)別來(lái)說(shuō),(RT,RD,RM)分別為拓?fù)潢P(guān)系、方向關(guān)系和度量關(guān)系測(cè)試條件;對(duì)于其他缺陷識(shí)別來(lái)說(shuō),(RT,RD,RM)表示相應(yīng)的測(cè)試條件,可能為一項(xiàng),也可能為多項(xiàng)。
(3)(L,(j,k,I))為滿足條件時(shí)發(fā)生的行為,L表示缺陷等級(jí),(j,k,I)表示具體的缺陷信息,即j號(hào)目標(biāo)與k號(hào)目標(biāo)之間產(chǎn)生了I缺陷。
(4)P表示發(fā)生該行為的幾率,即規(guī)則的可靠性。
其判斷過(guò)程為:當(dāng)目標(biāo)分別屬于集合O1、O2時(shí),若滿足判斷條件(RT,RD,RM),那么j號(hào)目標(biāo)與k號(hào)目標(biāo)之間有P的幾率出現(xiàn)等級(jí)為L(zhǎng)的缺陷I,P和L為經(jīng)驗(yàn)值。L的取值為(1,2,3,4,5),1級(jí)為嚴(yán)重缺陷,2級(jí)為重要缺陷,3級(jí)為一般缺陷,4級(jí)為次要缺陷,5級(jí)為其它缺陷。考慮到矢量地圖數(shù)據(jù)缺陷識(shí)別的主要任務(wù)是查錯(cuò),在大量正確的關(guān)系中檢測(cè)不合理的關(guān)系,即錯(cuò)誤的是少數(shù)、正確的占絕大多數(shù),因此,本文采用禁止關(guān)系規(guī)則作為測(cè)試條件。
3.2 五元組模型的特點(diǎn)
本文提出的五元組模型具有以下特點(diǎn):
(1)增加了對(duì)規(guī)則可靠性的描述,便于作業(yè)員對(duì)地圖數(shù)據(jù)進(jìn)行有針對(duì)性的人工交互檢查,也便于缺陷識(shí)別軟件對(duì)缺陷進(jìn)行進(jìn)一步的確認(rèn)與核實(shí),有利于提高缺陷識(shí)別結(jié)果的精度。
(2)增加了對(duì)缺陷等級(jí)的描述,便于地圖數(shù)據(jù)質(zhì)量的評(píng)估。
(3)在地圖數(shù)據(jù)缺陷信息的描述方面,不僅說(shuō)明了缺陷的類型,而且標(biāo)示了產(chǎn)生錯(cuò)誤的兩個(gè)地理實(shí)體的編號(hào),便于缺陷的查找、確認(rèn)與修改。
(4)定義的規(guī)則具有一定的層次性,可滿足不同層次的質(zhì)量需求。例如,在識(shí)別時(shí)間優(yōu)先的情況下,可以采用可靠性較低的規(guī)則進(jìn)行缺陷粗判,避免了大量的求交運(yùn)算,缺陷識(shí)別的效率較高;而在識(shí)別準(zhǔn)確度優(yōu)先的情況下,則可以采用可靠性較高的規(guī)則進(jìn)行精確識(shí)別和缺陷確認(rèn),缺陷識(shí)別的準(zhǔn)確性較高。
(5)在定義規(guī)則時(shí)考慮到了閾值對(duì)缺陷識(shí)別的影響,能提高缺陷識(shí)別的準(zhǔn)確性。
以等高線與水系之間的空間關(guān)系缺陷識(shí)別規(guī)則建立為例進(jìn)行分析。
4.1 等高線與水系之間的空間關(guān)系缺陷分析
等高線與水系(河流、湖泊、水庫(kù)、時(shí)令河等)的關(guān)系應(yīng)當(dāng)遵從“水往低處流”的自然規(guī)律,地貌的變化常常會(huì)改變周圍水系的分布,水系的變化也會(huì)對(duì)地貌產(chǎn)生反作用。等高線用來(lái)表示地貌特征,在空間數(shù)據(jù)庫(kù)中與水系要素的關(guān)系同樣要遵從一定的自然規(guī)律。具體情況如圖1所示,圖1(1)中等高線近似垂直地穿越雙線河,為正確的空間關(guān)系;圖1(2)中等高線小角度穿越雙線河,表示此處河流水面傾斜,為空間關(guān)系缺陷;圖1(3)中等高線與河流小面積相交,很可能是作業(yè)員失誤或者河流更新導(dǎo)致的錯(cuò)誤,屬于空間關(guān)系缺陷;圖1(4)中等高線與面狀水域的邊線發(fā)生了重疊,違背了“水往低處流”的自然規(guī)律,屬于空間關(guān)系缺陷;圖1(5)中等高線與線狀河流在小范圍內(nèi)多次相交,同樣也屬于空間關(guān)系缺陷。
因此,只要等高線與面狀水域邊線或線狀河流有重疊,即出現(xiàn)1維相切或1維相交關(guān)系,則一定有缺陷產(chǎn)生;當(dāng)?shù)雀呔€與面狀水域邊線或線狀河流之間出現(xiàn)0維相交關(guān)系時(shí),則有一定機(jī)率產(chǎn)生缺陷,需要進(jìn)一步判斷:可以通過(guò)判斷等高線與河流骨架線的夾角是否接近90°,或判斷等高線與河流邊線或線狀河流相交形成的區(qū)域的圖上面積是否小于規(guī)定閾值等方法進(jìn)一步確認(rèn),在進(jìn)一步確認(rèn)的過(guò)程中結(jié)果的可靠性也在不斷提升。
圖1 等高線與水系之間的空間關(guān)系
4.2 等高線落水識(shí)別規(guī)則的建立
為建立規(guī)則,本文定義了以下幾個(gè)參數(shù):
(1)線分割面的面積(AOD):線與面相交時(shí),線分割面的面積;
(2)線分割面的面積比(RDA):線與面相交時(shí),線分割面的面積比;
(3)線與面相交的角度(AOC):線與面相交時(shí),線與面邊界相交的兩個(gè)交點(diǎn)連線,與面的中心線的夾角;
(4) 將0維相交(0,C)記為C0,1維相交(1,C)記為C1,0維相接(0,M)記為M0,1維相接(1,M)記為M1,0維相切(0,T)記為T0,1維相切(1,T)記為T1。
等高線落水識(shí)別規(guī)則有以下8條:
規(guī)則1:若等高線與面狀水域之間的拓?fù)潢P(guān)系出現(xiàn)1維相交或1維相切,則會(huì)產(chǎn)生j號(hào)等高線落k號(hào)水域面的缺陷,缺陷等級(jí)為4。形式化表示為:
(O1,(((C1>0)∨(T1>0)),-,-),O2,(4,j號(hào)等高線落k號(hào)水域面),1)
規(guī)則2:若等高線與面狀水域之間的拓?fù)潢P(guān)系出現(xiàn)0維相交,則有50%的幾率出現(xiàn)j號(hào)等高線落k號(hào)水域面的缺陷,缺陷等級(jí)為4。形式化表示為:
(O1,((C0>0),-,-),O2,(4,j號(hào)等高線落k號(hào)水域面),0.5)
規(guī)則 3:若等高線與面狀水域之間的拓?fù)潢P(guān)系出現(xiàn)0維相交,且AOC<=70,則有80%的幾率出現(xiàn)j號(hào)等高線落k號(hào)水域面的缺陷,缺陷等級(jí)為4。形式化表示為:
(O1,((C0>0),-,(AOC<=70)),O2,(4,j號(hào)等高線落k號(hào)水域面),0.8)
規(guī)則 4:若等高線與面狀水域之間的拓?fù)潢P(guān)系出現(xiàn)0維相交、AOC<=70,且AOD<25,則有90%的幾率出現(xiàn)j號(hào)等高線落k號(hào)水域面的缺陷,缺陷等級(jí)為4。形式化表示為:
(O1,((C0>0),-,((AOC<=70)∧(AOD<25))),O2,(4,j號(hào)等高線落k號(hào)水域面),0.9)
規(guī)則5:若等高線與線狀河之間的拓?fù)潢P(guān)系出現(xiàn)1維相交、1維相切或0維相切,則一定出現(xiàn)j號(hào)等高線與k號(hào)河流的高曲矛盾,缺陷等級(jí)為4。形式化表示為:
(O1,(((C1>0)∨(T1>0)∨(T0>0)),-,-),O2,(4,j,k,高曲矛盾),1)
規(guī)則6:若等高線與線狀河之間的拓?fù)潢P(guān)系出現(xiàn)0維相交,則有50%的幾率出現(xiàn)j號(hào)等高線與k號(hào)河流的高曲矛盾,缺陷等級(jí)為4。形式化表示為:
(O1,((C0>0),-,(AOC<=70)),O2,(4,j,k,高曲矛盾),0.5)
規(guī)則 7:若等高線與線狀河之間的拓?fù)潢P(guān)系出現(xiàn)0維相交,且AOC<=70,則有80%的幾率出現(xiàn)j號(hào)等高線與k號(hào)河流的高曲矛盾,缺陷等級(jí)為4。形式化表示為:
(O1,((C0>0),-,(AOC<=70)),O2,(4,j,k,高曲矛盾),0.8)
規(guī)則 8:若等高線與線狀河之間的拓?fù)潢P(guān)系出現(xiàn)0維相交、AOC<=70且AOD<25,則有90%的幾率出現(xiàn)j號(hào)等高線與k號(hào)河流的高曲矛盾,缺陷等級(jí)為4。形式化表示為:
(O1,((C0>0),-,((AOC<=70)∧(AOD<25))),O2,(4,j,k,高曲矛盾),0.9)
本文分析了當(dāng)前空間關(guān)系缺陷識(shí)別規(guī)則中存在的問(wèn)題,提出了用于描述缺陷自動(dòng)識(shí)別規(guī)則的五元組模型,模型考慮了閾值對(duì)缺陷識(shí)別的影響,增加了對(duì)規(guī)則可靠性、缺陷等級(jí)、數(shù)據(jù)缺陷信息的描述,有利于缺陷識(shí)別效率、精度和軟件可用性的提高。基于五元組模型建立了詳實(shí)的等高線和河流關(guān)系缺陷自動(dòng)識(shí)別規(guī)則。數(shù)據(jù)缺陷識(shí)別規(guī)則的建立非常瑣碎,缺少較為成體系的方法論對(duì)其進(jìn)行指導(dǎo),而規(guī)則的建立直接影響著缺陷識(shí)別的查全率和查準(zhǔn)率,便于作業(yè)員對(duì)地圖數(shù)據(jù)進(jìn)行有針對(duì)性的人工交互檢查,也便于缺陷識(shí)別軟件對(duì)缺陷進(jìn)行確認(rèn)與核實(shí)。對(duì)于矢量地圖數(shù)據(jù)缺陷識(shí)別,可以依據(jù)實(shí)際應(yīng)用需求建立非常豐富的規(guī)則庫(kù),規(guī)則建立方法的提煉有助于規(guī)則的形成和不斷完善。同時(shí),矢量地圖數(shù)據(jù)缺陷識(shí)別規(guī)則的建立是一件非常靈活的事情,自由度越高,做需要發(fā)揮主觀能動(dòng)性的事情越不易。規(guī)則建立方法的研究就是為了給規(guī)則的建立提供一定的思路和途徑,使規(guī)則的建立有章可循、有據(jù)可依,因此,還需要在實(shí)際應(yīng)用中提煉更多的規(guī)則建立方法。另外,規(guī)則測(cè)試條件是一種綜合了多種因素的約束,對(duì)于缺陷識(shí)別的自動(dòng)化程度、效率和正確率具有決定性的作用。如何使規(guī)則既能滿足生產(chǎn)作業(yè)規(guī)范要求,又能做到簡(jiǎn)潔、有效、便于計(jì)算機(jī)實(shí)現(xiàn),是今后需要重點(diǎn)研究的問(wèn)題。
[1]華一新,吳升,趙軍喜.地理信息系統(tǒng)原理與技術(shù)[M].北京:解放軍出版社,2001.
[2]曾衍偉.空間數(shù)據(jù)質(zhì)量控制與評(píng)價(jià)技術(shù)體系研究[D]. 武漢:武漢大學(xué),2004.
[3]吳長(zhǎng)彬,閭國(guó)年,舒飛躍.基于知識(shí)與規(guī)則的地籍?dāng)?shù)據(jù)質(zhì)量檢查方法[J].地理與地理信息科學(xué),2007,9(5):22-24.
[4]楊華.基于知識(shí)與規(guī)則的地籍?dāng)?shù)據(jù)質(zhì)量檢查系統(tǒng)的研究[D].南京:南京師范大學(xué),2007.
[5]詹陳勝,武芳,翟仁健等.基于拓?fù)湟恢滦缘木€目標(biāo)空間沖突檢測(cè)方法[J].測(cè)繪科學(xué)技術(shù)學(xué)報(bào),2011,28(5):387-390.
[6]吳芳華,曹亞妮,吉國(guó)杰.數(shù)字地圖質(zhì)量批量檢查功能的設(shè)計(jì)與實(shí)現(xiàn)[J].測(cè)繪科學(xué)與工程,2013(1):57-60.
[7]吳芳華,周洪斌,吳娟.數(shù)字地圖要素幾何關(guān)系的自動(dòng)檢查[J].測(cè)繪科學(xué)與工程,2011(4):1-5.
[8]吳芳華,吉國(guó)杰,曹亞妮. 矢量地圖數(shù)據(jù)缺陷識(shí)別方法研究[J].測(cè)繪科學(xué)技術(shù)學(xué)報(bào),2014,31(3):294-299.
[9]劉萬(wàn)增.GIS數(shù)據(jù)庫(kù)更新中空間沖突自動(dòng)檢測(cè)方法[M]. 北京:測(cè)繪出版社,2009.
[10]SERVIGNES,UBEDAT,PURICELLIA,etal.Amethodologyforspatialconsistencyimprovementofgeographicdatabase[J].Geoinformatica, 2000 (1): 7-34.
[11]GADISHDA.InconsistencyDetectionandAdjustmentofSpatialDatausingRuleDiscovery[D].Canana:UniversityofGuelph: 2001.
[12]周曉光,陳軍,蔣捷等.地籍地塊間的空間拓?fù)潢P(guān)系[J].測(cè)繪學(xué)報(bào),2003,32(4):356-361.
[13]張攀,王波.專家系統(tǒng)中多種知識(shí)表示方法的集成應(yīng)用[J].微型電腦應(yīng)用,2004,20(6):4-5.
[14]徐寶祥,葉培華.知識(shí)表示的方法研究[J].情報(bào)科學(xué),2007,25(5):690-694.
[15]鮑軍鵬,張選平.人工智能導(dǎo)論[M]. 北京:機(jī)械工業(yè)出版社,2010.
[16]SERVIGNES,UBEDAT,PURICELLIA,etal.Amethodologyforspatialconsistencyimprovementofgeographicdatabase[J].Geoinformatica, 2000 (1): 7-34.
[17]KUFONIYIO.Spatialcoincidencemodeling,automateddatabaseupdatinganddataconsistencyinvectorGIS[D].InternationalInstituteforAerospaceSurveyandEarthScience, 1995.
Representation Model of Map Data Defect Identification Rules
Wu Fanghua1,2,Cao Yani2,3,Ji Guojie1,2,3
1. Xi’an Research Institute of Surveying and Mapping, Xi’an 710054, China 2. State Key Laboratory of Geo-information Engineering, Xi’an 710054, China 3. Institute of Geospatial Information, Information Engineering University, Zhengzhou 450052, China
The defect identification rule of map data is the basis of automatic defect identification which affects the recall ratio and precision ratio of automatic defect identification. First this paper systematically studies the automatic identification rules of map data and states the basis of the rules construction. Then the paper analyzes the existing defect of automatic defect identification rules by taking the conflict checking rule of spatial relation as an example. Besides, the paper studies the presentation model and test conditions of rules, proposes quintuple model for automatic defect identification and describes the model characteristics. Finally it constructs the spatial relationship defects identification rules of water system and contour lines based on the quintuple model.
vector map data;automatic defect identification;identification rule;quintuple model
2015-05-08。
青年科學(xué)基金資助項(xiàng)目(41101445)。
吳芳華(1965—),女,研究員,主要從事GIS及地理空間信息質(zhì)量控制與評(píng)估研究。
P208
B