楊 敏,艾廷華,劉鵬程,成曉強
1.武漢大學資源與環(huán)境科學學院,湖北武漢430072;2.華中師范大學城市與環(huán)境科學學院,湖北武漢430079
空間數(shù)據(jù)庫建立及更新需集成多種來源數(shù)據(jù),存在匹配中的不一致問題。這種不一致可能發(fā)生在不同主題、不同比例尺、不同時態(tài)的數(shù)據(jù)集成中,其表現(xiàn)形式包括要素表達不一致、鄰近關系沖突、拓撲結構不一致、地理匹配關系矛盾等。而一致性作為空間數(shù)據(jù)質量的5大特征之一[1],是空間分析、空間決策、空間數(shù)據(jù)挖掘等過程中應考慮的重要因素,因此,如何將異源數(shù)據(jù)進行有效地匹配,并探測、糾正不一致成為當前GIS領域的熱點。
當前,相關研究多集中于同類要素對象間的匹配及一致性維護(如道路網(wǎng)[2-3]、河流[4]、居民地[5-6]等),通過幾何特征、屬性特征及拓撲關系的相似性比較建立匹配關系[2-11],利用Delaunay三角網(wǎng)[12]、共軛點控制變換[6]等幾何方法實現(xiàn)一致性改正,而不同類要素對象間的匹配及一致性關系的維護由于缺少匹配條件而較少涉及。地理學第一定律[13]認為地表所有事物和現(xiàn)象在空間上都是關聯(lián)的,距離越近,關聯(lián)程度越強,距離越遠,關聯(lián)程度越弱。這種關聯(lián)關系表現(xiàn)為空間實體目標相互作用、相互影響形成特定結構的分布模式與依存關系,如某區(qū)域特定海拔高度與對應分布的植被類型具有一定的約束。這種發(fā)生在不同地理要素間的關聯(lián)關系對地理特征認知、空間建模、空間推理等有重要意義,也可以作為空間數(shù)據(jù)匹配的理論依據(jù)。
以地形圖上的水網(wǎng)、等高線為例,河流與地表地形間相互制約、相互作用,河流通過流水侵蝕、泥沙淤積一刻也不停地改變著地貌形態(tài),導致水網(wǎng)與等高線的分布形成了特定的模式,在地形圖表達上水網(wǎng)與等高線隱含谷底線所在位置應該一致。這種分布模式細化到幾何關系上包括:① 谷底點應與水網(wǎng)和等高線的交點重合;② 谷底線與水網(wǎng)重疊;③ 水網(wǎng)流向與谷底線沿高程降低的延伸方向一致。這些約束關系可以作為兩種數(shù)據(jù)匹配及是否一致的考察依據(jù)。
水網(wǎng)與等高線數(shù)據(jù)集成、更新過程中,由于數(shù)據(jù)的采集方式、更新周期及制圖過程中抽象概括程度不同,往往產(chǎn)生違背上述約束的情況,導致水網(wǎng)“爬坡”、等高線“入水”現(xiàn)象。當前,對這種空間關系沖突的檢測及糾正主要依靠作業(yè)員手工操作,效率低且易錯判、漏判,急需一種自動檢測及維護方法?;谏鲜龇治觯鉀Q問題的關鍵在于如何利用水網(wǎng)與等高線間的約束條件建立正確的匹配關系,并提出一致與否的評判規(guī)則。文獻[14]通過矢量投影法尋找等高線與水網(wǎng)對應的谷底點,比較谷底點至水網(wǎng)最小垂距檢測兩者是否一致,這種方法適用的前提是水網(wǎng)與對應谷底線相距較近且近似平行,實際應用有一定局限性,對于不一致的改正方法沒有作進一步探究。
本研究以水網(wǎng)、等高線線匹配為例探討這種不同類要素間的匹配問題,對它們之間的不一致進行探測并提出改正方法,基本思想是在等高線上利用Delaunay三角網(wǎng)提取谷底特征點,與水網(wǎng)和等高線交點建立匹配關系,當水網(wǎng)與谷底線在距離、方向上相差較大時,認為兩者不一致。采用兩種策略進行一致化改正,一是將水網(wǎng)移位至谷底線處,二是局部移位等高線,使隱含的谷底線與水網(wǎng)一致。方法選擇取決于兩種數(shù)據(jù)的定位精度及數(shù)據(jù)的具體應用背景。
等高線是通過等高度曲線的投影來表達三維地形,地形特征(如峰、洼地、山脊、谷地等)隱含在等高線表達中。判斷等高線與水網(wǎng)匹配是否一致,其實質是判斷谷底線與水網(wǎng)是否一致,為建立兩者間的匹配關系,首先要從等高線提取谷底特征。
從等高線提取地形結構特征有兩種途徑:一是將矢量等高線轉化為柵格DEM數(shù)據(jù),應用圖像處理方法根據(jù)極值點跟蹤或最陡坡降原則提取地形結構特征[15-16];二是單根等高線上的彎曲可看做谷地或山脊在某一高度水平面上的投影片段,谷地、山脊在等高線模型上表現(xiàn)為相應彎曲的集合,因此,通過對等高線彎曲特征分析可以直接提取地形結構特征[17-18]。相比第1種方法,通過彎曲特征分析直接提取地形結構特征可以有效避免DEM方法中的噪音干擾,并且結合彎曲特征的層次關系和分布形態(tài)可增強谷地樹組織的結構化特征。
這里采用文獻[17]中的方法從等高線提取谷底點并建立谷底線網(wǎng)絡結構。對單根等高線上的平面點集建立Delaunay三角網(wǎng),選取位于谷地所在單側的三角形子集,根據(jù)三角形間的鄰近關系搜索建立彎曲段之間層次包含關系的二叉樹[19],然后基于一定的分辨率提取合適的等高線彎曲作為“谷地片段”,其中分辨率控制條件為谷地深度(在彎曲特征上表現(xiàn)為三角網(wǎng)骨架線距離)。在選取的“谷地片段”彎曲中,考察其包含的三角形,提取骨架線建立以彎曲開口中點為根節(jié)點的骨架樹,比較根節(jié)點到葉節(jié)點的路徑距離,其中距離最長的葉節(jié)點即谷底點。如圖1所示,O點為彎曲開口連線中點,比較O到葉節(jié)點A、B、C、D的距離,確定距離最遠處的C為該彎曲的谷底點。等高線組提取“谷地片段”后,根據(jù)水流方向、坡降方向縱向連接谷底點便可得到谷底線,如圖2中的點群是“谷地片段”對應的谷底點,在連接為谷底線的過程中需考慮最短距離、法線方向、相交性等幾何約束條件。
圖1 骨架線最長分支確定谷底特征點CFig.1 The end point Cis regarded as the valley bottom point according to the longest skeleton branch principle
圖2 等高線組上谷底點提取Fig.2 The extraction of terrain valley points from contour group
等高線隱含谷底線與等高線正向相交,同時水網(wǎng)也與等高線相交,可通過比較同一等高線上谷底點與水網(wǎng)和等高線交點的位置關系進行兩者間的匹配,對應圖3算法敘述如下:
(1)建立水網(wǎng)和等高線交點集合R{r1,r2,…,rn}。
(2)任一ri∈R,搜索其兩側分布的谷底點建立匹配候選集Ci{c1,c2,…,cn},比較ri與Ci中各谷底點間等高線線段長度,按照距離最近原則(式(1)),得到與ri匹配谷底點cj(簡稱“匹配對m(ri,cj)”)
(3)循環(huán)執(zhí)行步驟(2),建立水網(wǎng)和等高線交點與谷底點間的匹配對集合M{m1,m2,…,mn}。
圖3 建立匹配關系Fig.3 Building the matching relation
步驟(2)中谷底點匹配候選集Ci的大小由單側搜索候選谷底點個數(shù)控制。圖3中ri對應谷底點匹配候選集為{C1,C2,C3,C4},按距離最近原則匹配的谷底點為C2,圖4中的虛線連接為谷底點與水網(wǎng)和等高線交點的匹配對應關系。
圖4 谷底點與水網(wǎng)和等高線交點匹配關系Fig.4 The matching relation between terrain valley points and intersection points of river network and contour
上述匹配過程僅考慮了單個水網(wǎng)和等高線交點與谷底點間的位置關系,未顧及水網(wǎng)流向及整體匹配情況,可能產(chǎn)生錯誤的匹配關系,需進行正確性檢查及改正。圖5(a)中水網(wǎng)和等高線交點R面臨谷底點B、C待匹配,按照距離最近原則,匹配結果為(R,C),而正確匹配應為(R,B),圖5(b)中R點實際經(jīng)過的區(qū)域等高線沒有明顯的彎曲存在(這種情形在河流的下游或主支流匯合時經(jīng)常出現(xiàn)),不存在與R點匹配的谷底點。類似上述錯誤匹配,根據(jù)谷底線方向(指谷底線沿高程降低的方向)與水網(wǎng)流向的一致性進行補救,算法如下:
(1)按水網(wǎng)流向排序匹配對集M{m1,m2,…,mn},連接水網(wǎng)和等高線交點及谷底點近似表示水網(wǎng)及谷底線,谷底線兩端點與鄰近水網(wǎng)節(jié)點相連。
(2)對mi(ri,ci),分別計算ri、ci相鄰有向線段間順時針方向夾角ai、bi,夾角差值θi=|ai-bi|。
(3)取夾角差值最大θp的匹配對mp(rp,cp),若θp>Δθ,從rp對應的谷底點匹配候選集Cp中剔除cp,然后選取新的匹配谷底點更新匹配對mp(若Cp為空,不存在與rp匹配的谷底點,刪除匹配對mp),執(zhí)行步驟(2);若θp<Δθ,檢查結束。
(4)得到補救后的匹配對集M{m1,m2,…,mk}。
圖5 錯誤的匹配關系Fig.5 The wrong matching relation
評價水網(wǎng)和等高線是否一致,可以采用水網(wǎng)和谷底線間的距離關系作為依據(jù)。如圖6所示,(R1,C1)和(R2,C2)為相鄰匹配對,線段C1C2近似表示谷底線,通過下式
求得水網(wǎng)線段R1R2與C1C2間平均距離表示兩者間的距離關系。式(2)中S為R1R2、C1C2與等高線圍成的多邊形(圖中陰影部分)面積,L1、L2分別表示R1R2與C1C2的長度。定義水網(wǎng)和等高線一致性改正的位置精度約束值(以水網(wǎng)和谷底線間距離的大小表示),當水網(wǎng)和谷底線間平均距離大于0且小于該約束值,認為水網(wǎng)與等高線不一致,并可進行一致性改正。當兩者間平均距離大于該約束值,則產(chǎn)生的不一致性不能簡單通過移動某目標的位置來改正,否則位置精度損失導致新的數(shù)據(jù)質量問題。一致性改正約束值設置需要考慮具體應用背景,如GB/T18315—2001規(guī)定1∶50 000地形圖山地區(qū)域地物點對最近野外控制點的圖上點位中誤差不能超過0.75mm,最大誤差為中誤差的2倍,一致性改正約束值可取實地37.5~75m之間。
一致性檢查后,對不一致的水網(wǎng)和等高線進行改正的方式包括移動水網(wǎng)匹配等高線和移動等高線匹配水網(wǎng),可以將兩種數(shù)據(jù)的定位精度作為選擇標準。當?shù)雀呔€定位精度高時,進行水網(wǎng)移位匹配等高線;反之,等高線移位匹配水網(wǎng);當兩種數(shù)據(jù)定位精度未知時,一致性改正可能造成定位精度的損失,此時一致性和定位精度成為了矛盾的兩個方面,需要結合數(shù)據(jù)的應用要求進行決策,若定位精度更為重要則不宜進行一致性改正。
簡單的改正方法便是由相鄰等高線間的谷底點順次相連代替原來水網(wǎng)局部線段,但是當?shù)雀呔噍^大時,不能很好地表現(xiàn)出水網(wǎng)的彎曲走勢,以谷底點與水網(wǎng)和等高線交點的匹配關系作為控制條件,通過線性變換移位原始水網(wǎng)可以較好地解決這個問題。圖6中水網(wǎng)線段R1R2,以端點R1、R2為控制點分別移位至C1、C2,其余點根據(jù)與兩端點間的線段長度作相應移位,如P點與R1、R2間線段長度以L1、L2表示,移位后對應點Q通過式(3)求得。該方法在移位水網(wǎng)使之與等高線一致化的同時,較好地保持了水網(wǎng)原來的彎曲走勢。
圖6 水網(wǎng)移位匹配等高線Fig.6 The displacement of river network to match contour
當谷底點所在等高線彎曲形態(tài)較復雜時,僅以水網(wǎng)線段的兩端點作為移位控制點是不夠的(如圖7(a)中水網(wǎng)移位后與同一條等高線產(chǎn)生多個交點),需加強移位控制條件。圖7(b)中,提取C1所在彎曲骨架線,取R1R2中點R3,求得骨架線上距R3距離最近點C3,增加控制點R3移位至C3,圖7(c)是增加控制點后水網(wǎng)移位的效果,但是該方法有一定局限性,要求水網(wǎng)線段與相關彎曲骨架線形態(tài)結構差別不大。整個水網(wǎng)移位過程中,為保持拓撲連通性,水網(wǎng)節(jié)點作為控制點移位前后位置不變。
圖7 增加移位控制條件避免移位后出現(xiàn)新的不一致情況Fig.7 Adding control condition to avoid new inconsistency after river network displacement
等高線移位的目標是使彎曲隱含的谷底線與水網(wǎng)一致,移位僅針對局部相關等高線的彎曲部分。圖8中C為谷底點,P1、P2為該谷底點所在彎曲的兩端點,C′是水網(wǎng)線段上距點C最近的點。以P1、P2、C為彎曲移位控制點,其中P1、P2移位前后位置不變,C移位至C′,彎曲線段上其余點P通過仿射變換(式(4))求得新的坐標位置P′
當水網(wǎng)與谷底線相距較遠時,等高線彎曲部分移位后形態(tài)變化較大,可能出現(xiàn)相鄰等高線相交及同一等高線與水網(wǎng)存在多個交點。如圖9,整個谷底點M所在等高線彎曲位于水網(wǎng)一側,移位后彎曲開后方向發(fā)生較大變化,出現(xiàn)了明顯的數(shù)據(jù)不一致,這種情況僅通過移位單個彎曲部分無法達到一致化的效果,需局部擴大移位的等高線范圍。與水網(wǎng)移位相比,等高線由于成組分布且形狀變化較大,移位后產(chǎn)生新的數(shù)據(jù)沖突較多,需要探索更好的移位方法。
圖8 等高線移位匹配水網(wǎng)Fig.8 The displacement of contour to match river
圖9 等高線移位后出現(xiàn)相交Fig.9 Contours intersected after displacement
試驗數(shù)據(jù)為云南省谷地特征較為明顯的山地區(qū)域地形圖數(shù)據(jù),該數(shù)據(jù)為在1∶1萬地形圖基礎上通過綜合縮編后得到的1∶5萬地形圖數(shù)據(jù),等高距40m,現(xiàn)要求對綜合結果數(shù)據(jù)的水網(wǎng)和等高線作一致性檢測維護。
匹配一致化過程涉及參數(shù)的取值需考慮具體區(qū)域特點及數(shù)據(jù)質量的要求。試驗數(shù)據(jù)中“谷地片段”彎曲深度大致在104~445m之間,取深度閾值465m以保證識別所有“谷地片段”彎曲。設置水網(wǎng)和等高線交點單側搜索匹配候選谷底點4個,超過該范圍的谷底點與等高線距離太遠,匹配概率極小且不宜一致性改正。水網(wǎng)流向與對應谷底線方向間夾角一般小于25°,在水網(wǎng)主支流交匯處可能偏大,因此設置匹配關系正確性檢查角度閾值Δθ=30°。一致性檢查時,考慮到水網(wǎng)與谷底線平均距離計算時以谷底點連線近似表示谷底線產(chǎn)生一定誤差,當平均距離大于3m且小于50m時,認為兩者不一致,并進行一致性改正。
以人工檢查的方式對試驗結果進行統(tǒng)計分析。表1是水網(wǎng)和等高線交點與谷底點匹配情況統(tǒng)計,匹配成功率達94.6%;一致性檢查時,88.1%的河流線段與等高線不一致;表2分析兩種一致化改正方法的結果,兩者成功率均達到90%以上。經(jīng)分析發(fā)現(xiàn),匹配一致化效果與水網(wǎng)和對應谷底線間的相對距離S及方向夾角Δθ密切相關,其中S=S1/S2,S1為水網(wǎng)與谷底線間距離,S2為谷底線對應“谷地片段”彎曲兩開口端點間距離。對于S<0.25且Δθ<30°的區(qū)域,水網(wǎng)和等高線匹配一致化效果較好,等高線移位匹配水網(wǎng)后出現(xiàn)相鄰等高線相交的情況相對較多,有待進一步改進。圖10、圖11分別是水網(wǎng)移位匹配等高線、等高線移位匹配水網(wǎng)效果圖。
表1 谷底點與水網(wǎng)和等高線交點匹配情況統(tǒng)計Tab.1 Statistics of the matching result
表2 水網(wǎng)與等高線移位一致化情況統(tǒng)計Tab.2 Statistics of the displacement result
圖10 水網(wǎng)移位匹配等高線(虛線為匹配后水網(wǎng))Fig.10 The displacement of river network to match contour
圖11 等高線移位匹配水網(wǎng)(虛線為匹配后的等高線)Fig.11 The displacement of contour to match river network
從實際數(shù)據(jù)的試驗結果分析,對于谷地特征較明顯的山地區(qū)域,水網(wǎng)與等高線的匹配關系正確率較高,達到了94.6%,兩種一致化改正方法較好地解決了數(shù)據(jù)間的不一致。
相比較同類要素的匹配,不同類要素間的匹配條件要少得多,需要利用空間分布知識將其間的匹配關系建立起來,進而完成數(shù)據(jù)間的一致性檢測及改正。因此,這種空間分布知識的提取及規(guī)則化成為不同要素類數(shù)據(jù)匹配一致化的關鍵所在。
本研究需要進一步改進的內容包括:① 一致化改正的兩種方法還需進一步改進,尤其是等高線移位匹配水網(wǎng)需挖掘更好的移位控制關系;② 針對線狀水網(wǎng)與等高線間的匹配及一致化改正,可進一步擴展至面狀水系要素(如面狀湖泊、水庫)與等高線間的匹配及一致化改正。
[1] GOODCHILD M F.Issues of Quality and Uncertainty[C]∥Proceedings of State of Indiana Geographic Information System Conference.Indianapolis:Indiana University,1991:113-140.
[2] CHEN Yumin,GONG Jianya,SHI Wenzhong.A Distancebased Matching Algorithm for Multi-scale Road Network[J].Acta Geodaetica et Cartographica Sinica,2007,36(1):84-90.(陳玉敏,龔健雅,史文中.多尺度道路網(wǎng)的距離匹配算法研究[J].測繪學報,2007,36(1):84-90.)
[3] ZHAO Dongbao,SHENG Yehua.Research on Automatic Matching of Vector Road Networks Based on Global Optimization[J].Acta Geodaetica et Cartographica Sinica,2010,39(4):416-421.(趙東保,盛業(yè)華.全局尋優(yōu)的矢量道路網(wǎng)自動匹配方法研究[J].測繪學報,2010,39(4):416-421.)
[4] BIRGIT K,HUANG W,HAUNERT J,et al.Matching River Datasets of Different Scales[C]∥Proceedings of AGILE Conference.Berlin:[s.n.],2009.
[5] REVELL P,ANTOINE B.Automated Matching of Building Features of Differing Levels of Detail:a Case Study[C]∥Proceedings of International Cartographic Conference 2009.Santiago:ICC,2009.
[6] HUH Y,YU K,HEO J.Detecting Conjugate-point Pairs for Map Alignment between Two Polygon Datasets[J].Computer,Environment and Urban Systems,2010,8(1):1-13.
[7] HOPE S,KEALY A.Using Topological Relationships to Inform a Data Integration Process[J].Transactions in GIS,2008,12(2):267-283.
[8] MUSTIERE S,DEVOGELE T.Matching Networks with Different Levels of Detail[J].GeoInformatic,2008,12(4):435-453.
[9] SAFRA E,KANZA Y,SAGIV Y.Location-based Algorithms for Finding Sets of Corresponding Objects over Several Geo-spatial Data Sets[J].International Journal of Geographical Information Science,2010,24(1):69-106.
[10] DEVOGELE T,PARENT C,SPACCAPIETRA S.On Spatial Database Integration[J].International Journal of Geographical Information Science,1998,12(4):335-352.
[11] WALTER V,F(xiàn)RITSCH D.Matching Spatial Data Sets:a Statistical Approach[J].International Journal of Geographical Information Science,1999,13(5):445-473.
[12] AI Tinghua,WU Hehai.Consistency Correction of Shared Boundary between Adjacent Polygons[J].Journal of Wuhan Technical University of Surveying and Mapping,2000,25(5):426-431.(艾廷華,毋河海.相鄰多邊形共享邊界的一致化改正[J].武漢測繪科技大學學報,2000,25(5):426-431.)
[13] TOBLER W R.A Computer Movie Simulating Urban Growth in the Detroit Region[J].Economic Geography,1970,46:234-240.
[14] LIU Wanzeng,CHEN Jun,DENG Kazhong,et al.Detecting the Spatial Inconsistency between the Updated Rivers and Valleys[J].Journal of Image and Graphics,2008,13(5):1003-1008.(劉萬增,陳軍,鄧喀中,等.數(shù)據(jù)庫更新中河流與山谷線一致性檢測[J].中國圖象圖形學報,2008,13(5):1003-1008.)
[15] MARK D M.Automated Detection of Drainage Network from Digital Elevation Model[J].Cartographica,1984,21(3):168-178.
[16] O’CALLAGHAN J F,MARK D M.The Extraction of Drainage Networks from Digital Elevation[J].Computer Vision,Graphics and Image Processing,1984,28(3):323-334.
[17] AI Tinghua,ZHU Guorui,ZHANG Genshou.Extraction of Landform Features and Organization of Valley Tree Structure Based on Delaunay Triangulation Model[J].Journal of Remote Sensing,2003,7(4):292-299.(艾廷華,祝國瑞,張根壽.基于Delaunay三角網(wǎng)模型的等高線地形特征提取及谷地樹結構化組織[J].遙感學報,2003,7(4):292-299.)
[18] TANG L.Automatic Extraction of Specific Geomorphological Elements from Contours[C]∥Proceedings of the 5th SDH conference.Charleston:[s.n.],1992:554-556.
[19] AI Tinghua,GUO Renzhong,LIU Yaolin.A Binary Tree Representation of Bend Hierarchical Structure Based on Gestalt Principles[C]∥Proceedings of the 9th International Symposium on Spatial Data Handling.Beijing:[s.n.],2000.