金詩程,李伊黎,3
(1.廣東省國土資源測繪院,廣州510700;2.自然資源部華南熱帶亞熱帶自然資源監(jiān)測重點實驗室,廣州510700;3.廣東省自然資源科技協(xié)同創(chuàng)新中心,廣州510700)
河系數(shù)據(jù)作為龐大空間數(shù)據(jù)庫中必不可少的部分,是地圖和地理信息分析中的基礎概念,在反映區(qū)域地理特征方面具有標志性作用,對居民點、交通網(wǎng)和工農業(yè)生產的分布和布局有顯著的影響作用,同時也是城市空間結構的重要制約因素[1]。河系作為一種廣泛存在的自然要素,是地圖的基礎結構內容,在空間數(shù)據(jù)集成和融合中占有較大的比例,合適的河系匹配方法對數(shù)據(jù)更新、集成與融合具有重要的意義。
線群目標可以分為包括等高線等呈線簇狀的目標和包括道路、水系、境界線等呈網(wǎng)狀分布的目標。劉濤等從空間關系和幾何特征建立了線群目標相似度計算模型,其中空間關系包括拓撲、方向和距離關系,幾何特征包括線群長度、平均長度、密度和曲折度[2]。Yang 等以stroke 表達道路網(wǎng),結合概率松弛法基于全局尋優(yōu)的策略實現(xiàn)道路網(wǎng)的分級匹配[3]。劉海龍等以stroke 為單元將離散的道路弧段構建為完整的道路,采用分類分級策略完成了整個道路網(wǎng)的匹配[4]。劉闖等在運用stroke 技術對道路網(wǎng)分級的同時,顧及道路的鄰域關系,以上下級空間關系相似性為約束條件實現(xiàn)了相近比例尺道路網(wǎng)匹配[5]。余夢娟提出基于Voronoi 圖的多尺度道路網(wǎng)匹配方法,將待匹配道路與鄰域道路作為一個整體進行整體的一致性相似性評價[6]。線群匹配多是結合實際地物來研究,以道路網(wǎng)匹配最為典型,應用較多的是stroke 分級表達,很少有河系等其他線群地物的匹配研究。本文從線群整體特征考慮,構建樹狀河系的樹結構,提出河系整體的相似性匹配方法。
河系數(shù)據(jù)需要經過一定的數(shù)據(jù)組織才能交給計算機處理,所以要選擇合適的數(shù)據(jù)結構將人眼識別的地圖語言轉化為計算機的數(shù)字語言。
2.1.1 河系實體處理 在河系數(shù)據(jù)重新存儲之前,需要對原始數(shù)據(jù)進行預處理,使得雜亂無章的數(shù)據(jù)變得有規(guī)律可循。將所有河段從交匯處分裂(如圖1虛線框1、2),從而形成標準的弧段-端點結構,然后將位于正?;《尉€上的端點(如圖1虛線框3、4)連接起來,從而形成完整連續(xù)的河段,在進行這一步操作時,可以將河系視為有向圖,根據(jù)度(與端點相連的弧段數(shù))將各個端點進行分類:(1)如果端點的度為1,表示該端點只連接一條弧段,為河系末端,不做任何處理;(2)如果端點的度為2,表示該端點連接兩條弧段,則將該端點相鄰的兩條弧段連接成一條弧段;(3)如果端點的度為3 及以上,表示該端點連接3 條以上的弧段,為正常端點,不做處理。
圖1 河系原始數(shù)據(jù)及處理后數(shù)據(jù)
2.1.2 河流方向判斷 河系是由不同源頭的河流匯聚而成的,河流的流向是從地勢高的地方流向地勢低的地方,并最終流入??诨蚝?,一個河系可以有多個河源,但只有一個河口。將河系數(shù)據(jù)按照有向圖的數(shù)據(jù)結構存儲時,可以得出河系結構的一系列重要特性[8]:(1)一個頂點可有多個上游河段,即入度大于等于1,但只能有一個下游河段,即出度等于1;(2)度為1 的頂點為河源河段的起點或河口河段的終點;(3)在單元化處理后,度大于等于2的頂點為河流的交匯點。
張青年等在人工識別河源的基礎上,自上游向下游追蹤各個河段,使河段上游指向下游,以此來判斷河流的方向[7]。一般情況下,河系的河源與河口存在多對一的數(shù)量關系,根據(jù)河系只有一個河口的特性,可以根據(jù)河口的位置,逆向尋找河系的河源,并逐段判斷河流的方向,構建主支流關系[8]。
2.1.3 河系樹建立 本文以主流為根結點,其支流為子結點構建河系的樹結構,每個結點為一個類,包含該結點河流的編號、級別(樹的深度)、長度、組成序列(頂點)、父親結點(根節(jié)點的父親為空)、孩子結點集合。
根據(jù)河系樹結構的特點,從河源到河口,只能找到一條路徑,因此可以從河源出發(fā),遍歷各個河源,搜索各個河源到河口的路徑,并計算路徑的長度,得到河系的最大長度,確定為主流。之后再以主流上各個交匯點為河口,以相同的思路遍歷河源,得到支流的最大長度,以此類推,最后得到如圖所示的樹結構。
2.2.1 河系特征指標 本文從河系的空間特征出發(fā),選取幾何相似性指標,對河系進行匹配。
圖2 河系方向處理前及處理后
圖3 河系及河系樹存儲結構
(1)中心位置 以河系主流及其支流首尾端點的中心坐標的平均值作為河系的中心坐標。設E1(X1,Y1),E2(X2,Y2)分別為兩個河系的中心點,則兩個河系中心距離為:
其中d≥0,d的值越小,兩河系的中心距離越近,匹配的可能性越大。
(2)空間范圍 以重疊面積的比例來作為河系空間位置相似度。這里設兩個待匹配的河系空間范圍面積分別為S1,S2,重疊面積為S,則河系空間位置相似度為:
其中S≤S1+S2-S,故0 ≤R≤1,兩河系空間范圍重疊度越高,空間范圍相似度約接近于1。
(3)主方向 主流的線性回歸趨勢線與橫坐標的夾角α作為河系的主方向,設α1,α2分別為兩個河系主流與橫坐標的夾角值,則它們的方向相似度定義為:
兩河系主方向越相近,方向相似度越趨近于1。
(4)河系形狀 以凸包長寬的比值來衡量河系的形狀,即河系的形狀特征值M為:
其中,length表示河系凸包的長度,width表示河系凸包的寬度。
設M1,M2分別為兩個河系的形狀特征值,則它們的形狀相似度定義為:
兩河系形狀越相似,河系形狀相似度越趨近于1。
2.2.2 匹配方法 在河系匹配中,通過河系中心位置這一特征篩選出匹配候選集后,再根據(jù)空間范圍、主方向、河系形狀三個特征指標作為綜合相似度來衡量整個河系的相似性。
設河系L的匹配候選集為L′= {L1,L2,…,Lk},L與候選集河系空間范圍相似度為R= {R1,R2,…,Rk},L與候選集河系主方向相似度為A={A1,A2,…,Ak},L與候選集河系形狀相似度為S={S1,S2,…,Sk}。在計算綜合相似度時,設空間范圍相似度的權重為γ,主方向相似度權重為β,則形狀相似度權重為1-γ-β,綜合相似度(SIM)函數(shù)表達式為:
其中i=1,2,…,k。
本文以云南省樹狀或格狀河系為實驗對象,如圖所示。匹配矢量數(shù)據(jù)分別來源于網(wǎng)站openstreetmap.org/(OSM)以及從地理空間數(shù)據(jù)云獲取的DEM 數(shù)據(jù)提取的河系網(wǎng),以下分別稱為OSM數(shù)據(jù)和DEM數(shù)據(jù)。
實驗中OSM 數(shù)據(jù)和DEM 數(shù)據(jù)分別標記出30 和29 個河系的河口,經實驗測試,將兩河系中心位置距離大于65 km視為不匹配,同樣設置系數(shù)γ、β分別為0.4、0.3。
圖4 云南省樹狀河系示意圖
計算結果如表1所示。無論是以OSM數(shù)據(jù)為匹配集,DEM 數(shù)據(jù)為候選集,還是以DEM 數(shù)據(jù)為匹配集,OSM 數(shù)據(jù)為候選集,部分河系的候選集中只有一個候選匹配河系,且綜合相似度接近1,如OSM 數(shù)據(jù)中2、3、8、12 號等河系,DEM 數(shù)據(jù)中2、3、7、12 號等河系,可以直接認定為匹配河系。另外部分河系的候選集中有多個候選匹配河系,如OSM 數(shù)據(jù)中1、4、5、6 號等河系,DEM 數(shù)據(jù)中1、4、5、6 號等河系,需要通過比較綜合相似度大小來判斷匹配河系。經過中心距離閾值的篩選,OSM 數(shù)據(jù)中30 號河系無候選集,DEM 數(shù)據(jù)中所有河系均有候選集。
表1 河系匹配綜合相似度
續(xù)表
如表1所示的綜合相似度計算結果中,OSM數(shù)據(jù)中的14 號河系與DEM 數(shù)據(jù)中的14 號河系綜合相似度為0.53,也小于閾值0.7,從各個特征指標來看,兩者的空間范圍相似度、主方向相似度、河系形狀相似度分別為0.55、0.23、0.91。如圖5所示,人工判別下,兩河系具有相似的形狀,在空間位置上能較大程度的對應,但計算得到的方向相似度過小,主要是兩河系主流存在一定的差別。如圖中顯示的兩河系主流,下側末端河流段方向的差異,引起兩河系主方向上的差異,導致主方向相似度過小。河系的主流是根據(jù)“主流長度最大”的原則進行判別的,由于不同數(shù)據(jù)的同一河系存在或大或小的差異,該原則判斷的主流可能存在一定的誤差,因此需要對河系的主流進行修正。這里以DEM 數(shù)據(jù)的14 號河系為主,將OSM 數(shù)據(jù)的14 號河系下側末端河段原來的支流更改為主流上的河段,原主流上的小段河段更改為支流,經過修正后計算得到的兩河系主方向相似度為1.00,綜合相似度為0.84,可以判斷為匹配河系。
圖5 OSM數(shù)據(jù)和DEM數(shù)據(jù)中的14號河系
除了上述情況,其他匹配河系的綜合相似度均在0.7 以上,較多的匹配河系相似度能達到0.9,部分匹配河系相似度為1.0,符合閾值范圍,也比較合理。綜上所述,在本次河系匹配實驗中,成功匹配的有28 對,OSM 數(shù)據(jù)中10、30 號河系無匹配河系,DEM數(shù)據(jù)中10號河系無匹配河系。
本文根據(jù)常見水系結構確定了樹狀河系研究對象,并從河系的幾何結構特征出發(fā),根據(jù)實體河流水系的特點,確定了河系方向及河流等級的判斷方法,建立了河系樹存儲結構。在此基礎上進行河系整體匹配,實驗發(fā)現(xiàn),河系的中心距離不能完全確定相互匹配的河系,河系的空間范圍、主方向和形狀三個方面的相似性對判斷河系整體性相似均有一定的貢獻意義,通過計算比較本文提出的綜合相似度可以有效地對同名河系進行識別和匹配。