艾 廷 華,何 亞 坤,杜 欣
(武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079)
?
GIS數(shù)據(jù)尺度變換中的信息熵變化
艾 廷 華,何 亞 坤,杜 欣
(武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079)
基于Shannon信息熵原理的GIS數(shù)據(jù)信息量表達(dá)屬于語(yǔ)言學(xué)信息體系中的語(yǔ)法層次,描述了空間目標(biāo)分布結(jié)構(gòu)上的不確定性特征。該文將該信息量測(cè)度方法應(yīng)用于空間數(shù)據(jù)的尺度變換中,考察尺度變換中空間數(shù)據(jù)語(yǔ)法結(jié)構(gòu)在統(tǒng)計(jì)意義上的變化特點(diǎn),進(jìn)而通過(guò)信息熵的變化發(fā)掘尺度變化中空間數(shù)據(jù)信息量的變化規(guī)律?;诳臻g目標(biāo)群的Voronoi圖剖分建立信息熵度量,以空間尺度變換中的移位、合并兩種典型操作為案例,研究了面狀目標(biāo)群尺度變換中信息量衰減的初步規(guī)律,并嘗試將其結(jié)論用于地圖綜合方法質(zhì)量評(píng)價(jià)。
空間尺度變換;信息熵;地圖綜合;Voronoi圖
旨在壓縮數(shù)據(jù)量、簡(jiǎn)化表達(dá)、概括主體特征的地圖綜合技術(shù)是空間數(shù)據(jù)處理的經(jīng)典方法,是傳統(tǒng)系列比例尺地圖生產(chǎn)、跨尺度地圖更新的技術(shù)支持。在地理信息服務(wù)新技術(shù)背景下,以海量空間數(shù)據(jù)為代表的“大數(shù)據(jù)”時(shí)代[1]需要在網(wǎng)絡(luò)上實(shí)時(shí)傳輸用戶感興趣的信息內(nèi)容,海量化、多元化、實(shí)時(shí)化、網(wǎng)絡(luò)化的技術(shù)需求使得空間數(shù)據(jù)的處理、傳輸與分析都需要自動(dòng)綜合與尺度變換的支持,這對(duì)新技術(shù)背景下地圖綜合的研究提出了新的挑戰(zhàn)。
顧及多種技術(shù)需求,地圖綜合和尺度變換首先要回答“在限定的表達(dá)空間中合理的信息量是多少?”的問(wèn)題,網(wǎng)絡(luò)實(shí)時(shí)傳輸?shù)囊环貓D不能包含太多的信息。為了使信息表達(dá)合理,同時(shí)自適應(yīng)滿足不同層次用戶的要求,地圖綜合需要采取有效的策略度量信息量,并分析尺度變換中的信息量變化規(guī)律。地圖綜合領(lǐng)域的T?pfer法則[2]總結(jié)了尺度變換中的目標(biāo)圖形數(shù)量變化規(guī)律,但“數(shù)量”與“信息量”有差別,“信息量”的內(nèi)涵更豐富、外延更廣,如何發(fā)現(xiàn)尺度變換中的信息量變化規(guī)律是一個(gè)難點(diǎn)。
地圖作為一種圖形語(yǔ)言,具有語(yǔ)言學(xué)的共同特質(zhì),根據(jù)語(yǔ)言學(xué)層次系統(tǒng)將地圖信息分為語(yǔ)法信息、語(yǔ)義信息和語(yǔ)用信息。Klir等[3]對(duì)三種信息進(jìn)行了詮釋,認(rèn)為語(yǔ)法信息是事物運(yùn)動(dòng)的狀態(tài)和方式的外在形式,語(yǔ)義信息是事物運(yùn)動(dòng)狀態(tài)及其變化方式的含義,語(yǔ)用信息則關(guān)心事物運(yùn)動(dòng)狀態(tài)及變化方式的效用。廣泛應(yīng)用的Shannon的信息熵理論是基于概率論而建立的統(tǒng)計(jì)信息熵[4],屬于語(yǔ)法層次的信息量度量,描述了空間目標(biāo)分布結(jié)構(gòu)上的不確定特征。Sukhov[5,6]將這一理論應(yīng)用于地圖信息量算,提出了符號(hào)信息熵,這種信息熵并沒(méi)有考慮符號(hào)的空間分布,所以也被稱為統(tǒng)計(jì)信息熵;隨后,Neumann[7]提出了一種度量地圖拓?fù)湫畔⒘康姆椒ǎ瑢⒌貓D符號(hào)之間的鄰接關(guān)系用對(duì)偶圖表示并計(jì)算對(duì)偶圖的熵,這種方法計(jì)算的熵只是表示符號(hào)類型的統(tǒng)計(jì)分布而不是空間分布;Bjφrke[8]設(shè)計(jì)了一種基于信息論的在道路地圖中去除弧段新算法,將信息論的原理成功應(yīng)用于地圖綜合;Li等[9]提出了基于Voronoi圖的空間信息度量方法,將地圖的信息量從簡(jiǎn)單的統(tǒng)計(jì)信息量擴(kuò)展到了拓?fù)湫畔⒘?、幾何信息量和專題信息量的計(jì)算;Harrie等[10,11]提出了將地圖信息的量算分為信息量和信息分布兩方面進(jìn)行度量。
以上研究只是對(duì)單一的靜止的空間分布狀態(tài)的信息描述,缺乏不同表達(dá)狀態(tài)間的過(guò)程比較。按照Shannon信息熵原理[4],信息的度量反映在信息編碼、信息通道、信息解碼3個(gè)環(huán)節(jié)中,由于信息通道的噪音產(chǎn)生信息變異,導(dǎo)致信息量的損失與誤差產(chǎn)生。地圖綜合與尺度變換可以與信息傳輸過(guò)程對(duì)應(yīng),綜合前的大比例尺地圖為信息編碼,綜合后的小比例尺地圖為信息解碼,地圖綜合操作則為信息通道,通過(guò)綜合操作即信息通道的有效處理,信息量壓縮并產(chǎn)生誤差信息,這一信息傳輸過(guò)程與地圖綜合的效應(yīng)相一致[12]。因此,在變化過(guò)程中討論地圖信息量,更符合Shannon信息熵原理。本研究即是基于該思路將信息傳輸理論與制圖綜合過(guò)程相結(jié)合探討尺度變化中的信息量變化規(guī)律。
Shannon定義信息量含義為收到信息后解除的不確定度的值,解除的不確定量越大,則信息量越大。其數(shù)學(xué)表達(dá)式為:
H(X)=-∑P(ai)logP(ai) (i=1,2,…,n),∑P(ai)=1(1)
其中:P(ai)是ai事件發(fā)生的先驗(yàn)概率,H(X)為信息熵[13]。文中所有對(duì)數(shù)均以2為底,單位為:bit。
在地圖與地理信息領(lǐng)域,應(yīng)用Shannon信息熵原理度量信息量的關(guān)鍵在于空間分布概率P(ai)的定義與計(jì)算,目前定義空間目標(biāo)群分布概率的形式主要有:1)數(shù)量百分比,以每種地圖符號(hào)類型的數(shù)量在總的符號(hào)數(shù)量中所占的比例作為每種符號(hào)類型的概率。2)面積百分比,以每個(gè)地圖符號(hào)的面積占地圖總面積的百分比作為該符號(hào)的概率。數(shù)量百分比和面積百分比是Shannon信息熵原理在制圖領(lǐng)域的直接應(yīng)用。這兩種信息量并沒(méi)有考慮到地圖符號(hào)的空間分布。從制圖學(xué)的角度看,這種忽略符號(hào)空間分布來(lái)計(jì)算信息熵的方法是不合理的。Sukhov提出的符號(hào)信息熵[5,6]就屬于這一類。3)類型比率,按照某種分類指標(biāo),將地圖中的符號(hào)歸類,以每類符號(hào)類型占地圖符號(hào)總數(shù)量的比例作為該符號(hào)的概率。這種計(jì)算方法只考慮了統(tǒng)計(jì)意義上不同類型符號(hào)的分布,并沒(méi)有很好地顧及空間分布。Neumann提出的拓?fù)湫畔㈧豙7]屬于類型比率。4)基于Voronoi空間剖分的百分比,Voronoi圖是基于鄰近規(guī)則與空間競(jìng)爭(zhēng)效應(yīng)對(duì)空間目標(biāo)影響區(qū)域的剖分,是空間分布分析的有力工具[14]。基于Voronoi圖剖分的信息熵度量方法將符號(hào)所占有的Voronoi剖分單元(泰森多邊形面積)與總的面積之比作為該符號(hào)的分布概率,不僅反映了實(shí)體對(duì)空間占有的勢(shì)力劃分,同時(shí)也體現(xiàn)出地物之間的鄰接關(guān)系。
本研究即采用基于Voronoi空間剖分的百分比進(jìn)行信息量量算(圖1),對(duì)于點(diǎn)群目標(biāo)可直接構(gòu)建Voronoi圖;對(duì)于線群目標(biāo)可采用基于道路網(wǎng)絡(luò)連通圖最短路徑分析的Voronoi圖空間劃分方法構(gòu)建道路網(wǎng)的Voronoi圖[15];對(duì)于面群目標(biāo)可以采用基于骨架線連接得到的仿Voronoi圖的剖分結(jié)構(gòu)[16]。
限于篇幅本研究只討論面目標(biāo)的信息量變化規(guī)律。假設(shè)S是整個(gè)地圖區(qū)域,通過(guò)建立Voronoi圖,S被N個(gè)Voronoi區(qū)域Si覆蓋,i=1,2,…,N,N為整個(gè)地圖區(qū)域地圖符號(hào)個(gè)數(shù),則每個(gè)地圖符號(hào)的概率表示如下:
圖1 三種幾何實(shí)體的Voronoi圖
Fig.1 Voronoi diagram of three kinds of geometric entities
(2)
(3)
(4)
由上述公式可得出影響信息熵大小的因素有:地圖符號(hào)的數(shù)量和Voronoi空間分割均衡度。當(dāng)比較兩幅具有不同符號(hào)數(shù)量的地圖時(shí),可對(duì)式(4)做標(biāo)準(zhǔn)化處理:
HI(M)=H(M)/Hmax(M),Hmax(M)
(5)
移位是地圖綜合中處理各圖形目標(biāo)相互關(guān)系并解決空間沖突的基本方法,其目的是要保證地圖各圖形目標(biāo)總體結(jié)構(gòu)特征的適應(yīng)性,即與實(shí)地的相似性?!耙莆弧辈僮骺疾斓膶?duì)象是目標(biāo)對(duì)或目標(biāo)群。群目標(biāo)的綜合需顧及上下文環(huán)境的影響,既要考慮針對(duì)單個(gè)目標(biāo)的綜合約束,也要考慮在群結(jié)構(gòu)上整體空間分布規(guī)律的保持及統(tǒng)計(jì)特征維護(hù)等綜合約束。信息熵所衡量的是目標(biāo)的空間分布結(jié)構(gòu)的變化,影響信息熵大小的因素有地圖符號(hào)的數(shù)量和Voronoi空間分割均衡度。單一的移位操作不改變地圖符號(hào)的數(shù)量,進(jìn)行移位的同時(shí)要求保證目標(biāo)物的空間分布與原圖一致,即Voronoi空間分割均衡度保持不變。通過(guò)以上分析得出,由于影響信息熵大小的兩因素均保持不變,移位過(guò)程中信息熵需保持不變,或圍繞原圖信息熵上下微小波動(dòng)。多組手動(dòng)移位實(shí)驗(yàn)結(jié)果均顯示,信息熵變化符合上述規(guī)律。
根據(jù)移位前后信息熵變化規(guī)律對(duì)基于場(chǎng)論分析的兩種移位方法:?jiǎn)瘟υ匆莆粓?chǎng)模型[16]和多力源移位場(chǎng)[17]模型的移位結(jié)果進(jìn)行質(zhì)量評(píng)價(jià)。1)單力源移位場(chǎng)模型:街區(qū)塊多邊形邊界的收縮產(chǎn)生了向街區(qū)塊內(nèi)部逐步傳遞并衰減的作用力,建立移位場(chǎng)“等距離關(guān)系曲線”,在移位場(chǎng)中目標(biāo)的運(yùn)動(dòng)方向與運(yùn)動(dòng)距離由矢量和運(yùn)算及梯度衰減函數(shù)計(jì)算完成。2)多力源移位場(chǎng)模型:周啟等[17]提出的多力源移位場(chǎng)模型同時(shí)考慮外部擠壓時(shí)產(chǎn)生的外力和通過(guò)鄰近距離閾值探測(cè)空間沖突作為內(nèi)力發(fā)生源引發(fā)的內(nèi)力,通過(guò)計(jì)算外力與內(nèi)力的矢量和得到每個(gè)空間目標(biāo)最終移位的方向與偏移距離。如圖2所示,從移位后的Voronoi圖剖分結(jié)果看,可以明顯看出圖2c對(duì)應(yīng)的多力源場(chǎng)模型移位方法在滿足綜合約束條件上占優(yōu),尤其在處理空間沖突和保持空間相對(duì)位置關(guān)系上。圖2b中用虛線圈出了在移位過(guò)程中產(chǎn)生的空間沖突(A,B)及空間相對(duì)位置關(guān)系的變化(C,D),這些問(wèn)題在圖2c中均得到了較好的效果。
圖2 兩種移位方法結(jié)果對(duì)比
Fig.2 Comparison of two displacement results
以上的定性分析多依賴于制圖人員的認(rèn)知,從實(shí)驗(yàn)效果看,多力源移位場(chǎng)模型能夠更好地避免次生沖突。為了更直觀更準(zhǔn)確地表達(dá)移位前后空間分布的變化,本研究結(jié)合Shannon信息熵原理將空間分布的變化用信息熵作為指標(biāo)來(lái)衡量,考察移位偏移量與信息熵之間的關(guān)系,研究移位過(guò)程中信息熵變化規(guī)律??紤]到移位過(guò)程中不改變地圖符號(hào)的數(shù)量,采用式(2)、式(3)計(jì)算信息熵,并將實(shí)驗(yàn)結(jié)果呈現(xiàn)在表1中。
表1 實(shí)驗(yàn)結(jié)果
Table 1 Test results
Offse(mm)單力源移位場(chǎng)模型信息熵(bit)多力源移位場(chǎng)模型信息熵(bit)06.1434026.1434020.56.1391715.84149516.1333735.7952471.56.1296095.62900426.1326715.6830312.56.1271445.78944136.1241335.4103633.55.9899455.40926145.7131095.5379644.55.7589835.38739755.5098075.2649255.55.5695495.00711365.4893984.8772326.55.0177594.950177
對(duì)得到的實(shí)驗(yàn)結(jié)果進(jìn)行分析,針對(duì)移位信息熵變化規(guī)律,設(shè)定兩個(gè)指標(biāo)(表2):1)極差R:用以衡量信息熵波動(dòng)的范圍。波動(dòng)范圍愈小,即極差愈小愈好。2)標(biāo)準(zhǔn)差δ:用以衡量信息熵的波動(dòng)率。波動(dòng)率愈小,即標(biāo)準(zhǔn)差愈小愈好。
表2 實(shí)驗(yàn)結(jié)果比較
Table 2 Comparison of test results
方法原圖信息熵(bit)最小信息熵(bit)極差R標(biāo)準(zhǔn)差δ單力源移位場(chǎng)模型多力源移位場(chǎng)模型6.1434024.8772321.26617 0.3684745.0177591.1256430.353364
兩種方法所得到的信息熵均為衰減變化,并伴隨微小波動(dòng),從表1的實(shí)驗(yàn)數(shù)據(jù)中可以看出,多力源移位場(chǎng)模型信息熵相鄰狀態(tài)間變化相對(duì)單力源移位場(chǎng)模型較小,信息衰減量也較小。表2 中,多力源移位場(chǎng)模型的極差較小,標(biāo)準(zhǔn)差也較小,說(shuō)明其波動(dòng)范圍較小,波動(dòng)性也較小,相對(duì)穩(wěn)定,保證地圖內(nèi)容各圖形目標(biāo)總體結(jié)構(gòu)特征與實(shí)地的相似性。實(shí)驗(yàn)結(jié)果與最初的認(rèn)知分析結(jié)果一致,多力源移位場(chǎng)模型更好地保持了空間目標(biāo)的分布模式。兩種移位均產(chǎn)生了不同程度的信息熵衰減,制圖綜合過(guò)程總會(huì)伴隨著信息量的衰減,在實(shí)際操作過(guò)程中由于街區(qū)塊的壓縮和衰減移位距離函數(shù)的限制使得可支配的空間總面積減少,并且Voronoi剖分面積也趨向于均衡變化,差異性減小,這些變化均會(huì)導(dǎo)致信息熵衰減。
多邊形合并是建筑物群綜合的另一個(gè)重要環(huán)節(jié),鄰近關(guān)系是合并過(guò)程的重要依據(jù)。在空間尺度變化過(guò)程中,當(dāng)制圖物體的圖形及其間距小于可辨析距離時(shí)(面群目標(biāo)為圖上距離大于0.2 mm[18]),采用合并操作。多邊形的合并分為多邊形的鄰近分析和多邊形合并兩種情形。群目標(biāo)的綜合操作要考慮群體分布所隱含的空間結(jié)構(gòu)化信息,本研究采用基于最小支撐樹(shù)MST的聚類方法挖掘建筑物群的分布模式(圖3),通過(guò)改變合并間距,研究合并信息量的變化規(guī)律。對(duì)圖4中的街區(qū)進(jìn)行合并操作,并根據(jù)式(2)、式(4)計(jì)算不同的合并間距所得到的合并信息熵。對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行最小二乘三次多項(xiàng)式擬合(圖5),擬合優(yōu)度R2達(dá)0.9963,實(shí)驗(yàn)數(shù)據(jù)與擬合數(shù)據(jù)的分布基本一致。
圖3 基于最小支撐樹(shù)MST的建筑物分布群識(shí)別
Fig.3 Building cluster recognition based on MST
圖4 不同合并間距的合并結(jié)果
Fig.4 The aggregation result of different aggregation interval
圖5 合并信息量的擬合曲線
Fig.5 The fitting curve of aggregation information entropy
合并操作意味著刪除標(biāo)志輪廓間隔的那部分?jǐn)?shù)據(jù),合并目標(biāo)間的細(xì)部,使得地圖目標(biāo)空間占據(jù)面積增大,區(qū)域劃分減少,制圖物體的數(shù)量也減少,信息量減少。從實(shí)驗(yàn)結(jié)果擬合曲線上可以清楚地看到信息量損失速率(即擬合曲線的斜率)逐漸減小,頭尾緩變,中間突變,并且有明顯的拐點(diǎn),呈現(xiàn)反“S”形曲線的特征。圖5中A區(qū)和C區(qū)比較平緩,B區(qū)有明顯的線性衰減的特征,在A區(qū),由于合并間距小于0.2 mm,小于可辨析距離,地圖目標(biāo)的所有細(xì)節(jié)基本保留;當(dāng)合并間距超過(guò)了0.2 mm,進(jìn)入B區(qū),低層次的細(xì)節(jié)均需要合并,合并信息熵受合并間距的影響逐漸增大;到達(dá)C區(qū)后,由于地圖目標(biāo)數(shù)量和低層次細(xì)節(jié)的減少,此時(shí)已經(jīng)探測(cè)不到低層次細(xì)節(jié)的信息,曲線也趨近于平緩變化。
本研究將信息傳輸理論與制圖綜合過(guò)程結(jié)合,并基于空間目標(biāo)群的Voronoi圖剖分建立語(yǔ)法信息熵度量。以空間尺度變換中的移位、合并兩種典型操作為案例,研究了面狀目標(biāo)群尺度變換中信息量衰減的初步規(guī)律。移位過(guò)程中信息熵保持在原圖信息熵上下微小波動(dòng),伴隨移位程度的加深做緩慢衰減。合并則呈現(xiàn)反“S”形衰減變化的特征。以移位為例,基于信息量衰減規(guī)律對(duì)兩種移位算法進(jìn)行了質(zhì)量評(píng)價(jià),并得到了可行可信的結(jié)果。
本研究的實(shí)驗(yàn)對(duì)象均為面狀目標(biāo),下一步將拓寬尺度變換操作(化簡(jiǎn)、夸大、選取)和目標(biāo)對(duì)象(點(diǎn)目標(biāo)、線目標(biāo)),總結(jié)歸納一般意義上的尺度變化導(dǎo)致信息量變化的規(guī)律,從而為地圖綜合方法質(zhì)量評(píng)價(jià)提供評(píng)判依據(jù)。
[1] GOODCHILD M F,GUO H,ANNONI A,et al.Next-generation digital earth[J].Proceedings of the National Academy of Sciences,2012,109(28):11088-11094.
[2] T?PFER F,PILLEWIZER W.The principles of selection:A means of cartographic generalization[J].The Cartographic Journal,1966,3(1):10-16.
[3] KLIR G J,FOLGER T A.Fuzzy Sets,Uncertainty,and Information[M].New York:Prentice Hall,1988.
[4] SHANNON C E.Mathematical theory of communication[J].The Bell System Technical Journal,1948,27:379-423,623-656.
[5] SUKHOV V I.Information capacity of a map entropy[J].Geodesy and Aero Photography,1967,X:212-215.
[6] SUKHOV V I.Application of information theory in generalization of map contents[J].International Yearbook of Cartography,1970,X:41-47.
[7] NEUMANN J.The topological information content of a map/an attempt at a rehabilitation of information theory in cartography[J].Cartographica:The International Journal for Geographic Information and Geovisualization,1994,31(1):26-34.
[8] BJO/RKE J T.Framework for entropy-based map evaluation[J].Cartography and Geographic Information Systems,1996,23(2):78-95.
[9] LI Z,HUANG P.Quantitative measures for spatial information of maps[J].International Journal of Geographical Information Science,2002,16(7):699-709.
[10] HARRIE L,STIGMAR H.An evaluation of measures for quantifying map information[J].ISPRS Journal of Photogrammetry and Remote Sensing,2010,65(3):266-274.
[11] STIGMAR H,HARRIE L.Evaluation of analytical methods to describe map readability[J].Cartographic Journal,2011,48(1):41-53.
[12] 艾廷華.基于空間映射觀念的地圖綜合概念模式[J].測(cè)繪學(xué)報(bào),2003,32(1):87-92.
[13] 鐘義信.信息科學(xué)原理[M].北京:北京郵電大學(xué)出版社,1996.
[14] GOLD C M.Problems with handling spatial data-the Voronoi approach[J].CISM Journal,1991,45(1):65-80.
[15] 謝順平,馮學(xué)智,魯偉.基于道路網(wǎng)絡(luò)分析的Voronoi面域圖構(gòu)建算法[J].測(cè)繪學(xué)報(bào),2010,39(2):88-94.
[16] 艾廷華.基于場(chǎng)論分析的建筑物群的移位[J].測(cè)繪學(xué)報(bào),2004,33(1):89-94.
[17] 周啟,艾廷華,張翔.面向多重空間沖突解決的移位場(chǎng)模型[J].測(cè)繪學(xué)報(bào),2013,42(4):615-620.
[18] 祝國(guó)瑞.地圖學(xué)[M].武漢:武漢大學(xué)出版社,2003.226.
Information Entropy Change in GIS Data Scale Transformation
AI Ting-hua,HE Ya-kun,DU Xin
(SchoolofResourceandEnvironmentalSciences,WuhanUniversity,Wuhan430079,China)
The information representation of GIS data belongs to the syntactic field in linguistic information system.It is based on the Shannon information theory and describes the uncertainty of spatial distributions which is related to the spatial layouts and associations.This study applies the measure of information entropy to investigate how the spatial data syntactic information changes in scale transformations and tries to detect the principles of information variation in map generalization.The entropy measure is based on the Voronoi cells of the object cluster partitioning.This study explores the law of information reduction in scale transformations by two typical generalization operators:displacement and aggregation.And this study tries to use these findings to evaluate the quality of map generalization.
spatial scale transformations;information entropy;map generalization;Voronoi diagram
2014-07-21;
2014-09-13
國(guó)家測(cè)繪地理信息局重點(diǎn)實(shí)驗(yàn)室開(kāi)放基金(KLM201304)
艾廷華(1969-),男,教授,博士生導(dǎo)師,研究方向?yàn)榈貓D綜合和空間認(rèn)知。E-mail:tinghua_ai@tom.com
10.3969/j.issn.1672-0504.2015.02.002
P208
A
1672-0504(2015)02-0007-05