李進(jìn)強(qiáng),王會(huì)珠
(1. 閩江學(xué)院地理科學(xué)系,福建 福州 350108; 2. 清華山維新技術(shù)開(kāi)發(fā)公司, 北京 100084)
Research on the Spatial Classification Matching Model Based on
Fuzzy Reasoning Rules
LI Jinqiang,WANG Huizhu
?
基于多元模糊推理的空間分類(lèi)匹配模型研究
李進(jìn)強(qiáng)1,王會(huì)珠2
(1. 閩江學(xué)院地理科學(xué)系,福建 福州 350108; 2. 清華山維新技術(shù)開(kāi)發(fā)公司, 北京 100084)
Research on the Spatial Classification Matching Model Based on
Fuzzy Reasoning Rules
LI Jinqiang,WANG Huizhu
摘要:空間分類(lèi)匹配是智能GIS研究領(lǐng)域的熱點(diǎn)問(wèn)題,具有重要的理論和實(shí)踐意義。本文深入分析了現(xiàn)有匹配技術(shù)的不足,提出了基于模糊推理規(guī)則進(jìn)行空間分類(lèi)匹配的通用算法框架,并重點(diǎn)解決了指標(biāo)集的“模糊隸屬度”轉(zhuǎn)化問(wèn)題,對(duì)其正確性和實(shí)用性在ArcGIS 9.3平臺(tái)上進(jìn)行了驗(yàn)證。
關(guān)鍵詞:空間分類(lèi)匹配;模糊推理;GIS
一、引言
空間分類(lèi)匹配是智能GIS的核心技術(shù)之一, 可廣泛用于空間數(shù)據(jù)庫(kù)更新、多源空間數(shù)據(jù)集成、多尺度空間數(shù)據(jù)庫(kù)變化信息發(fā)現(xiàn)與同步分發(fā)等方面,受到業(yè)界高度關(guān)注。
1. 空間分類(lèi)匹配研究現(xiàn)狀
所謂空間分類(lèi)匹配,是通過(guò)分析兩個(gè)數(shù)據(jù)集(新舊版本)中空間目標(biāo)的差異與相似性,識(shí)別出不同數(shù)據(jù)集中表達(dá)現(xiàn)實(shí)世界同一地理要素的空間目標(biāo),確定不同時(shí)期、不同尺度的同名地物是否發(fā)生變化[1]。
(1) 空間匹配流程分析
1) 確定集候選:在待匹配的兩個(gè)數(shù)據(jù)集中,以其中一個(gè)作為參考,在另一個(gè)數(shù)據(jù)集中作空間查詢(xún),得到待匹配的候選對(duì)象集。
2) 計(jì)算評(píng)價(jià)指標(biāo):如幾何相似度(形狀、位置、方向、長(zhǎng)度或大小等)、空間關(guān)系相似度、語(yǔ)義相似度等。
3) 多指標(biāo)合成:即綜合語(yǔ)義、幾何、拓?fù)涞榷鄠€(gè)匹配指標(biāo)。一種做法是順序使用各種匹配指標(biāo),排除一些不可能目標(biāo),這種策略需要為每一個(gè)指標(biāo)確定一個(gè)閾值,且匹配結(jié)果可能與匹配順序有關(guān)。另一種做法是對(duì)評(píng)價(jià)指標(biāo)進(jìn)行綜合計(jì)算,得出結(jié)論。顯然,第二種方法更加科學(xué)合理。
(2) 研究現(xiàn)狀分析
① 評(píng)價(jià)指標(biāo)研究現(xiàn)狀
形狀相似度計(jì)算是幾何評(píng)價(jià)指標(biāo)計(jì)算中的難點(diǎn),目前已有許多研究成果,如Hausdorff距離、Fourier描述子[2]、夾角鏈碼法[3]、正切空間(轉(zhuǎn)向角函數(shù)法)[4]、最大基因組比對(duì)法等,位置和方位指標(biāo)可通過(guò)計(jì)算圖形的二階不變矩[5]或進(jìn)行趨勢(shì)分析得到,這些方法側(cè)重點(diǎn)各不相同。
在空間關(guān)系計(jì)算方面,Egenhofer等提出的九交模型來(lái)描述實(shí)體與實(shí)體之間的拓?fù)潢P(guān)系[6]。丁虹在Egenhofer和AI-Taha基礎(chǔ)上建立了面的8種拓?fù)潢P(guān)系的差異矩陣[7],確定拓?fù)潢P(guān)系的強(qiáng)弱程度。張橋平等在Winter形態(tài)距離(morphological distance)概念上,提出了針對(duì)不同數(shù)據(jù)源的面目標(biāo)(集)模糊拓?fù)潢P(guān)系[8]。
由于語(yǔ)義匹配在很大程度上依賴(lài)于屬性數(shù)據(jù)結(jié)構(gòu)及屬性信息的完整性,往往缺少唯一標(biāo)識(shí)的屬性數(shù)據(jù)[1],或由于說(shuō)明文件的缺失等導(dǎo)致語(yǔ)義理解困難,語(yǔ)義相似度計(jì)算失去實(shí)用性。
② 多指標(biāo)合成研究現(xiàn)狀
Walter & Fritsch 提出基于概率統(tǒng)計(jì)的匹配方法,通過(guò)區(qū)域統(tǒng)計(jì)確定匹配閾值,最后利用信息論的優(yōu)勢(shì)函數(shù)確定匹配結(jié)果。童小華等為克服Walter & Fritsch法計(jì)算效率低下的缺點(diǎn),提出基于理論概率的多指標(biāo)融合匹配算法[9],其主要優(yōu)點(diǎn)是受閾值的影響較小。
熊天星將模糊綜合評(píng)判引入面實(shí)體匹配[10],綜合面質(zhì)心幾何距離法、面實(shí)體之間模糊拓?fù)潢P(guān)系、轉(zhuǎn)向角函數(shù)法3種方法。
③ 非一對(duì)一匹配模式
趙彬彬等對(duì)不同類(lèi)型(點(diǎn)、線(xiàn)、面)、不同尺度(較大、較小比例尺)空間目標(biāo)之間的多種匹配模式進(jìn)行了討論,并用信息傳輸模型對(duì)1:N、N:1、M:N進(jìn)行目標(biāo)相似度計(jì)算[11]。
2. 現(xiàn)有研究的不足
從上述分析可以看出,除語(yǔ)義相似度及非一對(duì)一匹配模式研究程度不足外,多指標(biāo)融合模型存在如下問(wèn)題:
1) 指標(biāo)體系缺乏系統(tǒng)性,即指標(biāo)不夠全面,或沒(méi)有從空間匹配的不同角度進(jìn)行系統(tǒng)考慮。
2) 合成模型理論依據(jù)不足,如基于概率的匹配方法,其匹配程度是否符合概率分布,概率值如何計(jì)算等。
3) 單一指標(biāo)可信度和合成權(quán)重對(duì)匹配結(jié)果影響很大,但已有研究大多沒(méi)有合理的交代。
二、多元模糊推理模型
由于使用不同精度的采集方法、不同的參考系、不同概念/語(yǔ)義模型,以及現(xiàn)實(shí)世界時(shí)刻發(fā)生著變化(人工改造或自然變遷),使得兩個(gè)數(shù)據(jù)集之間存在著不確定性[8],模糊數(shù)學(xué)為解決這類(lèi)問(wèn)題提供了有效工具。
1. 模糊推理規(guī)則
設(shè)模糊集U=(u1,u2,…,un),V=(v1,v2,…,vm),令R為U到V的模糊關(guān)系矩陣,R=(rij)n×m,rij表示ui到vj為真的可信度。A=(a1,a2,…,an),B=(b1,b2,…,bm)分別表示U和V的模糊子集,則稱(chēng)模糊變換
B=A·R
(1)
由于涉及多個(gè)因素,故又稱(chēng)多元模糊推理。
2. 多元模糊推理匹配模型
(1) 指標(biāo)集
指標(biāo)體系的好壞可從如下3個(gè)方面考量:
1) 指標(biāo)的選取要有系統(tǒng)性,即指標(biāo)集能夠從多個(gè)角度較全面地反映空間對(duì)象的異同。
2) 指標(biāo)與匹配結(jié)果嚴(yán)格相關(guān),即指標(biāo)越好越能得到肯定的匹配結(jié)果。
3) 指標(biāo)內(nèi)涵不交叉重復(fù)。
重疊度作為預(yù)匹配是一個(gè)比較好的指標(biāo),但其中包含形狀、距離、大小、拓?fù)潢P(guān)系等指標(biāo)概念交叉。另外,形狀越相似,大小越接近,因此不宜同時(shí)選用形狀相似度和大小相似度。
本文建議采用的指標(biāo)集見(jiàn)表1。
表1 模糊關(guān)系矩陣
(2) 評(píng)判集
理論上評(píng)判集可包含任意多個(gè)元素,但元素太多,易造成模糊關(guān)系矩陣太復(fù)雜,因此在能夠滿(mǎn)足要求的前提下,評(píng)判集元素應(yīng)盡可能少,本文取V={A,B,C},包含3個(gè)元素,含義分別是:A表示“匹配”;B表示“不匹配”;C表示“未知”。
(3) 模糊關(guān)系矩陣
模糊關(guān)系矩陣R 可表示為表1,其中rij表示由U到V為真的隸屬度。
三、空間模糊度轉(zhuǎn)化計(jì)算
確定模糊關(guān)系矩陣(隸屬度)是進(jìn)行模糊推理的關(guān)鍵,下面介紹將指標(biāo)值轉(zhuǎn)化為模糊隸屬度的方法。
1. 形狀相似隸屬度轉(zhuǎn)化
形狀相似度計(jì)算一般符合如下規(guī)則:
1) 具有平移、旋轉(zhuǎn)不變性,即形狀相似度不受平移旋轉(zhuǎn)的影響,縮放因子則可以忽略。
2) 兩個(gè)要素的形狀相似度必須與其匹配程度成嚴(yán)格單調(diào)性,即越相似的匹配度越高,越不相似的匹配度越低。
3) 取值在0~1,越接近0越不相似,越接近1越相似,0.5屬于最模糊狀態(tài)。
設(shè)形狀相似度為x,評(píng)判 A、B、C相應(yīng)的隸屬函數(shù)分別為μA(x)、μB(x)、μC(x)。因?yàn)锽是A的補(bǔ)集,因此μB(x)=1-μA(x);C是表達(dá)A/B之間最模糊地帶,如果A隸屬函數(shù)與參數(shù)x呈線(xiàn)性關(guān)系, μC(x)可表示為μA(x)的三角型隸屬關(guān)系(如圖1所示), 即有
(2)
圖1
2. 空間距離隸屬度轉(zhuǎn)化
距離指標(biāo)可使用空間目標(biāo)重心之間的歐氏距離,或通過(guò)平移旋轉(zhuǎn)將兩個(gè)空間目標(biāo)相互對(duì)齊,獲得平移量,假設(shè)δ為空間距離s的標(biāo)準(zhǔn)差(δ可根據(jù)采集精度、成圖比例尺等因素確定),本文采用正態(tài)隸屬度函數(shù)模型
s∈[0, 2δ]表示明顯支持隸屬于同名地物的區(qū)域;s∈[3δ,∞]表示明顯不支持隸屬于同名地物的區(qū)域;s∈[2δ, 3δ]是過(guò)渡區(qū)域, s=2.5δ是最模糊狀態(tài),隸屬度≈0.5。
μC(s)中心位置μ=2.5δ,參數(shù)k盡量接近μA對(duì)應(yīng)的三角型隸屬關(guān)系。
綜合考慮后,得隸屬函數(shù)如下
(3)
3. 相對(duì)方位隸屬度轉(zhuǎn)化
公認(rèn)的8個(gè)方位分別為:東、南、西、北、東南、西
北、西南、東北,如圖2所示。
圖2
假設(shè)T1、T2分別表示待匹配空間目標(biāo)的方向角,相對(duì)方位角可用T=A2-A1進(jìn)行計(jì)算,取值范圍為[-90°,90°]。
1) |T|=0°,方位隸屬度應(yīng)等于1。
2) |T|≥45°,因?yàn)椤皷|”在[-45°,45°]之間,方位隸屬度應(yīng)等于0。
3) |T|= 22.5°是最模糊的狀態(tài),方位隸屬度=0.5。
以下三角函數(shù)表示的方位隸屬度函數(shù)恰好滿(mǎn)足上述要求
(4)
4. 拓?fù)潢P(guān)系隸屬度轉(zhuǎn)化
丁虹在Egenhofer和AI-Taha基礎(chǔ)上建立了8種拓?fù)潢P(guān)系的差異矩陣確定拓?fù)潢P(guān)系的強(qiáng)弱程度,差異矩陣從相離(無(wú)關(guān))到相等共分為9個(gè)等級(jí)(0-8),實(shí)質(zhì)上反映了空間目標(biāo)是否匹配的可信度。
本文采用模糊層次分析法,將差異矩陣轉(zhuǎn)化為相應(yīng)的隸屬度:
1) 將差異矩陣改造成1—9度重要性正反矩陣,方法是將差異矩陣上三角元素全部+1,使得自身對(duì)自身的重要度比為1∶1,然后改寫(xiě)為比例形式,下三角部分取反(見(jiàn)表2)。
表2 重要性正反矩陣
根據(jù)文獻(xiàn)[8]研究,包含與被包含,往往意味著兩空間目標(biāo)是非同名實(shí)體,可能是變更引起的,如房屋拆遷后在原位置重蓋。而覆蓋和被覆蓋,往往說(shuō)明兩空間目標(biāo)是同名實(shí)體,因此,“包含”與“被包含”兩列數(shù)據(jù)沒(méi)有+1。
2) 按公式 0.5+log81rij將表2轉(zhuǎn)換為模糊互補(bǔ)矩陣。
3) 利用式(5)求取權(quán)重向量wi(j=1,2,…,n)
(5)
4) 求隸屬度,即μA(j)=wi/max(wi),同樣求μB(j)、 μC(j)。結(jié)果見(jiàn)表3。
表3 拓?fù)潢P(guān)系權(quán)值向量與隸屬度表
5. 語(yǔ)義相似度隸屬度轉(zhuǎn)化
文本型字段相似度采用基于分詞的中文文本相似度計(jì)算法,數(shù)值型字段相似度采用差異距離法,最后將所有字段相似度進(jìn)行綜合求得整體相似度,相應(yīng)的隸屬度函數(shù)和前文基本相同。
6. 指標(biāo)權(quán)重的確定
權(quán)重向量與應(yīng)用類(lèi)型相關(guān),本文針對(duì)1∶500空間數(shù)據(jù)更新,對(duì)10位專(zhuān)家進(jìn)行問(wèn)卷調(diào)查,按“0.5—1.0”標(biāo)度法統(tǒng)計(jì)得出各指標(biāo)重要性系數(shù),然后采用模糊層次分析法求取權(quán)重向量,結(jié)果見(jiàn)表4。
表4 指標(biāo)重要系數(shù)表
7. 計(jì)算舉例
有新舊數(shù)據(jù)集目標(biāo)對(duì),評(píng)價(jià)指標(biāo)為:u1=0.850, u2=0.624 m(δ=0.2 m 計(jì)算),u3=12°,u4=“相交”,u5=0.777,得到模糊關(guān)系矩陣
為保留所有信息不被遺漏,采用加權(quán)算子進(jìn)行矩陣合成運(yùn)算
B=W·R=[0.6540.3470.471]
根據(jù)最大隸屬度原則,可判定待匹配目標(biāo)屬于同名對(duì)象。
四、實(shí)例驗(yàn)證
為驗(yàn)證匹配模型的正確性,筆者利用ArcGIS Engine 9.3+Visual C#,開(kāi)發(fā)匹配程序模塊,然后掛接到福州市空間資源數(shù)據(jù)庫(kù)同步系統(tǒng)上進(jìn)行驗(yàn)證。
1. 試驗(yàn)環(huán)境
同步系統(tǒng)可按指定時(shí)間將生產(chǎn)庫(kù)中的變化信息同步到應(yīng)用庫(kù)。本次試驗(yàn)的生產(chǎn)庫(kù)為1∶500空間數(shù)據(jù)庫(kù),該系統(tǒng)對(duì)1∶500數(shù)據(jù)進(jìn)行不間斷的修測(cè)。應(yīng)用庫(kù)采用Oracle 9i+ArcSDE 9.3臨時(shí)搭建,入庫(kù)數(shù)據(jù)是福州大學(xué)城周邊地區(qū),面積約20 km2。
同步系統(tǒng)啟動(dòng)后,先提取1∶500生產(chǎn)庫(kù)中更新區(qū)域的數(shù)據(jù),再送交匹配程序與應(yīng)用庫(kù)的相同區(qū)域進(jìn)行匹配,最后根據(jù)匹配結(jié)果對(duì)應(yīng)用庫(kù)進(jìn)行更新。以上過(guò)程由同步控制器進(jìn)行控制,每天晚上0點(diǎn)自動(dòng)執(zhí)行一次。
2. 匹配指標(biāo)計(jì)算方法
對(duì)于自然變遷數(shù)據(jù)層,形狀相似度采用Fourier描述子計(jì)算,距離和方位指標(biāo)采用不變矩法計(jì)算;對(duì)于人工地物數(shù)據(jù)層, 形狀相似度采用最大基因組比對(duì)法進(jìn)行計(jì)算,同時(shí)獲得距離和方位指標(biāo)值。拓?fù)潢P(guān)系采用ArcGIS Engine 拓?fù)溥\(yùn)算接口計(jì)算。另外,為簡(jiǎn)化計(jì)算,語(yǔ)義相似度僅考慮變化字段與不變化字段的數(shù)量比例。
3. 試驗(yàn)結(jié)果
經(jīng)過(guò)分析統(tǒng)計(jì)程序連續(xù)運(yùn)行一個(gè)月的匹配記錄,去除不在有效區(qū)域內(nèi)的內(nèi)容(16 d),以及新增地物、消亡地物和未變化的地物,共成功匹配新舊版本同名變化對(duì)象:點(diǎn)87個(gè),線(xiàn)230個(gè),面115個(gè),匹配準(zhǔn)確率達(dá)到91.5%。試驗(yàn)結(jié)果表明, 本文提出的匹
配方法針對(duì)性強(qiáng)、準(zhǔn)確率高,能有效發(fā)現(xiàn)新舊版本變化信息,可作為空間數(shù)據(jù)更新的關(guān)鍵技術(shù)。
五、結(jié)論與展望
本文采用空間信息科學(xué)與模糊集理論相結(jié)合的分析方法,對(duì)空間分類(lèi)匹配問(wèn)題進(jìn)行深入研究,主要結(jié)論如下:
1) 本文基于模糊推理規(guī)則,為空間匹配提供了通用的算法框架。
2) 綜合運(yùn)用半經(jīng)驗(yàn)半理論分析法和模糊層次分析法等,解決了各指標(biāo)“隸屬度”轉(zhuǎn)化問(wèn)題,使計(jì)算模型兼?zhèn)淞己玫睦碚撔院蛯?shí)用性。
3) 基于該算法框架,可實(shí)現(xiàn)庫(kù)對(duì)庫(kù)增量變化自動(dòng)提取,為數(shù)據(jù)更新、變化率統(tǒng)計(jì)提供了理論基礎(chǔ)。
本文研究成果在ArcGIS 9.3平臺(tái)上進(jìn)行了驗(yàn)證,可為同類(lèi)型空間數(shù)據(jù)庫(kù)更新維護(hù)、多源數(shù)據(jù)融合等人員借鑒和參考。
參考文獻(xiàn):
[1]徐楓,鄧敏,趙彬彬,等.空間目標(biāo)匹配方法的應(yīng)用分析[J].地球信息科學(xué)學(xué)報(bào),2009, 11(5):657-663.
[2]王濤,劉文印.傅立葉描述子識(shí)別物體的形狀[J].計(jì)算機(jī)研究與發(fā)展, 2002, 13(12):1715-1718.
[3]趙宇,陳雁秋.曲線(xiàn)描述的一種方法:夾角鏈碼[J].軟件學(xué)報(bào), 2004, 15(2):300-307.
[4]付忠良,邵世雄,童春芽.基于正切空間的多尺度面實(shí)體形狀匹配[J].計(jì)算機(jī)工程, 2010, 36(17):216-217.
[5]曹明.不變矩在矢量圖形識(shí)別中的應(yīng)用[D].大連:大連理工大學(xué),2008:14-16.
[6]EGENHOFER M,AI-TAHA K.Reasoning about Gradual Change of Topological Relationship[J].Lecture Note in Computer Science,1992(639):196-219.
[7]丁虹.空間相似性理論與計(jì)算模型的研究[D].武漢:武漢大學(xué),2004:13-34.
[8]張橋平,李德仁,龔健雅.城市地圖數(shù)據(jù)庫(kù)面實(shí)體匹配技術(shù)[J].遙感學(xué)報(bào), 2004, 8(2):107-112.
[9]童小華,鄧愫愫,史文中.基于概率的地圖實(shí)體匹配方法[J].測(cè)繪學(xué)報(bào), 2007, 36(2):210-217.
[10]熊天星.模糊綜合評(píng)判在面實(shí)體匹配中的應(yīng)用研究[J].長(zhǎng)江大學(xué)學(xué)報(bào), 2013, 10(25):23-27.
[11]趙彬彬.多尺度矢量地圖空間目標(biāo)匹配方法及其應(yīng)用研究[D].長(zhǎng)沙:中南大學(xué),2011:70-77.引文格式: 張弓同,李四海,焦紅波,等. LiDAR點(diǎn)云生成DEM的水面置平方法研究與實(shí)現(xiàn)[J].測(cè)繪通報(bào),2015(6):61-64.DOI:10.13474/j.cnki.11-2246.2015.0179
引文格式:李進(jìn)強(qiáng),王會(huì)珠. 基于多元模糊推理的空間分類(lèi)匹配模型研究[J].測(cè)繪通報(bào),2015(6):49-52.DOI:10.13474/j.cnki.11-2246.2015.0176
作者簡(jiǎn)介:李進(jìn)強(qiáng)(1962—),男,碩士,教授,主要從事地理空間數(shù)據(jù)庫(kù)開(kāi)發(fā)與應(yīng)用等方面的教學(xué)與研究。E-mail:1361639771@qq.com
基金項(xiàng)目:福建省測(cè)繪地理信息局2013年科技計(jì)劃項(xiàng)目(2013M15)
收稿日期:2014-08-27
中圖分類(lèi)號(hào):P208
文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):0494-0911(2015)06-0049-04