晏雄鋒,袁 拓,楊 敏,孔 博,劉鵬程
1. 同濟(jì)大學(xué)測(cè)繪與地理信息學(xué)院,上海 200092; 2. 武漢大學(xué)資源與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079; 3. 華中師范大學(xué)城市與環(huán)境科學(xué)學(xué)院,湖北 武漢 430079
化簡(jiǎn)是矢量建筑物數(shù)據(jù)處理的基礎(chǔ)性操作之一,其目的在于移除建筑物邊界上的凹凸細(xì)節(jié)特征,從而滿足制圖表達(dá)的要求。在制圖綜合領(lǐng)域形狀化簡(jiǎn)是建筑物尺度變換的主要算子之一,廣泛應(yīng)用于多比例尺地形圖縮編、三維城市建模、導(dǎo)航地圖生成與更新等諸多應(yīng)用[1]。此外,該變換操作也是影像數(shù)據(jù)提取矢量建筑物的后處理環(huán)節(jié)之一[2]。從遙感影像中提取的建筑物輪廓通常難以直接用于制圖表達(dá),存在弱直角和冗余點(diǎn)等問題,需要運(yùn)用化簡(jiǎn)方法進(jìn)行去噪和規(guī)則化處理。
建筑物化簡(jiǎn)過程不僅需要控制位置偏移,而且要盡量保持目標(biāo)原有的形狀、大小、方向及正交性特征。對(duì)此,學(xué)者們?cè)O(shè)計(jì)了不同類型的建筑物化簡(jiǎn)算法。第一類算法注重局部特征的探測(cè)與簡(jiǎn)化處理,包括短邊剔除法[3-4]、凹凸特征探測(cè)與漸進(jìn)式刪除法[5-7]、鄰近四點(diǎn)法[8]等,還引入最小二乘[9-11]、整數(shù)規(guī)劃[12]等優(yōu)化技術(shù)提升短邊或者局部凹凸特征處理的合理性。第二類算法強(qiáng)調(diào)建筑物化簡(jiǎn)前后整體結(jié)構(gòu)的保持,包括迭代法[13]和模板匹配法[14-15],主要面向具有特殊形狀的建筑物目標(biāo)。此外,一些學(xué)者借助數(shù)學(xué)形態(tài)學(xué)[16-17]以及圖像處理技術(shù)[18-19]設(shè)計(jì)建筑物化簡(jiǎn)方法。上述算法設(shè)計(jì)的角度或采用的策略不同,面向不同形狀的建筑物具有各自的適應(yīng)范圍和局限性。由于同一區(qū)域建筑物在幾何形態(tài)上往往存在多樣性,單一算法難以合理地化簡(jiǎn)所有建筑物目標(biāo)。
破解上述難題的思路之一是將不同算法集成形成組合式化簡(jiǎn)模型[20-22],使得每個(gè)建筑物目標(biāo)能夠依據(jù)自身形狀特點(diǎn)自適應(yīng)匹配適宜的化簡(jiǎn)算法。文獻(xiàn)[21]較早開展相關(guān)研究,通過幾何特征分析識(shí)別規(guī)則形狀和不規(guī)則形狀的建筑物,分別采用矩形擬合、直角化處理、短邊剔除等不同化簡(jiǎn)操作,能較好地保持局部結(jié)構(gòu)模式,但缺乏整體結(jié)構(gòu)上的分析視角。文獻(xiàn)[22]提出一種基于評(píng)價(jià)策略的混合式化簡(jiǎn)方法,根據(jù)化簡(jiǎn)前后位置、方向、面積、形狀等指標(biāo)變化從多種算法產(chǎn)生的候選方案中挑選最佳化簡(jiǎn)結(jié)果。該方法以結(jié)果為導(dǎo)向能夠相對(duì)平衡地考慮多種化簡(jiǎn)指標(biāo)要求,但是缺乏對(duì)形狀特征的深層次認(rèn)知。為此,本文提出一種深度學(xué)習(xí)支持下的形狀自適應(yīng)建筑物化簡(jiǎn)方法。該方法建立在對(duì)建筑物形狀的整體結(jié)構(gòu)認(rèn)知和表達(dá)上,主要包括兩個(gè)步驟:①構(gòu)建一種基于圖結(jié)構(gòu)的卷積自編碼網(wǎng)絡(luò),提取隱含在邊界節(jié)點(diǎn)分布上的形狀特征,并將建筑物形狀表達(dá)為一組特征向量,從而實(shí)現(xiàn)對(duì)建筑物的形狀特征表達(dá);②采用機(jī)器學(xué)習(xí)分類的方法,在有監(jiān)督的學(xué)習(xí)訓(xùn)練下建立形狀編碼與不同化簡(jiǎn)算法之間的映射關(guān)系,從而實(shí)現(xiàn)依據(jù)輸入建筑物的形狀特征選擇適宜化簡(jiǎn)算法的自適應(yīng)機(jī)制。
建筑物的形狀特征表達(dá)是化簡(jiǎn)動(dòng)作實(shí)施的基礎(chǔ),主要包括兩個(gè)部分:建筑物圖結(jié)構(gòu)構(gòu)建及特征提取與建筑物形狀的自編碼學(xué)習(xí)模型。
圖是一種表達(dá)對(duì)象及其關(guān)聯(lián)關(guān)系的數(shù)據(jù)結(jié)構(gòu),定義為G=(V,E,W),其中節(jié)點(diǎn)集合V={v1,v2,…,vn}表示對(duì)象,E為連接節(jié)點(diǎn)的邊集合,W記錄邊的權(quán)值。每個(gè)圖節(jié)點(diǎn)可包含p個(gè)描述特征,構(gòu)成特征矩陣f∈Rn×p。對(duì)于建筑物多邊形的圖表達(dá),可將邊界節(jié)點(diǎn)作為圖節(jié)點(diǎn),邊界直線段對(duì)應(yīng)連接圖節(jié)點(diǎn)的邊[23]??紤]到建筑物邊界序列中間隔很遠(yuǎn)的節(jié)點(diǎn)也可能位置接近而存在視覺聯(lián)系,本文采用Delaunay三角網(wǎng)建立邊界節(jié)點(diǎn)間的空間鄰近關(guān)系,將建筑物多邊形內(nèi)部三角形邊作為圖的連接邊,如圖1所示。
圖1 建筑物邊界預(yù)處理與圖結(jié)構(gòu)表達(dá)Fig.1 Preprocessing and graph-based representation for building boundary
不同建筑物間的節(jié)點(diǎn)數(shù)量和密度可能存在差異,因此需要進(jìn)行冗余點(diǎn)剔除和內(nèi)插加密預(yù)處理,以保證邊界節(jié)點(diǎn)分布均衡性以及數(shù)量一致性。冗余點(diǎn)剔除主要目的是去除分布密集且對(duì)建筑物形狀結(jié)構(gòu)貢獻(xiàn)度低的節(jié)點(diǎn),采用Douglas-Peucker(DP)算法完成。其中,DP算法設(shè)置的矢高閾值需十分保守(例如0.01~0.05 m,以保證不能丟失關(guān)鍵的形狀特征點(diǎn)。加密處理采用弧段內(nèi)均勻插值方法,使得內(nèi)插后節(jié)點(diǎn)數(shù)量達(dá)到預(yù)設(shè)固定值,該值依據(jù)剔除冗余點(diǎn)后建筑物節(jié)點(diǎn)的數(shù)量分布以及模型中特征圖數(shù)量和池化層數(shù),本文設(shè)為64。
圖2 建筑物邊界節(jié)點(diǎn)的上下文特征提取Fig.2 Feature extraction of building boundary nodes using shape context descriptor
本文參考U-net架構(gòu)[24],設(shè)計(jì)一種圖的自編碼學(xué)習(xí)模型分析上述構(gòu)建的建筑物圖結(jié)構(gòu),輸入即鄰接矩陣W64×64和節(jié)點(diǎn)特征f64×24。模型由編碼器(encoder)和解碼器(decoder)組成。其中,編碼器包含一個(gè)卷積層和兩個(gè)池化層,將輸入的64×24維的建筑物形狀特征編碼為32維向量。解碼器則由兩個(gè)上采樣層和一個(gè)卷積層構(gòu)成,將32維編碼向量恢復(fù)原始尺寸和特征維度。由于編碼過程中壓縮和提取特征減小了節(jié)點(diǎn)尺寸,可能會(huì)丟失空間位置信息。因此,解碼過程中每次上采樣操作后,將輸出結(jié)果與編碼時(shí)對(duì)應(yīng)特征圖進(jìn)行連接增強(qiáng)運(yùn)算??傮w架構(gòu)如圖3所示。
圖3 面向建筑物形狀特征分析的自編碼學(xué)習(xí)模型Fig.3 Graph-based autoencoding architecture for building shape representation
由于圖上節(jié)點(diǎn)的鄰域結(jié)構(gòu)不固定,無(wú)法直接執(zhí)行規(guī)范柵格上的卷積和池化等運(yùn)算算子。本文介紹一種基于圖傅里葉變換的卷積運(yùn)算算子用于圖上局部范圍內(nèi)用于特征提取,并在此基礎(chǔ)上設(shè)計(jì)有效的池化和上采樣運(yùn)算。詳細(xì)運(yùn)算算子和損失函數(shù)介紹如下。
1.2.1 卷積運(yùn)算
(XTg))。
(1)
1.2.2 池化和上采樣運(yùn)算
圖卷積本質(zhì)上是利用拉普拉斯矩陣將圖的節(jié)點(diǎn)特征矩陣fn×Fin映射到fn×Fout。該過程更新圖的節(jié)點(diǎn)特征,但不會(huì)改變圖的尺寸,因此不利于層次化特征的提取以及數(shù)據(jù)表征維度的改變。針對(duì)此,本文采用DIFFPOOL方法[26],即學(xué)習(xí)一組可微分的分配矩陣S∈n×m,將n節(jié)點(diǎn)映射到m節(jié)點(diǎn)形成不同粒度的特征層輸出,從而支撐池化和上采樣層的設(shè)計(jì)。具體通過兩次卷積運(yùn)算實(shí)現(xiàn),即:和其中,Convembed為了生成新的節(jié)點(diǎn)特征,Convpool為了獲得到節(jié)點(diǎn)之間的分配矩陣,并通過Softmax函數(shù)歸一化。基于此,(l+1)層圖的鄰接矩陣和節(jié)點(diǎn)特征矩陣分別更新為
(2)
(3)
在上述過程中,圖節(jié)點(diǎn)的數(shù)量和特征維度得到了調(diào)整。當(dāng)m小于n時(shí),節(jié)點(diǎn)數(shù)量減少,理解為對(duì)節(jié)點(diǎn)進(jìn)行了聚類以得到粗化輸出,即圖的池化運(yùn)算,以獲取不同粒度的特征。當(dāng)m大于n時(shí),節(jié)點(diǎn)數(shù)量增加,即圖的上采樣運(yùn)算,以恢復(fù)圖的尺寸。
1.2.3 損失函數(shù)
該模型通過非監(jiān)督方式進(jìn)行訓(xùn)練,訓(xùn)練目標(biāo)為最小化輸入和輸出之間的差異。考慮到池化運(yùn)算中分配矩陣優(yōu)化的困難性,文獻(xiàn)[26]在損失函數(shù)中加入兩組約束,分別是每層鄰接矩陣差異最小化以及分配矩陣逐行的熵最小化。其中,前者保障鄰接矩陣中邊的穩(wěn)定性,后者保障每個(gè)節(jié)點(diǎn)的分配概率接近一位有效向量(one-hot vector),以清晰地表達(dá)其與下一層輸出之間的關(guān)系。最終損失函數(shù)定義為
(4)
本文通過機(jī)器學(xué)習(xí)模型分析上述獲取的建筑物編碼,并從多個(gè)候選化簡(jiǎn)算法中選擇最適合處理該建筑物的算法,該過程包括兩部分:候選建筑物化簡(jiǎn)算法和利用機(jī)器學(xué)習(xí)的算法選擇模型。
如前所述,目前已經(jīng)提出了多種建筑物化簡(jiǎn)算法。理論上,越多的化簡(jiǎn)算法作為候選,越有利于為每個(gè)建筑物提供高質(zhì)量的化簡(jiǎn)方案,但也會(huì)使得構(gòu)建的選擇模型越復(fù)雜。綜合考慮,本文選擇矩形擬合法[21]、模板匹配法[15]、鄰近四點(diǎn)法[8]、迭代法[13]作為每個(gè)建筑物實(shí)施化簡(jiǎn)的候選算法。這4種算法的基本原理、適用范圍及局限性總結(jié)見表1。一方面,這4種算法的設(shè)計(jì)原理互不相同,面對(duì)不同形狀建筑物時(shí)優(yōu)缺點(diǎn)互補(bǔ)性強(qiáng);另一方面,它們都是基于矢量的化簡(jiǎn)方法并且采用簡(jiǎn)單參數(shù)實(shí)現(xiàn),便于生成化簡(jiǎn)程度相近的輸出結(jié)果。
表1 4種候選化簡(jiǎn)算法比較Tab.1 Comparison of four candidate building simplification algorithms
本文目標(biāo)在于建立形狀自適應(yīng)的化簡(jiǎn)算法選擇模型,即依據(jù)建筑物的形狀編碼從候選算法集中選擇最佳算法進(jìn)行化簡(jiǎn)。該過程是一個(gè)多分類問題,輸入為32維的建筑物形狀編碼,輸出為4維向量,分別代表使用4種化簡(jiǎn)算法的適宜性。該問題可以利用監(jiān)督式機(jī)器學(xué)習(xí)分類方法構(gòu)建得到算法選擇模型。構(gòu)建模型時(shí),首先利用一部分帶標(biāo)注的建筑物編碼樣本,即標(biāo)注每一個(gè)建筑物最適合的化簡(jiǎn)算法,對(duì)分類器進(jìn)行訓(xùn)練,獲取分類知識(shí);隨后,逐個(gè)輸入建筑物的形狀編碼,模型以概率形式表達(dá)預(yù)測(cè)其最適合的化簡(jiǎn)算法。該過程如圖4所示。
圖4 基于監(jiān)督學(xué)習(xí)的建筑物化簡(jiǎn)算法選擇模型Fig.4 Selection model of building simplification algorithms using a supervised learning
很多機(jī)器學(xué)習(xí)分類模型可以完成上述任務(wù),例如人工神經(jīng)網(wǎng)絡(luò)(backpropagation neural network,BPNN)、支持向量機(jī)(support vector machine,SVM)、隨機(jī)森林(random forest,RF)等。在利用這些學(xué)習(xí)模型構(gòu)建用于建筑物化簡(jiǎn)算法選擇的分類器時(shí),不需要建立特殊的數(shù)據(jù)組織方式或運(yùn)算技巧,采用通用模型即可。因此,基于不同學(xué)習(xí)模型構(gòu)建分類器的原理和過程不再贅述。
本文使用1∶1萬(wàn)比例尺建筑物數(shù)據(jù)進(jìn)行試驗(yàn)分析。其中,訓(xùn)練建筑物數(shù)據(jù)選自住宅、商業(yè)、工業(yè)等不同城市功能區(qū),總數(shù)為1000個(gè)。對(duì)建筑物預(yù)處理后,應(yīng)用四種算法化簡(jiǎn),并由人工標(biāo)注出最佳算法?;?jiǎn)目標(biāo)比例尺為1∶2.5萬(wàn),參考制圖規(guī)范將化簡(jiǎn)閾值定義為最短邊長(zhǎng)度不小于6 m;對(duì)于矩形擬合法和模板匹配法,如果其最短邊長(zhǎng)沒有達(dá)到該閾值,則進(jìn)行適當(dāng)放大處理。在模板匹配法中,使用了人工建立的包含61個(gè)模板的建筑物庫(kù)。試驗(yàn)使用兩組數(shù)據(jù)集進(jìn)行測(cè)試,數(shù)據(jù)集Ⅰ包含219個(gè)來(lái)自住宅區(qū)的建筑物,尺寸相對(duì)較小、形狀比較規(guī)范;數(shù)據(jù)集Ⅱ包含222個(gè)來(lái)自商業(yè)區(qū)的建筑物,尺寸相對(duì)較大、形狀較為復(fù)雜。測(cè)試集的處理過程和參數(shù)與訓(xùn)練集一致。
為了定量評(píng)價(jià)化簡(jiǎn)結(jié)果,本文采用如下指標(biāo)度量化簡(jiǎn)前后建筑物多邊形的位置、面積方向和形狀變化以及化簡(jiǎn)后正交特征。
(1) 位置變化指標(biāo)。設(shè)原始建筑物邊界節(jié)點(diǎn)p1,p2,…,pn,n表示節(jié)點(diǎn)數(shù)量。節(jié)點(diǎn)pi的位置變化定義為該點(diǎn)到化簡(jiǎn)后多邊形邊界的最近距離d(pi)。化簡(jiǎn)前后整體位置變化通過所有節(jié)點(diǎn)位移平均值來(lái)描述,計(jì)算為
(5)
(2) 方向變化指標(biāo)。方向變化指標(biāo)通過最小外接矩形長(zhǎng)邊的方向變化值來(lái)度量,計(jì)算為
(6)
式中,Ob和Oa分別表示化簡(jiǎn)前后最小外接矩形長(zhǎng)邊與X軸方向的夾角。
(3) 面積變化指標(biāo)。面積變化通過化簡(jiǎn)前后建筑物多邊形的面積差值來(lái)度量,計(jì)算為
(7)
式中,Ab和Aa分別表示化簡(jiǎn)前后的面積。
(4) 形狀變化指標(biāo)。建筑物形狀通過邊界上的點(diǎn)沿參考方向(如x軸)切角變化情況來(lái)描述,即轉(zhuǎn)交函數(shù)[27],表示方法為一維分段函數(shù)。形狀變化則由化簡(jiǎn)前后建筑物多邊形對(duì)應(yīng)的轉(zhuǎn)角函數(shù)組成的空間距離來(lái)表示,即
(8)
式中,fb(s)和fa(s)分別表示化簡(jiǎn)前后建筑物多邊形的轉(zhuǎn)角函數(shù);θ代表建筑物多邊形的旋轉(zhuǎn)角度;t代表自起點(diǎn)沿多邊形行進(jìn)的弧長(zhǎng)。如圖5所示,形狀變化即兩組轉(zhuǎn)交曲線所圍成的區(qū)域范圍大小。
圖5 化簡(jiǎn)前后建筑物形狀變化度量Fig.5 Shape change measurement of the building polygons before and after simplification using turning function
(9)
式中,αi表示化簡(jiǎn)后建筑物多邊形相鄰兩邊形成的夾角;n為多邊形節(jié)點(diǎn)數(shù)。
本文首先利用上述構(gòu)建的圖卷積自編碼學(xué)習(xí)模型對(duì)試驗(yàn)數(shù)據(jù)集中的全部建筑物進(jìn)行訓(xùn)練,獲取形狀編碼庫(kù)。模型采用Adam算法優(yōu)化,學(xué)習(xí)率為0.2,迭代次數(shù)為200。為了清晰地展現(xiàn)編碼效果,利用t-SNE算法[28]將全部建筑物編碼降維至二維并在平面空間可視化,結(jié)果如圖6所示。
可以看到,在編碼空間中距離較近的建筑物,其形狀在視覺上也較為接近;而距離較遠(yuǎn)的建筑物,其形狀在視覺上也差異較大。例如,在圖6上方區(qū)域的建筑物形狀接近矩形狀和圓狀,較為相似;而右下方區(qū)域則集中分布為L(zhǎng)型、U型、E型、鋸齒扁平狀建筑物。該結(jié)果表明本文提出的圖卷積編碼模型對(duì)形狀特征具備較好的表征能力。后續(xù)即利用監(jiān)督學(xué)習(xí)模型在該特征空間中進(jìn)行非線性化分類,從而區(qū)分出不同形狀特征所對(duì)應(yīng)的最佳化簡(jiǎn)算法。
圖6 形狀特征表達(dá)的可視化Fig.6 Visualization of the shape representation using the proposed graph-based autoencoding architecture
本文使用BPNN、SVM、RF這3種機(jī)器學(xué)習(xí)方法構(gòu)建化簡(jiǎn)算法選擇模型。本文分別設(shè)置BPNN模型中隱含層神經(jīng)元數(shù)量為4、8、12、20和30進(jìn)行對(duì)比試驗(yàn),訓(xùn)練次數(shù)都為100 000;RF模型中決策樹數(shù)量設(shè)置為30、50和100進(jìn)行對(duì)比;SVM模型則分別采用線性和高斯核函數(shù)以實(shí)現(xiàn)線性和非線性優(yōu)化擬合的對(duì)比。表2為不同參數(shù)下3個(gè)模型在兩組測(cè)試數(shù)據(jù)集上的分類準(zhǔn)確率。
表2 不同機(jī)器學(xué)習(xí)方法支持下化簡(jiǎn)算法選擇模型的分類精度Tab.2 Classification accuracies of the simplification algorithm selection using different machine learning models (%)
可以看到,BPNN模型在較少神經(jīng)元時(shí)分類精度較低,隨著神經(jīng)元數(shù)據(jù)增加,精度有所提升且表現(xiàn)穩(wěn)定;但神經(jīng)元達(dá)到一定數(shù)量,精度略微下降,這可能與模型復(fù)雜程度以及訓(xùn)練數(shù)據(jù)量相關(guān)。綜合兩個(gè)數(shù)據(jù)集的結(jié)果,BPNN模型中神經(jīng)元數(shù)量為12時(shí)表現(xiàn)較佳。RF模型在不同的決策樹數(shù)量參數(shù)下分類精度變化并不大。但是對(duì)于SVM模型,采用線性核的分類精度遠(yuǎn)低于高斯非線性核。
對(duì)比3種模型,BPNN模型在數(shù)據(jù)集Ⅰ的最佳精度達(dá)到78.2%,相比SVM和RF模型有一定的優(yōu)勢(shì),但是在數(shù)據(jù)集Ⅱ中的精度為63.7%,略遜于RF模型。RF模型在數(shù)據(jù)集Ⅰ精度低于BPNN及非線性SVM模型,但在數(shù)據(jù)集Ⅱ上精度達(dá)65%,優(yōu)于其他模型。對(duì)比兩組數(shù)據(jù)集,3種模型都是在數(shù)據(jù)集Ⅰ中的表現(xiàn)優(yōu)于數(shù)據(jù)集Ⅱ。分析可能的原因是住宅區(qū)中建筑物面積一般較小、形態(tài)特征比較簡(jiǎn)單顯著;并且局部范圍內(nèi)的建筑物往往呈現(xiàn)相似的形狀、具備相近的尺寸,適合采用相同的化簡(jiǎn)算法進(jìn)行處理。因此,在編碼器將相似形狀表征后,分類器能具備較好的區(qū)分能力。相比較之下,商業(yè)區(qū)中的建筑物形狀和尺寸差別較大,形狀較為復(fù)雜、相似性也不強(qiáng),導(dǎo)致模型進(jìn)行不同化簡(jiǎn)算法選擇時(shí)難度系數(shù)提升。特別是針對(duì)都適合處理較為復(fù)雜形狀的鄰近四點(diǎn)法和迭代法,模型很難獲得與人工一致性較高的判斷知識(shí)。
上述結(jié)果表明BPNN模型總體上表現(xiàn)較好。因此,本文進(jìn)一步以包含12個(gè)神經(jīng)元的BPNN模型產(chǎn)生的分類結(jié)果為基礎(chǔ),分析測(cè)試數(shù)據(jù)集的化簡(jiǎn)結(jié)果,部分建筑物化簡(jiǎn)前后狀態(tài)對(duì)比如圖7所示。表3給出了測(cè)試集中所有建筑物評(píng)價(jià)指標(biāo)的平均值,同時(shí)給出了分別使用4個(gè)單一算法化簡(jiǎn)的結(jié)果指標(biāo)。
表3 利用不同方法化簡(jiǎn)的結(jié)果評(píng)價(jià)指標(biāo)Tab.3 Evaluation of the simplified results produced by different methods
可以看到,單一算法在某些指標(biāo)上具有一定的優(yōu)勢(shì)。例如矩形擬合法在面積、方向保持以及正交性特征指標(biāo)上最優(yōu),原因在于其化簡(jiǎn)時(shí)會(huì)縮放最小外接矩形使其面積和方向保持與原始形狀一致,這是強(qiáng)約束,同時(shí)也能保證化簡(jiǎn)后多邊形4個(gè)角都是直角。鄰近四點(diǎn)法在位置保持指標(biāo)上表現(xiàn)良好,原因在于其化簡(jiǎn)動(dòng)作是通過移動(dòng)或刪除局部凹凸結(jié)構(gòu)實(shí)現(xiàn)的,只會(huì)處理一部分結(jié)構(gòu)點(diǎn),因此其平均位置移動(dòng)最小。但是單一算法很難兼顧全部的指標(biāo),例如矩形擬合法和模板匹配法的位置指標(biāo)表現(xiàn)欠佳,表明其化簡(jiǎn)后存在較大的位置偏移;迭代法和鄰近四點(diǎn)法在方向和面積保持方面欠優(yōu),表明這兩種局部處理的策略,可能會(huì)造成整體形狀特征出現(xiàn)失衡。
總體而言,本文方法在各指標(biāo)上都表現(xiàn)出一定優(yōu)勢(shì)和協(xié)調(diào)性,特別是在數(shù)據(jù)集Ⅰ中形狀保持方面表現(xiàn)最佳。這表明,本文方法不會(huì)產(chǎn)生效果極差的結(jié)果。雖然在某些指標(biāo)上略遜色于單一算法方法,但這也是合理的。因?yàn)椴⒉皇悄稠?xiàng)指標(biāo)保持得好,該化簡(jiǎn)效果就合理。例如在矩形擬合法中,雖然方向、面積、垂直性都保持良好,但并不意味著化簡(jiǎn)結(jié)果好,對(duì)一些復(fù)雜形狀可能會(huì)存在非常嚴(yán)重的形狀變化。從圖7化簡(jiǎn)結(jié)果中也可以驗(yàn)證這一點(diǎn),每一種算法都或多或少存在不合理的化簡(jiǎn)情況,而本文方法總體上保持比較均衡,效果良好。
前文中指出由于數(shù)據(jù)集Ⅱ中的建筑物形態(tài)較為復(fù)雜、尺寸差異較大,算法選擇時(shí)分類精度較低,因此也進(jìn)一步影響了后續(xù)化簡(jiǎn)過程。例如表3中,在數(shù)據(jù)集Ⅱ中化簡(jiǎn)指標(biāo)整體較數(shù)據(jù)集Ⅰ略差。但差距不是很明顯,同時(shí)從圖7(b)中也可以看到數(shù)據(jù)集Ⅱ中很多建筑物也能取得較好的化簡(jiǎn)效果。分析可能的原因是一個(gè)建筑物可能存在多種化簡(jiǎn)算法,其效果比較接近且都能滿足化簡(jiǎn)需求。因此,在部分情況下,就算自動(dòng)選擇的算法與人工選擇的算法不一致,但是其化簡(jiǎn)結(jié)果也是可以接受的。
針對(duì)建筑物化簡(jiǎn)這一長(zhǎng)期面臨挑戰(zhàn)的問題,本文提出了基于形狀特征認(rèn)知的自適應(yīng)化簡(jiǎn)方法。該方法首先通過圖卷積深度學(xué)習(xí)建立建筑物形狀的特征表達(dá),然后利用機(jī)器學(xué)習(xí)技術(shù)建立形狀表達(dá)與不同化簡(jiǎn)算法之間的選擇模型。試驗(yàn)結(jié)果及相關(guān)分析表明:①基于圖的自編碼器能有效地表征建筑物形狀特征,相似的建筑物形狀在編碼空間中,距離也更為接近;②基于機(jī)器學(xué)習(xí)的算法選擇模型對(duì)于住宅區(qū)建筑物表現(xiàn)較好,精度達(dá)到78.2%,應(yīng)用于形態(tài)和尺寸變化多樣的商業(yè)區(qū)建筑物表現(xiàn)略差;③本文方法的化簡(jiǎn)結(jié)果在位置、方向、面積和形狀變化等指標(biāo)上,總體上優(yōu)于運(yùn)用單一算法獲得的化簡(jiǎn)結(jié)果。
下一步工作包括:①本文以形狀特征作為建筑物化簡(jiǎn)算法選擇的判斷依據(jù),后續(xù)進(jìn)一步考慮尺寸、區(qū)域地理環(huán)境特征(如城中村)等其他指標(biāo);②加入其他建筑物化簡(jiǎn)算法,進(jìn)一步豐富候選化簡(jiǎn)算法集。此外,本文方法中形狀編碼表達(dá)和化簡(jiǎn)算法選擇是相互獨(dú)立的,后續(xù)研究可考慮構(gòu)建模型集成這兩個(gè)過程,即將化簡(jiǎn)算法的選擇作為圖卷積模型的訓(xùn)練目標(biāo)。