国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面狀居民地形狀分類的圖卷積神經(jīng)網(wǎng)絡(luò)方法

2022-11-29 13:13:00于洋洋賀康杰許俊奎
測繪學(xué)報 2022年11期
關(guān)鍵詞:面狀形狀卷積

于洋洋,賀康杰,武 芳,許俊奎

1. 河南大學(xué)地理與環(huán)境學(xué)院,河南 開封 475004; 2. 黃河中下游數(shù)字地理技術(shù)教育部重點實驗室(河南大學(xué)),河南 開封 475004; 3. 信息工程大學(xué)地理空間信息學(xué)院,河南 鄭州 450001

面狀居民地要素作為地理空間數(shù)據(jù)的一種,廣泛存在于各種大、中比例尺地形圖、地籍圖中,其主要描述城市和鄉(xiāng)鎮(zhèn)聚集區(qū)中各種建筑物的形狀與分布情況。地圖上的面狀居民地要素通過反映實際居民地的位置、輪廓、基本結(jié)構(gòu)、行政意義以及名稱等信息,在城市建模應(yīng)用中發(fā)揮著重要作用[1]。隨著我國經(jīng)濟(jì)的快速發(fā)展,城市化建設(shè)進(jìn)程的加快,城市的面貌日新月異,由此地圖更新也越來越頻繁,而面狀地物的形狀分類是地圖制圖綜合和更新的關(guān)鍵技術(shù)環(huán)節(jié),面狀要素的選取、更新、匹配等[2-4]也大多依賴于其形狀特征。

形狀作為地理要素的一個屬性,在地理實體的表達(dá)中傳遞了比顏色、紋理等更多的信息量[5]。在形狀描述與分類問題上,國內(nèi)外學(xué)者進(jìn)行了大量的研究。在描述建筑物形狀特征方面,可以大致分為以下幾種方式:一是根據(jù)地理要素的幾何結(jié)構(gòu)特征,基于矢量數(shù)據(jù)直接定義形狀描述子,通過數(shù)學(xué)模型描述形狀的一般特征,進(jìn)而判斷地理要素之間的形狀相似性。文獻(xiàn)[6—7]使用傅里葉變換度量形狀的大小,構(gòu)建數(shù)學(xué)模型,定義一系列的幾何特征描述形狀的相關(guān)性,但是該種方法在對不同的形狀描述時需要定義不同的相似隸屬度函數(shù)對每種形狀模板進(jìn)行描述,同時,由于傅里葉變換在形狀描述上的不足,該方法對形狀的結(jié)構(gòu)比較敏感,對于一些凹凸度較大的要素描述結(jié)果較差。文獻(xiàn)[8]在描述面狀實體時,通過對面狀實體的輪廓線定義幾何描述算子,設(shè)定合理的閾值,進(jìn)而建立用于面狀實體化簡的復(fù)雜性度量模型。文獻(xiàn)[9]運用形態(tài)抽象化的方式描述居民地要素的形狀,構(gòu)建居民地形狀模板用于居民地的形狀識別與化簡。二是基于柵格圖像數(shù)據(jù)分析居民地圖像的輪廓像素集合描述形狀。文獻(xiàn)[10]通過構(gòu)造形狀描述鏈碼(chain code)描述建筑物的形狀。文獻(xiàn)[11]通過小波描述符對圖像和形狀進(jìn)行匹配計算。文獻(xiàn)[12]使用形狀上下文(shape context)來表示形狀。文獻(xiàn)[13]使用直方圖的統(tǒng)計方法計算圖像形狀信息,以表達(dá)圖像的形狀特征。這些方法的優(yōu)點是計算思想直觀,但卻在一定程度上忽略了視覺認(rèn)知因素。

近年來,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,深度神經(jīng)網(wǎng)絡(luò)在計算機視覺、自然語言處理和語音識別等方面取得了前所未有的成果[14-16]。尤其在機器視覺領(lǐng)域,卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)對于局部視覺特征具有很強的表現(xiàn)能力,在圖像處理、目標(biāo)檢測、圖像分割等方面大放異彩[17-19]。部分學(xué)者也開始嘗試借用圖像處理、計算機視覺等領(lǐng)域的技術(shù)來解決地理要素的形狀識別與分類,其主要思路是將地理矢量數(shù)據(jù)轉(zhuǎn)為柵格圖像,通過卷積神經(jīng)網(wǎng)絡(luò)提取圖像的輪廓特征,進(jìn)而描述要素的形狀。文獻(xiàn)[20—21]將城市中矢量立交橋數(shù)據(jù)轉(zhuǎn)為柵格圖像,通過CNN卷積神經(jīng)網(wǎng)絡(luò)和GoogleLeNet神經(jīng)網(wǎng)絡(luò)提取道路交叉口的模糊特征,從而判別復(fù)雜交叉路口的形狀類別。文獻(xiàn)[22]利用機器自監(jiān)督學(xué)習(xí)的方式,通過卷積神經(jīng)網(wǎng)絡(luò)對圖像特征學(xué)習(xí),結(jié)合自動編碼機的自監(jiān)督學(xué)習(xí)能力對建筑物面要素的幾何形狀進(jìn)行度量。

但是,由于矢量數(shù)據(jù)結(jié)構(gòu)的不規(guī)則性,無法將卷積神經(jīng)網(wǎng)絡(luò)直接用于矢量數(shù)據(jù)的處理中。為此,一些研究者提出了基于圖的圖卷積神經(jīng)網(wǎng)絡(luò)(graph convolutional network,GCN)。文獻(xiàn)[23]使用圖卷積神經(jīng)網(wǎng)絡(luò)模型分析建筑物群的分布模式,其主要使用圖傅里葉變換和卷積定理,將頂點域卷積轉(zhuǎn)換為譜域中的點積,對建筑物群構(gòu)成的圖進(jìn)行特征提取,進(jìn)而給出規(guī)則和不規(guī)則兩種建筑物群的類別判定。文獻(xiàn)[24]利用圖結(jié)構(gòu)對建筑物的形狀進(jìn)行建模,提出了一種圖卷積自編碼器(GCAE)模型,提取頂點的局部和區(qū)域結(jié)構(gòu)特征,通過無監(jiān)督學(xué)習(xí)對建模的圖進(jìn)行分析,實現(xiàn)了形狀編碼認(rèn)知。受這些研究啟發(fā),本文使用圖卷積神經(jīng)網(wǎng)絡(luò)中的空間方法來構(gòu)建端到端的形狀分類器,通過對居民地形狀信息的多輪次聚合和提取,并將其嵌入一個高維向量中,利用全連接神經(jīng)網(wǎng)絡(luò)對高維向量進(jìn)行分類,以解決在大中比例尺下面狀居民地形狀分類認(rèn)知問題。

1 圖卷積神經(jīng)網(wǎng)絡(luò)

1.1 圖上的卷積運算

圖一般是由節(jié)點和邊構(gòu)成,圖的定義可以是G=(V,E,A),其中V是節(jié)點的集合,E是節(jié)點間連接邊的集合,A∈Rn×n是圖的鄰接矩陣,表示節(jié)點間邊的連接關(guān)系和權(quán)重[25]。圖數(shù)據(jù)的卷積運算方式分為兩種,一種是基于譜方法的卷積運算,另一種是基于空間方法的卷積運算?;谧V方法的圖卷積運算借助于信號處理的思想[26],將節(jié)點域的輸入和卷積核通過傅里葉變換投影到譜域中,在譜域進(jìn)行卷積運算,然后將得到的結(jié)果再逆變換到節(jié)點域,以實現(xiàn)圖上的卷積運算,這種方式計算復(fù)雜度高,占用計算資源大。

本文采用的是基于空間方法的圖卷積神經(jīng)網(wǎng)絡(luò)模型,該方法的關(guān)鍵思想是基于圖上節(jié)點狀態(tài)信息的聚合與更新。文獻(xiàn)[27]提出的NN4G(neural network for graphs)是第1個基于空間方法的圖卷積神經(jīng)網(wǎng)絡(luò)。NN4G通過直接累加節(jié)點的鄰域信息來實現(xiàn)圖的卷積運算。隨后,文獻(xiàn)[28]提出的擴散卷積網(wǎng)絡(luò)(diffusion convolutional neural network,DCNN)將圖卷積看作是一個擴散過程。它假設(shè)信息以一定的轉(zhuǎn)移概率從一個節(jié)點轉(zhuǎn)移到相鄰的一個節(jié)點,使信息分布在幾輪后達(dá)到均衡。在圖結(jié)構(gòu)數(shù)據(jù)中,每個節(jié)點的存在狀態(tài)并不是相互獨立的,節(jié)點與節(jié)點之間是相互聯(lián)系與依存的關(guān)系。圖上卷積運算的空間方法是在節(jié)點域直接定義聚合函數(shù)[29],在更新中心節(jié)點的狀態(tài)信息時,利用了其相鄰節(jié)點的狀態(tài)信息,通過一定的規(guī)則將鄰居節(jié)點的信息,也就是特征,匯聚到中心節(jié)點上。通常來說,對于節(jié)點間特征的匯聚規(guī)則,可以加入一個線性變換矩陣W,作為一種匯聚節(jié)點特征的映射關(guān)系,即

(1)

式中,U是節(jié)點V鄰域N(V)中的節(jié)點;H(l)是第l層節(jié)點的特征。如果加上激活函數(shù),式(1)可以表達(dá)為

H(l+1)=σ(AH(l)W(l))

(2)

式中,σ(·)是非線性激活函數(shù);A是圖的鄰接矩陣,表示節(jié)點間的鄰接關(guān)系;H(l+1)是經(jīng)第l層匯聚后節(jié)點特征的輸出。

文獻(xiàn)[30]提出了一種用于圖中節(jié)點分類的圖卷積模型,本文借助于其提出的圖上卷積運算的方式,將其應(yīng)用到面狀居民地形狀分類模型中,其中圖上的卷積運算如下

(3)

1.2 圖卷積神經(jīng)網(wǎng)絡(luò)

本文借助于節(jié)點域中的圖卷積神經(jīng)網(wǎng)絡(luò)模型,通過疊加多個卷積層構(gòu)造了面狀居民地形狀分類模型。該模型是由多個疊加的卷積層和一個線性分類層構(gòu)成,將面狀居民地構(gòu)造成圖數(shù)據(jù)后提取居民地輪廓幾何特征,并將其作為圖中節(jié)點屬性,然后將帶有節(jié)點屬性和標(biāo)簽的圖輸入到GCN分類模型中,通過多個隱藏層逐層傳播,其中從第l層到第l+1層隱藏層的傳播計算方式如下

(4)

式中,N(i)是節(jié)點i的相鄰節(jié)點集合;ci,j是節(jié)點的度的平方根的乘積;W(l)是一個特定于層的可訓(xùn)練權(quán)重矩陣;b(l)∈R1×D是圖卷積網(wǎng)絡(luò)中的偏置系數(shù);σ(·)表示非線性激活函數(shù),例如ReLU(·)=max(0,·)。H(l)∈RN×D是第l層的特征矩陣,初始化為H(0)=X,X是圖中節(jié)點的輸入特征,N是圖的節(jié)點個數(shù),D是每個節(jié)點特征向量的維度。

2 基于圖卷積神經(jīng)網(wǎng)絡(luò)的居民地形狀分類模型

2.1 總體思路

本文借助于圖卷積神經(jīng)網(wǎng)絡(luò)對于圖數(shù)據(jù)局部特征敏感的特點,將其運用到地理要素的形狀分類與認(rèn)知中,以圖結(jié)構(gòu)表達(dá)居民地的形狀特征,通過圖卷積運算對特征進(jìn)行學(xué)習(xí)。本文以面狀居民地要素為例,將矢量數(shù)據(jù)的面狀居民地要素建模為圖數(shù)據(jù)結(jié)構(gòu),依據(jù)面狀居民地要素的形狀類別對相應(yīng)的圖進(jìn)行標(biāo)注,通過有監(jiān)督圖學(xué)習(xí)的方式,運用圖卷積神經(jīng)網(wǎng)絡(luò)提取面狀居民地要素形狀的高維結(jié)構(gòu)特征,最后通過分類器對圖數(shù)據(jù)進(jìn)行分類,以此實現(xiàn)對面狀居民地形狀的分類。該過程的整體框架結(jié)構(gòu)如圖1所示,主要分為以下幾個步驟。

圖1 基于圖卷積神經(jīng)網(wǎng)絡(luò)的面狀居民地形狀分類流程Fig.1 Flowchart of areal settlements shape classification based on graph convolutional neural networks

(1) 圖構(gòu)建:以面狀居民地的輪廓多邊形描述實體居民地的形狀,將多邊形線段作為圖的節(jié)點,以線段之間的連接關(guān)系作為邊,構(gòu)建圖結(jié)構(gòu),同時將圖按居民地的形狀劃分成不同的類別進(jìn)行標(biāo)注。

(2) 提取節(jié)點特征:提取面狀居民地輪廓多邊形的幾何特征,作為節(jié)點的屬性。

(3) 圖學(xué)習(xí):以包含節(jié)點屬性和標(biāo)注的圖作為輸入,對多層圖卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,預(yù)測居民地形狀的類別。

2.2 居民地形狀圖的構(gòu)造及標(biāo)注

利用圖卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行形狀分類的第1步是將面狀居民地實體構(gòu)建為圖結(jié)構(gòu)數(shù)據(jù),以實現(xiàn)面狀居民地矢量形狀的圖表達(dá)。本文采用面狀居民地實體的輪廓多邊形來描述其形狀,如圖2(a)所示,首先提取其輪廓多邊形,獲取組成面狀要素的頂點坐標(biāo),將其邊界按存儲的頂點坐標(biāo)劃分成線段。圖神經(jīng)網(wǎng)絡(luò)的節(jié)點一般代表網(wǎng)絡(luò)結(jié)構(gòu)中的個體,例如社交網(wǎng)絡(luò)中的人,軟件結(jié)構(gòu)網(wǎng)絡(luò)中的函數(shù)等,邊代表了個體之間的關(guān)系。具體到居民地形狀結(jié)構(gòu)而言,雖然其自然結(jié)構(gòu)可以看作圖結(jié)構(gòu),但居民地的主要信息蘊含在邊及其關(guān)系上,邊界頂點只是表達(dá)了邊之間的相交與連接關(guān)系,基于此考慮,本文以居民地的輪廓多邊形線段作為最小形狀單元,同時將其作為圖數(shù)據(jù)的節(jié)點,線段之間的連接關(guān)系作為邊,構(gòu)造成圖數(shù)據(jù)結(jié)構(gòu),如圖2(b)所示。

圖2 面狀居民地輪廓形狀和圖結(jié)構(gòu)Fig.2 Areal settlement contour shape and its corresponding computation graph

圖的標(biāo)注是對每個居民地構(gòu)建成的圖數(shù)據(jù)進(jìn)行形狀類型的標(biāo)注。根據(jù)格式塔原理,人在認(rèn)知一個物體時,先是從整體上感知物體的全局形狀,然后深入到底層分析該物體的局部形狀細(xì)節(jié)。在實際中,對于形狀的辨別以人的主觀認(rèn)知為主對形狀進(jìn)行類別的劃分,本文采用文獻(xiàn)[24]中的人工標(biāo)注數(shù)據(jù)。

2.3 節(jié)點特征的提取

2.3.1 局部結(jié)構(gòu)特征

節(jié)點的屬性特征提取直接影響著整個圖的形狀表達(dá)。在特征提取上,采用面狀居民地的輪廓多邊形構(gòu)造圖,主要通過描述輪廓多邊形線段的幾何特征和線段之間的空間關(guān)系,實現(xiàn)對面狀居民地整體形狀的描述。如圖3所示,其中節(jié)點P表示面狀居民地邊界線段AB,提取的特征包含:①邊界線段AB的長度L1;②邊界線段的方位角α。其中,L1表示由相鄰頂點A、B組成的線段長度,方位角α表示線段A、B在二維平面中的方向。本文中以正北方向的北端起,順時針轉(zhuǎn)至目標(biāo)直線的夾角,記為該直線的方位角,取值范圍是(0,360°)。

圖3 節(jié)點P的局部特征提取Fig.3 Local features extraction of node P

由于形狀特征在平移、旋轉(zhuǎn)和縮放下應(yīng)該保持不變,故需要對形狀特征進(jìn)行歸一化處理。對于邊界線段的長度L1,除以面狀居民地輪廓多邊形的周長D,進(jìn)行歸一化處理;依據(jù)方位角α的取值范圍,將方位角α除以360°進(jìn)行歸一化處理,具體如下

(5)

(6)

2.3.2 整體結(jié)構(gòu)特征

若僅在居民地輪廓多邊形上提取邊界線段的幾何特征,并不能完整地表達(dá)居民地的整體形態(tài)結(jié)構(gòu),故本文引入居民地形狀中心點,將居民地邊界線段的中點與居民地形狀中心點相連,從而表達(dá)居民地的整體結(jié)構(gòu)特征。如圖4所示,連接居民地中心點與邊界線段AB的中點P,提取的特征包含:①線段OP的長度L2;②線段OP到OQ的轉(zhuǎn)向角β。轉(zhuǎn)向角β表示從OP到OQ的角度,逆時針方向為正,否則為負(fù)。

圖4 節(jié)點P的整體特征提取Fig.4 Global features extraction of node P

同理,需要對提取的特征進(jìn)行歸一化處理,將居民地中心點O到各線段中點的長度L2累加和記為S,將L2除以S進(jìn)行歸一化;依據(jù)轉(zhuǎn)向角β的取值范圍(-180°,+180°),故將轉(zhuǎn)向角β除以360°進(jìn)行歸一化,即

(7)

(8)

在將面狀居民地構(gòu)造成圖結(jié)構(gòu)時,需要將面狀居民地的輪廓形態(tài)也同時映射到圖結(jié)構(gòu)中。本文將面狀居民地的輪廓形態(tài)特征嵌入圖的節(jié)點中,用圖結(jié)構(gòu)表達(dá)面狀居民地的輪廓形狀。圖中節(jié)點的屬性承載著面狀居民地輪廓的局部和整體形態(tài)特征,由于面狀居民地形狀的不同,提取到的節(jié)點特征也是不同的。因此,在圖上進(jìn)行卷積運算時,可以從不同角度提取形狀的特征,在分類預(yù)測時,通過全連接神經(jīng)網(wǎng)絡(luò)聚合形狀特征,并根據(jù)獲取的形狀概率值預(yù)測其類別。

2.4 基于GCN的居民地圖分類模型結(jié)構(gòu)

基于GCN的居民地圖分類模型如圖5所示,模型主要分為兩個部分,第1部分是圖的嵌入,該過程主要提取圖中節(jié)點的高維隱藏特征,通過卷積層的運算,將一張圖中的節(jié)點特征聚合成整張圖的圖表示,然后將圖表示嵌入高維向量中;第2部分是圖分類過程,經(jīng)分類器將得到的高維向量進(jìn)行形狀類別的預(yù)測,完成居民地圖分類任務(wù)。圖5表示輸入一個batch的圖經(jīng)過圖卷積神經(jīng)網(wǎng)絡(luò)將圖嵌入高維向量中,每個batch有多個圖,每個圖得到一個嵌入向量,通過分類器對圖的類別進(jìn)行預(yù)測,每個圖根據(jù)數(shù)據(jù)集中所劃分的類別數(shù)得到對應(yīng)數(shù)量的概率預(yù)測值,本文試驗數(shù)據(jù)集所劃分的類別數(shù)為10類,故每個圖都有10個概率預(yù)測值,表示該圖分別屬于每一類的概率,選擇其中概率值最大的作為其分類標(biāo)簽,圖5分別表示了屬于類別10和類別2的兩種情況。

圖5 基于圖卷積神經(jīng)網(wǎng)絡(luò)的圖分類模型Fig.5 Graph classification model based on graph convolutional neural networks

3 試驗與分析

3.1 試驗環(huán)境與數(shù)據(jù)

本文采用Python語言和Pytorch深度學(xué)習(xí)框架實現(xiàn)居民地形狀識別的圖卷積神經(jīng)網(wǎng)絡(luò)模型。所使用的平臺為Microsoft Win10 64位操作系統(tǒng),CPU Intel(R)Core(TM)i7-9700,主頻3.0 GHz,內(nèi)存16 GB,硬盤1024 GB。

建筑物的形狀是由設(shè)計師和建筑師設(shè)計的,而英文字母的形狀在建筑物形狀中是很常見的,它們可以作為建筑物形狀類別的一種簡化形式的表達(dá),本文采用文獻(xiàn)[32]所述的面狀居民地的形狀類別劃分方法。本文試驗所使用的數(shù)據(jù)來自O(shè)penStreetMap開源數(shù)據(jù)集,人工選取面狀居民地10種類型,包括E形、F形、I形、Y形等,具體形狀見表1,其中,每種類型有500個,數(shù)據(jù)集樣本共5000個,對于英文字母以外的不規(guī)則居民地形狀,本文暫未涉及。為了使試驗結(jié)果更加具有客觀性,本文試驗從10種類型的樣本中各隨機選取300個,共3000個樣本作為訓(xùn)練集,在剩余的2000個樣本中隨機從每類中選擇100個居民地共1000個樣本作為驗證集,余下的1000個樣本作為測試集,訓(xùn)練集、驗證集,測試集劃分比例為6∶2∶2。

本文試驗中,從OSM獲取的數(shù)據(jù)集為矢量數(shù)據(jù),原始數(shù)據(jù)不能直接作為圖數(shù)據(jù)輸入到網(wǎng)絡(luò)模型中,需要根據(jù)原始的矢量數(shù)據(jù)提取面狀居民地的輪廓多邊形,以其輪廓多邊形線段構(gòu)造圖結(jié)構(gòu)。依據(jù)矢量數(shù)據(jù)在計算機中存儲的格式,提取每個面狀居民地的頂點坐標(biāo),頂點坐標(biāo)之間用線段連接構(gòu)成了面狀居民地的輪廓多邊形。依照2.2節(jié)中的方法,利用居民地的頂點坐標(biāo)構(gòu)造對應(yīng)的圖。同時,依據(jù)居民地的形狀對構(gòu)造的圖進(jìn)行標(biāo)注,得到帶有標(biāo)簽的數(shù)據(jù)集。對于圖中節(jié)點的特征提取,依據(jù)2.3節(jié)中的方法提取對應(yīng)節(jié)點的屬性,同時將提取到的屬性賦予對應(yīng)節(jié)點,完成圖數(shù)據(jù)的預(yù)處理。

表1 數(shù)據(jù)集中面狀居民地的10種形狀類別

3.2 模型結(jié)構(gòu)和參數(shù)設(shè)置

本文試驗使用的是一個5層的模型,其包含4個卷積層和1個線性分類層,如圖6所示。通過使用本文所提出的構(gòu)建居民地圖數(shù)據(jù)及提取節(jié)點屬性的方法,完成圖的構(gòu)造,然后將構(gòu)造的帶標(biāo)簽的圖分批次輸入模型,初始化權(quán)重參數(shù),并對模型參數(shù)進(jìn)行學(xué)習(xí),經(jīng)反向傳播更新權(quán)重參數(shù),最大迭代次數(shù)為350次,經(jīng)過試驗,選定模型學(xué)習(xí)率為0.005,訓(xùn)練批次為100。為了防止過擬合,在連續(xù)迭代次數(shù)為100次且驗證集的精確度不再增大時則停止訓(xùn)練。

圖6 居民地圖分類模型參數(shù)Fig.6 Parameters of areal settlements classification model

在第1層圖輸入層中,輸入的特征維度是4,嵌入向量維度是128,經(jīng)過圖卷積運算,將第1層輸出值傳給下一層,激活函數(shù)為ReLU函數(shù)。

第2至4層的圖卷積層作為圖卷積神經(jīng)網(wǎng)絡(luò)的隱藏層,模型的輸入和輸出的向量維度是128,激活函數(shù)為ReLU函數(shù)。

第5層是線性分類層,將隱藏層輸出的結(jié)果通過分類層進(jìn)行分類,輸出結(jié)果為居民地的形狀預(yù)測類別,分別對應(yīng)數(shù)據(jù)集中的形狀類別,該層以全連接神經(jīng)網(wǎng)絡(luò)和softmax函數(shù)作為分類層,全連接層函數(shù)如式(9)所示

y=xAT+b

(9)

本文試驗中訓(xùn)練集和驗證集的訓(xùn)練結(jié)果如圖7所示,從試驗結(jié)果可以得出,訓(xùn)練結(jié)束后損失值降為0.069,驗證集準(zhǔn)確度率為92.3%,同時該模型在經(jīng)過250次的迭代之后,模型能夠很好地收斂。從準(zhǔn)確率為92.3%可以得出,該模型具有很好的泛化能力,對面狀居民地形狀的敏感度有很好的效果,能夠有效地對面狀居民地的形狀進(jìn)行分類。

圖7 GCN網(wǎng)絡(luò)模型訓(xùn)練過程中損失值和準(zhǔn)確率的變化曲線Fig.7 Changing curve of loss and validation accuracy in GCN model training

3.3 模型參數(shù)敏感度分析

在本文試驗中,分析了模型的超參數(shù)對模型準(zhǔn)確率的影響,其中包括訓(xùn)練批次數(shù)的大小、節(jié)點特征屬性的數(shù)量、模型的深度(隱藏層層數(shù))和形狀嵌入向量維度大小等。

試驗中,可以逐個輸入訓(xùn)練數(shù)據(jù)對模型訓(xùn)練,雖然這種每輸入一個數(shù)據(jù)就計算一次損失函數(shù),然后求梯度更新參數(shù)的方式訓(xùn)練速度比較快,但是模型訓(xùn)練結(jié)果不容易收斂,在梯度下降過程中參數(shù)的更新可能在最優(yōu)點附近來回震蕩,始終達(dá)不到最優(yōu)點,兩次參數(shù)的更新也有可能互相抵消掉,造成目標(biāo)函數(shù)震蕩比較劇烈。若遍歷全部數(shù)據(jù)集計算一次損失函數(shù),然后計算函數(shù)對各個參數(shù)的梯度更新參數(shù),每更新一次參數(shù)都需要把數(shù)據(jù)集里的所有樣本遍歷一次,計算量大,對于模型的訓(xùn)練傳遞了較大的誤差更新,每次的參數(shù)更新過大,因此選擇合理的訓(xùn)練批次大小是非常重要的。為了克服這兩種方法的缺點,在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中一般采用分批次訓(xùn)練的方式,對此進(jìn)行了研究與分析,如圖8所示。

由圖8可以看出,隨著訓(xùn)練批次的逐漸增大,模型訓(xùn)練結(jié)果的準(zhǔn)確率逐漸降低,訓(xùn)練批次的大小對模型的性能產(chǎn)生了較大的影響。在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中,每次梯度的下降是由每一訓(xùn)練批次樣本數(shù)據(jù)總體來決定的。在試驗中,對于訓(xùn)練批次小于1000的情況作了進(jìn)一步研究,改變訓(xùn)練批次的大小,觀察模型訓(xùn)練結(jié)果的準(zhǔn)確率,如圖9所示。由圖9可以看出,在訓(xùn)練批次從10增大到100時,模型訓(xùn)練結(jié)果的準(zhǔn)確率改變程度并不明顯,對模型的性能影響較小;在訓(xùn)練批次從100增大到1000時,模型訓(xùn)練結(jié)果的準(zhǔn)確率有明顯的降低。經(jīng)過試驗,最終選定模型的訓(xùn)練批次為100。

圖8 訓(xùn)練批次數(shù)目對模型準(zhǔn)確率的影響Fig.8 Test of the different number of training batches

圖9 不同訓(xùn)練批次模型的損失值Fig.9 The loss value of the model at different training batches number

在模型的層數(shù)和形狀嵌入向量維度等其他超參數(shù)一定時,還分析了使用不同數(shù)量的節(jié)點屬性對模型準(zhǔn)確率的影響。對于圖結(jié)構(gòu)數(shù)據(jù),有兩個重要特征影響著圖數(shù)據(jù):第一是圖的空間結(jié)構(gòu)特征,圖本身是非歐空間數(shù)據(jù),其不規(guī)則的空間結(jié)構(gòu)特征對圖中節(jié)點的鄰接關(guān)系以及節(jié)點間相互作用關(guān)系都有很大的影響;第二是圖中節(jié)點的屬性特征,節(jié)點的屬性特征表示了節(jié)點的狀態(tài)信息。本文在研究過程中,針對節(jié)點特征提取的客觀性作了探索,使用不同數(shù)量的節(jié)點特征對模型進(jìn)行訓(xùn)練,研究模型對于面狀居民地形狀的敏感度。本文試驗中,在設(shè)定模型中卷積層層數(shù)為4,嵌入向量維度為128時,以及其他條件不變的情況下改變節(jié)點的特征數(shù)量以研究所提取的居民地特征對于模型性能的影響。

如圖10所示,在節(jié)點特征數(shù)為2時,即僅以邊界線段的長度L1和方位角為特征α?xí)r,模型訓(xùn)練后的準(zhǔn)確率僅有63%左右。在逐個增加整體結(jié)構(gòu)特征L2和轉(zhuǎn)向角β后,由圖10可以看出,模型訓(xùn)練后的準(zhǔn)確率有明顯的提高,在由輪廓邊界上的特征數(shù)量逐漸增加整體結(jié)構(gòu)特征的過程中,可以得出居民地整體形態(tài)結(jié)構(gòu)對居民的地形狀有著較大的影響,由此可以說明所提取的居民地形狀特征的有效性。

圖10 特征個數(shù)對準(zhǔn)確率的影響Fig.10 Test of the number of vertex attributes

在模型的學(xué)習(xí)率為0.005、訓(xùn)練批次大小為100等條件一定時,本文試驗研究了模型的層數(shù)及形狀嵌入向量維度對模型性能的影響。由圖11可以看出,在一定條件下,通過增加模型的深度和形狀嵌入向量的維度可以提高模型分類的準(zhǔn)確率,但這也同樣增加了對計算資源的占用和模型訓(xùn)練的時間,并且由于模型采用反向傳播來更新權(quán)重參數(shù),如果模型復(fù)雜度過大會造成梯度消失或梯度爆炸。

圖11 模型深度和向量維度對模型的影響Fig.11 Test of the number of hidden layer and vector dimension

通過試驗研究得出使模型最優(yōu)時的超參數(shù)后,進(jìn)一步研究了模型的深度對模型性能的影響。在模型的其他超參數(shù)一定時,如訓(xùn)練批次為100、節(jié)點特征數(shù)量為4、嵌入向量維度為128、學(xué)習(xí)率為0.005且最大迭代次數(shù)為350次時,研究模型深度對模型性能的影響。如圖12所示,在試驗中,以模型分類的準(zhǔn)確率作為評價模型性能好壞的指標(biāo)。圖12中的數(shù)據(jù)說明,在一定的范圍內(nèi),增大模型深度,能夠提高模型對于形狀識別的準(zhǔn)確率。

圖12 模型深度對模型性能的影響Fig.12 The results of different hidden layers

對于該模型來說,當(dāng)模型層數(shù)為4層卷積層,權(quán)重維度為128時,模型的性能相對最好,模型分類的準(zhǔn)確率為92.3%。同樣,在模型深度為5層,權(quán)重維度為256時,模型的性能也比較不錯,模型準(zhǔn)確率為91.7%,但是隨著增加模型的深度和權(quán)重的維度,模型結(jié)構(gòu)變得更加復(fù)雜,易造成過擬合現(xiàn)象,這會削弱模型的泛化能力。

3.4 分類準(zhǔn)確率分析

為了衡量居民地形狀分類模型的好壞,需要給定一個測試集,用模型對測試集中的每一個樣本進(jìn)行預(yù)測,并根據(jù)模型預(yù)測分類的結(jié)果計算評價得分。對于分類問題,常見的評價標(biāo)準(zhǔn)有準(zhǔn)確率、精確率、召回率和F1值等。本文使用準(zhǔn)確率評價模型對所有類別整體分類的好壞,對于每個類的性能估計,使用精確率(P)和召回率(R)進(jìn)行評估(表2)。精確率也叫精度或查準(zhǔn)率,一個類別的查準(zhǔn)率是所有預(yù)測為該類的樣本中預(yù)測正確的比例;召回率也叫查全率,一個類別的查全率是所有真實標(biāo)簽為該類的樣本中預(yù)測正確的比例。F1值為查準(zhǔn)率和召回率的調(diào)和均值,表示在兩者同樣重要時給出的一種指標(biāo)。

(10)

(11)

(12)

表2 模型分類數(shù)據(jù)統(tǒng)計

由表2可知,該模型對于10種類型的居民地形狀有很好的分類效果,模型在精確率和召回率上都有很好的體現(xiàn),說明該方法在判斷居民地形狀類別方面有很大的優(yōu)勢。

為了對比圖卷積神經(jīng)網(wǎng)絡(luò)與其他類似方法的差異,本文分別采用多層感知機(multilayer perceptron,MLP)和支持向量機(support vector machine,SVM)進(jìn)行了對比試驗。由于面狀居民地輪廓多邊形頂點數(shù)目的不一致性,在使用MLP和SVM算法時,無法統(tǒng)一輸入層的神經(jīng)元數(shù)目,故本文中將面狀居民地的輪廓頂點增密到64個,節(jié)點的特征提取數(shù)量為4,輸入的特征維度為256(64×4)。在試驗中,MLP算法采用了3層結(jié)構(gòu),輸入為256維的特征向量,隱藏層為128,得到64×10維度的嵌入向量,MLP模型的訓(xùn)練結(jié)果如圖13所示。

圖13 MLP模型訓(xùn)練準(zhǔn)確率Fig.13 Training accuracy of MLP model

在SVM算法對比測試中,借助于Python中的scikit-learn庫實現(xiàn)SVM算法模型,優(yōu)化機器學(xué)習(xí)算法的參數(shù)值,能有效地提高模型的性能。在SVM算法中,模型性能主要受核函數(shù)(kernel)、懲罰系數(shù)C以及gamma值的影響。懲罰系數(shù)C是對誤差的寬容度,C值越大,說明越不能容忍出現(xiàn)誤差,容易過擬合;C值過小,容易欠擬合。C值過大或過小,都會使模型的泛化能力變差。gamma是選擇RBF函數(shù)作為核函數(shù)后,該函數(shù)自帶的一個參數(shù),隱含地決定了數(shù)據(jù)映射到新的特征空間后的分布。gamma越大,支持向量越少;gamma值越小,支持向量越多,支持向量的個數(shù)影響模型訓(xùn)練與預(yù)測的速度。在試驗中,選擇RBF函數(shù)作為核函數(shù),經(jīng)過試驗選擇了合適的懲罰系數(shù)C和gamma值,其中懲罰系數(shù)C為100,gamma值為1,具體試驗結(jié)果如圖14所示。

圖14 SVM模型訓(xùn)練準(zhǔn)確率Fig.14 Training accuracy of SVM model

在對比試驗上得到較優(yōu)結(jié)果后,在測試集上進(jìn)行測試,GCN、MLP和SVM算法的居民地形狀分類結(jié)果見表3。

表3 模型試驗結(jié)果對比

在機器學(xué)習(xí)領(lǐng)域,MLP和SVM都常用于分類任務(wù)中,在居民地形狀分類任務(wù)中,圖卷積神經(jīng)網(wǎng)絡(luò)的分類結(jié)果是遠(yuǎn)高于這兩種分類方法的。這是因為居民地形狀多邊形在建模為圖結(jié)構(gòu)后能夠最大程度地提取、保留居民地的空間幾何特征。在圖卷積運算的過程中,居民地形狀信息在兩個層次上進(jìn)行聚合和傳遞,一個是頂點內(nèi)部的屬性經(jīng)過維度擴展(從4維擴展到128維),實現(xiàn)了更高分辨率的屬性表達(dá);另一個是頂點間屬性聚合及傳遞,實現(xiàn)了相鄰節(jié)點形狀特征的組合與提取。而多層圖卷積神經(jīng)網(wǎng)絡(luò)的串行連接,則保證了高階、遠(yuǎn)距離形狀特征的聚合,故屬性信息的維度擴展和多層卷積網(wǎng)絡(luò)都對最終的分類效果提供了明顯的增益效果。此外,GCN在卷積的過程中充分考慮了居民地形狀計算圖的拓?fù)浣Y(jié)構(gòu),通過局域特征的多層次提取來實現(xiàn)圖信息的編碼表達(dá),而MLP和SVM顯然在這些方面難以企及。

3.5 應(yīng)用

為驗證模型的可用性,應(yīng)用本文中的居民地圖形狀分類模型對鄭州市部分居民地的形狀進(jìn)行識別,試驗數(shù)據(jù)來自O(shè)penStreetMap(OSM)。在鄭州市居民地矢量圖中,本文選取了部分居民地作為測試對象,如圖15中紫色部分,測試樣本數(shù)據(jù)集中共包含431個樣本,人工對選取的居民地進(jìn)行標(biāo)注,用訓(xùn)練好的模型對該數(shù)據(jù)集進(jìn)行分類,分類結(jié)果準(zhǔn)確率能達(dá)到85.0%左右,精確率為85.1%,召回率為87.7%,模型分類結(jié)果見表4。由圖15可以看出,在實際中建筑物多以矩形為主要,存在類型間數(shù)量不均衡的現(xiàn)象。

圖15 鄭州市試驗數(shù)據(jù)Fig.15 Experimental data of Zhengzhou

綜合前文訓(xùn)練階段的數(shù)據(jù)來看,測試集上的模型分類結(jié)果要優(yōu)于試驗集,例如測試集的F1主要集中在88.0%~99.5%,見表2;但是在鄭州市試驗集上得到的F1分布在33.3%~98.2%之間,見表4。這主要是因為模型訓(xùn)練和測試所用的數(shù)據(jù)集與鄭州市試驗數(shù)據(jù)集是不同源的兩個數(shù)據(jù)集。在模型訓(xùn)練和測試時,數(shù)據(jù)集中的10種居民地類型數(shù)量相等,數(shù)據(jù)分布較為均勻;類型內(nèi)不同居民地間的差異性不大,具體見表1。在鄭州市試驗數(shù)據(jù)集上,選取的是自然居民地數(shù)據(jù),該數(shù)據(jù)主要集中在同一片區(qū)域內(nèi),數(shù)據(jù)分布不均勻,見表2,這造成了10種形狀類型的數(shù)量各不相同,且類型內(nèi)居民地形狀差異也比較大;試驗數(shù)據(jù)集中F形和Y形的居民地數(shù)量明顯低于其他類型居民地,過少的樣本對試驗準(zhǔn)確率造成了較大的影響,故在試驗數(shù)據(jù)集上的F1與測試集上的F1差異較大。在下一步的研究中,將會進(jìn)一步增大訓(xùn)練集和試驗數(shù)據(jù)集,以便更加客觀地體現(xiàn)模型分類的準(zhǔn)確率。

表4 鄭州市部分居民地分類統(tǒng)計

4 結(jié) 語

面狀居民地形狀認(rèn)知與分類對于不同比例尺地形圖下居民地的選取、化簡及匹配等問題都有重大意義。針對面狀居民地典型形狀的認(rèn)知與分類等問題,本文提出一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的面狀居民地形狀分類方法。該方法以面狀居民地要素的輪廓多邊形作為構(gòu)建計算圖的基礎(chǔ),以面狀居民地的輪廓多邊形線段作為最小單元,提取輪廓多邊形線段的幾何特征作為計算圖的節(jié)點屬性特征,以圖結(jié)構(gòu)表達(dá)面狀居民地的輪廓形狀特征,將帶有標(biāo)簽和節(jié)點屬性的圖作為GCN分類模型的輸入,通過有監(jiān)督訓(xùn)練,利用圖卷積神經(jīng)網(wǎng)絡(luò)對高維形狀特征進(jìn)行分辨,實現(xiàn)面狀居民地的形狀分類。試驗結(jié)果表明,依據(jù)地理空間中的矢量數(shù)據(jù)構(gòu)造計算圖,能夠有效地利用圖結(jié)構(gòu)表達(dá)面狀居民地的輪廓形狀特征,圖卷積神經(jīng)網(wǎng)絡(luò)能夠明顯地區(qū)分出具有不同屬性和結(jié)構(gòu)的圖,能夠有效地的實現(xiàn)面狀矢量數(shù)據(jù)典型形狀的認(rèn)知和分類任務(wù)。

該方法以端到端的模式實現(xiàn)了居民地形狀分類的過程,克服了人為設(shè)置指標(biāo)的不足;此外,通過真實數(shù)據(jù)集的驗證,證明該方法能有效地識別出類別內(nèi)的字母型面狀居民地。但本文方法對于類別外的不規(guī)則面狀居民地形狀還無法做出判斷,這將是后續(xù)要改進(jìn)的主要工作之一,擬采用聚類和圖神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法深入研究;此外,今后的研究工作還將嘗試提高模型的分類準(zhǔn)確率,如嘗試其他圖神經(jīng)網(wǎng)絡(luò)類型、增大樣本的數(shù)據(jù)量、更加充分地描述矢量數(shù)據(jù)的局部以及整體特征等。

猜你喜歡
面狀形狀卷積
挖藕 假如悲傷有形狀……
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
利用ArcGis實現(xiàn)森林資源管理“一張圖”線轉(zhuǎn)面的方法探討
綠色科技(2021年5期)2021-04-08 08:14:00
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
你的形狀
顧及遙感影像特征的面狀地物輪廓簡化
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
一種面狀要素地圖的連續(xù)綜合方法研究
看到的是什么形狀
一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識別方法
大渡口区| 黔江区| 江西省| 八宿县| 荥经县| 弋阳县| 广宗县| 瑞安市| 保山市| 南和县| 修水县| 洞口县| 中江县| 马龙县| 红桥区| 松桃| 阳城县| 奉新县| 浦城县| 乌审旗| 成安县| 子长县| 芒康县| 永顺县| 犍为县| 雅安市| 济南市| 景宁| 株洲市| 木兰县| 黎平县| 介休市| 南城县| 吉隆县| 黑龙江省| 宁乡县| 安多县| 新晃| 策勒县| 周至县| 夏邑县|