林 怡 季昊巍 NICO Sneeuw 葉 勤
(1.同濟(jì)大學(xué)測(cè)繪與地理信息學(xué)院,上海 200092; 2.斯圖加特大學(xué)航空航天與大地測(cè)量學(xué)院, 斯圖加特 70173-70619)
基于魚(yú)群算法的極限學(xué)習(xí)機(jī)影像分類(lèi)方法優(yōu)化
林 怡1季昊巍1NICO Sneeuw2葉 勤1
(1.同濟(jì)大學(xué)測(cè)繪與地理信息學(xué)院,上海 200092; 2.斯圖加特大學(xué)航空航天與大地測(cè)量學(xué)院, 斯圖加特 70173-70619)
在傳統(tǒng)極限學(xué)習(xí)機(jī)(ELM)研究的基礎(chǔ)上,考慮到傳統(tǒng)ELM參數(shù)的不確定會(huì)導(dǎo)致整體分類(lèi)精度下降,利用仿生魚(yú)群算法(AF)對(duì)ELM的小波核參數(shù)和正則化參數(shù)進(jìn)行尋優(yōu),并構(gòu)造參數(shù)優(yōu)化后的小波ELM影像分類(lèi)模型(AF-ELM)。通過(guò)實(shí)驗(yàn)比較了該算法與人工神經(jīng)網(wǎng)路(ANN)、支持向量機(jī)(SVM)、極限學(xué)習(xí)機(jī)(ELM)等標(biāo)準(zhǔn)分類(lèi)器在遙感影像分類(lèi)上的精度與速度差異,并且與ELM多項(xiàng)式核、RBF核分類(lèi)算法進(jìn)行比較分析,驗(yàn)證了AF-ELM在分類(lèi)速度和精度上的優(yōu)越性。實(shí)驗(yàn)結(jié)果表明,AF-ELM分類(lèi)方法分類(lèi)速度較快,精度較高,均優(yōu)于其他分類(lèi)方法。能較好地應(yīng)用于遙感影像上各類(lèi)地物要素的自動(dòng)提取。
極限學(xué)習(xí)機(jī); 魚(yú)群算法; 影像分類(lèi); 小波核函數(shù); 遙感影像; 優(yōu)化
遙感技術(shù)以其快速、準(zhǔn)確的特點(diǎn)在大尺度土地利用動(dòng)態(tài)監(jiān)測(cè)中具有明顯的優(yōu)勢(shì),能夠?yàn)榈厍蛸Y源調(diào)查與開(kāi)發(fā)、土地利用/覆蓋變化(LUCC)信息的獲取以及環(huán)境動(dòng)態(tài)監(jiān)測(cè)等研究提供一種探測(cè)手段,在國(guó)內(nèi)外已經(jīng)得到了廣泛應(yīng)用[1-2]。而遙感影像的自動(dòng)分類(lèi)方法,是遙感影像自動(dòng)識(shí)別、獲得LUCC變化的一個(gè)重要環(huán)節(jié),其目的是對(duì)不同地物的類(lèi)型進(jìn)行判別[3-4]。目前有很多方法可以對(duì)遙感影像進(jìn)行分類(lèi),如支持向量機(jī)(SVM)、決策樹(shù)(Decision Tree)、人工神經(jīng)網(wǎng)絡(luò)(ANN)等[5]。然而SVM需要進(jìn)行多種分類(lèi)器的組合,速度較慢[6];決策樹(shù)分類(lèi)需要大量樣本,不能達(dá)到全局最優(yōu);神經(jīng)網(wǎng)絡(luò)算法雖然具有較強(qiáng)的學(xué)習(xí)能力,但學(xué)習(xí)速度較慢且易限于局部最小,效率較低[7],這些缺點(diǎn)極大制約了分類(lèi)方法的應(yīng)用和發(fā)展[8]。
因此,極限學(xué)習(xí)機(jī)(Extreme learning machine, ELM)在單隱層神經(jīng)網(wǎng)絡(luò)(SLFN)基礎(chǔ)上應(yīng)運(yùn)而生,該算法學(xué)習(xí)速度快、泛化性能好,很好地滿足一些領(lǐng)域?qū)?zhǔn)確率和速度的雙重要求。DENG 等[9]在傳統(tǒng) ELM 模型基礎(chǔ)上,在法方程矩陣中加入正則化對(duì)角陣,使得矩陣的特征根偏離零值,構(gòu)建了更穩(wěn)定、泛化性能更好的正則化 ELM 改進(jìn)模型。HUANG 等[10-11]將 ELM 與機(jī)器學(xué)習(xí)領(lǐng)域中應(yīng)用非常廣泛的 SVM 算法進(jìn)行了比較,得出在多分類(lèi)問(wèn)題中,ELM 與 SVM 相比,分類(lèi)精度更高、耗時(shí)更短。吳軍等[12]結(jié)合了正負(fù)模糊規(guī)則和極限學(xué)習(xí)機(jī)使得影像分類(lèi)結(jié)果較為理想;楊易旻[13]將改進(jìn)的極限學(xué)習(xí)機(jī)應(yīng)用到模式識(shí)別中,提高了其相關(guān)性能。上述研究中 ELM 仍存在抗粗差能力差、模型參數(shù)估計(jì)不穩(wěn)定等問(wèn)題,而且正則化參數(shù)在一定數(shù)值范圍內(nèi)的微小變化會(huì)對(duì)最終 ELM 模型精度產(chǎn)生巨大影響。
由于ELM的速度和精度受其相關(guān)參數(shù)組合方式的影響,因此需要利用仿生學(xué)的智能算法對(duì)其進(jìn)行優(yōu)化,如常見(jiàn)的遺傳算法(GA)全局尋優(yōu)能力較強(qiáng)而局部尋優(yōu)能力較差,易出現(xiàn)早熟收斂現(xiàn)象,粒子群算法(PSO)能夠進(jìn)行局部尋優(yōu)但速度較慢。而人工魚(yú)群算法(AFSA)是一種模仿魚(yú)群行為,通過(guò)搜索最優(yōu)值以對(duì)整體進(jìn)行優(yōu)化的智能算法[14]。該算法不要求較多的初值而且通過(guò)尋找全局極值來(lái)克服局部性問(wèn)題,在ELM分類(lèi)器的參數(shù)尋優(yōu)中相對(duì)其他仿生算法具有極大優(yōu)勢(shì)[15]。
本文將以小波核函數(shù)作為ELM 激活函數(shù)的分類(lèi)器,并利用AF優(yōu)化算法進(jìn)行尋優(yōu)以構(gòu)造一個(gè)更優(yōu)化的分類(lèi)器。首先利用魚(yú)群算法對(duì)ELM分類(lèi)器中的核參數(shù)和正則參數(shù)的最優(yōu)值進(jìn)行搜索,然后,通過(guò)對(duì)研究區(qū)影像數(shù)據(jù)進(jìn)行訓(xùn)練,尋找并建立最優(yōu)目標(biāo)函數(shù),采用AF算法在給定的范圍內(nèi)對(duì)參數(shù)進(jìn)行優(yōu)化,尋找魚(yú)群周邊食物濃度最大值所在的位置即分類(lèi)最優(yōu)值;然后,對(duì)其核參數(shù)和正則參數(shù)的組合參數(shù)進(jìn)行優(yōu)化以提高ELM分類(lèi)器對(duì)影像的分類(lèi)精度;同時(shí)將本文方法和常規(guī)的人工神經(jīng)網(wǎng)路(ANN)、支持向量機(jī)(SVM)和極限學(xué)習(xí)機(jī)(ELM)3種方法對(duì)研究區(qū)影像的分類(lèi)結(jié)果進(jìn)行綜合比較分析以驗(yàn)證本文構(gòu)造的AF-ELM分類(lèi)器的優(yōu)越性,最后實(shí)現(xiàn)對(duì)研究區(qū)影像的整體分類(lèi)。
1.1 研究區(qū)概況
研究區(qū)位于安徽省中部的環(huán)巢湖流域,流域面積約4 000 km2,其位置為116°24′30″E~118°0′0″E,30°58′40″N~32°6′0″N,處于長(zhǎng)江、淮河兩大水系之間。地處江淮丘陵地帶,四周分布大量低山丘陵,地勢(shì)為西高東低、中間低洼平坦。屬于亞熱帶和暖溫帶過(guò)渡性的副熱帶季風(fēng)氣候區(qū)。由于整個(gè)研究區(qū)域面積較大,進(jìn)行全部分類(lèi)所耗時(shí)間較長(zhǎng),因此選擇其影像的部分區(qū)域進(jìn)行實(shí)驗(yàn)分析。該地區(qū)地物類(lèi)別較豐富,適合進(jìn)行研究分析,面積為111 km2,如圖1中方框所示。
圖1 2013年環(huán)巢湖流域影像圖Fig.1 Image of Chaohu Lake Basin in 2013
1.2 數(shù)據(jù)來(lái)源
采用的衛(wèi)星影像數(shù)據(jù)是較高光譜分辨率的Landsat-8的TM、ETM+數(shù)據(jù),波段選擇為常用的4、3、2組合多光譜波段與較高空間分辨率的ZY-1 02C衛(wèi)星全色波段。由于植被在生長(zhǎng)過(guò)程中會(huì)呈現(xiàn)不同的光譜特性,為保障多時(shí)相數(shù)據(jù)分析可靠性,采用了2013年8月7日的環(huán)巢湖衛(wèi)星影像數(shù)據(jù)。表1、表2分別為L(zhǎng)andsat-8 相關(guān)的數(shù)據(jù)技術(shù)指標(biāo)以及ZY-1 02C衛(wèi)星參數(shù)。
表1 Landsat-8數(shù)據(jù)技術(shù)指標(biāo)Tab.1 Landsat-8 data technical indicators
1.3 ELM的基本理論
網(wǎng)絡(luò)模型的隱節(jié)點(diǎn)個(gè)數(shù)只要足夠定義,隱含層前饋神經(jīng)網(wǎng)絡(luò)模型的輸入權(quán)值和偏置即使是在任意取值的情況下,該模型也能夠逼近任意連續(xù)函數(shù)[16]。
表2 ZY-1 02C衛(wèi)星參數(shù)Tab.2 Parameters of ZY-1 02C satellite
若訓(xùn)練集樣本數(shù)與隱含層神經(jīng)元數(shù)相等,則對(duì)于任意的權(quán)重w和偏置b,單隱含層前饋神經(jīng)網(wǎng)絡(luò)都能夠用零誤差逼近訓(xùn)練樣本,即
(1)
其中
y=[y1jy2j…ymj]T
(2)
式中y——輸出矩陣
tj——期望輸出矩陣中元素
yj——輸出矩陣中元素
通常為了減少計(jì)算量,隱含層神經(jīng)元個(gè)數(shù)K通常比訓(xùn)練樣本個(gè)數(shù)Q小,單隱含層前饋神經(jīng)網(wǎng)絡(luò)的訓(xùn)練誤差可以逼近ε>0,即
(3)
因此,當(dāng)激活函數(shù)g(x)無(wú)限可微時(shí),可以部分調(diào)整單隱含層前饋神經(jīng)網(wǎng)絡(luò)的參數(shù),在訓(xùn)練前可以隨機(jī)選擇w和b,且在訓(xùn)練過(guò)程中保持不變[17]。而隱含層與輸出層的連接權(quán)值可以通過(guò)求解以下方程組的最小二乘解獲得
(4)
其中
=H+T′
(5)
式中H——輸出矩陣
H+——隱含層輸出矩陣H的Moore-Penrose廣義逆
T′——期望輸出矩陣
求解H的Moore-Penrose廣義逆采用奇異值分解法。即
=(HTH)-1HTT′
(6)
因此,極限學(xué)習(xí)機(jī)在訓(xùn)練之前可以隨機(jī)產(chǎn)生權(quán)重w和偏置b,連接權(quán)值可以通過(guò)隱含層神經(jīng)元個(gè)數(shù)及隱含層神經(jīng)元的激活函數(shù)計(jì)算。核函數(shù)的基本原理是通過(guò)非線性函數(shù)Φ把輸入空間樣本數(shù)據(jù)映射到高維特征空間,然后在高維特征空間進(jìn)行數(shù)據(jù)的處理[18]。本文選擇可容許條件的小波基函數(shù)作為ELM分類(lèi)模型的核函數(shù)。但是由于小波對(duì)信號(hào)整體進(jìn)行內(nèi)積,使得信號(hào)特征的精度下降,且小波的多級(jí)分解會(huì)使得其下降速度加快,導(dǎo)致整體效果較差。因此,需要對(duì)其相關(guān)參數(shù)進(jìn)行優(yōu)化以改善其性能。
1.4 魚(yú)群算法優(yōu)化
如圖2所示,模擬的人工魚(yú)當(dāng)前位置為X,其視野范圍為V,其視點(diǎn)在某一時(shí)刻停留的位置為XV,若該位置XV的食物濃度高于當(dāng)前位置X的濃度,則人工魚(yú)向食物方向前進(jìn)一步到達(dá)Xn;若濃度低于當(dāng)前位置的濃度,則搜索其他方向的食物。搜索的次數(shù)越多,則對(duì)周?chē)h(huán)境更加了解,以便做出相應(yīng)的判斷和決策[19]。適當(dāng)增加的不確定性有助于避免局部最優(yōu)狀況,從而搜尋全局最優(yōu)。
圖2 人工魚(yú)的視野和移動(dòng)步長(zhǎng)Fig.2 Artificial fish field of view and moving steps
圖2中,人工魚(yú)當(dāng)前位置為X=(x1,x2,…,xn);視野所看到的位置為
搜尋食物的過(guò)程為
(7)
(8)
式中r——[-1,1]區(qū)間的隨機(jī)數(shù)
xi——人工魚(yú)位置
Xn——移動(dòng)后下一位置
XV——視野所看到的位置
S——人工魚(yú)移動(dòng)的步長(zhǎng)
圖2中Xn1、Xn2分別為一視野范圍內(nèi)2條魚(yú)的位置。由于環(huán)境里的其他人工魚(yú)數(shù)目是有限的,因此人工魚(yú)在視野中相互感知,并相應(yīng)改變自身位置的方法仍與式(8)相同。
通常情況下魚(yú)類(lèi)的主要行為:
(1)覓食行為:魚(yú)類(lèi)生存最基本的行為主要就是向食物靠近的過(guò)程;該行為通過(guò)視覺(jué)來(lái)感知食物濃度來(lái)進(jìn)行移動(dòng)。因此,該行為能夠融入視覺(jué)概念。
(2)聚群行為:魚(yú)群長(zhǎng)期生存過(guò)程中形成的一種生活方式,數(shù)目極大的魚(yú)群匯聚在一起能夠進(jìn)行統(tǒng)一覓食和躲避敵害的危險(xiǎn)。
設(shè)人工魚(yú)當(dāng)前狀態(tài)為Xi,探索當(dāng)前領(lǐng)域內(nèi)(di,j (9) 式中 ?——擁擠度因子 表明其他魚(yú)群位置處有較高食物濃度且魚(yú)群數(shù)目較小,則向該位置前進(jìn)一步;否則執(zhí)行覓食行為。 (3)追尾行為:魚(yú)群附近的魚(yú)群會(huì)尾隨其靠近食物,且更遠(yuǎn)處的魚(yú)群也會(huì)同樣尾隨的一種方式。 (4)隨機(jī)行為:魚(yú)類(lèi)在水中的位置及狀態(tài)是隨機(jī)的,這種隨機(jī)行為是為了更大范圍地搜尋食物以及伙伴。 通過(guò)Matlab平臺(tái)編程得到正則化參數(shù)C和核參數(shù)a的優(yōu)化過(guò)程及結(jié)果如圖3所示。 圖3 尋優(yōu)過(guò)程Fig.3 Optimization process 圖3為對(duì)正則化參數(shù)和ELM核參數(shù)的優(yōu)化過(guò)程,最終得到最優(yōu)正則化參數(shù)C的目標(biāo)值為38.50和ELM最優(yōu)核參數(shù)a為 85.06,所用時(shí)間為2.97 s。由于核參數(shù)和正則化參數(shù)的不同選擇將會(huì)對(duì)后續(xù)分類(lèi)實(shí)驗(yàn)的精度產(chǎn)生影響,因此通過(guò)魚(yú)群尋優(yōu)算法得到的參數(shù)值將會(huì)提高后續(xù)分類(lèi)實(shí)驗(yàn)的精度。 1.5 實(shí)驗(yàn)步驟 基于上述理論,首先對(duì)高分辨遙感影像進(jìn)行數(shù)據(jù)預(yù)處理,然后為了得到較高空間分辨率和光譜分辨率的影像,進(jìn)行了影像的數(shù)據(jù)融合,在對(duì)研究區(qū)各種地物類(lèi)型特點(diǎn)進(jìn)行分析之后,運(yùn)用魚(yú)群算法對(duì)其參數(shù)進(jìn)行優(yōu)化?,F(xiàn)對(duì)其進(jìn)行重點(diǎn)闡述,實(shí)驗(yàn)步驟如下: (1)設(shè)置魚(yú)群算法初始參數(shù),包括人工魚(yú)群個(gè)體大小Nfishnum,人工魚(yú)的感知距離V,人工魚(yú)移動(dòng)步長(zhǎng)S,擁擠度?,覓食行為嘗試的最大次數(shù)Ntry_number,當(dāng)前覓食行為次數(shù)n,最大迭代次數(shù)NMAXGEN。 (2)通過(guò)對(duì)研究區(qū)地物特點(diǎn)(道路、林地、裸地、草地、房屋、建筑用地、水體)進(jìn)行分析以設(shè)置研究區(qū)影像的訓(xùn)練樣本和測(cè)試樣本。 (3)對(duì)參數(shù)進(jìn)行搜索和優(yōu)化。根據(jù)式(9)判斷伙伴中心是否存在較多食物且不太擁擠,然后再根據(jù)式(7)、(8)更新人工魚(yú)的空間位置,再經(jīng)過(guò)隨機(jī)擾動(dòng)不斷迭代獲取魚(yú)群周邊食物的最高濃度所在的位置數(shù)據(jù),即為最優(yōu)目標(biāo)函數(shù)值。 (4)當(dāng)滿足迭代要求時(shí),轉(zhuǎn)到步驟(5),否則轉(zhuǎn)回步驟(3),進(jìn)行下一次搜索。 (5)輸出全局最優(yōu)點(diǎn)和最優(yōu)個(gè)體值。 改進(jìn)ELM算法參數(shù)選擇優(yōu)化流程如圖4所示。 圖4 魚(yú)群算法流程圖Fig.4 Flow chart of fish algorithm 1.6 參數(shù)設(shè)置 通過(guò)對(duì)參數(shù)的調(diào)整,能夠避免算法陷入局部最優(yōu)和加快收斂速度,同時(shí)適當(dāng)?shù)膮?shù)組合可以得到較好的精度和穩(wěn)定性,根據(jù)實(shí)驗(yàn)及相關(guān)文獻(xiàn)得到參數(shù)設(shè)置的依據(jù)[20]為: (1)尋優(yōu)的精度將會(huì)隨著移動(dòng)步長(zhǎng)S的減少而提升,反之將會(huì)降低。 (2)隨著步長(zhǎng)的逐步增加,迭代次數(shù)逐步減少,但是在超過(guò)一定范圍后,迭代次數(shù)增加,收斂速度減緩,當(dāng)步長(zhǎng)過(guò)大時(shí),會(huì)出現(xiàn)振蕩現(xiàn)象。因此需要采用合適的步長(zhǎng)使算法達(dá)到最好的尋優(yōu)效果。 (3)感知距離V對(duì)優(yōu)化精度有一定的影響,V越大,優(yōu)化精度越低。但是在步長(zhǎng)一定的情況下,迭代次數(shù)隨著視野的逐步增加有少量幅度不大的減少,而較小的視野能夠收斂到較好的結(jié)果。 (4)增加最大嘗試次數(shù)Ntry-number能夠減少人工魚(yú)的隨機(jī)游動(dòng)從而提高算法的收斂效率,但是增加了計(jì)算時(shí)間。 (5)優(yōu)化精度隨著魚(yú)群大小Nfishnum的增大而不斷提高,但Nfishnum超過(guò)一定數(shù)量后,提高幅度較低,其運(yùn)行時(shí)間與Nfishnum呈正比增大。 (6)正則化參數(shù)C用于控制模型復(fù)雜度和逼近誤差的折中,C越大則對(duì)數(shù)據(jù)的擬合程度越高。但泛化能力將降低。 (7)增加迭代次數(shù)和魚(yú)群大小雖然能夠得到更優(yōu)的ELM參數(shù),但是需要耗費(fèi)大量時(shí)間,效率較低;而較少的迭代次數(shù)和較小的魚(yú)群又不能得到更優(yōu)的參數(shù),因此需要反復(fù)驗(yàn)證,找到最優(yōu)的參數(shù)以保證其效率和精度。 通過(guò)綜合考慮精度和效率的關(guān)系,經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證設(shè)置魚(yú)群算法參數(shù)為:將極限學(xué)習(xí)機(jī)的正則化參數(shù)C設(shè)置為[10-6,106],小波核函數(shù)參數(shù)的搜索范圍設(shè)置為(0,100)。由于本文研究區(qū)地物類(lèi)別較為豐富,需要引入較大數(shù)量的魚(yú)群和較大的感知距離來(lái)進(jìn)行參數(shù)尋優(yōu)以滿足本文實(shí)驗(yàn)的需求,因此將 AF 中的參數(shù)進(jìn)行初始化設(shè)置為:Nfishnum為100,最大迭代次數(shù)NMAXGEN為70,Ntry-number為200,V為3.1,擁擠度因子 ? 為0.724,S為0.5。 2.1 訓(xùn)練樣本與測(cè)試樣本 訓(xùn)練樣本在高光譜遙感分類(lèi)過(guò)程中十分重要,如果訓(xùn)練樣本代表性較差,將會(huì)對(duì)最終分類(lèi)結(jié)果產(chǎn)生影響。為了從研究區(qū)影像上提取訓(xùn)練樣本作為參考光譜,本文通過(guò)在高光譜圖像上用訓(xùn)練區(qū)(ROI)方法圈定出能夠代表該地物的一片均勻區(qū)域,在此區(qū)域內(nèi)求出所有像元的均值光譜,并將其作為標(biāo)準(zhǔn)數(shù)據(jù)建立本文的光譜庫(kù)。同時(shí)通過(guò)對(duì)研究區(qū)的野外調(diào)查,了解研究區(qū)內(nèi)地物的分布狀況[21]。 測(cè)試樣本可以通過(guò)同樣的方法進(jìn)行建立。訓(xùn)練樣本和測(cè)試樣本數(shù)如表3所示。 表3 訓(xùn)練樣本和測(cè)試樣本數(shù)Tab.3 Number of training samples and test samples 2.2 相關(guān)結(jié)果 2.2.1數(shù)據(jù)融合 影像融合是將用不同傳感器對(duì)同一地區(qū)進(jìn)行成像,或者傳感器相同而成像方式不同的影像融合為一幅影像的過(guò)程;其融合的目的是使多光譜影像的空間分辨率得以提高。本文采用HSV融合方法。如圖5所示,將多光譜影像(圖5a)與全色波段影像(圖5b)進(jìn)行融合,得到更高空間分辨率和光譜分辨率的影像(圖5c)。 圖5 數(shù)據(jù)融合影像Fig.5 Data fusion images 2.2.2分類(lèi)性能對(duì)比 將訓(xùn)練數(shù)據(jù)加入到人工神經(jīng)網(wǎng)絡(luò)(ANN)、支持向量機(jī)(SVM)、極限學(xué)習(xí)機(jī)(ELM)3種分類(lèi)器中進(jìn)行學(xué)習(xí),同時(shí)利用PSO、GA、AF對(duì)分類(lèi)器的參數(shù)進(jìn)行優(yōu)化,建立了優(yōu)化后的分類(lèi)模型,其分類(lèi)結(jié)果如圖6和圖7 所示。 圖6 不同分類(lèi)算法下的準(zhǔn)確率Fig.6 Accuracy under different classification algorithms 由圖6、圖7可看出AF-ELM相對(duì)于PSO-ELM和GA-ELM的分類(lèi)性能更優(yōu),有效降低了錯(cuò)分率。由于AF算法能夠克服局部極值,對(duì)搜索空間具有一定的適應(yīng)能力,同時(shí)對(duì)參數(shù)選取不敏感,從而使得AF算法收斂速度加快,性能更優(yōu)。 2.2.3各種分類(lèi)器高光譜遙感影像分類(lèi) 實(shí)驗(yàn)將研究區(qū)的地物類(lèi)別分為7種類(lèi)型,即水體、林地、草地、裸地、建筑用地、道路和房屋。并設(shè)置感興趣區(qū)ROI,具體設(shè)置名稱(chēng)、顏色等信息如表4所示。將圖1所示區(qū)域作為實(shí)驗(yàn)區(qū),利用ANN、SVM、ELM進(jìn)行分類(lèi),并和本文AF-ELM的分類(lèi)結(jié)果進(jìn)行比對(duì)分析,結(jié)果如圖8所示。 圖7 不同分類(lèi)算法下的錯(cuò)分率Fig.7 Error rates under different classification algorithms 表4 感興趣區(qū)設(shè)置Tab.4 ROI settings 圖8 各種分類(lèi)方法對(duì)比Fig.8 Comparison of various classification methods 由圖8可看出,ANN分類(lèi)效果較差,不能很好地區(qū)分裸地及道路,引起了兩者的混淆。而SVM將大部分建筑用地錯(cuò)分為房屋。從圖8d中黑框可以看出,相對(duì)于SVM,AF-ELM將田徑場(chǎng)中的草地和塑膠跑道較好地區(qū)分了出來(lái)。 為了驗(yàn)證分類(lèi)的精度,引入混淆矩陣計(jì)算分類(lèi)結(jié)果的精度。實(shí)驗(yàn)主要驗(yàn)證了AF-ELM的精度,其混淆矩陣如表5所示。4種分類(lèi)方法的總體精度如表6所示。 由表6可看出,AF-ELM的總體精度為91.416 8%,Kappa系數(shù)為 0.881 1;相對(duì)于其他分類(lèi)方法而言,其精度更高,并且每類(lèi)地物的錯(cuò)分點(diǎn)相較于其他方法較少。 2.2.4算法復(fù)雜度分析 人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速度較慢,而SVM中訓(xùn)練效率較低主要由于時(shí)間都消耗在拉格朗日乘子的計(jì)算上,而ELM在樣本數(shù)據(jù)規(guī)模較大的時(shí)候,隱藏節(jié)點(diǎn)數(shù)通常遠(yuǎn)小于訓(xùn)練樣本數(shù),使得時(shí)間大大減少。4類(lèi)分類(lèi)方法所耗時(shí)間如表7所示。 表5 AF-ELM混淆矩陣Tab.5 AF-ELM confusion matrix 表6 4種方法總體精度比較Tab.6 Comparison of overall accuracy of four methods 表7 各類(lèi)分類(lèi)方法使用時(shí)間Tab.7 Time of various types of classification method 由表7可看出,在學(xué)習(xí)速度上,ELM比SVM更具有優(yōu)勢(shì),而本文AF-ELM的分類(lèi)效率最高,所用時(shí)間為0.897 1 s;同時(shí)其精度也較好,達(dá)到了91.416 8%。由于ELM不需要調(diào)整網(wǎng)絡(luò)輸入權(quán)值,在樣本數(shù)據(jù)較大時(shí)所需時(shí)間小于SVM,因此更具有優(yōu)勢(shì)。 2.2.5ELM的不同核函數(shù)高光譜遙感影像分類(lèi) 不同的核函數(shù)對(duì)應(yīng)于不同的映射形式,因此基于不同核函數(shù)的ELM分類(lèi)器也具有不同的特點(diǎn)。為了和本文的基于小波核的ELM進(jìn)行更好比較,選擇了多項(xiàng)式核和RBF核極限學(xué)習(xí)機(jī)進(jìn)行分類(lèi),同時(shí)選用了相同訓(xùn)練樣本,分類(lèi)結(jié)果如圖9、圖10所示。 圖9 多項(xiàng)式核ELM分類(lèi)結(jié)果Fig.9 Classification results of polynomial kernel 圖10 徑向基核ELM 分類(lèi)結(jié)果Fig.10 Classification results of radial basis function ELM 由圖9可看出,分類(lèi)的重點(diǎn)主要為居民區(qū),但由于居民區(qū)附近含有較多的地物,如裸地、草地和房屋,因此導(dǎo)致局部分類(lèi)精度下降,其精度只有80.62%。而圖10中RBF核對(duì)于數(shù)據(jù)中的噪聲有著較好的抗干擾能力,但是在本實(shí)驗(yàn)中,精度卻低于小波核ELM,只有87.54%。 綜合比較分析本文所用AF-ELM分類(lèi)器容易訓(xùn)練、收斂速度較快,分類(lèi)方法效率及精度都較好,可以適用于研究區(qū)遙感影像的分類(lèi)。將其用于環(huán)巢湖研究區(qū)影像的整體分類(lèi),結(jié)果如圖11所示。 圖11 研究區(qū)分類(lèi)Fig.11 Classification of study areas 由圖11可看出,AF-ELM分類(lèi)器能夠?qū)φ麄€(gè)環(huán)巢湖流域進(jìn)行較好分類(lèi),其分類(lèi)結(jié)果較好。同時(shí),AF-ELM分類(lèi)器能夠更好地提取高光譜影像中多且復(fù)雜的地物要素,能夠有效去除椒鹽現(xiàn)象。 2.2.6環(huán)巢湖流域影像分類(lèi)的精度評(píng)價(jià) 采用混淆矩陣的方法對(duì)分類(lèi)影像進(jìn)行精度評(píng)價(jià)。環(huán)巢湖流域影像分類(lèi)的精度評(píng)價(jià)如表8所示。由表8可以看出分類(lèi)的總體精度為94.183 1%,Kappa系數(shù)為 0.884 7,通過(guò)結(jié)合實(shí)地調(diào)查數(shù)據(jù)進(jìn)行相互驗(yàn)證發(fā)現(xiàn)本文分類(lèi)結(jié)果更加符合環(huán)巢湖流域?qū)嶋H地物的分布情況,分類(lèi)的精度較好。 表8 混淆矩陣精度評(píng)價(jià)Tab.8 Confusion matrix accuracy evaluation 注:總體精度為94.183 1%,Kappa系數(shù)為0.884 7。 (1)在極限學(xué)習(xí)機(jī)的相關(guān)理論的基礎(chǔ)上,利用仿生魚(yú)群算法AF對(duì)極限學(xué)習(xí)機(jī)的正則化參數(shù)和核參數(shù)進(jìn)行了優(yōu)化,在提高了遙感影像分類(lèi)效率的同時(shí),其精度也較大提高。 (2)實(shí)驗(yàn)結(jié)果表明AF-ELM的整體精度為91.416 8%,所用時(shí)間為0.897 1 s。這表明極限學(xué)習(xí)機(jī)比支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)的速度更快,而且性能更容易改善;同時(shí),通過(guò)和遺傳算法和粒子群算法進(jìn)行比較,人工魚(yú)群算法能夠更快、更好地搜索極限學(xué)習(xí)機(jī)的最優(yōu)參數(shù),因此能夠使研究區(qū)影像的分類(lèi)結(jié)果更優(yōu)。 (3)通過(guò)將ELM分類(lèi)器和AF優(yōu)化算法進(jìn)行結(jié)合構(gòu)造了一個(gè)更優(yōu)化的分類(lèi)器,其精度和效率都比傳統(tǒng)的ELM分類(lèi)器有了較大的提升,并將該分類(lèi)器應(yīng)用到環(huán)巢湖研究區(qū)影像的整體分類(lèi),總體精度達(dá)到了94.183 1%,所得到的分類(lèi)結(jié)果能夠?yàn)榄h(huán)巢湖流域的地球資源調(diào)查與開(kāi)發(fā)、土地利用/覆蓋變化(LUCC)信息的獲取以及環(huán)境的動(dòng)態(tài)監(jiān)測(cè)提供一種技術(shù)手段。 1 廖建尚,王立國(guó),郝思媛.基于雙邊濾波和空間鄰域信息的高光譜圖像分類(lèi)方法[J/OL].農(nóng)業(yè)機(jī)械學(xué)報(bào),2017,48(8):140-146,211.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20170815&journal_id=jcsam.DOI:10.6041/j.issn.1000-1298.2017.08.015. LIAO Jianshang, WANG Liguo, HAO Siyuan.Hyperspectral image classification method combined with bilateral filtering and pixel neighborhood information[J/OL].Transactions of the Chinese Society for Agricultural Machinery,2017,48(8):140-146,211.(in Chinese) 2 ESMAIL M, MASRIA A, NEGM A.Monitoring land use/land cover changes around Damietta promontory, Egypt, using RS/GIS [J].Procedia Engineering, 2016, 154:936-942. 3 林楠,姜琦剛,楊佳佳,等.基于資源一號(hào)02C高分辨率數(shù)據(jù)的農(nóng)業(yè)區(qū)土地利用分類(lèi)[J/OL].農(nóng)業(yè)機(jī)械學(xué)報(bào),2015,46(1):278-284.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20150139&journal_id=jcsam.DOI:10.6041/j.issn.1000-1298.2015.01.039. LIN Nan,JIANG Qigang,YANG Jiajia,et al.Classifications of agricultural land use based on high-spatial resolution ZY1-02C remote sensing images[J/OL].Transactions of the Chinese Society for Agricultural Machinery,2015,46(1):278-284.(in Chinese) 4 陳元鵬,鄖文聚,周旭,等.基于MESMA和RF的山丘區(qū)土地利用信息分類(lèi)提取[J/OL].農(nóng)業(yè)機(jī)械學(xué)報(bào),2017,48(7):136-144.http:∥www.j-csam.org/jcsam/ch/reader/view_abstract.aspx?flag=1&file_no=20170717&journal_id=jcsam.DOI:10.6041/j.issn.1000-1298.2017.07.017. CHEN Yuanpeng,YUN Wenju,ZHOU Xu,et al.Classification and extraction of land use information in hilly area based on MESMA and RF classifier[J/OL].Transactions of the Chinese Society for Agricultural Machinery,2017,48(7):136-144.(in Chinese) 5 杜斌, 張煒.基于面向?qū)ο蟮母叻直媛蔬b感影像分類(lèi)技術(shù)研究[J].西部資源, 2016(5):135-138. DU Bin, ZHANG Wei.Research on high-resolution remote sensing image classification based on object-oriented [J].Western Resources, 2016(5): 135-138.(in Chinese) 6 譚琨, 杜培軍.基于支持向量機(jī)的高光譜遙感圖像分類(lèi)[J].紅外與毫米波學(xué)報(bào), 2008, 27(2):123-128. TAN Kun, DU Peijun.Remote sensing image classification based on support vector machine [J].Journal of Infrared and Millimeter Waves, 2008, 27(2): 123-128.(in Chinese) 7 HUANG G B, ZHU Q Y, SIEW C K.Extreme learning machine: a new learning scheme of feedforward neural networks[C]∥IEEE International Joint Conference on Neural Networks, 2005:985-990. 8 李孝偉, 陳福才, 李邵梅.基于分類(lèi)規(guī)則的C4.5決策樹(shù)改進(jìn)算法[J].計(jì)算機(jī)工程與設(shè)計(jì), 2013, 34(12):4321-4325. LI Xiaowei, CHEN Fucai, LI Shaomei.An improved C4.5 decision tree algorithm based on classification rules [J].Computer Engineering and Design, 2013, 34(12): 4321-4325.(in Chinese) 9 DENG W, ZHENG Q, CHEN L.Regularized extreme learning machine[C]∥Computational Intelligence and Data Mining, 2009.CIDM ’09.IEEE Symposium on IEEE, 2009:389-395. 10 HUANG G B, DING X, ZHOU H.Optimization method based extreme learning machine for classification [M].Elsevier Science Publishers B.V.2010. 11 HUANG G B, ZHOU H, DING X, et al.Extreme learning machine for regression and multiclass classification[J].IEEE Transactions on Systems Man & Cybernetics Part B Cybernetics A Publication of the IEEE Systems Man & Cybernetics Society, 2012, 42(2):513-529. 12 吳軍,王士同,趙鑫.正負(fù)模糊規(guī)則系統(tǒng)、極限學(xué)習(xí)機(jī)與圖像分類(lèi)[J].中國(guó)圖象圖形學(xué)報(bào),2011,16(8):1408-1417. WU Jun, WANG Shitong, ZHAO Xin.Positive and negative fuzzy rules system, limit learning machine and image classification [J].Journal of Image and Graphics, 2011, 16(8): 1408-1417.(in Chinese) 13 楊易旻.基于極限學(xué)習(xí)的系統(tǒng)辨識(shí)方法及應(yīng)用研究[D].長(zhǎng)沙:湖南大學(xué),2013. YANG Yimin.Study on system identification method and its application based on extreme learning [D].Changsha:Hunan University, 2013.(in Chinese) 14 江銘炎.人工魚(yú)群算法及其應(yīng)用[M].北京:科學(xué)出版社, 2012. 15 SHEN M, LI L, LIU D.Research and application of function optimization based on artificial fish swarm algorithm[C]∥Proceedings of the 4th International Conference on Computer Engineering and Networks.Springer International Publishing, 2015:195-200. 16 洪炳熔, 金飛虎, 高慶吉.基于蟻群算法的多層前饋神經(jīng)網(wǎng)絡(luò)[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào), 2003, 35(7):823-825. HONG Bingrong, JIN Feihu, GAO Qingji.Multi-layer feedforward neural network based on ant colony algorithm [J].Journal of Harbin Institute of Technology, 2003, 35(7): 823-825.(in Chinese) 17 SANGER T D.Optimal unsupervised learning in a single-layer linear feedforward neural network [J].Neural Networks,1989, 2(6):459-473. 18 GB H, H Z, X D, et al.Extreme learning machine for regression and multiclass classification [J].Systems, Man, and Cybernetics, Part B: Cybernetics, IEEE Transactions on, 2012, 42(2):513-529. 19 李曉磊.一種新型的智能優(yōu)化方法-人工魚(yú)群算法[D].杭州:浙江大學(xué), 2003. LI Xiaolei.A new intelligent optimization method-artificial fish swarm algorithm [D].Hangzhou: Zhejiang University, 2003.(in Chinese) 20 王聯(lián)國(guó), 施秋紅.人工魚(yú)群算法的參數(shù)分析[J].計(jì)算機(jī)工程, 2010, 36(24):169-171. WANG Lianguo, SHI Qiuhong.Performance analysis of artificial fish swarm algorithm [J].Computer Engineering, 2010, 36(24): 169-171.(in Chinese) 21 陶秋香, 張連蓬, 李紅梅.植被高光譜遙感分類(lèi)中訓(xùn)練樣本的選擇方法[J].國(guó)土資源遙感, 2005, 17(2):33-35. TAO Qiuxiang, ZHANG Lianpeng, LI Hongmei.Characteristics of training samples in vegetation hyperspectral remote sensing classification [J].Remote Sensing for Land and Resources, 2005, 17(2): 33-35.(in Chinese) OptimizationofELMClassificationModelforRemoteSensingImageBasedonArtificialFish-swarmAlgorithm LIN Yi1JI Haowei1NICO Sneeuw2YE Qin1 (1.CollegeofSurveyingandGeo-Informatics,TongjiUniversity,Shanghai200092,China2.SchoolofAerospaceandGeodesy,UniversityofStuttgart,Stuttgart70173-70619,Germany) As a new means of earth resource survey, land use change and coverage (LUCC) and ecological environment monitoring, remote sensing technology has a great advantage.The automatic classification for remote sensing image is the key technology to extract rich ground-object information and monitor the dynamic change of LUCC.Machine learning can flexibly build a model portrayed by parameters, and automatically extract information, which has been widely used in image classification because of its good robustness and convergence, and easy to be combined with other methods.Based on the study of traditional extreme learning machine (ELM) theory, the optimal selection of kernel function parameters and regularizing parameters were performed by using artificial fish swarm algorithm (AF) and the optimal ELM image classification model (AF-ELM) was constructed.The classification model used AF to optimize the wavelet kernel parameters and regularizing parameters of ELM to improve the classification accuracy.After that the classification for multi-spectral remote sensing image was implemented by using the parameter-optimized ELM classifier, meanwhile, compared with some standard classifier such as artificial neural networks(ANM), support vector machine (SVM) and extreme learning machine (ELM), and it was comparatively analyzed with the ELM polynomial kernel and RBF kernel classification algorithm.The experiments proved that optimal AF-ELM classifier was more faster and accurate, which was superior to those before-mentioned classifiers.It can be used for the automatic extraction of various elements from remote sensing image. extreme learning machine; fish swarm algorithm; image classification; wavelet kernel function; remote sensing image; optimization 10.6041/j.issn.1000-1298.2017.10.019 TP79; F301.23 A 1000-1298(2017)10-0156-09 2017-06-14 2017-08-16 國(guó)土資源部公益性行業(yè)科研專(zhuān)項(xiàng)(201211011)和上海市科學(xué)技術(shù)委員會(huì)科研計(jì)劃項(xiàng)目(13231203602) 林怡(1970—),女,副教授,博士,主要從事攝影測(cè)量與遙感研究,E-mail: linyi@#edu.cn2 結(jié)果與討論
3 結(jié)論