韓立欽,張耀南,秦其明
?
深度學(xué)習(xí)自編碼結(jié)合混合蛙跳算法提取農(nóng)田高光譜影像端元
韓立欽1,2,張耀南1※,秦其明3
(1. 中國科學(xué)院西北生態(tài)環(huán)境資源研究院,蘭州 730000;2. 中國科學(xué)院大學(xué),北京 100049; 3. 北京大學(xué)地球與空間科學(xué)學(xué)院,北京 100871)
針對農(nóng)田高光譜遙感影像端元提取和混合像元分解精度不高的問題,該文提出了利用深度學(xué)習(xí)自編碼結(jié)合混合蛙跳算法的農(nóng)田高光譜影像端元提取方法。首先,利用深度學(xué)習(xí)的棧式自編碼模型對高光譜影像進(jìn)行光譜特征提取,優(yōu)選出備選端元集合;然后將影像端元提取問題轉(zhuǎn)化為組合優(yōu)化問題,設(shè)計了待優(yōu)化的目標(biāo)函數(shù),通過混合蛙跳算法對目標(biāo)函數(shù)進(jìn)行優(yōu)化從而實現(xiàn)對最佳端元組合的搜索;最后利用人工合成的不同信噪比農(nóng)田高光譜數(shù)據(jù)和真實的農(nóng)田高光譜影像,將該算法與3種現(xiàn)有的主要端元提取方法進(jìn)行對比。試驗結(jié)果表明,本文提出的端元提取算法對20 、30 和40 dB信噪比影像提取結(jié)果的平均光譜角分別達(dá)到0.106 88、0.030 32、0.009 94。對20 、30 和40 dB信噪比影像和真實影像提取結(jié)果的均方根誤差分別達(dá)到0.050 8、0.015 9、0.005 1、0.006 7。與現(xiàn)有的主要端元提取方法相比,該方法具有端元提取精度高、對不同等級噪聲魯棒性好等優(yōu)勢,在農(nóng)田高光譜遙感監(jiān)測中具有廣闊的應(yīng)用前景。
作物;遙感;圖像處理;高光譜;端元提??;棧式自編碼;混合蛙跳算法
高光譜遙感為每個成像像元提供了很窄的成像波段和連續(xù)的反射光譜,在大面積的農(nóng)作物種類識別、農(nóng)作物產(chǎn)量估算、作物病蟲害監(jiān)測、自然資源調(diào)查等農(nóng)業(yè)遙感的諸多領(lǐng)域有著廣泛的應(yīng)用前景[1-2]。但是,受限于傳感器的信息獲取能力,在保證一定信噪比的條件下,高光譜遙感影像的空間分辨率比較低。因此,對于高光譜影像而言,混合像元的問題尤為突出。為了更好地發(fā)揮高光譜遙感數(shù)據(jù)的優(yōu)勢,在對高光譜影像進(jìn)行應(yīng)用研究的過程中就需要進(jìn)行混合像元分解[3]。因此現(xiàn)有的大多數(shù)混合像元分解的方法分為2個步驟:一是端元提取;二是端元豐度估算[4]。
在過去的幾十年中,學(xué)者們提出了很多高光譜影像的端元提取方法。目前被廣泛討論和應(yīng)用的算法主要有:純像元指數(shù)法[5],光學(xué)實時自適應(yīng)光譜識別系統(tǒng)[6],內(nèi)部最大體積法[7],迭代誤差分析法[8],凸錐分析[9],自動形態(tài)學(xué)端元提取[10],順序最大角凸錐法[11],迭代約束端元法[12],個體進(jìn)化策略法[13],頂點成分分析法[14],獨立成分分析法[15]等。近年來,端元提取始終是高光譜遙感領(lǐng)域研究的熱點問題之一,一些新的方法也不斷涌現(xiàn),如文獻(xiàn)[16-17]。
雖然一系列的端元提取方法被提出,但是這些方法各有特色[18]。主要有:大多數(shù)算法基于凸面單形體的假設(shè),如內(nèi)部最大體積法(N-FINDR)、頂點成分分析法(vertex component analysis,VCA)等,但是由于線性混合模型的局限性以及傳感器噪聲的影響,端元并不一定位于凸面單形體的頂點,即直接把凸面單形體的頂點提取作為端元往往不能夠把真正的端元正確提取出來;一些方法屬于半自動方法,如PPI(pixel purity index,PPI)方法等,需要較多的人機交互式操作,受人為因素影響比較嚴(yán)重;大多數(shù)算法缺乏反饋機制,在順序提取端元的過程中,最先被提取的端元對最終結(jié)果影響較大,并且容易導(dǎo)致算法陷入局部最優(yōu)解。
端元提取的目的是為混合像元分解提供端元。事實上,由于地表的復(fù)雜性和傳感器成像能力的有限性,高光譜影像的端元一般指影像中包含某種地物類型比例很高的像元,而不是僅僅包含一種地物的嚴(yán)格意義上的純凈像元[4]。為了更好地實現(xiàn)混合像元分解,端元提取可轉(zhuǎn)化為一個離散優(yōu)化問題:從影像中選取最佳端元組合,使得混合像元分解的精度達(dá)到最高。作為深度學(xué)習(xí)中的典型模型,棧式自編碼(stacked autoencoder,SAE)能夠以無監(jiān)督的方式,通過逐層訓(xùn)練實現(xiàn)對高維信號的降維,相比主成分分析等傳統(tǒng)方法優(yōu)勢明顯[19-20],是深度學(xué)習(xí)(deep learning,DL)的算法之一,為高光譜影像的特征提取提供了很好的技術(shù)支撐。混合蛙跳算法(shuffled frog leaping algorithm,SFLA)模擬了青蛙群體覓食行為過程中信息共享機制,是一個全新的啟發(fā)式群體智能優(yōu)化算法,具有優(yōu)秀的計算性能和很好的全局搜索能力[21-22]。
針對上述端元提取方法的不足,本文提出一種基于深度學(xué)習(xí)中棧式自編碼模型和混合蛙跳算法的農(nóng)田影像端元提取方法。首先,利用SAE模型對高光譜影像進(jìn)行特征提取,篩選出可用于混合像元分解的備用端元;然后利用SFLA算法對端元組合進(jìn)行搜索和優(yōu)化,得到能夠使得混合像元分解精度最高的端元組合,為農(nóng)田高光譜影像混合像元分解提供端元。
本文算法流程如圖1所示。為了將SAE和SFLA算法運用到農(nóng)田影像端元提取中,對SAE和SFLA算法做了必要的適應(yīng)端元提取問題的改進(jìn),重新定義了SAE和SFLA算法中的參數(shù),設(shè)計了待優(yōu)化的目標(biāo)函數(shù)。
圖1 深度學(xué)習(xí)結(jié)合混合蛙跳的農(nóng)田高光譜影像端元提取流程
在自編碼神經(jīng)網(wǎng)絡(luò)中,每一層可以看作是對上層輸出的非線性變換和特征表示,每增加一個隱含層就可以計算出更為復(fù)雜的特征表示[23],所以利用深層的神經(jīng)網(wǎng)絡(luò)能夠以更緊湊的方式來表達(dá)更多的函數(shù)集合,具備更好的特征提取能力。作為一種典型的深度學(xué)習(xí)模型,SAE模型由多個稀疏自編碼神經(jīng)網(wǎng)絡(luò)串聯(lián)組成,前一個自編碼神經(jīng)網(wǎng)絡(luò)的輸出層作為后一個自編碼神經(jīng)網(wǎng)絡(luò)的輸入層,每一層都是對輸入層一種特征表示,盡可能地復(fù)現(xiàn)輸入層的信息,從而實現(xiàn)特征提取。一個簡單的SAE模型的結(jié)構(gòu)如圖2所示(以4層結(jié)構(gòu)為例)。
對SAE神經(jīng)網(wǎng)絡(luò)的訓(xùn)練可以分成2個步驟:
1)使用逐層貪婪訓(xùn)練的方式對神經(jīng)網(wǎng)絡(luò)進(jìn)行構(gòu)建。利用輸入層訓(xùn)練SAE的第一個自編碼器;在保持第一個自編碼器的參數(shù)不變的條件下,將第一個自編碼器的輸出層作為下一個自編碼器的輸入層,對第二個自編碼器進(jìn)行訓(xùn)練得到相應(yīng)的權(quán)重和偏置量,如此類推,最終得到最后一個自編碼器的權(quán)重、偏置量和輸出層。
2)使用微調(diào)的方式對構(gòu)建的神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化。微調(diào)是深度學(xué)習(xí)中用于提高神經(jīng)網(wǎng)絡(luò)性能的典型策略。利用全局微調(diào)的方式,將由所有層構(gòu)成的整個SAE神經(jīng)網(wǎng)絡(luò)看做一個整體,基于誤差反向傳播的方法對神經(jīng)網(wǎng)絡(luò)中的參數(shù)進(jìn)行統(tǒng)一的修正。
圖2 4層棧式自編碼神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)
將該影像的每個像元視作一個訓(xùn)練樣本,像元的波段數(shù)是SAE輸入層的維數(shù),每個波段的反射率值都是輸入層的一個特征。構(gòu)建SAE神經(jīng)網(wǎng)絡(luò)對影像像元進(jìn)行特征提取,得到每個像元的特征表示。特征提取后的第個像元都可以表示為一個向量p= (p1, p2, p3, …, p),123。其中為特征數(shù),為影像的像元個數(shù)。將所有像元投放在維特征空間中,選擇維幾何體的端點及端點附近的像元作為備選端元。
在混合蛙跳算法中,定義每一只青蛙的位置為端元提取解空間中一個解x(x1, x2, x3,…, x, …, x),x1+x2+x3++x=m,x∈{0, 1},其中為需要提取的端元個數(shù),為備選端元的個數(shù),x=1表示在第只青蛙代表的端元提取解中第個備選端元被選為端元。
在線性光譜混合模型中,端元豐度服從式(1)~(3)。
其中a(1, 2, 3,1, 2, 3,)表示第個端元在第個像元中所占的比例(端元豐度);e(1, 2, 3,)為第個端元。采用經(jīng)典的全約束條件下最小二乘法對上述線性混合模型進(jìn)行混合像元分解[24],得到端元豐度,再依據(jù)式(4)求得反混圖像。
式中表示反混圖像中第個像元反射率向量。端元提取的目的是得到高精度的混合像元分解的結(jié)果。本文采用混合像元分解后反混圖像與原圖像之間的均方根誤差(root mean square error,RMSE)作為待優(yōu)化的目標(biāo)函數(shù)。RMSE在統(tǒng)計學(xué)中能夠很好地反映出計算值與真實值的偏差,在端元提取的同類研究中被廣泛用于評價端元提取的效果,如文獻(xiàn)[17-18,25]。具體來說,對于第只青蛙,用于評價其位置優(yōu)劣性的目標(biāo)函數(shù)如式(5)。
其中p表示原圖像第個像元的第個波段的反射率。?表示反混圖像中第個像元的第個波段的反射率,是總波段數(shù)目。RMSE越小,說明該青蛙位置越好,其代表的端元組合越接近于最佳端元組合。
對蛙群的參數(shù)(青蛙數(shù)目、分組數(shù)目、組內(nèi)進(jìn)化次數(shù)、青蛙允許移動的最大距離D和最大迭代次數(shù))進(jìn)行初始化,然后按照如下步驟進(jìn)行蛙群更新與端元搜索(可參見圖1)。
1)蛙群分組:對每只青蛙隨機初始化以后,計算每只青蛙對應(yīng)的RMSE值,將青蛙按照RMSE值升序進(jìn)行排列,并將種群分為個組:排序完成后,第1只青蛙進(jìn)入第1組,第2只青蛙進(jìn)入第2組,直到第只青蛙進(jìn)入第組,然后第+1只青蛙再進(jìn)入第1組,以此類推,直到所有青蛙分組完畢。
2)組內(nèi)更新:對組內(nèi)位置最差(RMSE值最大)的青蛙按式(6)~式(7)進(jìn)行位置更新。
其中x表示組內(nèi)位置最好的青蛙,x表示組內(nèi)位置最差的青蛙,rand()是0~1之間隨機生成的數(shù)。如果最差青蛙經(jīng)過更新后位置能夠變好,則用新位置的青蛙代替原來位置的青蛙,否則用整個種群中最好的青蛙x代替x,然后再次執(zhí)行式(6)~式(7)。每次執(zhí)行式(6)~式 (7)完畢以后,按照值的大小順序,取x矢量的前個分量賦值為1,用于代表個被提取出來的端元,其余值賦值為0。如果仍然不能得到更好的位置或者移動距離超過D,則隨機產(chǎn)生一個青蛙的位置替代x。
3)整體更新:對每組的青蛙完成更新以后,將所有青蛙重新混合,更新全局最佳位置的青蛙,判斷是否滿足終止條件(達(dá)到最大迭代次數(shù)或者全局最佳位置在連續(xù)3次迭代中重復(fù)),如果滿足條件則結(jié)束迭代,全局最佳位置的青蛙所代表的端元組合即為最終提取到的端元,如果不滿足迭代條件,則重新進(jìn)行蛙群分組、組內(nèi)更新、整體更新。
本文算法與現(xiàn)有的主要端元提取算法[17]的時間復(fù)雜度對比見表1。由于影像像元個數(shù)遠(yuǎn)遠(yuǎn)大于影像降維以后的維數(shù)和青蛙數(shù),所以時間復(fù)雜度主要取決于影像像元個數(shù)。此外,青蛙數(shù)小于影像降維以后的維數(shù)。所以,由表1可知,本文算法的時間復(fù)雜度與現(xiàn)有的端元提取算法相當(dāng),并略有降低。
表1 不同算法的時間復(fù)雜度對比
注:()代表時間復(fù)雜度;表示迭代循環(huán)次數(shù),17~24;為影像像元個數(shù);為影像降維以后的維數(shù);為青蛙數(shù);=2.3~2.9[14]。
Note:() represents the time complexity.represents the number of iteration cycles,=17-24.is the number of image pixels.is the dimension after image dimensionality reduction.is the number of frogs.=2.3-2.9[14].
分別采用合成的農(nóng)田高光譜數(shù)據(jù)集和真實的農(nóng)田航空高光譜遙感影像對3種典型的端元提取方法的結(jié)果進(jìn)行計算,包括SMACC(順序最大角凸錐法,sequential maximum angle convex cone,SMACC)、VCA算法、N-FINDR算法,并與本文算法結(jié)果進(jìn)行對比。驗證方案(包括數(shù)據(jù)獲取和驗證方法)采用國內(nèi)外研究高光譜影像端元提取的通用方案[26-28]。
采用人工合成高光譜數(shù)據(jù)進(jìn)行算法的驗證是國際上該方面研究的通用做法[27,29-30],本文采用大多數(shù)研究數(shù)據(jù)合成方法,從美國地質(zhì)調(diào)查局(USGS)標(biāo)準(zhǔn)光譜庫、美國約翰霍普金斯大學(xué)標(biāo)準(zhǔn)光譜庫、Chris Elvidge標(biāo)準(zhǔn)光譜庫中隨機選取5種地物(灌木植被、草、砂壤土、粉質(zhì)壤土、細(xì)砂壤土)的光譜作為端元光譜(如圖3所示),并重采樣為224個波段模擬農(nóng)田高光譜影像光譜,利用如下方法合成高光譜數(shù)據(jù):建立64×64大小的空白圖像矩陣,在每一個位置隨機選取一種地物類型,并賦予其對應(yīng)的光譜;將圖像矩陣劃分為8×8的方塊區(qū)域,每個區(qū)域包含8×8個像元;對圖像施加9×9的均值濾波器實現(xiàn)像元混合[27,29-30];利用式(8)對圖像分別施加信噪比SNR(signal to noise ratio)分別為20、30和40 dB的服從標(biāo)準(zhǔn)正態(tài)分布的高斯噪聲,得到3個信噪比不同的高光譜數(shù)據(jù),如圖4所示。
SNR=lg(E[T]/ E[T]) (8)
其中為原始信號光譜,為噪聲光譜,E表示數(shù)學(xué)期望運算,T表示矩陣轉(zhuǎn)置運算。本文端元提取的結(jié)果利用如下2個指標(biāo)進(jìn)行衡量:
1)最終提取出來的端元與光譜庫中標(biāo)準(zhǔn)光譜之間的光譜角,如式(9)所示。
其中、分別為待評價的端元光譜和標(biāo)準(zhǔn)光譜向量,是總波段數(shù)目。光譜角衡量了2個光譜之間形狀的相似性,忽略光譜數(shù)值的大小,即與光譜向量的模無關(guān),而與光譜曲線的起伏形狀密切相關(guān),而光譜曲線的形狀由地物類型決定,光譜角越小,說明提取的端元地物類型越接近真實端元地物類型。
2)端元提取后進(jìn)行混合分解得到端元豐度,再按照式(4)計算反混圖像,然后計算式(5)中的RMSE值對端元提取結(jié)果進(jìn)行評價。RMSE衡量2個光譜之間的對應(yīng)波長處數(shù)值的相似性,是對光譜形狀和反射率大小相似性的整體評價。RMSE越小,說明提取的端元光譜在數(shù)值上越接近真實端元。
圖3 用于合成高光譜數(shù)據(jù)的5種端元光譜
a. SNR=20 dBb. SNR=30 dBc. SNR=40 dB
4種方法對不同信噪比的人工合成高光譜數(shù)據(jù)得到的光譜角如表2所示,得到的RMSE值如表3所示。以SNR=30 dB的影像為示例,提取到的端元光譜如圖 5所示。在人工合成農(nóng)田高光譜數(shù)據(jù)的試驗中,不同信噪比的數(shù)據(jù)都出現(xiàn)了相似的結(jié)果,本文算法相比現(xiàn)有方法得到的端元與標(biāo)準(zhǔn)光譜之間的光譜角最小,平均光譜角分別為0.106 88(20 dB)、0.030 32(30 dB)、0.009 94(40 dB)(值得注意的是,N-FINDR算法只提取到4種端元),利用本文算法提取到的端元進(jìn)行混合像元分解,其反混圖像與原始圖像之間的RMSE也是最小,分別為0.050 8、0.015 9、0.005 1。通過圖3和圖5的光譜對比可以發(fā)現(xiàn),本文算法提取的端元曲線更接近用于合成數(shù)據(jù)的原始端元曲線,即本文算法提取的端元質(zhì)量比其他算法顯著改善。對不同的噪聲水平,本文算法都能夠正確提取端元,說明本文算法對數(shù)據(jù)噪聲的魯棒性好。
表2 不同信噪比的合成高光譜數(shù)據(jù)試驗的光譜角
表3 不同信噪比的合成高光譜數(shù)據(jù)試驗的RMSE值
對真實的高光譜影像目前無法獲取其真正的端元光譜作為參考,因此無法對端元光譜直接進(jìn)行比較,目前國際同類研究均直接給出反混圖像的RMSE,并與其他方法進(jìn)行對比[26-28],本文也采用這種方法。真實高光譜影像驗證選用Salinas高光譜影像。Salinas高光譜影像由AVIRIS傳感器獲取,覆蓋了美國加利福尼亞州Salinas地區(qū),包含224個光譜波段,其成像時間為1992年,是國際上公認(rèn)的公共測試數(shù)據(jù),廣泛用于高光譜影像數(shù)據(jù)處理方法的驗證。本文選用Salinas影像的一個空間子集,稱為Salinas-A圖像(如圖6,該子集是國際通用標(biāo)準(zhǔn)數(shù)據(jù)集),包含6種植被端元類型(1種椰菜端元、1種玉米端元和4種生菜端元),該子集被廣泛應(yīng)用于高光譜遙感相關(guān)算法的測試[26-28]。對于真實高光譜影像很難確定標(biāo)準(zhǔn)光譜進(jìn)行端元的評價,目前國際上也沒有該影像的標(biāo)準(zhǔn)端元光譜。對于端元提取后混合像元分解的RMSE值,4種算法(本文算法、SMACC、VCA、N-FINDR)的RMSE分別為0.006 7、0.008 5、0.007 4、0.009 2。對真實高光譜數(shù)據(jù)而言,利用本文算法提取的端元進(jìn)行混合像元分解,反混圖像與原始圖像的RMSE值最?。?.006 7)。本文算法對人工合成數(shù)據(jù)和真實數(shù)據(jù)的驗證結(jié)果相似,說明本文算法相比現(xiàn)有主要算法的端元提取精度更高。
本文提出的端元提取方法主要分為2大步驟,第一步是利用深度學(xué)習(xí)選擇備選端元,第二步是將優(yōu)選出來的端元輸入混合蛙跳算法得到最佳的端元組合。在第一步目的是降低第二步計算的復(fù)雜性,目前常用的方法是主成分分析、最小噪聲分離等,深度學(xué)習(xí)比起目前方法來說選擇備選端元更加精準(zhǔn),同等情況下給第二步提供的備選端元數(shù)量少,減小第二步的運算量。第二步是端元提取算法的關(guān)鍵,算法的優(yōu)劣直接決定了最終提取的端元精度。因此,深度學(xué)習(xí)的貢獻(xiàn)主要在于降低第二步計算的復(fù)雜性,而第二步對端元提取具有決定性貢獻(xiàn),第二步驟的貢獻(xiàn)大于第一步驟。
圖5 不同算法的合成高光譜影像端元光譜提取結(jié)果(SNR=30 dB)
圖6 Salinas-A圖像的灰度圖像
針對高光譜遙感混合像元分解的問題,本文提出了基于深度學(xué)習(xí)中棧式自編碼和混合蛙跳算法的端元提取方法。利用人工合成的農(nóng)田高光譜數(shù)據(jù)和真實的AVIRIS高光譜影像數(shù)據(jù)對本文算法進(jìn)行了試驗驗證,并與現(xiàn)有的主要高光譜影像端元提取算法進(jìn)行對比。結(jié)果表明:
1)本文算法對人工合成數(shù)據(jù)提取到了更高精度的端元光譜,平均光譜角分別達(dá)到0.106 88(20 dB)、0.030 32(30 dB)、0.009 94(40 dB),對20 、30 、40 dB信噪比影像提取結(jié)果的均方根誤差分別達(dá)到0.050 8、0.015 9、0.005 1,均優(yōu)于現(xiàn)有算法。本文算法在不同水平的數(shù)據(jù)噪聲下性能穩(wěn)定,在不同信噪比條件均能取得優(yōu)于其他算法的結(jié)果,算法魯棒性好。
2)對于真實高光譜影像,本文算法能夠提高農(nóng)田高光譜遙感影像端元的提取精度,反混圖像與原始圖像的均方根誤差達(dá)到0.006 7,優(yōu)化了混合像元分解的結(jié)果。
本文算法在農(nóng)業(yè)遙感應(yīng)用過程中具有廣闊的發(fā)展前景。在未來的研究中,可用更多的農(nóng)田高光譜影像對算法進(jìn)行驗證。
[1] Wu M, Huang W, Niu Z, et al. Fine crop mapping by combining high spectral and high spatial resolution remote sensing data in complex heterogeneous areas[J]. Computers and Electronics in Agriculture, 2017, 139(6): 1-9.
[2] 楊紅衛(wèi),童小華. 中高分辨率遙感影像在農(nóng)業(yè)中的應(yīng)用現(xiàn)狀[J]. 農(nóng)業(yè)工程學(xué)報,2012,28(24):138-149. Yang Hongwei, Tong Xiaohua. Application status of middle and high resolution remote sensing images in agriculture[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2012, 28(24): 138-149. (in Chinese with English abstract)
[3] 藍(lán)金輝,鄒金霖,郝彥爽,等. 高光譜遙感影像混合像元分解研究進(jìn)展[J]. 遙感學(xué)報,2018,22(1):13-27. Lan Jinhui, Zou Jinlin, Hao Yanshuang, et al. Research progress on ummixing of hyperspectral remote sensing imagery[J]. Journal of Remote Sensing, 2018, 22(1): 13-27. (in Chinese with English abstract)
[4] 張成業(yè),秦其明,陳理,等. 高光譜遙感巖礦識別的研究進(jìn)展[J]. 光學(xué)精密工程,2015,23(8):2407-2418. Zhang Chengye, Qin Qiming, Chen Li, et al. Research and development of mineral identification utilizing hyperspectral remote sensing[J]. Optics and Precision Engineering, 2015, 23(8): 2407-2418. (in Chinese with English abstract)
[5] Graceline Jasmine S, Pattabiraman V. Performance analysis of statistical-based pixel purity index algorithms for endmember extraction in hyperspectral imagery[J]. Advances in Intelligent Systems and Computing. 2018(645): 10-21.
[6] Peter D B H, Wang X. Spectral representation of proton nmr spectroscopy for the pattern recognition of complex materials[J]. Journal of Analysis and Testing, 2017, 1(2): 1-10.
[7] 王紅軍,熊俊濤,黎鄒鄒,等. 基于機器視覺圖像特征參數(shù)的馬鈴薯質(zhì)量和形狀分級方法[J]. 農(nóng)業(yè)工程學(xué)報,2016,32(8):272-277. Wang Hongjun, Xiong Juntao, Li Zouzou, et al. Potato grading method of weight and shape based on imaging characteristics parameters in machine vision system[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(8): 272-277 (in Chinese with English abstract).
[8] Zhang C, Qin Q, Zhang T, et al. Endmember extraction from hyperspectral image based on discrete firefly algorithm (EE-DFA)[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2017, 126(4): 108-119.
[9] Makeev V V. Dividing a convex figure by a system of rays and inscribed polygons[J]. Mathematics, 2015, 48(3): 366-375.
[10] Plaza A, Plaza J, Martin G. Spatial-spectral endmember extraction from hyperspectral imagery using multi-band morphology and volume optimization[C]. IEEE International Conference on Image Processing, 2009(1): 3721-3724.
[11] Gruninger J H, Ratkowski A J, Hoke M L. The sequential maximum angle convex cone (SMACC) endmember model[J]. Proceedings of Spie, 2004, 5425(8): 1-14.
[12] Berman M, Kiiveri H, Lagerstrom R, et al. ICE: a statistical approach to identifying endmembers in hyperspectral images[J]. IEEE Transactions on Geoscience & Remote Sensing, 2008, 42(10): 2085-2095.
[13] Manuel A, Hernandez C, Gallego J. A single individual evolutionary strategy for endmember search in hyperspectral images[J]. Information Sciences, 2004, 161(3–4): 181-197.
[14] Nascimento J M P, Dias J M B. Vertex component analysis: A fast algorithm to unmix hyperspectral data[J]. IEEE Transactions on Geoscience & Remote Sensing, 2005, 43(4): 898-910.
[15] 李宏俏. 高光譜圖像的光譜解混模型與算法研究[D]. 成都:電子科技大學(xué),2017. Li Hongqiao. Study of Unmixing Models and Algorithms for Hyperspectral Images[D]. Chengdu: University of Electronic Science and Technology of China, 2017. (in Chinese with English abstract)
[16] 金瑞,李小昱,顏伊蕓,等. 基于高光譜圖像和光譜信息融合的馬鈴薯多指標(biāo)檢測方法[J].農(nóng)業(yè)工程學(xué)報,2015,31(16):258-263. Jin Rui, Li Xiaoyu, Yan Yiyun, et al. Detection method of multi-target recognition of potato based on fusion of hyperspectral imaging and spectral information[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2015, 31(16): 258-263. (in Chinese with English abstract)
[17] Xu Mingming, Zhang Liangpei, Du Bo, et al. An image-based endmember bundle extraction algorithm using reconstruction
error for hyperspectral imagery[J]. Neurocomputing, 2016, 173(2): 397-405.
[18] Zhang B, Sun X, Gao L, et al. Endmember extraction of hyperspectral remote sensing images based on the ant colony optimization (ACO) algorithm[J]. IEEE Transactions on Geoscience and Remote Sensing, 2011, 49(11): 4173-4176.
[19] Chen Y, Lin Z, Zhao X, et al. Deep learning-based classification of hyperspectral data[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2014, 7(6): 2094-2107.
[20] Bengio Y, Lamblin P, Popovici D, et al. Greedy layer-wise training of deep networks[J]. Advances in Neural Information Processing Systems, 2007, 19(1): 153-160.
[21] Eusuff M M, Lansey K E. Optimization of water distribution network design using the shuffled frog leaping algorithm[J]. Journal of Water Resources Planning and Management, 2003, 129(3): 210-225.
[22] Daoden K, Thaiupthump T. A Modified Shuffled Frog Leaping Algorithm Using Truncated Gaussian Distribution in Frog’s Position Updating Process[J]. Information Science and Applications (ICISA), 2016, 376(2): 965-974
[23] 崔廣新,李殿奎. 基于自編碼算法的深度學(xué)習(xí)綜述[J]. 計算機系統(tǒng)應(yīng)用,2018,27(9):47-51. Cui Guangxin, Li Diankui. Overview on deep learning based on automatic encoder algorithms[J]. Computer Systems & Applications, 2018, 27(9): 47?51. (in Chinese with English abstract)
[24] Denisova A, Juravel Y, Myasnikov V. Linear spectral mixture analysis of hyperspectral images with atmospheric distortions[J]. Computer Vision and Graphics. 2016, 9972(9): 134-141
[25] Zhang B, Sun X, Gao L, et al. Endmember extraction of hyperspectral remote sensing images based on the discrete particle swarm optimization algorithm[J]. IEEE Transactions on Geoscience & Remote Sensing, 2011, 49(11): 4173-4176.
[26] Filippi A M, Archibald R . Support vector machine-based endmember extraction[J]. IEEE Transactions on Geoscience and Remote Sensing, 2009, 47(3): 771-791.
[27] Miao L, Qi H. Endmember extraction from highly mixed data using minimum volume constrained nonnegative matrix factorization[J]. IEEE Transactions on Geoscience and Remote Sensing, 2007, 45(3): 765-777.
[28] Chan T H, Ambikapathi A M, Ma W K, et al. Robust affine set fitting and fast simplex volume max-min for hyperspectral endmember extraction[J]. IEEE Transactions on Geoscience & Remote Sensing, 2013, 51(7): 3982-3997.
[29] Rajabi R, Ghassemian H . Spectral unmixing of hyperspectral imagery using multilayer NMF[J]. IEEE Geoscience and Remote Sensing Letters, 2014, 12(1): 38-42.
[30] Chang C I, Xiong W, Liu W, et al. Linear spectral mixture analysis based approaches to estimation of virtual dimensionality in hyperspectral Imagery[J]. IEEE Transactions on Geoscience and Remote Sensing, 2010, 48(11): 3960-3979.
Endmember extraction of farmland hyperspectral image using deep learning autoencoder and shuffled frog leapingalgorithm
Han Liqin1,2, Zhang Yaonan1※, Qin Qiming3
(1.,,730000,; 2.,100049,; 3.,,100871,)
Hyperspectral remote sensing image includes hundreds of narrow contiguous spectral bands with high spectral resolution, and can provides a contiguous spectral curve for each pixel, which is an important tool for the cropland monitoring in rapid and large-scale way. However, due to the contradiction between spectral resolution and spatial resolution, hyperspectral remote sensing image usually possesses relative low spatial resolution. Therefore, it is very important to mix various vegetation and soil at one pixel point for spectral decomposition in hyperspectral image and spectral unmixing of farmland. The first step in spectral unmixing is usually endmember extraction. Endmember extraction from a hyperspectral remote sensing image is to find some pixels (endmembers) and regard them as pure spectral reflectance of the vegetation and soil in the image to get the best accuracy of spectral unmixing results. So endmember extraction from hyperspectral remote sensing image can be regarded as a typical discrete optimization problem, which can be solved by swarm intelligence optimization algorithm. Before optimization, the spectral dimension of the image should be reduced by deep learning. In order to solve the problem of spectral unmixing of hyperspectral images, a method of extracting farmland endmember based on deep learning and shuffled frog leaping algorithm (SFLA) is proposed in this paper. Firstly, deep learning model named stacked auto encoders (SAE) was used to extract spectral features . SAE performs a non-linear transfer from the original spectral signals to a form with significant features and less dimensions. In the low-dimension space, the candidate endmembers were selected as the input of the SFLA. The purpose of extracting the candidate endmembers is to simplified the computational complexity in the next step. Secondly, the endmember extraction of hyperspectral image was transferred into the combinatorial optimization and the objective function was constructed, then the SFLA was used to optimize the objective functionto get the best combination of endmembers. The objective function in study was designed as the RMSE (root mean square error) between the real hyperspectral remote sensing image and the simulated hyperspectral remote sensing image using the endmembers and abundance after endmember extraction and spectral unmixing. Thirdly, 2 groups experiments were carried out on the synthetic hyperspectral datasets with 3 different SNR (signal to noise ratio, 20 , 30 and 40 dB) and the real AVIRIS hyperspectral remote sensing dataset in Salinas region, respectively. In experiments, the experimental results of the proposed method was compared with that of 3 traditional methods for endmember extraction including the sequential maximum angle convex cone (SMACC), N-FINDR, Vertex Component Analysis (VCA). The results were evaluated by RMSE and spectral angle. The results showed that the RMSE was 0.050 8, 0.015 9, 0.005 1, 0.006 7 for 20, 30 and 40 dB dataset, and the real dataset, respectively. The average spectral angle was 0.106 88, 0.030 32, 0.009 94 for 20, 30 and 40 dB dataset respectively. The proposed method was better than traditional methods in terms of extraction accuracy, which had wide potential applications on cropland monitoring using hyperspectral remote sensing. The method proposed in this paper reduced the influence of the non-linear factors and the noise, better endmember extraction and spectral unmixing results (both less spectral angle and less RMSE) could be obtained, and the proposed method was robust when the noise of the image increased sharply. In conclusion, the endmember extraction method proposed by this study is of significant importance for the cropland monitoring using hyperspectral remote sensing and has a prosperous future for the application on the remote sensing of agriculture.
crops; remote sensing; image processing; hyperspectral; endmember extraction; stacked autoencoders; shuffled frog leaping algorithm
2018-11-29
2019-01-29
國家科技基礎(chǔ)條件平臺項目(Y719H71006);中科院信息化專項(XXH13506);甘肅省高??萍嫁D(zhuǎn)化項目(2017D-27)
韓立欽,副教授,博士生,主要研究方向為定量遙感與地理信息集成。Email:hanliqin@lzb.ac.cn
張耀南,研究員,博士,主要研究方向為地學(xué)大數(shù)據(jù)融合分析。 Email:yaonan@lzb.ac.cn
10.11975/j.issn.1002-6819.2019.06.020
TP394.1;TH691.9
A
1002-6819(2019)-06-0167-07
韓立欽,張耀南,秦其明. 深度學(xué)習(xí)自編碼結(jié)合混合蛙跳算法提取農(nóng)田高光譜影像端元[J]. 農(nóng)業(yè)工程學(xué)報,2019,35(6):167-173. doi:10.11975/j.issn.1002-6819.2019.06.020 http://www.tcsae.org
Han Liqin, Zhang Yaonan, Qin Qiming. Endmember extraction of farmland hyperspectral image using deep learning autoencoder and shuffled frog leapingalgorithm[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(6): 167-173. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2019.06.020 http://www.tcsae.org