馮云云,劉麗娟,陸燈盛,龐 勇
(1.浙江農(nóng)林大學(xué) 浙江省森林生態(tài)系統(tǒng)碳循環(huán)與固碳減排重點實驗室,浙江 臨安311300;2.浙江農(nóng)林大學(xué) 省部共建亞熱帶森林培育國家重點實驗室,浙江 臨安 311300;3.中國林業(yè)科學(xué)研究院 資源信息研究所,北京 100091)
機載高光譜影像降維方法比較
馮云云1,2,劉麗娟1,2,陸燈盛1,2,龐 勇3
(1.浙江農(nóng)林大學(xué) 浙江省森林生態(tài)系統(tǒng)碳循環(huán)與固碳減排重點實驗室,浙江 臨安311300;2.浙江農(nóng)林大學(xué) 省部共建亞熱帶森林培育國家重點實驗室,浙江 臨安 311300;3.中國林業(yè)科學(xué)研究院 資源信息研究所,北京 100091)
高光譜數(shù)據(jù)波段多、波段之間相關(guān)性強,導(dǎo)致信息冗余嚴(yán)重,增加了數(shù)據(jù)處理的工作量,有效準(zhǔn)確地在眾多波段中選擇具有代表性的波段尤為重要。首先用Wilks’Lambda(WL),隨機森林(random forest,RF)與自適應(yīng)波段選擇(adaptive band selection,ABS)這3種方法對高光譜數(shù)據(jù)進行降維處理。然后提出了基于曲線誤差指數(shù)的評價方法,用此指數(shù)的趨勢來確定每種降維方法所要選擇的合適波段數(shù)量,同時用指數(shù)的大小評價不同降維方法的優(yōu)劣,并用分類方法對評價結(jié)果加以驗證。結(jié)果顯示:Wilks’Lambda最終選擇的波段數(shù)為10個,α6-α平穩(wěn)值(選擇6個波段時的曲線誤差值與曲線誤差平穩(wěn)值之間的差值)為0.05;隨機森林最終選擇的波段數(shù)為13個,α6-α平穩(wěn)值為0.06;自適應(yīng)波段選擇方法最終選擇的波段數(shù)為 20個,α6-α平穩(wěn)為0.14。Wilks’Lambda的總體分類精度為80.56%,Kappa系數(shù)為0.77;隨機森林的總體分類精度為79.11%,Kappa系數(shù)為0.76;自適應(yīng)波段選擇方法的總體分類精度為49.94%,Kappa系數(shù)為0.41。得出以下結(jié)論:①基于曲線誤差指數(shù)的方法得出Wilks’Lambda有最小的α6-α平穩(wěn)值,是最佳的波段降維方法;分類結(jié)果顯示:Wilks’Lambda有最大的總體分類精度與Kappa系數(shù),是最佳的波段降維方法。②基于曲線誤差指數(shù)的評價方法與基于分類結(jié)果的誤差一致,說明此方法具有可行性。圖5表4參20
森林經(jīng)理學(xué);高光譜圖像;曲線誤差指數(shù);Wilks’Lambda;隨機森林;自適應(yīng)波段選擇
Abstract:Hyperspectral datasets have been widely used in monitoring analyses of vegetation due to their abundant spectral information;however,their spectral resolution greatly increases information redundancy causing more data processing work.To find an efficient method for selecting the most representative bands to reduce redundancy before using them,three traditional dimension reduction methods,namely Wilks’Lambda(WL),random forest(RF),and adaptive band selection (ABS),were used to select optimal bands among the 64 bands.Then,a new evaluation method based on a curve error index was proposed to determine the appropriate number of bands through analysis trend of the index values and to select the best dimension reductionmethod.Lastly,classification results were used to demonstrate the validity of this method.Results indicated that WL selected 10 bands and the α6-αsmoothvalue (the curve error difference between selecting six bands and when the curve becomes stable) was 0.05.The RF method selected 13 bands and its corresponding α6-αsmoothvalue was 0.06.The ABS method selected 20 bands and its α6-αsmoothvalue was 0.14.The overall accuracy of WL based band selection was 80.56%with a Kappa coefficient of 0.77;RF was 79.11%with a Kappa coefficient of 0.76;and ABS had an overall accuracy of 49.94%and a Kappa coefficient of 0.41.Thus, (1) with the curve error index method WL presented the smallest α6-αsmoothvalue and had the highest overall classification accuracy,suggesting WL was the optimal method for dimensional reduction,and (2) the two evaluation methods had the same results,illustrating the curve was feasible. [Ch,5 fig.4 tab.20 ref.]
Key words:forest management;hyperspectral imagery;curve error index;Wilks’Lambda;random forest;adaptive band selection
高光譜圖像具有光譜分辨率高、圖譜合一、波段多且連續(xù)、信息量豐富等優(yōu)點[1],但這一系列優(yōu)點提高了數(shù)據(jù)維數(shù),增加了數(shù)據(jù)運算量,給高光譜圖像遙感地物分類等實際應(yīng)用帶來困難,嚴(yán)重影響了高光譜遙感技術(shù)的推廣。因此,要從高光譜圖像中獲得更加精準(zhǔn)的信息,需在處理之前進行波段降維。這樣不僅有利于降低數(shù)據(jù)的空間維數(shù),減少數(shù)據(jù)處理工作量,也有利于人工圖像解譯和后續(xù)的分類處理[2]。對高光譜數(shù)據(jù)進行波段降維處理時一般考慮3個方面的因素:波段信息量的多少、波段間相關(guān)性的強弱以及目標(biāo)地物的光譜響應(yīng)特征[3]。常見的波段降維方法主要分為2種:基于特征變換的方法和基于原始信息的波段選擇方法?;谔卣髯儞Q的方法是依據(jù)某一原則,運用一定的數(shù)學(xué)運算法則,將原始高維特征空間的多個特征值映射到低維空間。近年來,ROWEIS等[4]提出了局部線性嵌入的流行學(xué)習(xí)方法,白楊等[5]提出了改進的核二維主成分分析方法,杜博等[6]提出新的判別流行學(xué)習(xí)方法。這些方法都是以嚴(yán)格的數(shù)學(xué)理論為支撐,但是由于改變了高光譜數(shù)據(jù)的原有特性,導(dǎo)致原始波段物理信息損壞甚至丟失,存在一定的局限性?;谠夹畔⒌牟ǘ芜x擇方法是依據(jù)某個準(zhǔn)則從原始波段中選擇部分最具代表性的波段, 常用的有自適應(yīng)波段選擇[7]、 波段指數(shù)[8]、 最佳指數(shù)因子[9]等。 秦方普等[10]提出了基于譜聚類與類間可分性因子的高光譜波段選擇方法,CHEPUSHTANOVA等[11]提出了基于稀疏支持向量機的波段降維方法,宋欠欠等[12]探討了關(guān)于隨機森林的變量捕獲方法及其在高維數(shù)據(jù)變量篩選中的應(yīng)用,GEORGE等[13]用Wilks’Lambda的方法對EO-1Hyperion數(shù)據(jù)選擇特征波段。由于這些方法直接從原始光譜空間中選擇波段,未經(jīng)過變換處理,保持了圖像的原有特性[14],因此,成為高光譜遙感降維處理的重要研究方向。波段選擇還存在另外2個關(guān)鍵的問題:如何選擇合適的波段數(shù)量以及如何評價不同降維方法的優(yōu)劣性。關(guān)于波段數(shù)量選擇的研究,2004年,CHANG等[15]提出一種衡量波段數(shù)目的指標(biāo) “虛擬維度”,并且得到了廣泛的應(yīng)用;在評價波段選擇方法優(yōu)劣的研究方面,也出現(xiàn)了一些判定標(biāo)準(zhǔn),如歐氏距離、信息熵、光譜角匹配、光譜信息散度等[7]?;谝陨铣晒狙芯勘容^分析了Wilks’Lambda(WL),隨機森林(random forest,RF)和自適應(yīng)波段選擇(adaptive band selection,ABS)這3種基于原始信息的波段降維方法;同時提出一種基于曲線誤差指數(shù)的評價方法,旨在找到3種方法中最有效的降維方法以及檢驗基于曲線誤差指數(shù)的方法是否具有可行性。
實驗數(shù)據(jù)采用的是由AISA Eagle傳感器獲取的位于浙江省衢州市開化縣(29°13′N,118°05′E)的機載高光譜影像。開化縣是全國重點的生態(tài)功能保護區(qū),屬于中亞熱帶常綠闊葉林帶。研究區(qū)有大量的植被覆蓋,且植被種類繁多,主要植被類型為常綠闊葉林、針葉林和毛竹Phyllostachys edulis林等。機載高光譜數(shù)據(jù)覆蓋了398.55~994.44 nm光譜區(qū)間的64個波段,每個波段對應(yīng)的波長如表1所示。野外樣地數(shù)據(jù)的獲取時間為2014年12月,結(jié)合谷歌地球(Google Earth),最終確定14個10 m×10 m的小樣本:包括2個闊葉林,3個針葉林,2個毛竹林,2個農(nóng)田,2個不透水地表,2個裸地,1個水體,平均分布在研究區(qū)范圍內(nèi)。
表1 不同波段對應(yīng)中心波長位置Table 1 Different bands corresponding to the wavelength center position
2.1.1 Wilks’Lambda法 Wilks’Lambda(WL)是逐步判別分析法中的一種方法,它基于多變量的方差分析。計算時,首先確定分類系統(tǒng),然后把每個變量建立于分類樣本之上,在分類總體中檢驗類均值是否一致。最后,對研究的對象總體,假設(shè)總體服從正態(tài)分布,將樣本量為n的樣本按大小順序排列編秩,然后由確定的顯著性水平α,以及樣本量為n時所對應(yīng)的系數(shù)αi, 根據(jù)式(1)計算出統(tǒng)計量W。最后根據(jù)W的大小選擇出合適的波段。Wilks’Lambda計算公式如下[16]:
2.1.2 隨機森林法 隨機森林法(RF)是一種現(xiàn)代回歸和分類技術(shù),同時也是一種組合式的自學(xué)習(xí)技術(shù),能夠有效地處理高維變量問題[17]。它以裝袋算法(bagging)為理論基礎(chǔ)。裝袋算法是在樣本中隨機抽樣,生成多個樹模型,然后以多數(shù)投票的方式來預(yù)測結(jié)果。隨機森林法比裝袋算法更進一步,不僅對樣本隨機抽樣,而且對變量(波段)隨機抽樣。最后可以計算出每個變量(波段)的重要性,且計算速度快。隨機森林法計算波段重要性的主要步驟[17-18]為:①將樣本隨機分為訓(xùn)練樣本和測試樣本(如7∶3),生成分類樹組成隨機森林;②以波段xi(i∈1,2,…,m)為例,將檢測樣本中xi的所有值隨機打亂,然后根據(jù)步驟①中建立好的隨機森林模型對每個樣本所屬類別進行預(yù)測,計算波段xi去掉前后檢測樣本預(yù)測錯誤率的大??;③對于所有的樹,計算波段xi去掉前后的檢測樣本預(yù)測錯誤率的大小,將平均值作為變量重要性的評分;④計算出每個變量的重要性R。
2.1.3 自適應(yīng)波段選擇法 自適應(yīng)波段選擇法(ABS)[7]主要考慮每個波段自身信息量的大小以及波段之間相關(guān)性的大小。計算公式為:
式(2)中:I為自適應(yīng)指數(shù),σi為第i個波段的標(biāo)準(zhǔn)差,Ri-1,i為第i-1波段與第i波段之間的相關(guān)系數(shù),Ri,i+1為第i波段與第i+1波段之間的相關(guān)系數(shù)。從式(2)可以看出,I值的計算是用波段的標(biāo)準(zhǔn)差除以某一波段與前后2個波段之間相關(guān)系數(shù)的平均值。由于波段的標(biāo)準(zhǔn)差代表了波段信息量的豐富程度,相關(guān)系數(shù)代表了波段的獨立性,因此相除運算可以找出信息量大且獨立性好的波段。對于最終波段的選擇,首先將自適應(yīng)指數(shù)I從大到小排序,然后根據(jù)后續(xù)處理的需要選擇合適的波段數(shù)量或者設(shè)定閾值選擇最終的波段。
2.2.1 基于曲線誤差的方法 評價一個波段降維方法的優(yōu)劣時,不僅要考慮降維后的波段所包含信息量的多少,還要考慮所選擇出的波段對目標(biāo)地物光譜響應(yīng)曲線趨勢是否改變?;诖怂枷?,本研究提出基于曲線誤差的評價方法。曲線誤差主要對波段選擇前后同一目標(biāo)地物光譜響應(yīng)曲線的匹配度進行檢驗,即以選擇的波段為基礎(chǔ),在相鄰2個波段之間以一個波段為內(nèi)插距離進行線性內(nèi)插,直到整個波譜段內(nèi)插完畢,然后計算各波段內(nèi)插值與原始值之間差值,見式(3)。
式(3)中:σ為曲線誤差,n為波段數(shù),D為內(nèi)插值與原始值的差值。觀察圖1可以發(fā)現(xiàn):水體的曲線相對平穩(wěn),不透水地表的曲線呈上升趨勢,裸地的曲線在675~742 nm之間有小幅度波動,而針葉林、闊葉林、毛竹林和農(nóng)田這類綠色植物的曲線最為復(fù)雜,含有2個波峰和1個波谷。綜合考慮不同地物的光譜曲線發(fā)現(xiàn),6個位置(425, 506, 553, 675, 742, 965 nm 附近)的光譜非常重要,因此,要想把不同地物的光譜曲線完整地表現(xiàn)出來,至少需要6個波段。將上述3種方法計算的W值、R值、I值,從大到小分別進行排列。以排在前面的6個波段開始,1次增加1個波段,計算原始曲線與內(nèi)插曲線之間的整體誤差。這樣,每個波段數(shù)量都會得到1個整體誤差值σ。根據(jù)σ的趨勢,將σ趨于平穩(wěn)時所對應(yīng)的波段數(shù)量確定為最佳波段數(shù)量,從而得出每種降維方法的最佳波段。由于整體曲線誤差值的趨勢反映的是不同降維方法選擇的波段對曲線擬合程度的強弱,以及是否選擇了反射率突變的一些重要波段位置,因此選擇6個波段時的初始誤差值α6與誤差的平穩(wěn)值α平穩(wěn)之間的差最能反映降維方法的優(yōu)劣。α6-α平穩(wěn)越小,則說明降維方法越好,反之,則越差。
圖1 不同地物的波譜曲線Figure 1 Spectral curves of different features
2.2.2 分類方法 本研究分類采用的是支持向量機(support vector machine,SVM)分類器。支持向量機是CORTES等[19]提出的。該分類器是針對小樣本訓(xùn)練區(qū)分類設(shè)計的,根據(jù)有限的樣本信息在模型的復(fù)雜性(對特定訓(xùn)練樣本的學(xué)習(xí)精度)和學(xué)習(xí)能力(無錯誤識別任意樣本的能力)之間尋求最佳狀態(tài),以獲得最好的推廣能力[20]。支持向量機對高維數(shù)據(jù)的分類尤其方便,相較與最大似然法等傳統(tǒng)分類方法有很大的提高。在使用SVM分類器分類時,為了方法的可重復(fù)性,本研究盡量選擇遙感圖像處理軟件(the environment for visualizing images,ENVI)中默認(rèn)的參數(shù),懲罰參數(shù)、分類概率閾值與金字塔等級分別為100,0,0。選擇的函數(shù)為徑向基核函數(shù),設(shè)置的伽瑪核函數(shù)參數(shù)為輸入圖像波段數(shù)的倒數(shù)(0.016)。
將Wilks’Lambda法、隨機森林法與自適應(yīng)波段選擇法這3種方法選擇的波段重新組合為新的圖像,并使用同樣的訓(xùn)練樣本與驗證樣本分別進行分類驗證。
表2為不同波段的W,R,I值計算結(jié)果(W值中的空白值是在計算過程中被剔掉而沒有參與分析的波段)。根據(jù)計算結(jié)果,選擇W值比較小的前6個波段,R值和I值比較大的前6個波段開始,計算不同波段數(shù)量下內(nèi)插曲線與原始曲線之間的整體誤差值σ。結(jié)果如圖2所示。
表2 3種降維方法的波段計算結(jié)果Table 2 Index calculation result of three dimension reduction methods
曲線誤差是從地物的光譜特征出發(fā),評價波段選擇前后同一地物光譜曲線的相似度。若在波峰波谷等曲線突變點選有波段,則曲線誤差較小,反之較大。分析圖2可以發(fā)現(xiàn),Wilks’Lambda法在選擇10個波段之后,曲線的誤差趨向于平穩(wěn),隨著波段數(shù)的增加誤差值沒有明顯的變化,說明10個波段都在植被曲線的重要位置(即波谷或波峰),可以將植被的光譜曲線完整地表示出來;隨機森林法在選擇13個波段的時候趨向于平穩(wěn),但之后仍有輕微下降的趨勢,平穩(wěn)度低于Wilks’Lambda法選擇10個波段之后的平穩(wěn)度;自適應(yīng)波段選擇法的曲線誤差值則一直在下降,只在選擇20個波段時有1個小的平穩(wěn)值,說明隨著波段的增加曲線發(fā)生很大的變化,即所選擇的波段沒有選在關(guān)鍵的波長位置,不具有代表性。從曲線誤差的趨勢出發(fā),我們可以得出結(jié)論:Wilks’Lambda法選擇的最佳波段數(shù)量為10個波段,隨機森林法為13個波段,自適應(yīng)波段選擇法為20個波段(表 3)。
圖2 3種方法不同波段數(shù)量的曲線誤差結(jié)果Figure 2 Curve error results of different band numbers in three methods
從表3選擇的結(jié)果也可以看出,Wilks’Lambda法選擇的波段在整個光譜范圍內(nèi)分布比較均勻,隨機森林法選擇的波段較多的分布在紅光以及近紅外波段附近,而自適應(yīng)波段選擇法選擇的波段都集中在40波段之后,即選擇的都為近紅外范圍的波段。
對于綠色植被(如闊葉林、針葉林、毛竹林和農(nóng)田等)的反射曲線,在0.54 μm(17波段)附近有1個小的反射峰,主要反映植被葉綠素吸收帶的強弱。從圖4可以看出:用Wilks’Lambda法方法選擇的波段包含了小反射峰波段(第17波段附近的波段),而隨機森林法選擇的波段直接從第3波段和第4波段跨越到第29波段,忽略了小反射峰。紅邊峰值及紅邊位置是監(jiān)測植被葉綠素、生理活動以及生物量等最常用的因素,是植被光譜最明顯的標(biāo)志。分析圖3的原始波段曲線可發(fā)現(xiàn),植被的紅邊范圍為675~762 nm(31~40波段),因此,31~40波段之間的選擇十分重要。Wilks’Lambda法選擇的波段在此范圍內(nèi)都有分布,與原始曲線保持一致;隨機森林法選擇的波段拉長了紅邊的范圍;自適應(yīng)波段選擇法選擇的波段集中在40波段之后,直接忽略了小反射峰和紅邊的位置,沒有將植被的光譜特征表現(xiàn)出來。
表3 3種降維方法波段選擇結(jié)果Table 3 Band selection results of three dimension reduction methods
圖3 波段選擇結(jié)果對不同地類的光譜響應(yīng)曲線Figure 3 Spectral response curve of different feature in different methods
由于不透水地表的光譜曲線以及裸地的曲線并沒有存在很明顯的波谷與波峰,因此不同的方法選擇的波段并沒有很大的區(qū)別,但是由于自適應(yīng)波段選擇法所選擇的波段集中在近紅波段,仍然不能表現(xiàn)地物的光譜響應(yīng)曲線。
內(nèi)插計算時,默認(rèn)將原始波段的第1個波段到所選擇波段的第1個波段之間、所選擇波段的最后一個波段到原始波段的最后一個波段之間的內(nèi)插曲線值均設(shè)置為0(首尾位置不存在內(nèi)插值)。由于近紅外波段的反射率明顯高于可見光波段,因此每種降維方法的最終曲線誤差值與選擇的波段的起始位置相關(guān)。若選擇的波段集中在近紅外波段,則誤差值整體偏低,選擇的波段集中在可見光波段,則誤差值整體偏高。因此,不同降維方法之間的整體誤差值不存在比較意義,而應(yīng)重點關(guān)注整體曲線誤差值的趨勢,α6-α平穩(wěn)才能評價不同降維方法的優(yōu)劣。
圖4顯示:α6-α平穩(wěn)值Wilks’Lambda法最小, 其次為隨機森林法,最大為自適應(yīng)波段選擇法。因此我們可以得出結(jié)論:Wilks’Lambda法可以選擇出數(shù)量最少且最具有代表性的波段。Wilks’Lambda法與隨機森林法都是監(jiān)督分類的降維方法,在降維的時候不僅考慮波段本身的信息量,并且也考慮到了類內(nèi)類間的差距。自適應(yīng)波段選擇法是基于波段的標(biāo)準(zhǔn)差與波段間的相關(guān)性來計算的,由于高光譜圖像波段之間的相關(guān)性本來就高,2個波段之間的相關(guān)系數(shù)只有微小的差別,而每個波段的標(biāo)準(zhǔn)差卻差別很大,特別是近紅外區(qū)域,每個波段都具有很高的標(biāo)準(zhǔn)差。這樣自適應(yīng)指數(shù)的大小就由波段的標(biāo)準(zhǔn)差決定,最后選擇的波段多集中在近紅外波段的范圍內(nèi),因此存在的誤差較大。
圖4 不同方法的曲線誤差平穩(wěn)值與6個波段的曲線誤差差值Figure 4 Curve error difference between selecting six bands and when the curve becomes smooth in different methods
從圖5的分類結(jié)果可以看出,自適應(yīng)波段選擇法選擇的波段分類結(jié)果與原始波段、Wilks’Lambda法選擇的波段、隨機森林法選擇的波段的分類結(jié)果有很明顯的不同,其中最大的區(qū)別在于不透水地表和植被的大面積混淆。主要是因為自適應(yīng)波段選擇法選擇的波段主要集中在近紅外波段,而植被與不透水地表光譜特征的最大的差異在可見光波段,自適應(yīng)波段選擇法忽略了可見光部分,最終導(dǎo)致植被與不透水地表混分現(xiàn)象嚴(yán)重。
從總體分類精度來看(表4),自適應(yīng)波段選擇法選擇的20個波段具有最小的總體分類精度49.94%, 雖然選擇的波段數(shù)量多,但是由于選擇的波段都不具有代表性且比較集中,分類效率明顯低于隨機森林法與Wilks’Lambda法。隨機森林法與Wilks’Lambda法選擇的波段總體分類精度和原始波段的總體分類精度相差不大,但Wilks’Lambda法的精度(80.56%)高于隨機森林法(79.11%)。
比較每種降維方法中所有地類的生產(chǎn)者精度和用戶精度,植被都普遍偏低,其中毛竹林最低,與其他樹種之間混分現(xiàn)象嚴(yán)重。前面的分析中提到,自適應(yīng)波段選擇法和隨機森林法在綠光波段的小波峰以及紅邊附近選擇的波段不合理,影響不同樹種之間的分類精度,使樹種之間存在錯分混分的現(xiàn)象。
本研究采用Wilks’Lambda法、隨機森林法、自適應(yīng)波段選擇法等3種降維方法分別對高光譜圖像進行降維處理,并提出一種基于曲線誤差指數(shù)的高光譜降維方法評價指標(biāo)。通過比較分析發(fā)現(xiàn),Wilks’Lambda法選擇的波段能夠完整地將植被的光譜信息表示出來,是最佳的波段降維方法。
本研究在分類精度評價的基礎(chǔ)上,驗證了基于曲線誤差指數(shù)這種評價指標(biāo)的可行性。結(jié)果表明:分類精度與基于曲線誤差指數(shù)的評價方法得出的結(jié)果一致,都得出對于本研究區(qū),Wilks’Lambda法是最佳的波段降維方法,即曲線誤差指數(shù)作為評價不同降維方法優(yōu)劣性的指標(biāo)是可行的。曲線可以反映地物的光譜特征,基于曲線的誤差計算不僅可以體現(xiàn)所選波段的波長位置是否合適,同時通過曲線誤差的趨勢也可以確定合適的波段數(shù)量?;谇€誤差指數(shù)的評價方法完全符合了評價降維方法時要考慮所選擇出的波段對目標(biāo)地物光譜響應(yīng)曲線保持不變的思想,方法操作簡單,物理意義明確,易于理解和分析,可以準(zhǔn)確地在眾多降維方法中選擇最合適的波段降維方法。
圖5 不同降維方法的分類結(jié)果Figure 5 Results of different dimension reduction methods
表4 不同降維方法分類結(jié)果的混淆矩陣Table 4 Confusion matrix of classification results in different dimension reduction methods
表4 (續(xù))Table 4 Continued
[1] CHANG C I.Hyperspectral Imaging:Signal Processing Algorithm Design and Analysis [M].Baltimore:University of Maryland,2009.
[2] 耿修瑞.高光譜遙感圖像目標(biāo)探測與分類技術(shù)研究[D].北京:中國科學(xué)院,2005.GENG Xiurui.Target Detection and Classification for Hyperspectral Imagery [D].Beijing:Chinese Academy of Sciences,2005.
[3] BAJWA S G,BAICSY P,GROVES P,et al.Hyperspectral image data mining for band selection in agricultural applications [J].Transac Am Soc Agric Eng,2004,47(3):895 - 907.
[4] ROWEIS S T,SAUL L K.Nonlinear dimensionality reduction by locally linear embedding [J].Science,2000,290(5500):2323 - 2326.
[5] 白楊,趙銀娣,韓天慶.一種改進的K2DPCA高光譜遙感圖像降維方法[J].測繪科學(xué),2014,39(7):126-130.BAI Yang,ZHAO Yindi,HAN Tianqing.Hyperspectral remote sensing dimensional reduction based on improved kernel two-dimension principal component analysis [J].Sci Surv Map,2014,39(7):126 - 130.
[6] 杜博,張樂飛,張良培,等.高光譜圖像降維的判別流形學(xué)習(xí)方法[J].光子學(xué)報,2013,42(3):320-325.DU Bo,ZHANG Lefei,ZHANG Liangpei,et al.Discriminant manifold learning approach for hyperspectral image dimension reduction [J].Acta Photonica Sin,2013,42(3):320 - 325.
[7] 劉春紅,趙春暉,張凌雁.一種新的高光譜遙感圖像降維方法[J].中國圖象圖形學(xué)報,2005,10(2):218-222.LIU Chunhong,ZHAO Chunhui,ZHANG Lingyan.A new method of hyperspectral remote sensing image dimensional reduction [J].J Image Graph,2005,10(2):218 - 222.
[8] 姜小光,唐伶俐,王長耀,等.高光譜數(shù)據(jù)的光譜信息特點及面向?qū)ο蟮奶卣鲄?shù)選擇:以北京順義區(qū)為例[J].遙感技術(shù)與應(yīng)用,2002,17(2):59- 65.JIANG Xiaoguang,TANG Lingli,WANG Changyao,et al.Spectral characteristics and feature selection of hyperspectral remote sensing data:taking shunyi region of Beijing as a study area [J].Remote Sens Technol Appl,2002,17(2):59-65.
[9] CHAVEZ B P S,BERLIN G L,SOWERS L B.Statistical method for selection Landsat MSS ratios [J].J Appl Photogr Eng,1984,8(1):23 - 30.
[10] 秦方普,張愛武,王書民,等.基于譜聚類與類間可分性因子的高光譜波段選擇[J].光譜學(xué)與光譜分析,2015,35(5):1357 - 1364.QIN Fangpu,ZHANG Aiwu,WANG Shumin,et al.Hyperspectral band selection based on spectral clustering and inter-class separability factor [J].Spectrosc Spectr Anal,2015,35(5):1357 - 1364.
[11] CHEPUSHTANOVA S,GITTINS C,KIRBY M.Band selection in hyperspectral imagery using sparse support vector machines [C]//Proceedings of the SPIE,2014,9800:90881F-15.
[12] 宋欠欠,李軼群,侯艷,等.隨機森林的變量捕獲方法在高維數(shù)據(jù)變量篩選中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計,2015,32(1):49 - 53.SONG Qianqian,LI Yiqun,HOU Yan,et al.The application of a random forest-based variable hunting method to variable selection in high-dimensional data [J].Chin J Health Stat,2015,32(1):49 - 53.
[13] GEORGE R,PADALIA H,KUSHWAHA S P S.Forest tree species discrimination in western Himalaya using EO-1 Hyperion [J].Int J Appl Earth Observ Geoinform,2014,28(5):140 - 149.
[14] 卓莉,鄭璟,王芳,等.基于 GA-SVM封裝算法的高光譜數(shù)據(jù)特征選擇[J].地理研究,2008,27(3):493-501,726.ZHUO Li,ZHENG Jing,WANG Fang,et al.A genetic algorithm based wrapper feature selection method for classification of hyper spectral data using support vector maching [J].Geogr Res,2008,27(3):493 - 501,726.
[15] CHANG Cheinl,DU Qian.Estimation of number of spectrally distinct signal sources in hyperspectral imagery [J].IEEE Trans Geosci Remote Sens,2004,42(3):608 - 619.
[16] GREEN P E,CARROLL J D.Analyzing Multivariate Data [M].Hinsdale:Dryden Press,1978.
[17] BREIMAN L.Random forest[J].Mach Learn,2001,45(1):5 - 32.
[18] WU Xiaoyan,WU Zhenyu,LI Kang.Identification of differential gene expression for microarray data using recursive random forest[J].Chin Med J,2008,121(24):2492 - 2496.
[19] CORTES C,VAPNIK V N.Support vector networks [J].Mach Learn,1995,20(2):273 - 297.
[20] VAPNIK V N.統(tǒng)計學(xué)習(xí)理論的本質(zhì)[M].張學(xué)工,譯.北京:清華大學(xué)出版社,2000.
A comparative study of dimension reduction methods for airborne hyperspectral images
FENG Yunyun1,2,LIU Lijuan1,2,LU Dengsheng1,2,PANG Yong3
(1.Zhejiang Provincial Key Laboratory of Carbon Cycling in Forest Ecosystems and Carbon Sequestration,Zhejiang A&F University,Lin’an 311300,Zhejiang,China;2.State Key Laboratory of Subtropical Silviculture,Zhejiang A&F University,Lin’an 311300,Zhejiang,China;3.Institute of Forest Resource Information Techniques,Chinese Academy of Forestry,Beijing 100091,China)
S757.1
A
2095-0756(2017)05-0765-10
2016-12-02;
2016-12-30
國家自然科學(xué)基金青年基金資助項目(41201365);浙江農(nóng)林大學(xué)科研發(fā)展基金資助項目(2013FR052,2014FR004);浙江農(nóng)林大學(xué)林學(xué)重中之重一級學(xué)科學(xué)生創(chuàng)新基金資助項目(201513)
馮云云,從事森林經(jīng)理學(xué)研究。E-mail:fengyyfm@163.com。通信作者:劉麗娟,講師,博士,從事林業(yè)遙感研究。E-mail:llj7885@163.com