于 宏,黃樹桃,劉京晶
(1.核工業(yè)北京地質(zhì)研究院,遙感信息與圖像分析技術(shù)國家級重點(diǎn)實(shí)驗(yàn)室,北京 100029;2.國家衛(wèi)星氣象中心,北京 100081)
基于光譜知識庫對高光譜影像目標(biāo)快速識別方法
于 宏1,黃樹桃1,劉京晶2
(1.核工業(yè)北京地質(zhì)研究院,遙感信息與圖像分析技術(shù)國家級重點(diǎn)實(shí)驗(yàn)室,北京 100029;2.國家衛(wèi)星氣象中心,北京 100081)
針對國內(nèi)引進(jìn)的機(jī)載高光譜成像儀(CASI/SASI)數(shù)據(jù)采集系統(tǒng),介紹了利用先驗(yàn)知識建立的多種地物目標(biāo)光譜庫,以及高光譜影像目標(biāo)快速識別的技術(shù)方法研究;同時還闡述了其數(shù)據(jù)處理流程、目標(biāo)識別原理和應(yīng)用開源代碼編程實(shí)現(xiàn)過程,并對其結(jié)果與應(yīng)用進(jìn)行了簡要的分析。
目標(biāo)識別;知識庫;成像光譜系統(tǒng)
高光譜遙感作為遙感技術(shù)的重大成就之一,近年來取得了重大進(jìn)展。高光譜影像目標(biāo)識別技術(shù)是利用空間維和光譜維信息進(jìn)行目標(biāo)定位和定性的技術(shù)方法;利用高光譜圖像(Hyperspectral Images)進(jìn)行目標(biāo)識別是當(dāng)前國內(nèi)、外遙感圖像處理和分析的研究熱點(diǎn)之一,尤其是近年涌現(xiàn)出大量星載和機(jī)載高光譜數(shù)據(jù)采集系統(tǒng),并獲得了相當(dāng)豐富的高光譜數(shù)據(jù)資源。因此,國內(nèi)、外科研單位對其的研究日益重視,促使人們?yōu)榭焖購暮A繑?shù)據(jù)中獲取所需信息,開展了大量的研究分析與應(yīng)用工作。其中,利用已知目標(biāo)的光譜特征,從高光譜影像數(shù)據(jù)中檢索該目標(biāo)的空間分布是高光譜數(shù)據(jù)分析應(yīng)用的重點(diǎn)之一。
CASI/SASI是加拿大 ITRES公司生產(chǎn)的機(jī)載成像光譜儀,為兩個獨(dú)立的成像系統(tǒng),可在同一平臺進(jìn)行數(shù)據(jù)采集,其中CASI波長為 350~1 100 nm,最高光譜分辨率為 10 nm; SASI波長為900~2 500 nm,光譜分辨率為10 nm。當(dāng)前的數(shù)據(jù)處理與分析應(yīng)用的工作過程是:利用設(shè)備數(shù)據(jù)預(yù)處理軟件,進(jìn)行輻射校正和幾何校正,然后采用 “黑/白布標(biāo)”同步測試的方法或利用FLASH在ENVI平臺中進(jìn)行大氣校正,最終進(jìn)行光譜角填圖、地物目標(biāo)分類等分析應(yīng)用。由于采集的數(shù)據(jù)量都相當(dāng)大,數(shù)據(jù)處理方式流程繁雜、工作效率偏低,為此,筆者針對該系統(tǒng)的數(shù)據(jù)特點(diǎn)和當(dāng)前的主要應(yīng)用任務(wù),對高光譜圖像的目標(biāo)進(jìn)行高速、有效和智能化的識別,設(shè)計了一套規(guī)范實(shí)用的數(shù)據(jù)處理流程,并基于開源代碼編程開發(fā)了高光譜圖像目標(biāo)快速識別系統(tǒng),從而實(shí)現(xiàn)對高光譜影像中地物目標(biāo)的準(zhǔn)確定位與快速定性。
高光譜影像的分類和目標(biāo)識別,主要有兩種方法:即基于地物光譜特征的分類識別方法和基于統(tǒng)計的分類識別方法?;诮y(tǒng)計特征的分類,可采用非監(jiān)督和監(jiān)督分類兩種方法,非監(jiān)督方法一般不需要具備對數(shù)據(jù)的先驗(yàn)知識,也可以直接應(yīng)用原始高光譜遙感圖像數(shù)據(jù)來進(jìn)行分類,雖然精度有所欠缺,但簡單易行,也是常用的方法之一。由于地物光譜特征分類識別方法是利用光譜庫中已知的光譜數(shù)據(jù),采用匹配算法來鑒別和識別圖像中的地物類型,因而該種方法既可采用全波長的比較和匹配,也可用感興趣的光譜特征或部分波長的光譜或光譜組合參量進(jìn)行匹配,達(dá)到分類和識別的目的[1-2]。筆者采用該方法,使其整個數(shù)據(jù)處理過程更為系統(tǒng)化,其基本原理是,首先對高光譜影像進(jìn)行大氣校正,計算反射率,利用光譜數(shù)據(jù)庫中已知目標(biāo),在影像中對每個像素點(diǎn)進(jìn)行光譜匹配檢索,同時獲取該像素點(diǎn)的空間坐標(biāo)(圖1),反射率計算、空間坐標(biāo)獲取和光譜匹配過程基本是同步進(jìn)行。其中光譜數(shù)據(jù)庫中的數(shù)據(jù)來源于美國地調(diào)局(USGS)和近年研究項(xiàng)目的數(shù)據(jù)積累;目標(biāo)檢索的算法主要是引進(jìn)現(xiàn)有成熟的算法——光譜角度匹配、相關(guān)系數(shù)、最小距離、約束能量最小化和基于支持向量機(jī)的光譜匹配算法等[3];目標(biāo)的空間定位是利用傳感器、平臺與GPS時間同步,獲取傳感器的姿態(tài)參數(shù),結(jié)合其成像方式,進(jìn)行空間坐標(biāo)變換計算獲得。
在高光譜遙感影像數(shù)據(jù)處理中,光譜匹配技術(shù)是高光譜地物目標(biāo)識別的最為關(guān)鍵技術(shù)之一。經(jīng)過了幾十年的發(fā)展,高光譜遙感圖像數(shù)據(jù)的分析處理技術(shù)取得了巨大進(jìn)步,在傳統(tǒng)分類算法的基礎(chǔ)上發(fā)展,形成了一系列面向高光譜圖像的目標(biāo)識別與分類算法。國內(nèi)、外這類算法有數(shù)十種之多,其中的許多算法原理都類同,只是進(jìn)行了部分改進(jìn)。光譜角、最小距離匹配等是比較常用的算法。基于光譜間的最小距離匹配算法與最小距離分類法幾乎一致,只是最小距離匹配基于樣本數(shù)據(jù),將未知光譜和參考光譜數(shù)值之間距離進(jìn)行計算,再根據(jù)最小二乘法進(jìn)行分類匹配,光譜可以采用歐氏、馬氏和巴氏距離等。SAM方法是把光譜看作多維矢量,通過計算測量光譜(像元光譜)與目標(biāo)光譜之間的 “角度”來確定它們兩者之間的相似性。SVM是最近幾年因計算機(jī)性能的極大提高而引入至高光譜影像數(shù)據(jù)分類的方法,SVM是Cortes和Vapnik于1995年首先提出的,建立在統(tǒng)計學(xué)習(xí)理論的VC維理論和結(jié)構(gòu)風(fēng)險最小原理基礎(chǔ)上,它在解決小樣本、非線性及高維模式識別中表現(xiàn)出許多特有的優(yōu)勢,并能夠推廣應(yīng)用到函數(shù)擬合等其他機(jī)器學(xué)習(xí)問題中,其本質(zhì)上是一種對問題真實(shí)模型的逼近[4-5]。本文并沒有對上述算法的具體內(nèi)容作過多的研究,而是直接引用了這些成熟的算法和開源代碼。
根據(jù)上述原理和算法,實(shí)現(xiàn)基于光譜知識庫的高光譜影像目標(biāo)的快速識別系統(tǒng)由3個主要部分組成,即地物波譜信息管理系統(tǒng)、高光譜影像地理編碼和高光譜影像目標(biāo)檢索模塊,其工作流程如圖2所示。地物波譜信息管理系統(tǒng)是一個集波譜測量數(shù)據(jù)、地物目標(biāo)先驗(yàn)知識數(shù)據(jù)于一體的信息管理系統(tǒng),為高光譜影像目標(biāo)識別提供地物目標(biāo)先驗(yàn)知識的平臺。其建立方法是首先在MS Access中建立數(shù)據(jù)結(jié)構(gòu),光譜數(shù)據(jù)以BLOB存儲;其后通過ADO.Net接口應(yīng)用C++編程開發(fā),實(shí)現(xiàn)對光譜數(shù)據(jù)及輔助信息的綜合管理。當(dāng)前該數(shù)據(jù)庫中包含有來自USGS及近年積累的波譜數(shù)據(jù)(ASD測量),總計約5 000多個樣本。其基本功能包括:數(shù)據(jù)入庫、查詢、光譜圖形可視化和數(shù)值分析等。
高光譜影像地理編碼是利用CASI/SASI成像光譜系統(tǒng)的傳感器、POS和GPS的時間同步及其空間幾何關(guān)系進(jìn)行空間投影變換,對影像中每一像素進(jìn)行空間定位。CASI和SASI在進(jìn)行輻射校正后產(chǎn)生兩個文件,一個為文件記錄每像素的輻亮度值 (單位為SUR,1 SUR=1 μW·cm-2·sr-1·nm-1)的高光譜影像數(shù)據(jù);另一文本文件存儲每一掃描行的特征描述信息,包括了系統(tǒng)時間、傳感器坐標(biāo)、姿態(tài)等輔助數(shù)據(jù),須與GPS進(jìn)行同步以獲取機(jī)下點(diǎn)像素精確的坐標(biāo)與姿態(tài)數(shù)據(jù),其時間同步方法參照成像光譜系統(tǒng)所附技術(shù)說明書。掃描線的其他像素坐標(biāo)依據(jù)飛行高度及空間變換矩陣計算獲得[6]。
高光譜影像目標(biāo)檢索模塊是依據(jù)用戶輸入?yún)?shù),從高光譜影像中提取相應(yīng)的目標(biāo)空間分布,具體功能包括:利用黑/白布標(biāo)計算反射率,從地物波譜庫中獲得一組光譜數(shù)據(jù)(單個或多個樣本),并自動提取目標(biāo),圖像的基本操作與處理功能包括顯示、放大、縮小、濾波、直方圖和閾值設(shè)置等。可自選光譜匹配算法和任選不同的波段組合,目前只有光譜角和相關(guān)性兩種算法。SVM算法尚在進(jìn)行測試中,還未取得好的結(jié)果。程序的實(shí)現(xiàn)是基于GDAL、Open CV等開源代碼,應(yīng)用C++編程調(diào)用其動態(tài)庫功能函數(shù)實(shí)現(xiàn)的。
首先,對不同匹配算法進(jìn)行比較測試,從光譜庫中隨機(jī)抽取20個樣本,即應(yīng)用3種算法(SAM、相關(guān)性和SVM)對一組光譜數(shù)據(jù)20個樣本進(jìn)行實(shí)驗(yàn)循環(huán)測試,即,使用其中一個作為檢測對象,同時對樣本的相似性進(jìn)行排序,前兩者獲取結(jié)果基本一致,重疊率達(dá)95%,但SVM算法與前兩者的差異較大,重疊率僅為70%。而在使用SVM算法進(jìn)行高光譜影像目標(biāo)檢索時,沒有獲得預(yù)期的結(jié)果,究其原因,初步認(rèn)為是C++調(diào)用Open CV動態(tài)庫過程中的參數(shù)設(shè)置存在錯誤。該方法已在兩個實(shí)際應(yīng)用課題中取得了良好的效果。在其后的工作中將完善SVM算法的測試,并引進(jìn)更多的算法進(jìn)行應(yīng)用。
[1]童慶禧,張 兵,鄭蘭芬.高光譜遙感:原理、技術(shù)與應(yīng)用[M].北京:高等教育出版社,2006.
[2]耿修瑞,趙永超.高光譜遙感圖像小目標(biāo)探測的基本原理[J].中國科學(xué)D輯:地球科學(xué),2007,37(8):1 081-1 087.
[3]Claudio Persello.Advanced techniquesforthe classification of very high resolution and hyperspectral remote sensing images[D].Trento:DISI-University of Trento,2010.
[4]Marconcini M, Camps-Valls G, Bruzzone L.A composite semisupervised SVM for classification of hyperspectral images[J]. IEEE Geoscience and Remote Sensing Letters, 2009, 6(2):234-238.
[5]Gualtieri J A,Chettri S.Support vector machines for classification ofhyperspectral data [C]//Proc.of IEEE-IGARSS 2000.Hawaii:IEEE-IGARSS,2000:813-815.
[6]Skaloud J,Lichti D.Rigorous approach to bore-sight self-calibration in airborne laser scanning [J].ISPRS JournalofPhotogrammetryand Remote Sensing, 2006, 61(1):47-59.
Technique of identifying speedy hyperspectral images object based on spectrum repository
YU Hong1,HUANG Shu-tao1, LIU Jing-jing2
(1.National Key Laboratory of Remote Sensing Information and Image Analysis Technology,Beijing Research Institute of Uranium Geology, Beijing 100029, China;2.National Satellite Meteorological Center, Beijing 100081, China)
Aimed at the imported airborne hyperspectral data collection system (CASI/SASI) , the authors first introduce the knowledge based spectral repository for multi ground objects,the study on the technique approaches to identifying object at speed with hyperspectral images,and then expound the principle of object identification,the flow of data processing and the programming procedure with open code,finally make a brief analysis for the results and its application.
object identification; knowledge repository; spectral imaging system
TP73
A
1672-0636(2011)01-0029-03
10.3969/j.issn.1672-0636.2011.01.006
2011-02-16
裝備預(yù)研項(xiàng)目:可探測目標(biāo)的光、電特性監(jiān)測評估研究(編號:51303020701-6)
于 宏(1960—),男,河北東光人,高級工程師,長期從事目標(biāo)光學(xué)特性研究工作。E-mail:yh6011@sina.com