国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于CNN的農(nóng)作物機(jī)載高光譜影像質(zhì)量評(píng)價(jià)
——以棉花為例

2022-12-05 07:34:52劉漢青趙慶展田文忠王學(xué)文
關(guān)鍵詞:光譜卷積樣本

劉漢青,趙慶展,田文忠,王學(xué)文

(1 石河子大學(xué)機(jī)械電氣工程學(xué)院, 新疆 石河子 832002;2 石河子大學(xué)信息科學(xué)與技術(shù)學(xué)院, 新疆 石河子 832002;3 兵團(tuán)空間信息工程技術(shù)研究中心, 新疆 石河子 832002;4 兵團(tuán)工業(yè)技術(shù)研究院, 新疆 石河子 832002)

成像光譜技術(shù)自上世紀(jì)八十年代初期產(chǎn)生,經(jīng)過接近半個(gè)世紀(jì)的發(fā)展,孕育出成像光譜學(xué)等新興學(xué)科類別[1]。高光譜成像技術(shù)作為成像光譜技術(shù)中的新成員,已經(jīng)成為植被調(diào)查、大氣遙感、農(nóng)業(yè)遙感、環(huán)境監(jiān)測等領(lǐng)域的重要技術(shù)手段。高質(zhì)量影像數(shù)據(jù)獲取已經(jīng)成為現(xiàn)代農(nóng)業(yè)數(shù)據(jù)組成中的重要研究方法之一,是判斷現(xiàn)代化作物種植、管理、監(jiān)測情況的重要依據(jù)[2]。準(zhǔn)確高效地評(píng)價(jià)光譜影像數(shù)據(jù)的質(zhì)量,一方面可以對(duì)影像采集過程的結(jié)果進(jìn)行綜合分析,另一方面可以指導(dǎo)下一階段不同成像算法的選擇和影像應(yīng)用[3]。針對(duì)衛(wèi)星影像數(shù)據(jù)質(zhì)量評(píng)估研究,董勝越等[4]對(duì)我國高分五號(hào)衛(wèi)星(GF-5)搭載的全譜段光譜成像儀獲取的全波段影像,通過信噪比、清晰度、信息量、輻射不均一性等指標(biāo),同美國Landset 8衛(wèi)星影像數(shù)據(jù)進(jìn)行了橫向?qū)Ρ取?shí)驗(yàn)結(jié)果表明GF-5號(hào)影像數(shù)據(jù)在不同波段內(nèi)的數(shù)據(jù)量分布不同且數(shù)據(jù)質(zhì)量不同,部分波段與Landset 8影像質(zhì)量差異顯著。王崇倡等[5]針對(duì)GF-5的AHSI (visible short wave infrared Advanced Hyperspectral Imager, AHSI)數(shù)據(jù)進(jìn)行全面研究,利用標(biāo)準(zhǔn)差、清晰度、信息熵3個(gè)指標(biāo)對(duì)可見短波紅外譜段數(shù)據(jù)質(zhì)量以及可用性分析,結(jié)果表明其影像信息主要集中在可見近紅外和短波紅外第1-95波段內(nèi),部分波段受水汽影響嚴(yán)重導(dǎo)致無法應(yīng)用。影像質(zhì)量評(píng)估技術(shù)的發(fā)展讓數(shù)字影像的應(yīng)用場景精準(zhǔn)化,對(duì)于推進(jìn)生產(chǎn)實(shí)踐以及學(xué)科研究具有重要意義。

隨著無人機(jī)(Unmanned Aerial Vehicle,UAV)技術(shù)、光譜成像技術(shù)以及計(jì)算機(jī)技術(shù)的進(jìn)一步發(fā)展,機(jī)載高光譜成像系統(tǒng)開始在多個(gè)領(lǐng)域嶄露頭角。該系統(tǒng)由于運(yùn)載便利、靈活性高、作業(yè)周期短、可快速高通量地獲取田間作物表型信息,結(jié)合其影像數(shù)據(jù)分辨率高、良好成像性能、設(shè)備維護(hù)簡單等多方面優(yōu)勢,機(jī)載高光譜成像系統(tǒng)的應(yīng)用成為了研究熱點(diǎn)之一[6]。機(jī)載高光譜成像系統(tǒng)同樣面臨數(shù)據(jù)獲取過程中的失真問題,自然環(huán)境下光譜遙感數(shù)據(jù)在采集傳輸過程中受到多方面的因素干擾,如氣流擾動(dòng)、電子干擾、溫度漂移等,會(huì)產(chǎn)生影像失真的情況[7]。為了減少高光譜影像數(shù)據(jù)失真的影響,高林等[8]在圍繞光譜特征信息所開展的無人機(jī)高光譜遙感反演作物葉面積指數(shù)的研究中,使用均值計(jì)算來降低感興趣區(qū)域內(nèi)的地物光譜反射率誤差,并使用光譜輻射儀采樣對(duì)計(jì)算結(jié)果進(jìn)行對(duì)比,表明458~830 nm波段范圍內(nèi)數(shù)據(jù)質(zhì)量較高滿足實(shí)驗(yàn)要求,有利于冬小麥葉面積指數(shù)反演。實(shí)驗(yàn)從光譜曲線變化趨勢、光譜相關(guān)性以及目標(biāo)地物光譜差異三方面展開分析,通過篩選敏感波段進(jìn)行葉面積指數(shù)反演,但未能充分利用獲取影像的空間信息對(duì)整體實(shí)驗(yàn)區(qū)域影像進(jìn)行質(zhì)量評(píng)估,使得影像獲取后數(shù)據(jù)處理工作變得比較復(fù)雜。秦占飛等[9]基于機(jī)載光譜成像平臺(tái),結(jié)合統(tǒng)計(jì)分析以及遙感影像成圖技術(shù),通過構(gòu)建合適的光譜指數(shù),建立合適的回歸模型對(duì)實(shí)驗(yàn)區(qū)域內(nèi)的水稻葉片含氮量進(jìn)行估測,實(shí)驗(yàn)中發(fā)現(xiàn)偏最小二乘法由于模型復(fù)雜且因數(shù)據(jù)降維處理影響,導(dǎo)致估算精度較差。且光譜數(shù)據(jù)在850 nm波段后噪聲嚴(yán)重,使用均值法進(jìn)行區(qū)域像素平均計(jì)算可在一定程度上減少實(shí)驗(yàn)誤差。由此可見機(jī)載高光譜影像數(shù)據(jù)質(zhì)量的好壞直接影響著研究實(shí)驗(yàn)的最終結(jié)果。

卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)由于其權(quán)值共享機(jī)制以及卷積運(yùn)算方式,在圖像處理方面有著優(yōu)異的性能,為圖像質(zhì)量評(píng)價(jià)工作提供了新思路與新方法[10]。曹玉東等[11]結(jié)合并行小規(guī)模卷積神經(jīng)網(wǎng)絡(luò),對(duì)現(xiàn)有公開數(shù)據(jù)集圖像進(jìn)行質(zhì)量評(píng)估的研究,提出了一種無參考的圖像質(zhì)量評(píng)價(jià)方法。得益于卷積運(yùn)算對(duì)圖像細(xì)微特征的提取能力,模型結(jié)構(gòu)簡單穩(wěn)定泛化力強(qiáng),能分辨圖像樣本間的細(xì)微差異。黃法秀等[12]針對(duì)人臉識(shí)別準(zhǔn)確率低的問題,使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)人臉圖像亮度與清晰度的質(zhì)量評(píng)價(jià)研究,結(jié)果表明模型在人臉圖像上的識(shí)別準(zhǔn)確率高達(dá)90%以上。目前來看圖像質(zhì)量研究仍以可見光影像為主,針對(duì)高光譜影像數(shù)據(jù)的質(zhì)量研究尚在起步階段。侯睿等[13]為了解決小數(shù)據(jù)集下影像質(zhì)量評(píng)價(jià)模型學(xué)習(xí)帶來的過擬合問題,基于全連接神經(jīng)網(wǎng)絡(luò)以及光譜數(shù)據(jù)統(tǒng)計(jì)學(xué)特征,提出了一種基于多特征融合的星載高光譜影像質(zhì)量評(píng)價(jià)深度學(xué)習(xí)結(jié)構(gòu)。使用Landset 8衛(wèi)星遙感影像,利用光譜相關(guān)性、空間相關(guān)性等關(guān)鍵數(shù)據(jù)特征構(gòu)建特征向量,極大地提高了影像質(zhì)量評(píng)價(jià)的準(zhǔn)確性,但并未探索卷積網(wǎng)絡(luò)在星載高光譜影像質(zhì)量評(píng)價(jià)應(yīng)用上的方法。當(dāng)前,用無人機(jī)開展多(高)光譜數(shù)據(jù)獲取用以農(nóng)情監(jiān)測成為熱點(diǎn),但針對(duì)無人機(jī)高光譜影像質(zhì)量評(píng)價(jià)的研究較少。由于機(jī)載光譜成像系統(tǒng)在巡航作業(yè)中不可避免地出現(xiàn)姿態(tài)變化以及采集過程中噪聲信號(hào)的干擾,而導(dǎo)致所采集的影像數(shù)據(jù)產(chǎn)生模糊、噪聲失真。如何高效地篩選高質(zhì)量的光譜影像,對(duì)于完善現(xiàn)代化作物種植管理、監(jiān)測體系有著重要意義。本文以棉花的機(jī)載高光譜數(shù)據(jù)為對(duì)象,使用卷積神經(jīng)網(wǎng)絡(luò)結(jié)合主觀圖像質(zhì)量判讀方法,探索卷積神經(jīng)網(wǎng)絡(luò)在辨別機(jī)載棉花高光譜影像模糊失真與噪聲失真的可能,提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的無人機(jī)高光譜遙感數(shù)據(jù)質(zhì)量評(píng)價(jià)的方法。

1 材料與方法

本文研究技術(shù)路線如圖1所示,包括數(shù)據(jù)獲取與預(yù)處理、數(shù)據(jù)增強(qiáng)、影像目視判讀分級(jí)處理、數(shù)據(jù)集生成、模型生成與訓(xùn)練以及模型評(píng)價(jià)6個(gè)階段。(1)選擇合適影像采集作業(yè)的棉花種植區(qū)域,結(jié)合物候特征使用機(jī)載高光譜成像系統(tǒng)采集棉花高光譜影像數(shù)據(jù),通過高光譜影像預(yù)處理得到原始影像;(2)通過模擬圖像采集與傳輸過程中的模糊與噪聲失真,對(duì)采集到的原始影像進(jìn)行數(shù)據(jù)增強(qiáng)處理;(3)將獲取的影像尺寸統(tǒng)一為1 024×1 024后進(jìn)行隨機(jī)分配,由專家進(jìn)行目視判讀質(zhì)量分級(jí)處理;(4)將標(biāo)注后的影像統(tǒng)一裁剪為256×256×42的大小,共計(jì)2 400幅,按照7∶1.5∶1.5劃分為數(shù)據(jù)集、驗(yàn)證集、測試集;(5)使用深度學(xué)習(xí)框架搭建卷積神經(jīng)網(wǎng)絡(luò),對(duì)模型的初始參數(shù)進(jìn)行調(diào)試,以探索不同參數(shù)對(duì)模型訓(xùn)練效果的影響,找出最佳模型參數(shù)進(jìn)行模型訓(xùn)練;(6)使用測試集進(jìn)行高光譜數(shù)據(jù)質(zhì)量分級(jí)評(píng)價(jià)實(shí)驗(yàn),結(jié)合模型評(píng)價(jià)指標(biāo)給出當(dāng)前模型評(píng)估結(jié)果,同時(shí)與其他網(wǎng)絡(luò)模型實(shí)驗(yàn)結(jié)果進(jìn)行比對(duì),分析實(shí)驗(yàn)結(jié)果并進(jìn)行探討。

圖1 技術(shù)路線圖

1.1 實(shí)驗(yàn)設(shè)備

無人機(jī)平臺(tái)采用大疆M600PRO六軸飛行器,結(jié)合如影Ronin-MX航拍三軸云臺(tái)來保證高光譜成像設(shè)備平穩(wěn)運(yùn)行。高光譜成像儀采用芬蘭SENOP公司生產(chǎn)的Rikola高光譜成像儀,其主要性能參數(shù)如表1所示。

表1 Rikola 高光譜成像儀性能參數(shù)

1.2 數(shù)據(jù)采集

本次實(shí)驗(yàn)區(qū)域位于新疆塔城地區(qū)沙灣縣蘑菇湖村,其位于44.413 3°N,85.894 7°E。沙灣縣屬于大陸性中溫帶干旱氣候,全年累計(jì)太陽日照時(shí)數(shù)約為2 800~2 870 h,平均氣溫6.4 ℃~6.8 ℃,無霜期170~190 d,年降水量140~350 mm,年蒸發(fā)量為1 500~2 000 mm,土質(zhì)松軟適合多種作物生長,研究區(qū)主要為裸土以及棉花作物。為了保證高光譜影像獲取的數(shù)據(jù)有效性,選擇晴朗的天氣在光照條件充分的情況下進(jìn)行數(shù)據(jù)采集。設(shè)定無人機(jī)巡航高度100 m,巡航速度8 m·s-1,航向重疊率80%,旁向重疊率70%,共采集118張42波段的原始高光譜影像,研究區(qū)數(shù)據(jù)獲取結(jié)果如圖2所示。

圖2 研究區(qū)數(shù)據(jù)獲取結(jié)果

1.3 數(shù)據(jù)處理

數(shù)據(jù)處理包含高光譜影像預(yù)處理、實(shí)驗(yàn)數(shù)據(jù)增強(qiáng)處理以及數(shù)據(jù)標(biāo)定處理3個(gè)部分。針對(duì)采集到的Rikola高光譜數(shù)據(jù)首先進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換和暗電流矯正,由于高光譜影像數(shù)據(jù)波段較多且在飛行運(yùn)動(dòng)中,在相機(jī)觸發(fā)曝光后波段順序采集的影像并不完全重疊,但該相機(jī)成像方式為框幅式成像波段配準(zhǔn)算法簡單成熟,先進(jìn)行波段配準(zhǔn)處理后,再進(jìn)行影像拼接,拼接后得到的影像長約155.8 m,寬約85.4 m。

使用GDAL (Geospatial Data Abstraction Library,GDAL)以及OpenCV函數(shù)庫對(duì)含有地理坐標(biāo)信息的影像數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng)處理,以避免模型泛化力弱的現(xiàn)象產(chǎn)生。由于遙感系統(tǒng)內(nèi)影像失真以模糊失真和噪聲失真最為常見[14],因此針對(duì)采集到的高光譜數(shù)據(jù)進(jìn)行逐波段影像模糊和噪聲添加處理。均值模糊由于計(jì)算效率高且易于產(chǎn)生視覺上可接受的模糊處理效果,被用來近似無人機(jī)巡航采樣下因氣流擾動(dòng)產(chǎn)生的失焦模糊現(xiàn)象。均值模糊處理是指在圖像上給目標(biāo)像素一個(gè)模板,該模板包含其周圍的臨近像素,通過模板計(jì)算選中區(qū)域內(nèi)的像素平均值來替換原位置處的像素值,模糊運(yùn)算的具體計(jì)算方法如下:

(1)

式中,K表示當(dāng)前像素點(diǎn)計(jì)算結(jié)果,W表示模板橫向大小,H表示模板縱向大小,本文使用W=H進(jìn)行模糊處理。高斯噪聲是指圖像上出現(xiàn)的噪聲信號(hào)其概率密度符合高斯分布的一類失真。其概率密度表示如下:

(2)

式中,x為噪聲大小,μ表示均值,σ2表示方差。對(duì)采集到的影像添加μ=0,σ2依次等于0、0.005、0.01、0.02、0.04的高斯噪聲。圖3列出了部分?jǐn)?shù)據(jù)增強(qiáng)后的棉花影像,其橫向?yàn)槟:幚斫Y(jié)果對(duì)比,縱向?yàn)楦咚乖肼曁砑犹幚斫Y(jié)果對(duì)比,為了避免均值處理對(duì)噪聲信號(hào)的平滑作用,先進(jìn)行模糊處理后再進(jìn)行噪聲信號(hào)的添加。

圖3 實(shí)驗(yàn)區(qū)域內(nèi)同一時(shí)期棉花數(shù)據(jù)增強(qiáng)變化對(duì)比(16,9,1波段合成影像)

遙感影像質(zhì)量評(píng)價(jià)的一般方法分為兩類,客觀評(píng)價(jià)方法和主觀評(píng)價(jià)方法??陀^評(píng)價(jià)方法根據(jù)是否有參考圖像分為全參考、半?yún)⒖己蜔o參考質(zhì)量評(píng)價(jià)[15]。而主觀評(píng)價(jià)方法是在測試人員目視判讀情況下,對(duì)圖像紋理,圖像清晰度,圖像呈現(xiàn)的細(xì)節(jié)等方面進(jìn)行評(píng)估的一種手段。由于遙感應(yīng)用中所采集的影像大多為真實(shí)狀態(tài)下的數(shù)據(jù),難以獲得標(biāo)準(zhǔn)參考影像,使得全參考評(píng)價(jià)方法受到限制。并且無參考圖像評(píng)價(jià)基于統(tǒng)計(jì)學(xué)原理計(jì)算圖像評(píng)價(jià)特征指標(biāo),一張圖像在不同計(jì)算方法下結(jié)果差異顯著,難以確定統(tǒng)一標(biāo)準(zhǔn)進(jìn)行直接評(píng)價(jià)。人眼作為接受圖像的第一感官,對(duì)人類視覺系統(tǒng)(Human Visible System, HVS)以及圖像判讀方式的深入理解,始終推進(jìn)著計(jì)算機(jī)圖像質(zhì)量評(píng)估方式的進(jìn)步,大量研究表明結(jié)合HVS工作特性開展圖像質(zhì)量評(píng)估工作,能顯著提高圖像質(zhì)量的評(píng)價(jià)準(zhǔn)確性[15]。因此根據(jù)實(shí)驗(yàn)樣本間的差異采用專家觀察方法對(duì)數(shù)據(jù)集進(jìn)行標(biāo)定,具體采用雙激勵(lì)損傷量表法對(duì)所采集的樣本數(shù)據(jù)進(jìn)行標(biāo)定[16]。雙激勵(lì)損傷量表法是指觀察者在評(píng)價(jià)圖像的同時(shí)對(duì)無損傷的原始影像進(jìn)行觀察,通過觀察兩者之間的差異性,根據(jù)表2主觀評(píng)價(jià)圖像質(zhì)損傷量表,給出被觀察圖像質(zhì)量評(píng)價(jià)結(jié)果[17]。

表2 主觀評(píng)價(jià)圖像質(zhì)損傷量表

實(shí)際操作中經(jīng)熟悉遙感影像背景知識(shí)的專家,以預(yù)處理后未進(jìn)行失真處理的高光譜影像為參考對(duì)實(shí)驗(yàn)所使用的高光譜影像進(jìn)行質(zhì)量分級(jí)標(biāo)定,分級(jí)標(biāo)準(zhǔn)為表2內(nèi)的5個(gè)等級(jí),分別以數(shù)字5、4、3、2、1來表示,數(shù)值越大影像質(zhì)量越高[18]。為了便于神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)讀取與運(yùn)算,將影像數(shù)據(jù)統(tǒng)一裁剪為256×256共2 400張的棉花高光譜影像,經(jīng)質(zhì)量分級(jí)標(biāo)定后按照7∶1.5∶1.5的比例生成數(shù)據(jù)集(1 680張)、測試集(360張)、驗(yàn)證集(360張)。

1.4 模型定義與訓(xùn)練

神經(jīng)網(wǎng)絡(luò)通過迭代計(jì)算來減少學(xué)習(xí)結(jié)果與樣本標(biāo)簽之間的差異,在此過程中優(yōu)化權(quán)值,更新參數(shù)以達(dá)到預(yù)測影像質(zhì)量等級(jí)的目的。Inception結(jié)構(gòu)的第一次出現(xiàn)是參加2014年ImageNet大規(guī)模視覺識(shí)別挑戰(zhàn)比賽,由于該網(wǎng)絡(luò)致力于在保持網(wǎng)絡(luò)結(jié)構(gòu)稀疏的情況下,保證密集矩陣運(yùn)算的性能,創(chuàng)新地提出將網(wǎng)絡(luò)橫向結(jié)構(gòu)擴(kuò)大并取消了全連接層,在使用稀疏結(jié)構(gòu)下使用不同大小的卷積運(yùn)算拼接不同特征,同時(shí)還引入1×1卷積運(yùn)算解決維度爆炸的問題,使其網(wǎng)絡(luò)結(jié)構(gòu)在高維特征的計(jì)算上更有優(yōu)勢,避免了臃腫網(wǎng)絡(luò)下模型性能退化的現(xiàn)象[19]。對(duì)應(yīng)于高光譜數(shù)據(jù)的高緯度、高分辨率特征,本研究中結(jié)合Inception卷積結(jié)構(gòu)對(duì)多維度圖像特征提取的優(yōu)勢,設(shè)計(jì)一種適合高光譜影像質(zhì)量分級(jí)評(píng)價(jià)的網(wǎng)絡(luò)結(jié)構(gòu),該網(wǎng)絡(luò)通過多層卷積、擴(kuò)大網(wǎng)絡(luò)橫向結(jié)構(gòu)來提高模型準(zhǔn)確率,并使用全局平均池化減少運(yùn)算參數(shù),通過全連接層輸出分集結(jié)果,模型結(jié)構(gòu)如圖4所示。

圖4 棉花高光譜影像質(zhì)量分級(jí)評(píng)價(jià)網(wǎng)絡(luò)

卷積網(wǎng)絡(luò)一般結(jié)構(gòu)為卷積層、池化層以及全連接層。由于高光譜影像數(shù)據(jù)不同于一般遙感影像,其特征提取困難而經(jīng)常產(chǎn)生欠擬合的情況,因此采用Inception網(wǎng)絡(luò)結(jié)構(gòu)塊的形式進(jìn)行特征提取。該結(jié)構(gòu)使用多層卷積計(jì)算,不同大小的卷積核在處理高光譜影像時(shí)由于感受野的不同,特征抽象能力不同,且進(jìn)行網(wǎng)絡(luò)橫向規(guī)模的擴(kuò)大,在保留大量特征數(shù)據(jù)的同時(shí),結(jié)合1×1卷積、全局池化的操作來減少計(jì)算參數(shù),從而提高網(wǎng)絡(luò)計(jì)算效率。

實(shí)驗(yàn)選擇4層Inception結(jié)構(gòu)以及2層全連接網(wǎng)絡(luò)來防止欠擬合現(xiàn)象的產(chǎn)生。該模型數(shù)據(jù)輸入大小為256×256×42的高光譜影像,進(jìn)入網(wǎng)絡(luò)計(jì)算時(shí)需歸一化處理;經(jīng)過第1層3×3步長為2(stride=2)的卷積計(jì)算,輸出16通道特征提取結(jié)果;隨后進(jìn)入Block計(jì)算,Block one與 Block three均采用步長為2(stride=2)的卷積核,方便特征圖像尺寸的減少;Block two、Block four采用步長為1(stride=1)的卷積核,有利于保留卷積計(jì)算信息;激活函數(shù)均用Relu函數(shù)。數(shù)據(jù)計(jì)算過程中每經(jīng)過兩個(gè)Block,卷積通道數(shù)增加一倍,通過Block four計(jì)算后進(jìn)行全局池化以及兩個(gè)連續(xù)的全連接層;第1個(gè)全連接層的神經(jīng)元個(gè)數(shù)為網(wǎng)絡(luò)初始化通道數(shù)×網(wǎng)絡(luò)輸出分類數(shù),激活函數(shù)為Relu;第2層神經(jīng)元個(gè)數(shù)為5以滿足五分類的實(shí)驗(yàn)需求,經(jīng)Softmax函數(shù)計(jì)算后輸出。由于樣本標(biāo)簽并未使用獨(dú)熱編碼(One-Hot Encoding)標(biāo)記,因此使用稀疏交叉熵作為損失函數(shù)。

圖5 PCA處理后特征數(shù)據(jù)樣本散點(diǎn)圖

為了觀測卷積神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練樣本的特征的提取效果,使用主成分分析(Principal Component Analysis,PCA)將網(wǎng)絡(luò)分類輸出前的特征向量壓縮至三維顯示在空間坐標(biāo)系內(nèi),樣本點(diǎn)分布情況如圖5所示。5種顏色代表5個(gè)質(zhì)量等級(jí)的機(jī)載棉花高光譜影像??梢钥闯鎏卣鞒槿『蟮母吖庾V影像樣本被分類在空間內(nèi)的不同扇形區(qū)域且樣本類別之間有較為清晰的邊界劃分,即能夠找到一個(gè)空間平面用于分類樣本點(diǎn)。說明該網(wǎng)絡(luò)能夠?qū)Ω吖庾V影像樣本進(jìn)行有效的特征抽取,以完成對(duì)不同質(zhì)量的高光譜影像準(zhǔn)確分類的目的。

1.5 模型評(píng)價(jià)指標(biāo)

本次研究主要目的在于棉花高光譜影像質(zhì)量分級(jí)評(píng)價(jià)屬于多分類問題。模型評(píng)價(jià)指標(biāo)宜采用準(zhǔn)確率(Accuracy)、平均精確率(Average precision, AP)、Kappa系數(shù)進(jìn)行模型精度驗(yàn)證[20]。不同評(píng)價(jià)標(biāo)準(zhǔn)計(jì)算方法如下:

(3)

(4)

(5)

式中,n∈(1,2,3,4,5),T表示總體樣本中被正確分類的樣本數(shù),A表示總體樣本個(gè)數(shù),TPi表示第i類樣本內(nèi)正確預(yù)測的正例樣本個(gè)數(shù),F(xiàn)Pi表示第i類樣本內(nèi)被錯(cuò)誤預(yù)測的正例樣本的個(gè)數(shù),ai+表示預(yù)測結(jié)果混淆矩陣內(nèi)第i行的總觀測數(shù),b+i表示預(yù)測結(jié)果混淆矩陣內(nèi)第i列的總觀測數(shù)。

1.6 實(shí)驗(yàn)環(huán)境與參數(shù)配置

實(shí)驗(yàn)在以下硬件環(huán)境中完成:英特爾Xeon Silver 4110 CPU@2.10 GHz,32 GB內(nèi)存,單個(gè)NVIDIA Quadro P2000 GPU。軟件使用Tensorflow1.13.1深度學(xué)習(xí)開源框架,CUDA通用并行計(jì)算架構(gòu) (11.0版本)。在訓(xùn)練和測試過程中,均采用大小為 256×256×42的影像數(shù)據(jù)。在本次研究中為了保證輸入影像的準(zhǔn)確性,輸入影像均為TIFF格式,存儲(chǔ)模式為逐波段存儲(chǔ)(Band sequential format, BSQ),有利于影像空間分布信息的顯示與處理。

2 結(jié)果與分析

2.1 模型超參數(shù)調(diào)試

深度學(xué)習(xí)模型的可解釋性較差類似于黑盒學(xué)習(xí),需要對(duì)超參數(shù)反復(fù)調(diào)試以驗(yàn)證當(dāng)前網(wǎng)絡(luò)分類能力是否滿足研究需要。本文采用人工設(shè)定的方法來確定網(wǎng)絡(luò)訓(xùn)練的超參數(shù),通過對(duì)比不同超參數(shù)選擇的訓(xùn)練過程實(shí)現(xiàn)參數(shù)調(diào)優(yōu)。表3記錄著不同超參數(shù)的選擇范圍。

為了確定合適本文網(wǎng)絡(luò)的超參數(shù),結(jié)合控制變量法使用訓(xùn)練集樣本對(duì)模型進(jìn)行訓(xùn)練,驗(yàn)證集來驗(yàn)證。實(shí)驗(yàn)設(shè)定最大迭代次數(shù)為100(epochs=100),通過分析不同參數(shù)下模型分類精度變化曲線,了解不同參數(shù)的選取對(duì)模型訓(xùn)練效果的影響。超參數(shù)調(diào)整實(shí)驗(yàn)對(duì)比結(jié)果如圖6所示,其中a、b、c、d分別表示迭代計(jì)算過程中不同參數(shù)在數(shù)據(jù)集上的結(jié)果,其上方描述模型在訓(xùn)練集的準(zhǔn)確率變化,下方描述模型在驗(yàn)證集的準(zhǔn)確率變化。

表3 超參數(shù)的選擇范圍

圖6 超參數(shù)調(diào)整實(shí)驗(yàn)對(duì)比結(jié)果

(1)模型提取能力受初始通道數(shù)影響。分析圖6a發(fā)現(xiàn)始通道過大(init_ch=32)或過小(init_ch=8)時(shí),相同迭代次數(shù)下模型分類精度下降。較大的特征輸出通道一方面增大模型運(yùn)算參數(shù),另一方面使信息冗余性增大,模型訓(xùn)練過程中容易產(chǎn)生較大波動(dòng)。過小的特征通道,盡管訓(xùn)練過程平穩(wěn),但圖像信息提取能力下降,表現(xiàn)不如初始通道為16時(shí)模型精度高。由于網(wǎng)絡(luò)結(jié)構(gòu)中存在卷積通道擴(kuò)大操作,采用8通道作為輸入時(shí)最后一層卷積輸出結(jié)果僅為64通道,采用16通道輸入時(shí)后一層卷積輸出達(dá)到128層,在滿足信息提取的同時(shí),避免了256層輸出時(shí)因信息冗余度大造成模型提取能力下降的可能。

(2)高光譜圖像質(zhì)量分類模型收斂速度易受初始學(xué)習(xí)率影響。由圖6b可以看出過大(Lr = 0.01)或過小(Lr = 0.000 01)的學(xué)習(xí)率使得模型無法有效收斂甚至無法學(xué)習(xí)。當(dāng)學(xué)習(xí)率為0.000 1時(shí)雖然不如0.001時(shí)的訓(xùn)練效率高,但整個(gè)訓(xùn)練過程平穩(wěn)。結(jié)合最大迭代次數(shù)以及影像數(shù)據(jù)規(guī)模的考慮,認(rèn)為學(xué)習(xí)率為0.000 1時(shí)更加符合研究需求。

(3)高光譜圖像質(zhì)量分類模型訓(xùn)練平穩(wěn)性與迭代輸入數(shù)據(jù)量的大小有關(guān)。由于高光譜圖像數(shù)據(jù)量大,過大的batch_size對(duì)計(jì)算機(jī)數(shù)據(jù)讀取效率影響很大,因此對(duì)單次循環(huán)使用的樣本大小進(jìn)行對(duì)比分析。圖6c對(duì)比batch_size的實(shí)驗(yàn)中由于網(wǎng)絡(luò)模型結(jié)構(gòu)限制,較小的batch_size能夠增加單次循環(huán)中的計(jì)算次數(shù)。當(dāng)batch_size=8時(shí)一次循環(huán)內(nèi)迭代次數(shù)為210次(1 680/8=210),100次循環(huán)共計(jì)21 000次迭代計(jì)算,以保證訓(xùn)練過程中神經(jīng)網(wǎng)絡(luò)充分利用數(shù)據(jù)間的差異性與復(fù)雜性。

(4)不同優(yōu)化策略對(duì)訓(xùn)練效果影像顯著。均方根傳播算法 (Root Mean Square Prop, RMSProp)作為隨機(jī)梯度下降法(Stochastic Gradient Descent, SGD)的發(fā)展,通過引入一個(gè)衰減系數(shù),讓學(xué)習(xí)率每回合都衰減一定比例,避免學(xué)習(xí)過程過早的結(jié)束,但未能擺脫對(duì)全局學(xué)習(xí)率的影響。Adam(Adaptive Moment Estimation, Adam)優(yōu)化器結(jié)合RMSProp與動(dòng)量的優(yōu)點(diǎn),通過計(jì)算梯度的一階矩估計(jì)和二階矩估計(jì)為不同的參數(shù)設(shè)計(jì)獨(dú)立的自適應(yīng)性學(xué)習(xí)率。Adamax作為Adam方法的變體,僅使得學(xué)習(xí)率的邊界范圍計(jì)算更加簡單。通過圖6d優(yōu)化器對(duì)比實(shí)驗(yàn)結(jié)果可知,相比RMSProp以及Adamax,Adam優(yōu)化器針對(duì)本文使用的棉花高光譜影像數(shù)據(jù)集在分類效果上表現(xiàn)更佳。

結(jié)合上述實(shí)驗(yàn)過程,超參數(shù)的選取如下:初始學(xué)習(xí)率=0.000 1,單次迭代樣本數(shù)據(jù)量大小batch_size=8,模型初始通道數(shù)init_ch =16,優(yōu)化器使用Adam。

2.2 訓(xùn)練結(jié)果與實(shí)驗(yàn)分析

為了驗(yàn)證網(wǎng)絡(luò)性能,實(shí)驗(yàn)在確定超參數(shù)后將epochs提高至1 000,共計(jì)210 000次迭代。文章使用的卷積神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果如圖7所示,分別記錄了模型在訓(xùn)練集與驗(yàn)證集的計(jì)算結(jié)果以及模型在測試集上的混淆矩陣。

圖7 實(shí)驗(yàn)結(jié)果

由圖7a不難發(fā)現(xiàn)隨著迭代次數(shù)增多網(wǎng)絡(luò)模型逐漸收斂,前200次迭代計(jì)算時(shí)損失函數(shù)快速下降模型加速收斂,隨后模型損失函數(shù)緩慢下降,經(jīng)800次迭代后網(wǎng)絡(luò)在驗(yàn)證集上的分類準(zhǔn)確率達(dá)到較高水平。圖7b混淆矩陣表示了樣本被分類的準(zhǔn)確程度,可以看出測試集樣本內(nèi)以較差樣本觀測總量最多,優(yōu)良樣本觀測總量最少符合樣本一般規(guī)律,且測試集內(nèi)絕大部分樣本被準(zhǔn)確分類沿矩陣對(duì)角線分布,個(gè)別樣本被錯(cuò)誤分類。

通過多次試驗(yàn)進(jìn)行更為準(zhǔn)確的模型精度測量。表4記錄了不同評(píng)價(jià)標(biāo)準(zhǔn)在多次獨(dú)立測試的結(jié)果對(duì)比以及算數(shù)平均值,測試結(jié)果1、2、3分別使用測試集樣本的60%、80%、100%進(jìn)行模型精度驗(yàn)證。

表4 不同評(píng)價(jià)標(biāo)準(zhǔn)在多次測試中的結(jié)果對(duì)比

為了驗(yàn)證本研究使用網(wǎng)絡(luò)結(jié)構(gòu)的有效性,在測試過程中與3類常見的卷積神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比,分別是Resnet34、Xception和VGG13,實(shí)驗(yàn)計(jì)算結(jié)果記錄在表5。

表5 不同模型的分類評(píng)價(jià)標(biāo)準(zhǔn)測試結(jié)果對(duì)比

計(jì)算結(jié)果表明:Resnet34網(wǎng)絡(luò)難以有效的對(duì)樣本進(jìn)行特征提取并分類。原因可能在于輸入的多通道高光譜數(shù)據(jù)使得網(wǎng)絡(luò)特征提取過程復(fù)雜化,34層深度的網(wǎng)絡(luò)結(jié)構(gòu)在訓(xùn)練集數(shù)據(jù)上產(chǎn)生網(wǎng)絡(luò)退化的情況,不適用于機(jī)載棉花高光譜數(shù)據(jù)集的分級(jí)評(píng)價(jià)處理;Xception作為Inception結(jié)構(gòu)的進(jìn)一步發(fā)展,擴(kuò)大網(wǎng)絡(luò)橫向結(jié)構(gòu)的同時(shí)采用深度可分離卷積的思想以提高多通道特征提取融合能力,使得該模型在同樣的訓(xùn)練次數(shù)下達(dá)到70.67% 的分類準(zhǔn)確率,但其復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)降低了模型訓(xùn)練效率,實(shí)驗(yàn)中使用了89 634秒完成1 000個(gè)epoch的循環(huán);針對(duì)實(shí)驗(yàn)獲取的高光譜數(shù)據(jù),標(biāo)準(zhǔn)VGG13在實(shí)驗(yàn)條件下無法完成計(jì)算,因此將卷積核個(gè)數(shù)減半且全連接層神經(jīng)元個(gè)數(shù)為標(biāo)準(zhǔn)狀況下的四分之一。優(yōu)化后的VGG13有較好的樣本適應(yīng)能力,經(jīng)測試樣本分類準(zhǔn)確率高達(dá)84.98%,訓(xùn)練時(shí)間相較其余3類網(wǎng)絡(luò)優(yōu)勢突出;對(duì)比前3類網(wǎng)絡(luò)測試結(jié)果文章提出的卷積神經(jīng)網(wǎng)絡(luò)雖然在模型訓(xùn)練效率上略有不足,但網(wǎng)絡(luò)綜合優(yōu)勢突出,在不同評(píng)價(jià)標(biāo)準(zhǔn)上實(shí)現(xiàn)了良好的平衡。

3 討論與結(jié)論

3.1 討論

影像質(zhì)量評(píng)價(jià)是一項(xiàng)十分復(fù)雜的任務(wù),不應(yīng)當(dāng)局限于當(dāng)前實(shí)驗(yàn)研究的狀況。本研究存在以下幾點(diǎn)不足:(1)采用均值模糊對(duì)影像失焦模糊進(jìn)行了樣本復(fù)現(xiàn),對(duì)于無人機(jī)運(yùn)動(dòng)過程中引起的運(yùn)動(dòng)模糊、散焦模糊等影像失真未進(jìn)行樣本復(fù)現(xiàn)。關(guān)于此類失真如何進(jìn)行準(zhǔn)確的影像質(zhì)量評(píng)估可作為后續(xù)的研究重點(diǎn)內(nèi)容。(2)由于高光譜影像圖譜合一的特性,針對(duì)光譜數(shù)據(jù)開展質(zhì)量評(píng)估研究,可以作為高光譜影像質(zhì)量評(píng)價(jià)參考內(nèi)容之一,這對(duì)于辨別高質(zhì)量的機(jī)載高光譜影像數(shù)據(jù)是極為有利的。(3)本文所使用的影像樣本標(biāo)定過程采用專家目視解譯標(biāo)定不一定絕對(duì)可靠。關(guān)于高光譜影像樣本的標(biāo)定需要引入更符合數(shù)據(jù)特點(diǎn)的評(píng)價(jià)標(biāo)準(zhǔn)以及客觀評(píng)價(jià)指標(biāo)來進(jìn)行橫向參考,即目前影像樣本僅為單標(biāo)簽標(biāo)定,可以進(jìn)一步考慮對(duì)高光譜影像進(jìn)行多標(biāo)簽標(biāo)定,以體現(xiàn)每個(gè)樣本間的細(xì)微差異突出數(shù)據(jù)集的多樣性、復(fù)雜性。(4)目前僅對(duì)棉花種植區(qū)域的高光譜影像進(jìn)行了數(shù)據(jù)采集,對(duì)于其他農(nóng)作物機(jī)載高光譜影像質(zhì)量分級(jí)評(píng)價(jià)的問題,難以避免模型泛化力不足的現(xiàn)象。本文針對(duì)現(xiàn)有機(jī)載棉花高光譜數(shù)據(jù)集進(jìn)行了影像質(zhì)量評(píng)價(jià)方法上的探索,所采用的研究手段可供后續(xù)其他作物的高光譜影像質(zhì)量評(píng)價(jià)工作的開展參考。

3.2 結(jié)論

本文對(duì)無人機(jī)高光譜數(shù)據(jù)提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的機(jī)載棉花高光譜影像質(zhì)量評(píng)價(jià)的研究方法。通過數(shù)據(jù)獲取與預(yù)處理、數(shù)據(jù)增強(qiáng)、標(biāo)簽標(biāo)注、數(shù)據(jù)集生成、模型生成與訓(xùn)練以及模型評(píng)價(jià)六個(gè)步驟進(jìn)行。結(jié)合圖像主觀評(píng)價(jià)方法以及高光譜數(shù)據(jù)特點(diǎn),在卷積網(wǎng)絡(luò)中引入Inception結(jié)構(gòu),使得卷積運(yùn)算在抽象特征的同時(shí),進(jìn)行跨通道的信息交互以及信息整合。實(shí)驗(yàn)前通過多次的超參數(shù)調(diào)節(jié)確定網(wǎng)絡(luò)初始化條件,確保模型結(jié)構(gòu)滿足研究需求。對(duì)樣本的分類結(jié)果表明該網(wǎng)絡(luò)可有效的對(duì)5類質(zhì)量不同的機(jī)載棉花高光譜影像數(shù)據(jù)進(jìn)分類,在測試集上樣本的分類準(zhǔn)確率為 99. 06%,平均精確率為 99. 07%,Kappa系數(shù)為0.988 7,即基于卷積神經(jīng)網(wǎng)絡(luò)對(duì)判斷機(jī)載棉花高光譜影像中的噪聲差異以及圖像模糊差異具有較好的適應(yīng)性,能夠完成高光譜影像質(zhì)量的分級(jí)評(píng)價(jià)。

猜你喜歡
光譜卷積樣本
基于三維Saab變換的高光譜圖像壓縮方法
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
推動(dòng)醫(yī)改的“直銷樣本”
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
隨機(jī)微分方程的樣本Lyapunov二次型估計(jì)
村企共贏的樣本
星載近紅外高光譜CO2遙感進(jìn)展
苦味酸與牛血清蛋白相互作用的光譜研究
西吉县| 南京市| 温州市| 上虞市| 芮城县| 思茅市| 义乌市| 昭苏县| 莆田市| 吉隆县| 郴州市| 都江堰市| 固始县| 林芝县| 奎屯市| 乌鲁木齐县| 阿克陶县| 东明县| 呈贡县| 宜君县| 什邡市| 涞源县| 邢台县| 泽库县| 洪江市| 嘉善县| 基隆市| 临邑县| 庄河市| 陕西省| 色达县| 开化县| 砚山县| 建阳市| 南和县| 修水县| 屯昌县| 米林县| 紫云| 江城| 黑水县|