王碧琳,王生生*,張 哲
(1.吉林大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,吉林 長(zhǎng)春 130012;2.中國科學(xué)院 蘇州生物醫(yī)學(xué)工程技術(shù)研究所,江蘇 蘇州 215163)
隨著航天技術(shù)和電子信息科學(xué)的發(fā)展,遙感器分辨率及信息處理能力不斷提高,遙感技術(shù)已被廣泛應(yīng)用于氣象觀測(cè)、精準(zhǔn)農(nóng)業(yè)和土地利用規(guī)劃等多個(gè)領(lǐng)域[1-3]。高光譜圖像由多空間平臺(tái)的成像光譜儀采集,結(jié)合光譜儀和光學(xué)相機(jī)的優(yōu)點(diǎn),實(shí)現(xiàn)目標(biāo)區(qū)域的大范圍細(xì)粒度成像,采集圖像數(shù)據(jù)中包含豐富光譜-空間結(jié)構(gòu)信息?;谙袼乜臻g關(guān)系及多波段光譜信息,高光譜圖像分類技術(shù)致力于實(shí)現(xiàn)圖像中地物精準(zhǔn)分類,逐像素分配語義標(biāo)簽,對(duì)后續(xù)多種復(fù)雜地球信息的分析研究具有重要意義。
由于時(shí)空環(huán)境變化和圖像采集設(shè)備不同,高光譜圖像通常處于不同數(shù)學(xué)概率分布,數(shù)據(jù)特征偏移明顯。在已有標(biāo)注的源域數(shù)據(jù)集上訓(xùn)練的模型難以直接有效遷移到新捕獲的無標(biāo)注目標(biāo)域數(shù)據(jù)。數(shù)據(jù)標(biāo)注工作依賴專業(yè)設(shè)備和領(lǐng)域內(nèi)專家,耗時(shí)費(fèi)力,難以收集足夠的標(biāo)注數(shù)據(jù)。標(biāo)注數(shù)據(jù)的缺乏對(duì)構(gòu)建高精度高光譜圖像分類模型帶來了巨大挑戰(zhàn)。
為解決域偏移導(dǎo)致的模型遷移困難問題,領(lǐng)域自適應(yīng)技術(shù)通過縮減源域數(shù)據(jù)與目標(biāo)域數(shù)據(jù)間的分布差異實(shí)現(xiàn)模型適配。當(dāng)前領(lǐng)域自適應(yīng)技術(shù)通常采用基于深度學(xué)習(xí)的方法,構(gòu)建神經(jīng)網(wǎng)絡(luò)模型提取樣本高維特征,衡量特征分布差異,利用神經(jīng)網(wǎng)絡(luò)迭代反饋促使域?qū)R[4]。Liu 等[5]提出建立特征提取器與多個(gè)域鑒別器對(duì)抗學(xué)習(xí)模型結(jié)構(gòu),引入基于概率分布的最大均值差異方法,有效提升模型特征比較能力。Miao 等[6]提出聯(lián)合分布對(duì)齊框架,采用變分自編碼器學(xué)習(xí)在共享空間中學(xué)習(xí)域不變表示,實(shí)現(xiàn)細(xì)粒度跨域比對(duì)。Fang 等[7]提出將領(lǐng)域自適應(yīng)與自信學(xué)習(xí)相結(jié)合,選取高置信度的目標(biāo)域樣本作為訓(xùn)練數(shù)據(jù),并逐步增加高置信度樣本的比例,從而提升分類準(zhǔn)確性。Liang 等[8]提出多源few-shot 學(xué)習(xí)方法,從源域融合同質(zhì)和異質(zhì)數(shù)據(jù)內(nèi)提取特征,提升分類模型的泛化能力。Makkar 等[9]基于對(duì)抗學(xué)習(xí)提取一致特征,采用半監(jiān)督方法擴(kuò)展可用標(biāo)簽,模型在多類別大尺度遙感圖像上取得了優(yōu)異效果。
為進(jìn)一步減小源域和目標(biāo)域的分布差異,緩解域偏移,結(jié)合高光譜遙感圖像性質(zhì),本文提出一種基于部分最優(yōu)傳輸?shù)挠蜻m應(yīng)方法,引入類感知批量樣本采樣技術(shù)和質(zhì)量分?jǐn)?shù)因子自適應(yīng)調(diào)整策略,促進(jìn)同類別像素樣本間建立傳輸映射,緩解類別錯(cuò)誤對(duì)齊。在建立傳輸方案時(shí)考慮目標(biāo)域樣本偽標(biāo)簽置信度,通過計(jì)算熵可靠性自適應(yīng)調(diào)整傳輸質(zhì)量分?jǐn)?shù),促進(jìn)構(gòu)建全局最優(yōu)映射,優(yōu)化傳輸方案,減小分布差異,提升分類模型精度。
神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練依賴于大規(guī)模有標(biāo)注樣本。然而,由于數(shù)據(jù)分布不同,在已有標(biāo)注的源域訓(xùn)練集上學(xué)習(xí)的模型通常難以在新出現(xiàn)的無標(biāo)注目標(biāo)域數(shù)據(jù)上取得同樣優(yōu)異的表現(xiàn)。為了充分利用已有的數(shù)據(jù)信息,提高模型在多源分布數(shù)據(jù)上的魯棒性,無監(jiān)督領(lǐng)域自適應(yīng)(Unsupervised Domain Adaptation,UDA)方法通過基于對(duì)抗或基于散度的方法對(duì)域間差異進(jìn)行準(zhǔn)確度量,挖掘域不變信息或減小域間分布差異,從而使源域模型同樣適用于目標(biāo)域數(shù)據(jù)?;谝陨蠘?gòu)想,Ben-David 等提出了無監(jiān)督領(lǐng)域自適應(yīng)的優(yōu)化泛化誤差界[10]。具體公式如下:
其中:h∈H為假設(shè)函數(shù)空間中分類函數(shù)。函數(shù)h在目標(biāo)域數(shù)據(jù)上的分類誤差εT(h)由源域分類誤差εS(h)、源域與目標(biāo)域間分布差異dHΔH以及常數(shù)項(xiàng)λ約束。因此,無監(jiān)督領(lǐng)域自適應(yīng)算法的關(guān)鍵是在保證分類函數(shù)h適配于源域樣本的同時(shí)最小化源域與目標(biāo)域間的分布差異。進(jìn)一步,對(duì)源域與目標(biāo)域分布間差異的準(zhǔn)確度量至關(guān)重要。
最優(yōu)傳輸(Optimal Transport,OT)理論在18 世紀(jì)由Gaspard Monge 提出,旨在通過優(yōu)化尋找概率測(cè)度間變換。Kantorovich 將求解多個(gè)數(shù)學(xué)分布之間的變換問題松弛化為求解滿足條件的聯(lián)合概率分布,從而有效衡量不同分布間的差異[11-12]。假設(shè)存在兩組處于不同分布的樣本點(diǎn)X:=和Y:=組成的兩個(gè)離散概率分布μn:=和νn:=,則分布μn與νn間的最優(yōu)傳輸優(yōu)化問題定義如下:
其中:C是分布間的傳輸成本矩陣,π為分布間的概率耦合。在域適應(yīng)問題中,為最小化域間分布差異,建立全局最優(yōu)傳輸方案準(zhǔn)確度量域間距離,在樣本間建立傳輸,通過反向傳播更新高維特征,實(shí)現(xiàn)樣本級(jí)別分布對(duì)齊。
假設(shè)存在兩組由成像光譜儀采集的處于不同分布的高光譜遙感圖像數(shù)據(jù),兩組數(shù)據(jù)中包含相同的地物類別。圖像數(shù)據(jù)中任意像素位置均包含多個(gè)光譜多段信息,在模型構(gòu)建及訓(xùn)練中,將圖像中像素逐一作為數(shù)據(jù)樣本。源域HS為有標(biāo)注樣本集XS=,包含M個(gè)像素樣本,對(duì)應(yīng)像素位置的標(biāo)簽為YS=。目標(biāo)域HT為無標(biāo)注樣本集XT=,包含N個(gè)像素樣本。源域與目標(biāo)域像素地物類別空間YS(T)∈{1,2,…,C}相同,均包含C個(gè)類別。源域分布與目標(biāo)域分布分別表示為和。
根據(jù)基于散度的領(lǐng)域自適應(yīng)方法框架,利用度量函數(shù)衡量域間差異,通過不斷縮減源域與目標(biāo)域間距離學(xué)習(xí)域不變特征,實(shí)現(xiàn)模型遷移。域適應(yīng)模型構(gòu)建中需要解決的關(guān)鍵問題在于如何準(zhǔn)確衡量復(fù)雜分布間差異,以及如何通過調(diào)整特征提取器參數(shù)實(shí)現(xiàn)源域與目標(biāo)域特征在高維空間中對(duì)齊。
針對(duì)以上問題,本文提出基于部分最優(yōu)傳輸?shù)念I(lǐng)域自適應(yīng)模型,算法框架如圖1 所示。對(duì)于傳入的源域與目標(biāo)域數(shù)據(jù),采用共享多層卷積神經(jīng)網(wǎng)絡(luò)Gθ作為特征提取器,將數(shù)據(jù)映射到潛在高維特征空間。對(duì)于提取到的數(shù)據(jù)特征,采用基于部分最優(yōu)傳輸?shù)亩攘亢瘮?shù),通過類感知樣本采樣以及質(zhì)量分?jǐn)?shù)因子自適應(yīng)調(diào)整策略,構(gòu)建樣本間最優(yōu)傳輸方案,準(zhǔn)確衡量域間差異。進(jìn)一步,利用兩個(gè)不同的由全連接網(wǎng)絡(luò)構(gòu)造的分類器Fφ和Fφ之間的對(duì)抗學(xué)習(xí),挖掘難以辨別的樣本特征從而實(shí)現(xiàn)特征對(duì)齊。通過分類器Fφ計(jì)算源域樣本分類損失,保證模型在域不變特征上具備分類能力。
圖1 基于部分最優(yōu)傳輸?shù)念I(lǐng)域自適應(yīng)模型整體框架Fig.1 Framework of proposed domain adaptive model base on partial optimal transport
3.2.1 部分最優(yōu)傳輸
對(duì)于離散樣本集,最優(yōu)傳輸算法通過建立樣本間的全局映射,根據(jù)樣本間傳輸成本矩陣,計(jì)算最優(yōu)全局傳輸方案,從而準(zhǔn)確度量離散分布間差異。然而,高光譜圖像數(shù)據(jù)通常包含數(shù)以萬計(jì)離散樣本點(diǎn),直接建立全局映射面臨嚴(yán)重運(yùn)算存儲(chǔ)問題和難以接受的計(jì)算復(fù)雜度。因此,在實(shí)際計(jì)算中,通常采用批量樣本采樣方法,在每次迭代中僅使用原始數(shù)據(jù)集中的小部分樣本參與訓(xùn)練,從而提升模型迭代效率。在此情況下,每次映射僅有部分像素樣本參與,無法保證域間最優(yōu)樣本匹配同時(shí)采樣在當(dāng)前批量,導(dǎo)致計(jì)算得到的最優(yōu)映射存在偏差,域間樣本次優(yōu)對(duì)齊,影響模型到目標(biāo)域數(shù)據(jù)的適配效果。
針對(duì)以上問題,部分最優(yōu)傳輸(Partial Optimal Transport,POT)算法[13]通過在傳輸過程中設(shè)置質(zhì)量分?jǐn)?shù)因子控制樣本質(zhì)量映射,避免局部次優(yōu)傳輸導(dǎo)致的負(fù)遷移。依照定義,離散概率測(cè)度μn與νn間的部分最優(yōu)傳輸優(yōu)化問題如下:
3.2.2 類感知樣本采樣
基于部分最優(yōu)傳輸理論構(gòu)建域間差異損失,為進(jìn)一步促進(jìn)最優(yōu)傳輸?shù)慕?,預(yù)先避免由于域間樣本類別不一致導(dǎo)致的傳輸干擾,提出類感知樣本采樣方法(Class-aware Sampling,CS),通過顯式采樣控制每次迭代中批量樣本的類別,期望存在相同類別的域間樣本,為類級(jí)別特征對(duì)齊以及建立最優(yōu)匹配傳輸?shù)於ɑA(chǔ)。首先,在訓(xùn)練過程中利用源域數(shù)據(jù)訓(xùn)練的分類器Fφ計(jì)算目標(biāo)域樣本類別的偽標(biāo)簽:
3.2.3 質(zhì)量分?jǐn)?shù)因子自適應(yīng)調(diào)整
已有基于部分最優(yōu)傳輸?shù)姆椒ㄍǔT诓煌蜻m應(yīng)任務(wù)中采用顯式設(shè)置質(zhì)量分?jǐn)?shù)因子的方式,在模型開始訓(xùn)練前固定因子數(shù)值,通過多次訓(xùn)練觀測(cè)不同質(zhì)量分?jǐn)?shù)因子下的模型分類效果,確定最優(yōu)數(shù)值[13]。然而,由于數(shù)據(jù)集規(guī)模不同、分布差異不同,難以預(yù)先準(zhǔn)確估計(jì)質(zhì)量分?jǐn)?shù)因子的具體選取區(qū)間,并且批量采樣的訓(xùn)練方式進(jìn)一步加劇了固定因子數(shù)值難以適配到全部最優(yōu)傳輸建立的情況,導(dǎo)致分布差異度量準(zhǔn)確性嚴(yán)重受到質(zhì)量分?jǐn)?shù)因子的限制。
為解決以上問題,這里提出一種基于目標(biāo)域樣本分類預(yù)測(cè)熵可靠性的方法,自適應(yīng)調(diào)整質(zhì)量分?jǐn)?shù)因子s的取值(s-adapt)。假設(shè)最優(yōu)傳輸映射存在比例受當(dāng)前批量樣本類別匹配度的影響,考慮目標(biāo)域樣本預(yù)測(cè)偽標(biāo)簽的可信度,將目標(biāo)域樣本分類輸出向量的熵正則化結(jié)果融入質(zhì)量分?jǐn)?shù)因子的計(jì)算中,每次迭代前更新質(zhì)量分?jǐn)?shù)因子s,實(shí)現(xiàn)自適應(yīng)調(diào)整,計(jì)算公式如下:
基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建分類模型,期望在反向傳播時(shí)更新特征提取器和分類器參數(shù),特征在潛在高維空間實(shí)現(xiàn)對(duì)齊,在建立損失函數(shù)中綜合考慮模型分類能力、域特征間分布差異檢測(cè)能力,對(duì)模型訓(xùn)練中建立的各項(xiàng)損失函數(shù)進(jìn)行介紹。
對(duì)于特征提取器Gθ得到的特征,根據(jù)無監(jiān)督領(lǐng)域自適應(yīng)泛化誤差[10],需要確保分類器可以對(duì)模型挖掘到的域不變特征準(zhǔn)確分類。因此,基于交叉熵?fù)p失函數(shù)lce計(jì)算源域樣本分類損失:
進(jìn)一步,采用基于邊際差異MDD 的域差異測(cè)度[14],設(shè)置兩個(gè)分類函數(shù)Fφ,F(xiàn)φ,計(jì)算分類器間對(duì)抗損失,利用分類結(jié)果一致性損失度量域間差異,disp(,)函數(shù)表示分類器結(jié)果差異,計(jì)算公式如下:
結(jié)合以上目標(biāo)函數(shù),模型整體優(yōu)化問題由三部分組成,分別是源域樣本分類損失Lcls、域間分布差異損失LPOT以及源分類器間對(duì)抗損失Ladv。整體優(yōu)化目標(biāo)函數(shù)如下:
其中:α,β為平衡因子,平衡各個(gè)損失項(xiàng)在模型訓(xùn)練中所占的比例。
為驗(yàn)證本文模型的有效性,在兩組公開高光譜遙感圖像數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),包括Pavia 數(shù)據(jù)集和Houston 數(shù)據(jù)集。
4.1.1 Pavia 數(shù)據(jù)集
Pavia 數(shù)據(jù)集[15]由反射光學(xué)光譜傳感器ROSIS 于2003 年在意大利北部上空采集,其中包含Pavia University(UP)和 Pavia Center(PC)兩組數(shù)據(jù),波長(zhǎng)為0.43~0.86 μm,空間分辨率為1.3 m/pixel,均為城市場(chǎng)地圖像。UP 數(shù)據(jù)實(shí)驗(yàn)過程中,將UP 與PC 分別作為源域與目標(biāo)域數(shù)據(jù),并移除UP 中最后一個(gè)光譜波段,使UP 與PC擁有相同的光譜波段數(shù)量,均為102,同時(shí)選取共有的7 種地物類別用于構(gòu)建分類模型。偽彩色圖像及對(duì)應(yīng)的地物類別標(biāo)簽如圖2 所示。表1 顯示了Pavia 數(shù)據(jù)集中包含的地物類別及對(duì)應(yīng)的樣本數(shù)量。
表1 Pavia 數(shù)據(jù)集中的地物類別及樣本數(shù)Tab.1 Land cover classes and numbers of samples in Pavia dataset
圖2 Pavia 數(shù)據(jù)集的偽彩色圖和地物標(biāo)簽Fig.2 Pseudocolor images and corresponding ground truths with color indexes of Pavia dataset
4.1.2 Houston 數(shù)據(jù)集
Houston 數(shù)據(jù)集[16]包 括Houston2013(H13)與Houston2018(H18)兩組數(shù)據(jù),由不同傳感器于不同年份在美國休斯敦上空采集,空間分辨率分別為2.5 m/pixel 與1 m/pixel,包含波段數(shù)量分別為144 個(gè)和48 個(gè),波長(zhǎng)均為380~1 050 nm。實(shí)驗(yàn)過程中,將Houston2013 與Houston2018 分別作為源域與目標(biāo)域數(shù)據(jù),選取Houston2013 數(shù)據(jù)中與Houston2018 數(shù)據(jù)相對(duì)應(yīng)的48 個(gè)光譜波段和共有的7 個(gè)類別。偽彩色圖像及對(duì)應(yīng)的地物類別標(biāo)簽如圖3 所示。表2 顯示了Houston 數(shù)據(jù)集中包含的地物類別及對(duì)應(yīng)的樣本數(shù)量。
表2 Houston 數(shù)據(jù)集中的地物類別及樣本數(shù)Tab.2 Land cover classes and numbers of samples in Houston dataset
圖3 Houston 數(shù)據(jù)集的偽彩色圖和地物標(biāo)簽Fig.3 Pseudocolor images and corresponding ground truths with color indexes of Houston dataset
4.2.1 評(píng)價(jià)指標(biāo)
為檢驗(yàn)本文提出方法的有效性,采用總體精度(Overall Accuracy,OA)、平均精度(Average Accuracy,AA)和Kappa 系數(shù)3 種指標(biāo)評(píng)價(jià)模型的分類性能。其中,OA 計(jì)算正確分類樣本個(gè)數(shù)占所有樣本數(shù)量的比例,評(píng)估模型對(duì)數(shù)據(jù)的整體分類能力;AA 則分別在每個(gè)類別上計(jì)算精度,反映模型對(duì)數(shù)據(jù)中各個(gè)類別的分類能力;Kappa 系數(shù)則是基于混淆矩陣計(jì)算,用于一致性檢驗(yàn),當(dāng)模型出現(xiàn)強(qiáng)偏向性時(shí),計(jì)算出的Kappa 數(shù)值降低,反映模型出現(xiàn)了類別預(yù)測(cè)偏向性。
4.2.2 實(shí)現(xiàn)細(xì)節(jié)
本文研究基于Pytorch 框架,利用Nvidia 2080Ti GPU 實(shí)現(xiàn)。在訓(xùn)練集和測(cè)試集構(gòu)建過程中,為有效利用空間關(guān)系信息提高網(wǎng)絡(luò)特征的提取能力,在構(gòu)建樣本時(shí),將每個(gè)像素本身及其周圍兩個(gè)像素看作一個(gè)樣本,即每個(gè)樣本尺寸均為5×5,通道數(shù)為波段數(shù)量,樣本標(biāo)簽為中心像素所屬類別。模型訓(xùn)練時(shí),為了避免由于樣本類別不平衡導(dǎo)致的分類器偏移,參考Fang 等[7]提出模型中的實(shí)驗(yàn)設(shè)置,對(duì)于有類別標(biāo)注的源域樣本,在每個(gè)類別中隨機(jī)采樣180 個(gè)樣本用于模型訓(xùn)練,而目標(biāo)域中包含的全部樣本均參與隨機(jī)采樣,訓(xùn)練過程中不使用類別標(biāo)簽。特征提取器Gθ由多層卷積神經(jīng)網(wǎng)絡(luò)構(gòu)成,將樣本特征映射到200 維,并利用平均池化及全連接映射將每個(gè)樣本表示為128 維向量,用于后續(xù)訓(xùn)練分類網(wǎng)絡(luò)。分類網(wǎng)絡(luò)Fφ,F(xiàn)φ均為兩層全連接層網(wǎng)絡(luò),進(jìn)行128→64→C過程映射,最終輸出地物類別數(shù)量長(zhǎng)度的向量作為分類結(jié)果。采用隨機(jī)梯度下降法訓(xùn)練模型,動(dòng)量因子為0.9,權(quán)重衰減系數(shù)為0.000 5,學(xué)習(xí)率設(shè)置為0.01,批量采樣大小為64,迭代輪次為100。在平衡因子α,β的選取上,利用網(wǎng)格搜索法調(diào)整參數(shù),在固定其中一個(gè)參數(shù)α(β)時(shí),對(duì)另一個(gè)參數(shù)β(α)在{0.05,0.1,0.5,1,5}內(nèi)進(jìn)行調(diào)整,選取模型OA 最高時(shí)的參數(shù)值。具體地,對(duì)于Pavia 數(shù)據(jù)集和Houston 數(shù)據(jù)集,參數(shù)(α,β)分別設(shè)置為(1,0.5)和(1,0.1)時(shí),模型OA 最優(yōu)。
4.2.3 分類結(jié)果
在UP→PC,Houston2013→Houston2018 兩組域適應(yīng)遷移任務(wù)上進(jìn)行實(shí)驗(yàn)。為驗(yàn)證本文提出模型的效果,將分類結(jié)果與當(dāng)前已有方法進(jìn)行對(duì)比,比較方法包括TSVM[17],DAN[18],DANN[19],ED-DMM-UDA[20],CDA[5]以 及CLDA[7]。以上方法的實(shí)現(xiàn)細(xì)節(jié)及結(jié)果參照方法CLDA[7]文中結(jié)果。
兩組遷移任務(wù)的量化像素級(jí)地物分類結(jié)果如表3 所示??梢钥闯?,基于深度學(xué)習(xí)的方法優(yōu)于傳統(tǒng)方法TSVM,證明了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)能夠有效挖掘樣本特征,基于對(duì)抗和散度的方法在高維空間上對(duì)齊源域與目標(biāo)域,提高了模型適配能力。對(duì)于遷移任務(wù)UP→PC,本文方法相較于TSVM 方法提升17.64%,相較于采用聚類的方法ED-DMM-UDA、利用偽標(biāo)簽的方法CDA、采用自信學(xué)習(xí)進(jìn)一步篩選偽標(biāo)簽的方法CLDA 在OA 上分別提升11.7%、3.89%和0.87%,相應(yīng)的AA 及分類一致性Kappa 結(jié)果同樣得到了提升,證明了本文提出的類感知采樣方法和隨后的質(zhì)量分?jǐn)?shù)因子自適應(yīng)調(diào)整方法充分利用了偽標(biāo)簽信息,指導(dǎo)域不變特征挖掘,實(shí)現(xiàn)了更加精確的類級(jí)別特征對(duì)齊,提升了模型的分類精度。對(duì)于遷移任務(wù)H13→H18,雖然本文方法相較于已有方法存在小幅度提升,但在分類精度上仍低于80%,推測(cè)原因是當(dāng)前源域與目標(biāo)域的分布差異更為明顯,因此從初始訓(xùn)練時(shí)取得的目標(biāo)域樣本的偽標(biāo)簽準(zhǔn)確度不高,導(dǎo)致其指導(dǎo)的類感知采樣及后續(xù)質(zhì)量分?jǐn)?shù)因子調(diào)整均受到較多錯(cuò)誤標(biāo)簽的影響,建立的傳輸難以達(dá)到最優(yōu)。從一致性檢驗(yàn)系數(shù)Kappa 值可以看出,模型對(duì)于分類類別具有較強(qiáng)的傾向性,后續(xù)考慮在模型構(gòu)建中進(jìn)一步針對(duì)各個(gè)地物類別特點(diǎn)優(yōu)化特征提取器和最優(yōu)傳輸算法。
表3 目標(biāo)域上不同方法在OA、AA 和Kappa 上的分類結(jié)果Tab.3 Classification performance on OA,AA(%)and Kappa of different target domains
圖4 展示了部分已有方法及本文提出方法的像素級(jí)地物分類效果。可以看出,本文方法的分類效果更加精細(xì)。較為明顯的是,對(duì)于處于地物不同類別間邊緣的像素,本文方法獲得了更為清晰的地物輪廓邊緣。由于處于邊緣的像素通常存在更復(fù)雜的空間上下文關(guān)系,提取到的特征往往區(qū)別于地物中心位置的像素,因此,需要與源域建立更為準(zhǔn)確的映射關(guān)系。本文提出的基于部分最優(yōu)傳輸?shù)挠蜻m應(yīng)方法實(shí)現(xiàn)了類級(jí)別的樣本傳輸,有助于緩解樣本負(fù)遷移,提升了分類模型的穩(wěn)定性。
圖4 不同方法在PC 數(shù)據(jù)上的分類效果Fig.4 Classification maps of PC dataset produced by different methods
4.2.4 消融實(shí)驗(yàn)
為了驗(yàn)證本文提出的基于部分最優(yōu)傳輸?shù)臒o監(jiān)督領(lǐng)域自適應(yīng)高光譜圖像分類模型中各個(gè)模塊的有效性,分別討論部分最優(yōu)傳輸算法POT、類感知樣本采樣CS 以及質(zhì)量分?jǐn)?shù)因子自適應(yīng)調(diào)整算法s-adapt 對(duì)模型分類的影響。在兩組域適應(yīng)遷移任務(wù)UP→PC,H13→H18 上進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表4 所示?;€方法采用模型中的源域分類損失和雙分類器一致性損失進(jìn)行訓(xùn)練,即式(9)中的Lcls+Ladv。可以看出,相比于基線方法,在模型中加入原始最優(yōu)傳輸方法OT作為度量函數(shù)計(jì)算域間差異損失,在兩組遷移任務(wù)上分別提升0.5%和0.74%。在此基礎(chǔ)上,添加類感知采樣法CS 對(duì)分類結(jié)果進(jìn)一步提升了0.89%和1.03%,證明了類感知采樣方法通過建立特定類別間的傳輸可以更好地對(duì)齊特征。相比于傳統(tǒng)OT 算法,采用部分最優(yōu)傳輸POT,即使在固定質(zhì)量分?jǐn)?shù)因子s=0.5 的情況下,模型分類精度仍有提升,證明POT 能夠避免由于原始強(qiáng)制傳輸導(dǎo)致的樣本錯(cuò)誤遷移,建立更加適宜的傳輸方案,提升了模型的適配能力。當(dāng)運(yùn)用質(zhì)量分?jǐn)?shù)因子自適應(yīng)調(diào)整策略s-adapt 后,質(zhì)量分?jǐn)?shù)因子隨當(dāng)前批量傳輸樣本的熵可靠性自適應(yīng)變化,相比于固定s=0.5,分類模型精度分別提升了0.62%和0.82%,反映出質(zhì)量分?jǐn)?shù)因子s的取值對(duì)POT 傳輸方案具有重要作用。
表4 不同遷移任務(wù)消融實(shí)驗(yàn)分類結(jié)果OATab.4 Ablation study classification results of OA with different transfer tasks (%)
本文提出基于部分最優(yōu)傳輸?shù)臒o監(jiān)督領(lǐng)域自適應(yīng)方法用于高光譜圖像分類,以緩解由于標(biāo)注數(shù)據(jù)不足導(dǎo)致的模型訓(xùn)練困難的問題。研究部分最優(yōu)傳輸算法在批量采樣神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的作用、類感知采樣方法以及質(zhì)量分?jǐn)?shù)因子自適應(yīng)調(diào)整算法對(duì)建立傳輸方案的影響,并在兩組公開的高光譜遙感數(shù)據(jù)上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,相比于基線方法,本文方法建立的分類模型在兩組遷移任務(wù)上的地物分類結(jié)果分別提升2.21% 和2.75%,驗(yàn)證了算法各個(gè)模塊的有效性。