毛麗珍,湯紅忠,2,范朝冬,曾淑英
1(湘潭大學(xué) 信息工程學(xué)院 ,湖南 湘潭 411105)2(湘潭大學(xué) 智能計算與信息處理教育部重點實驗室,湖南 湘潭 411105) E-mail:diandiant@126.com
現(xiàn)如今,癌癥已成為世界上最常見的疾病之一,世界衛(wèi)生組織的報告顯示,近年來癌癥統(tǒng)計數(shù)據(jù)迅速增長,每年世界各地約有170萬新增的癌癥病例登記在冊,預(yù)計發(fā)病率為25.2%.因此,癌癥的預(yù)防、早期診斷和治療引起了廣泛的關(guān)注和討論.病理檢查仍然是癌癥檢測的黃金標(biāo)準(zhǔn).而病理學(xué)家手工分析大量的組織病理學(xué)圖像是一項繁重的工作,非常耗時且容易出錯.與此同時,顯微鏡成像技術(shù)與機(jī)器學(xué)習(xí)的發(fā)展共同促進(jìn)了數(shù)字病理學(xué)的出現(xiàn)[1].數(shù)字病理學(xué)旨在利用計算機(jī)來自動分析數(shù)字化組織病理學(xué)圖像特征,從而服務(wù)于不同任務(wù),如檢測、分割和檢索,而其中研究最廣泛的莫過于組織病理圖像分類了.
許多早期的組織病理圖像分類算法一般包括兩個階段,即特征提取與分類器構(gòu)造.在特征提取階段,基于生物學(xué)先驗知識,如fractals[2],LBP[3]和HOG[4]特征被提出并用于組織病理圖像分類.而另一些研究者關(guān)注于分類器的構(gòu)造,并提出了AdaBoost[5]和隨機(jī)森林[6]等分類器.以上這些算法在某些特定的數(shù)據(jù)集上取得了很好的分類效果,但這些算法一般是針對特定數(shù)據(jù)集設(shè)計的,其泛化性能有限.
得益于人類視覺系統(tǒng)稀疏機(jī)制的啟發(fā),稀疏表示在計算機(jī)視覺領(lǐng)域得到了廣泛的應(yīng)用[7,8].基于稀疏表示的算法主要可分為兩大類:第一類是基于預(yù)定義字典的算法,如Srinivas等人[9]利用彩色圖像RGB三通道之間的相關(guān)性來構(gòu)造字典,并應(yīng)用于組織病理圖像表示與分類.由于字典是用訓(xùn)練樣本構(gòu)造的,這種基于預(yù)定義字典的算法可能不能充分利用到隱藏在訓(xùn)練樣本中的判別信息.因此,第二類算法應(yīng)運而生,即從訓(xùn)練樣本中學(xué)習(xí)字典.這一類算法又可以分為非監(jiān)督學(xué)習(xí)與監(jiān)督學(xué)習(xí).
非監(jiān)督學(xué)習(xí)算法關(guān)注于組織病理圖像的精確重構(gòu).例如,通過利用圖像的多尺度和空間信息,Tang等人[10]提出了一種用于乳腺圖像分類的多尺度表示學(xué)習(xí)算法.Zhang等人[11]提出了一種異質(zhì)特征融合算法并應(yīng)用于乳腺組織圖像分類.上述算法主要關(guān)注組織病理圖像的重構(gòu),因此其分類性能不一定是最佳的.
而監(jiān)督學(xué)習(xí)是在非監(jiān)督學(xué)習(xí)的基礎(chǔ)上發(fā)展起來的,這一類算法通過在字典訓(xùn)練過程中考慮到訓(xùn)練樣本的類標(biāo)信息,從而學(xué)習(xí)出判別性字典,例如文獻(xiàn)[12-14]通過在目標(biāo)函數(shù)中引入線性分類器[12]、類標(biāo)一致性約束[13]、對稀疏編碼系數(shù)的Fisher約束[14],提高了學(xué)習(xí)的字典的判別性.除此之外,VU等人[15]提出了一種基于判別性特征的字典學(xué)習(xí)算法(DFDL),通過約束類內(nèi)和類間的重構(gòu)誤差,學(xué)習(xí)出每一類的判別性子字典.受文獻(xiàn)[15]啟發(fā),文獻(xiàn)[16]提出了一種面向判別性特征的字典學(xué)習(xí)算法(FCDFDL),利用Fisher準(zhǔn)則約束字典的類內(nèi)和類間距離,提升了分類性能.進(jìn)一步,Tang等人[17]利用圖像RGB通道的互信息,構(gòu)造了共享字典和RGB通道獨有字典,并用SVM進(jìn)行分類.
然而,在組織病理圖像分類中,樣本特征之間一般具有很高的相關(guān)性.為了解決這一問題,一些學(xué)者認(rèn)為編碼系數(shù)應(yīng)該是滿足低秩的,因此在字典學(xué)習(xí)過程中約束稀疏編碼的低秩性[18,19].與上述算法不同,本文提出了一種基于低秩約束的判別性字典學(xué)習(xí)算法(Discriminative dictionary learning with low-rank constraint,LRCDDL).在訓(xùn)練階段,LRCDDL算法將子字典對同類和非同類樣本的重構(gòu)誤差項加入到字典學(xué)習(xí)的目標(biāo)函數(shù)中,增強子字典對同類樣本的重構(gòu)能力,降低子字典對非同類樣本的重構(gòu)能力.同時,在目標(biāo)函數(shù)中構(gòu)造了子字典的低秩約束項,為每一類樣本尋找最具判別性的特征,從而學(xué)習(xí)出結(jié)構(gòu)最為緊湊的字典.在測試階段,本文利用重構(gòu)誤差對測試圖像進(jìn)行分類.本文在ADL數(shù)據(jù)集上進(jìn)行的實驗結(jié)果證明了LRCDDL算法的有效性.
近年來,低秩矩陣恢復(fù)理論的出現(xiàn)有助于準(zhǔn)確地恢復(fù)數(shù)據(jù)中的底層低秩結(jié)構(gòu),因此,低秩矩陣恢復(fù)在背景建模[20]、子空間聚類[21]等方面應(yīng)用廣泛.
假設(shè)一個矩陣可以分解為兩個矩陣之和:X=A+E,其中A是低秩矩陣,E是稀疏矩陣.低秩矩陣恢復(fù)的目的是從X中獲得低秩矩陣A,因此可得到以下優(yōu)化問題:
(1)
其中rank(A)表示A的秩,‖E‖0表示E中非零元的個數(shù),λ是控制E的權(quán)重.以上問題是NP難問題,因此轉(zhuǎn)化為下式求解:
(2)
其中,‖A‖*表示A的核范數(shù),近似等于A的秩.而‖E‖1是‖E‖0的凸優(yōu)化形式.這一形式通常被用來圖像恢復(fù).近年來,低秩矩陣?yán)碚撘脖粦?yīng)用于圖像分類領(lǐng)域,如文獻(xiàn)[18,19]強調(diào)保證編碼系數(shù)的低秩性可以增強學(xué)習(xí)字典的判別性.而本文認(rèn)為,從同一類樣本中學(xué)習(xí)出的子字典應(yīng)該是滿足低秩的.因此,本文構(gòu)造字典的低秩約束項.
本文提出了一種基于低秩約束的判別性字典學(xué)習(xí)算法,整體框架如圖1所示,由兩部分組成:訓(xùn)練階段和測試階段.首先,利用訓(xùn)練樣本通過LRCDDL字典學(xué)習(xí)模型學(xué)習(xí)出判別性字典.在測試階段,基于學(xué)習(xí)的字典,利用重構(gòu)誤差對測試圖像進(jìn)行分類.
圖1 LRCDDL算法整體流程Fig.1 Overall flow of the LRCDDL algorithm
本文提出的字典學(xué)習(xí)模型為:
(3)
固定字典Di,公式(3)可化為:
(4)
(5)
(6)
2)字典Di更新
(7)
公式(7)可化為如下所示:
(8)
(9)
公式(9)可利用ADMM算法[23]求解,求解過程如下:
(10)
其中λ>0是調(diào)節(jié)因子,Di可通過ODL算法求解,Ji可通過SVD算法求解.
在訓(xùn)練階段學(xué)習(xí)出字典后,得到總字典D=[D1,…,DC],因此可以對測試圖像Y進(jìn)行分類.首先通過下式求出其在D上的編碼系數(shù)X:
(11)
其中,L是稀疏度.其中,L是稀疏度,公式(11)可通過OMP算法求解得到X=[X1;…;XC].
接著,計算各子字典對測試樣本Y的重構(gòu)誤差:Ri=Y-DiXi(i∈{1,…,C}),并通過比較重構(gòu)誤差的大小來判斷測試圖像Y的類別:若Rr 為驗證LRCDDL算法的有效性,本節(jié)在ADL數(shù)據(jù)集上進(jìn)行了實驗.所有實驗均在Windows 10的電腦上進(jìn)行,電腦配置如下:處理器為Intel(R)Pentium(R)CPU G3220@3.00GHz,內(nèi)存3.82G.使用的軟件是MATLAB. 圖2 ADL數(shù)據(jù)庫圖像示例Fig.2 Example of the ADL dataset ADL數(shù)據(jù)集(1)http://signal.ee.psu.edu/medical_imaging.html一共有900多幅組織病理圖像.該數(shù)據(jù)集一共包括3種動物器官的圖像:腎臟,脾臟和肺部.每種器官有健康和炎癥兩類情況,每類擁有150多幅尺寸為1360×1024×3的圖像.在實驗過程中,本文將圖像尺寸縮小為680×512×3.圖2是ADL數(shù)據(jù)集的圖像示例.其中,第一行分別是腎臟、脾臟和肺部的健康圖像,第二行分別是腎臟、脾臟和肺部的炎癥圖像. 對于每種器官,本文從健康和炎癥兩類中隨機(jī)選擇50幅圖像用于訓(xùn)練,余下的100幅圖像用于測試.從每幅訓(xùn)練圖像中隨機(jī)選擇200個20×20×3的圖像塊,然后將圖像塊三個通道連接成一個列向量,組成訓(xùn)練樣本Y∈R1200×20000,字典原子個數(shù)設(shè)為200,訓(xùn)練階段迭代次數(shù)設(shè)為50.在腎臟分類時的參數(shù)分別設(shè)置為ρ=1E-4,α=1E-3;在脾臟分類時的參數(shù)分別設(shè)置為ρ=1E-2,α=1E-5;在肺部分類時的參數(shù)分別設(shè)置為ρ=1E-2,α=1E-3. 4.3.1 分類性能評估 為評估本文算法的性能,本文與SRC、SHIRC、LC-KSVD、FDDL、DFDL和FCDFDL等算法進(jìn)行了實驗比較.其中,SRC與SHIRC無需學(xué)習(xí)字典,而是直接使用訓(xùn)練樣本構(gòu)成字典,LC-KSVD、FDDL、DFDL和FCDFDL是圖像分類領(lǐng)域非常有效的字典學(xué)習(xí)算法. 表1 腎臟圖像分類結(jié)果Table 1 Kidney image classification results 表2 脾臟圖像分類結(jié)果Table 2 Spleen image classification results 表3 肺部圖像分類結(jié)果Table 3 Lung image classification results 在本文實驗中,我們采用10倍交叉驗證評估以上算法的分類性能.所有算法采用相同的實驗設(shè)置,如訓(xùn)練樣本、測試樣本和字典尺寸相同.我們比較了三個在組織病理圖像分類中使用非常普遍的三個指標(biāo):靈敏度、特異性和總體分類精度,表1-表3分別顯示了在腎臟、脾臟和肺部圖像分類中所有算法的實驗結(jié)果. 由表1-表3可知,在腎臟、脾臟和肺部圖像分類中,LRCDDL算法的靈敏度雖然在腎臟圖像上低于DFDL和FCDFDL等算法,但在脾臟和肺部圖像的分類上高于所有對比算法.此外,LRCDDL算法在特異性和整體分類精度均高于其他對比算法.這說明本文提出的LRCDDL算法有助于學(xué)習(xí)出緊湊的判別性字典,獲得更好的分類性能. 4.3.2 實驗參數(shù)分析 本小節(jié)討論了參數(shù)ρ和α對實驗分類精度的影響.實驗設(shè)置參照4.2節(jié).ρ和α取值為{1E-5,1E-4,1E-3,1E-2,1E-1}.圖3分別顯示了腎臟、脾臟和肺部上的實驗結(jié)果. 圖3 ρ和α對圖像分類的影響Fig.3 Influence of ρ and α on the image classification 從圖3中可知,在腎臟圖像中設(shè)置為ρ=1E-4,α=1E-3;在脾臟圖像中設(shè)置為ρ=1E-2,α=1E-5;在肺部圖像中設(shè)置為ρ=1E-2,α=1E-3,LRCDDL算法可以獲得最高的分類精度. 本文提出了一種基于低秩約束的判別性字典學(xué)習(xí)算法(LRCDDL),并將其應(yīng)用于組織病理圖像分類.在字典學(xué)習(xí)的目標(biāo)函數(shù)中,LRCDDL算法加入了子字典對同類和非同類樣本的重構(gòu)誤差項,從而增強子字典對同類樣本的重構(gòu)能力和降低其對非同類樣本的重構(gòu)能力.考慮到樣本之間具有很高的相關(guān)性,LRCDDL算法在目標(biāo)函數(shù)中構(gòu)造了子字典的低秩約束項,為每一類樣本尋找最具判別性的特征,從而學(xué)習(xí)出結(jié)構(gòu)最為緊湊的字典.這一策略與主流的低秩表示中關(guān)注稀疏編碼的低秩性不同.最后,在ADL數(shù)據(jù)集上的實驗證明了本文提出的LRCDDL算法的有效性,與一些現(xiàn)有算法相比,LRCDDL算法獲得了更好的組織病理圖像分類效果.4 實驗分析
4.1 數(shù)據(jù)集介紹
4.2 實驗設(shè)置
4.3 實驗結(jié)果與分析
5 結(jié)束語