劉露 楊培亮 孫巍巍 周洋 趙宏遠(yuǎn)
摘 要:針對(duì)肺部CT圖像中孤立性肺結(jié)節(jié)(SPN)良惡性分類問題,尋求能夠有效表示SPN圖像的特征,通過適合的分類器實(shí)現(xiàn)對(duì)SPN良惡性的準(zhǔn)確判別。由SPN圖像的多分辨率直方圖得到768維的特征空間,并將該類特征用于支持向量機(jī)(support vector machine,SVM)分類器進(jìn)行訓(xùn)練,最后取得了令人滿意的分類效果。結(jié)合深度學(xué)習(xí)領(lǐng)域中相關(guān)知識(shí),將深度置信網(wǎng)絡(luò)(deep belief network, DBN)用于SPN良惡性分類任務(wù)當(dāng)中。將從肺部CT圖像中分割出的SPN圖像規(guī)整化作為DBN的輸入,進(jìn)行無監(jiān)督訓(xùn)練;用帶有良惡性類標(biāo)的SPN圖像對(duì)網(wǎng)絡(luò)進(jìn)行微調(diào)得到最終的DBN模型;用訓(xùn)練好的DBN模型在測(cè)試圖像集上進(jìn)行分類。在實(shí)驗(yàn)中選擇肺結(jié)節(jié)患者480例,提取600個(gè)SPN圖像作為實(shí)驗(yàn)數(shù)據(jù)。將新提出的DBN模型與基于紋理特征和多分辨率直方圖特征的SVM模型進(jìn)行對(duì)比,在不考慮醫(yī)學(xué)象征的情況下,DBN模型的識(shí)別準(zhǔn)確率高達(dá)86%,較SVM分類器的分類性能有了顯著提升。
關(guān)鍵詞:CT圖像;孤立性肺結(jié)節(jié)(SPN);多分辨率直方圖;深度置信網(wǎng)(DBN)
DOI:10.15938/j.jhust.2018.03.002
中圖分類號(hào): TP391
文獻(xiàn)標(biāo)志碼: A
文章編號(hào): 1007-2683(2018)03-0009-07
DBN Classifier for Classification of Benign and Malignant Solitary Pulmonary Nodule
LIU Lu1, YANG Pei-liang1, SUN Wei-wei1, ZHOU Yang2, ZHAO Hong-yuan1
(1.School of Computer Science and Technology, Harbin University of Science and Technology, Harbin 150080, China;
2.The Tumor Hospital of Harbin Medical University,Harbin 150081,China)
Abstract:At present, image classification technology is more and more used in the qualitative diagnosis of medical images, which promotes the development of computer-aided diagnosis. For lung CT images of solitary pulmonary nodules (SPN) classification problem, the main idea of the research is seeking to express the characteristics of SPN images effectively through the classifier for benign and malignant SPN accurate discrimination. Before this team work, 768 dimensional feature space is obtained by multi-resolution histograms of SPN image. Features for Support vector machine (SVM) classifier is trained, and finally achieved the satisfactory classification results. This paper is combined with the field of deep-learning related knowledge, the deep-learning of the Deep Belief Network (DBN) for SPN benign and malignant classification task. First of all, the CT image is segmented from the lung SPN image as the input of DBN for unsupervised training; Then, the final DBN model is obtained by fine tuning of the SPN image with benign and malignant classification. Finally, the trained DBN model is used to classify the test image set.In the part of experiment, 480 cases of pulmonary nodules were selected, and 600 SPN images were extracted as the experimental data. The proposed DBN model and SVM model based on the texture features and multi-resolution histogram features were compared in the absence of consideration of the medical symbol, the DBN model for high identification accuracy of 86%, the classification performance of a SVM classifier have significantly improved.
Keywords:CT image; solitary pulmonary nodule(SPN); multi-resolution histogram; deep belife network
0 引 言
最近幾年,由于我國(guó)空氣污染形勢(shì)嚴(yán)峻,吸煙人數(shù)不斷上漲,導(dǎo)致肺癌患者人數(shù)日益增多,肺癌已經(jīng)對(duì)我國(guó)人民的身體健康構(gòu)成了巨大的威脅。因?yàn)榉伟┑脑缙诎Y狀不明顯、病變速度快,所以死亡率很高,只有早發(fā)現(xiàn)、早治療才有可能達(dá)到最理想的治療效果,延緩生命[1]。肺癌在醫(yī)學(xué)圖像中的早期表現(xiàn)為孤立性肺結(jié)節(jié)(solitary pulmonary nodule, SPN),SPN是指肺內(nèi)部實(shí)質(zhì)單發(fā)的、邊界清晰的,且不伴有衛(wèi)星病灶、肺不張、淋巴結(jié)腫大的類圓形致密影。臨床上可將孤立性肺結(jié)節(jié)按照大小進(jìn)行劃分,一般將直徑小于或者等于8mm的SPN稱為小結(jié)節(jié);直徑大于8mm并且小于或者等于3cm的SPN稱為典型孤立性肺結(jié)節(jié)[2]。小結(jié)節(jié)多為良性,臨床上采用影像學(xué)定期觀察的方式,對(duì)典型孤立性肺結(jié)節(jié)處理一般更為積極。如果早期能夠準(zhǔn)確的對(duì)SPN良惡性進(jìn)行判斷,并對(duì)惡性SPN患者進(jìn)行切除手術(shù),在很大程度上可以提高患者的生存率。但是,孤立性肺結(jié)節(jié)往往難以判斷其良惡性,因?yàn)镾PN病灶形態(tài)特征多樣,有邊界不規(guī)則、模糊、分葉狀、毛刺、棘突等多種情況,病灶周圍結(jié)構(gòu)會(huì)呈現(xiàn)支氣管異常、毛刺狀改變、胸膜凹陷等變化,病灶中心結(jié)構(gòu)多為空泡征、空洞、鈣化等[3]。SPN良惡性之間征象會(huì)有一定的差異性,但其中又有一部分病癥比較模糊,比如一般良性SPN的邊界會(huì)比較光滑,但是約有三分之一的惡性SPN或者肺轉(zhuǎn)移瘤的病灶周圍也比較光滑。對(duì)于特征不是很明顯的影像,即使經(jīng)驗(yàn)豐富的醫(yī)生也很難準(zhǔn)確做出判斷。
隨著多層螺旋CT(multidetector-row computed tomography,MDCT)的普及,孤立性肺結(jié)節(jié)的檢出率提升明顯[4]。CT檢查孤立性肺結(jié)節(jié)病灶圖像,增強(qiáng)病灶邊界、平滑圖像通過適量調(diào)整窗寬、調(diào)制窗位,原圖像放大、翻轉(zhuǎn)、累加等對(duì)灰階的處理功能,這樣可以顯示病灶內(nèi)部的密度、病變與周圍紋理結(jié)構(gòu)關(guān)系等。盡管醫(yī)生利用CT圖像結(jié)合病人的實(shí)際情況能區(qū)分結(jié)節(jié)良惡性,但準(zhǔn)確性問題仍未根本解決。另外臨床統(tǒng)計(jì)歸納得到的SPN醫(yī)學(xué)征象,這些征象主要是表層形態(tài)和空間位置特征,與病理檢測(cè)的相關(guān)度不高,將臨床歸納特征廣泛的應(yīng)用在SPN醫(yī)學(xué)影像診斷中得出的結(jié)果會(huì)導(dǎo)致較高的假陽性和假陰性,這樣阻礙了醫(yī)學(xué)影像定性診斷的發(fā)展[5]。
隨著模式識(shí)別方法被廣泛地應(yīng)用于醫(yī)學(xué)圖像研究領(lǐng)域,國(guó)內(nèi)外開展了很多計(jì)算機(jī)輔助診斷(computer-aided diagnosis,CAD)的研究工作[6]。計(jì)算機(jī)輔助診斷作為醫(yī)生的“第二雙眼睛”,利用計(jì)算機(jī)的高速運(yùn)算和自動(dòng)化處理優(yōu)勢(shì),可以自動(dòng)標(biāo)記可疑小結(jié)節(jié)、識(shí)別結(jié)節(jié)病灶,減少醫(yī)生工作量,提高了SPN檢測(cè)的普及率,從而在一定程度上降低了漏診的概率,為孤立性肺結(jié)節(jié)定性診斷提供有價(jià)值的參考意見。傳統(tǒng)的SPN良惡性輔助診斷系統(tǒng)通過預(yù)處理把病變從CT圖像中提取出來,然后通過量化病變提取SPN特征,最后利用決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)等分類器進(jìn)行分類判別。而這些單層模型的分類能力往往是有限的,例如分類性能最為突出的SVM[7],當(dāng)面對(duì)SPN圖像良惡性分類問題時(shí),需要前期提取帶有類標(biāo)的高維圖像特征,這不但對(duì)訓(xùn)練數(shù)據(jù)方面有很高的要求,而且模型本身還有非常多的參數(shù)需要調(diào)整,如核函數(shù)的選擇、正則乘法等[8]。深度學(xué)習(xí)方法近年來備受關(guān)注,基于深度網(wǎng)絡(luò)結(jié)構(gòu)的深度置信網(wǎng)(DBN),可以先利用容易獲取的無類標(biāo)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,通過多層網(wǎng)絡(luò)模型提取出圖像本身的許多細(xì)節(jié)信息,而這些信息對(duì)圖像的
準(zhǔn)確識(shí)別至關(guān)重要,然后利用少量的有類標(biāo)數(shù)據(jù)對(duì)整個(gè)網(wǎng)絡(luò)進(jìn)行調(diào)整,使得DBN具有良好的分類能力。
在本文中,首先通過對(duì)基于多分辨率直方圖特征的SVM分類器模型方法的簡(jiǎn)單敘述,概括的介紹了SPN良惡性分類問題;然后以SPN圖像作為輸入,將深度置信網(wǎng)絡(luò)應(yīng)用于SPN良惡性分類。文章第二部分總結(jié)了SPN分類研究工作,歸納了之前提出的基于多分辨率直方圖特征的SVM分類器方法;第三部分詳細(xì)敘述了DBN原理以及本文提出的DBN對(duì)SPN良惡性分類過程;第四部分為本文的實(shí)驗(yàn)設(shè)計(jì)與分析,以真實(shí)的醫(yī)院CT圖像為實(shí)驗(yàn)數(shù)據(jù),在SPN良惡性分類任務(wù)中,比較了基于DBN模型和基于SVM分類器兩種方法的分類效果,其中SVM分類器分別使用紋理特征和多分辨率直方圖特征,并通過ROC曲線進(jìn)行了分類效果的評(píng)價(jià);最后的第五部分對(duì)所做的工作進(jìn)行了總結(jié)。
1 基于SVM的SPN分類介紹
1.1 SPN圖像特征
傳統(tǒng)的SPN圖像提取特征主要依據(jù)對(duì)SPN影像學(xué)的總結(jié),但是SPN的CT圖像顯現(xiàn)出百般特征[9]。如圖1(a),右肺下葉見少量異性細(xì)胞,少許肺組織及增生的纖維組織,其中一小塊纖維組織內(nèi)見異形細(xì)胞,為良性。圖1(b)患者右肺下葉可見腫瘤細(xì)胞,為小細(xì)胞癌,圖1(c)為腺癌,圖1(d)壞死組織中見異型細(xì)胞殘影,考慮為鱗癌,雖然后三幅CT圖像均為惡性結(jié)節(jié),但是不同類型伴有不同的特征,為結(jié)節(jié)分類帶來難度。同時(shí)SPN影像學(xué)上往往出現(xiàn)同病異影和異病同影的情況,如圖2(a)所示,CT平掃肺窗影像中,發(fā)現(xiàn)病灶邊界清晰并且伴有粗毛刺的征象,而縱隔窗圖2(b)中,縱隔窗病灶不規(guī)則并且無明顯分葉征,術(shù)前考慮為肺結(jié)核瘤,術(shù)后證實(shí)為腺癌。為了避免假陽性和假陰性情況的發(fā)生,應(yīng)在形態(tài)特征、空間位置特征的基礎(chǔ)上研究新的特征來描述孤立性肺結(jié)節(jié)圖像信息。
在CT影像中,組織和背景呈現(xiàn)出不同的灰度等級(jí),每種組織的灰度值分布在一個(gè)范圍內(nèi)并且相互覆蓋,所以可以考慮將紋理特征利用在解決SPN分類問題中[10],但是單一的紋理特征并不是十分理想。為了分類器能更好的學(xué)習(xí),與此同時(shí)考慮特征向量盡可能多攜帶信息,所以特征應(yīng)具有足夠多的維數(shù)。然而,高維的傳統(tǒng)紋理特征計(jì)算復(fù)雜并且有效性差。因此,采用多分辨率直方圖來表示CT圖像中SPN的低層圖像特征。
多分辨率直方圖不僅能夠產(chǎn)生高維特征,而且在性能方面也具有優(yōu)勢(shì),如計(jì)算速度快、對(duì)噪聲健壯性好、空間效率高、存儲(chǔ)便捷,還能表征圖像的空間信息變化。由此可見SPN的CT圖像空間變化信息可通過多分辨率直方圖來反映,多分辨率直方圖的具體流程可參見[11]。
為了避免在建立分類超平面時(shí)動(dòng)態(tài)范圍大的特征掩蓋動(dòng)態(tài)范圍小的特征,在應(yīng)用SVM分類器之前對(duì)提取的特征進(jìn)行歸一化,使所有特征在訓(xùn)練池中具有同等的地位,又能降低計(jì)算復(fù)雜度。歸一化處理公式如下:
λ=2×λ-λmax-λminλmax-λmin(1)
其中,λ為歸一化前的特征向量,λmax為特征向量的最大值,λmin為特征向量的最小值。經(jīng)過式(1)歸一化處理后,歸一化的特征向量λ限制在[-1,1]內(nèi)。
1.2 SVM分類器構(gòu)建
SVM分類器引入核函數(shù)K(x,z)≡φ(x)Tφ(z),分類函數(shù)可表示為:
fSVM(x)=∑Ni=1aiK(x,si)(2)
其中,si(i=1,2,…,N)代表支持向量,利用K(°,°)得到?jīng)Q策函數(shù),選取RBF作為核函數(shù):
K(x,z)=exp(-‖x-z‖2/2σ2)(3)
其中σ≥0是控制核寬度的參數(shù)。
使用高維多分辨率直方圖特征的SVM分類器獲得了較好的分類效果。但是在使用SVM分類器之前,要對(duì)SPN圖像進(jìn)行預(yù)處理以及特征提取,并且有監(jiān)督的訓(xùn)練模式對(duì)訓(xùn)練數(shù)據(jù)集也有較高的要求,所以系統(tǒng)的處理環(huán)境和數(shù)據(jù)集對(duì)分類任務(wù)的影響很大。針對(duì)上述問題,本文考慮到深度置信網(wǎng)絡(luò)模型對(duì)輸入數(shù)據(jù)無特征提取要求,可以使用無類標(biāo)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,所以將其應(yīng)用到SPN圖像的分類任務(wù)當(dāng)中。
2 基于深度置信網(wǎng)絡(luò)的SPN良惡性分類
深度置信網(wǎng)(deep belief network, DBN)是Hinton等在2006年提出的一個(gè)具有層次特征的概率生成模型[12],通過訓(xùn)練神經(jīng)元之間的權(quán)重,可以讓整個(gè)神經(jīng)網(wǎng)絡(luò)按照最大概率來生成訓(xùn)練數(shù)據(jù)。同時(shí)DBN是一種深層神經(jīng)網(wǎng)絡(luò),采用自底向上的傳遞,底層的神經(jīng)元接收原始的特征向量,不斷向更高層次抽象,頂層的神經(jīng)網(wǎng)絡(luò)形成易于組合的特征向量。通過增加層次就能夠使特征向量更高的抽象化,而且,每一層的網(wǎng)絡(luò)會(huì)弱化上一層的錯(cuò)誤信息和次要信息,以確保深層網(wǎng)絡(luò)的精度[13]。DBN結(jié)構(gòu)如圖1所示。其是由一系列疊加的受限玻爾茲曼機(jī)(restricted boltzmann machine, RBM)[14]和頂層的反向傳播(back propagation, BP)網(wǎng)絡(luò)[15]構(gòu)成。自提出以來受到了越來越多的關(guān)注,并陸續(xù)應(yīng)用于計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理等領(lǐng)域,有著廣闊的發(fā)展和應(yīng)用空間。
DBN的訓(xùn)練包含預(yù)訓(xùn)練和微調(diào)兩個(gè)步驟。首先,預(yù)訓(xùn)練階段利用大量無類標(biāo)信息數(shù)據(jù),無監(jiān)督地訓(xùn)練每層RBM,將下層 RBM的隱層輸出作為上一層RBM可見層的輸人。微調(diào)階段則采用有監(jiān)督學(xué)習(xí)方式對(duì)頂層的BP網(wǎng)絡(luò)進(jìn)行訓(xùn)練,將實(shí)際輸出與預(yù)期輸出的誤差逐層反向傳播,目的是調(diào)整網(wǎng)絡(luò)的權(quán)值[16]。DBN這樣做克服了BP網(wǎng)絡(luò)因隨機(jī)初始化權(quán)值而導(dǎo)致的局部最優(yōu)問題。
2.1 受限玻爾茲曼機(jī)
受限玻爾茲曼機(jī)(RBM)由隱層v和可見層h兩種神經(jīng)元節(jié)點(diǎn)構(gòu)成。可見層的作用是輸入數(shù)據(jù),隱層的作用是特征檢測(cè)。區(qū)別于玻爾茲曼機(jī),RBM的特點(diǎn)是可見層和隱層之間采用全連接的方式,而在可見層內(nèi)神經(jīng)元之間和隱層內(nèi)各神經(jīng)元之間是無連接的,以二分圖的形式存在,這樣相比玻爾茲曼機(jī)更為高效[17]。RBM是一種基于能量的模型。假設(shè)可見層與隱層的神經(jīng)元數(shù)目為I,J,vi表示第i個(gè)可見層神經(jīng)元狀態(tài),hj表示第j個(gè)隱層神經(jīng)元狀態(tài),那么特定一組(v,h)所構(gòu)成RBM的能量函數(shù)可以表示為
E(v,h|θ)=-∑Ii=1aivi-∑Jj=1bjhj-∑Ii=1∑Jj=1wijvihj(4)
式(4)中,θ=wij,ai,bj是RBM的參數(shù),wij表示vi節(jié)點(diǎn)和hj節(jié)點(diǎn)間的連接權(quán)值,ai和bj分別表示vi和hj的偏置值。如果用hj=0表示隱藏節(jié)點(diǎn)不活躍,hj=1活躍,則系統(tǒng)能量變化為:
ΔEj=Ehj=0-Ehj=1=aj+∑iwijvi(5)
通過能量函數(shù)可以得到(v,h)的聯(lián)合概率分布:
p(v,h|θ)=e-E(v,h|θ)/Z(θ)(6)
其中Z(θ)為歸一項(xiàng)。實(shí)際問題中最為關(guān)心的是p(v,h|θ)的邊緣分布p(v|θ),即觀測(cè)變量的分布。RBM一般通過迭代的方式訓(xùn)練,目的在于得到θ=wij,ai,bj參數(shù)值,以擬合訓(xùn)練數(shù)據(jù)。在訓(xùn)練數(shù)據(jù)集(樣本數(shù)T)上求極大對(duì)數(shù)似然函數(shù):
θ=argθmaxL(θ)=argθmax∑Tt=1lnp(v(t)|θ)(7)
對(duì)于各參數(shù)值的更新,采用Hinton提出的對(duì)比散度(constrastive divergence)算法[18],具體規(guī)則如下:
Δwij=ε〈vihj〉data-〈vihj〉recon;
Δai=ε〈vi〉data-〈vi〉recon;
Δbj=ε〈hj〉data-〈hj〉recon。(8)
其中ε為預(yù)訓(xùn)練學(xué)習(xí)率,〈·〉data為訓(xùn)練數(shù)據(jù)集定義分布上的數(shù)學(xué)期望,〈·〉recon為重構(gòu)后模型所定義分布上的數(shù)學(xué)期望。
2.2 BP神經(jīng)網(wǎng)絡(luò)
BP網(wǎng)絡(luò)主要是對(duì)RBM預(yù)訓(xùn)練階段所得特征向量分類,依據(jù)分類結(jié)果微調(diào)DBN每層參數(shù)。訓(xùn)練BP網(wǎng)絡(luò)包括前向和后向兩個(gè)過程。將特征向量向前傳播,由輸出層得到分類結(jié)果,將該分類結(jié)果與預(yù)期結(jié)果相比較得到誤差值[19]。后向傳播是將所得誤差值逐層回傳,從而調(diào)整DBN參數(shù)。傳播過程中每層需計(jì)算一個(gè)靈敏度δ,然后將δ向下傳遞調(diào)整網(wǎng)絡(luò)權(quán)值。
輸出層中,第i各節(jié)點(diǎn)輸出為oi,預(yù)期輸出為di,則計(jì)算δ值可以表示為
δi=oi(1-oi)(di-oi)(9)
對(duì)于第m個(gè)隱層,計(jì)算δ的表達(dá)式為
δli=yli(1-yli)∑iwlijδl+1j(10)
在得到各層敏感度值之后,對(duì)DBN的更新如下
wlij=wlij+εfine-tuning×yliδl+1j;
blj=blj+εfine-tuning×δl+1j(11)
2.3 DBN對(duì)SPN良惡性分類
訓(xùn)練DBN分類器包括預(yù)訓(xùn)練和微調(diào)兩個(gè)步驟。預(yù)訓(xùn)練通過無監(jiān)督方法使得節(jié)點(diǎn)參數(shù)逐漸優(yōu)化,完成后使網(wǎng)絡(luò)具有合適的初始值;微調(diào)階段通過有監(jiān)督方式對(duì)網(wǎng)絡(luò)進(jìn)行最后調(diào)整。用SPN圖像逐層訓(xùn)練DBN分類器,過程如下:
Step1規(guī)整后的無良惡性類標(biāo)的SPN圖像作為分類器最低層RBM的原始輸入;
Step2根據(jù)式(4) 生成隱藏特征向量;
Step3 RBM通過式(6) 把得到隱藏特征向量,反向重構(gòu)原輸入向量;
Step4通過式(8) 更新RBM的權(quán)值參數(shù),完成一次迭代;
Step5在迭代停止之前,底層RBM在訓(xùn)練樣本集上反復(fù)執(zhí)行1~4步;
Step6底層RBM訓(xùn)練結(jié)束后,隱藏層生成的特征向量作為鄰近上層RBM的輸入向量,然后重復(fù)以上迭代過程;
Step7輸入帶有良惡性類標(biāo)的SPN圖像,對(duì)經(jīng)過預(yù)訓(xùn)練初始化的網(wǎng)絡(luò)參數(shù)進(jìn)行調(diào)整。
當(dāng)整個(gè)DBN分類器訓(xùn)練完成之后,就可以在測(cè)試數(shù)據(jù)集上對(duì)分類器的性能進(jìn)行檢測(cè),需要做的是將測(cè)試SPN圖片規(guī)整后輸入DBN分類器,觀測(cè)分類器輸出結(jié)果。
3 實(shí)驗(yàn)結(jié)果與分析
本文實(shí)驗(yàn)使用了2012年10月至2014年9月哈爾濱醫(yī)科大學(xué)附屬腫瘤醫(yī)院胸外科的CT檢查中孤立性肺結(jié)節(jié)患者480例,其中男262例,女218例,年齡在19到81歲之間。CT 檢查使用 GE Light Speed Pro16螺旋CT機(jī)掃描,電流為200mA,電壓為120kV,螺距 1.3,準(zhǔn)直0.75mm,掃描層厚5.0mm,重建層厚1.25mm,層間距為1.25mm。
對(duì)含有孤立性肺結(jié)節(jié)的CT肺窗圖像區(qū)域進(jìn)行預(yù)處理,首先需專家醫(yī)師手工從整幅CT圖像中勾畫出SPN大致區(qū)域,然后在勾畫的區(qū)域中選取若干種子點(diǎn)用區(qū)域生長(zhǎng)法進(jìn)行分割,經(jīng)過專家醫(yī)師進(jìn)一步對(duì)邊緣的修改,得到SPN區(qū)域,并把SPN區(qū)域邊界以外的灰度值定為零[11]。此次共提取600個(gè)SPN,其中良性樣本300個(gè),惡性樣本300個(gè),訓(xùn)練樣本和測(cè)試樣本按照3∶1數(shù)量進(jìn)行隨機(jī)分配。如表1所示。
本文深度置信網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)是在文[20]網(wǎng)絡(luò)的基礎(chǔ)上,進(jìn)行了適應(yīng)性的修改,設(shè)置一個(gè)輸入層,4個(gè)隱藏層和一個(gè)輸出層。多次實(shí)驗(yàn)對(duì)比后,隱藏層的節(jié)點(diǎn)數(shù)分別設(shè)置為800、400、200、50,每層迭代次數(shù)設(shè)置為10。共生矩陣有兩個(gè)重要參數(shù) d和θ,θ代表方向,常取0°,45°,90°和135°四個(gè)具有代表性的方向。在提取圖像的灰度共生矩陣特征時(shí),d=5,θ=0°,45°,90°,135°,計(jì)算SPN在4個(gè)方向上的灰度共生矩陣,提取5個(gè)紋理統(tǒng)計(jì)特征共計(jì)20維,將提取出的SPN圖像計(jì)算成768維的多分辨率直方圖特征向量。實(shí)驗(yàn)將20維的紋理特征作為SVM的輸入進(jìn)行分類,768維的多分辨率直方圖特征作為SVM的輸入進(jìn)行分類,以SPN為中心,大小為64*64像素的圖像直接作為DBN的輸入進(jìn)行分類。圖4顯示了DBN的部分訓(xùn)練樣本,圖5顯示了NN(即上文的BP神經(jīng)網(wǎng)絡(luò))在60次迭代中,頂層DBN網(wǎng)絡(luò)的反向傳播誤差的變化情況,當(dāng)完成60次迭代時(shí),反向傳播誤差逐漸趨近平穩(wěn)。不同分類器分類結(jié)果如表2所示。
從表2中可以看出多分辨率直方圖特征用于分類器中各方面性能遠(yuǎn)遠(yuǎn)優(yōu)于紋理特征分類器;而直接以圖像作為輸入的DBN分類器在敏感性、特異性和準(zhǔn)確度方面高于輸入多分辨率直方圖特征的SVM分類器。這說明深度置信網(wǎng)絡(luò)對(duì)SPN圖像特征的描述更準(zhǔn)確。但是為了進(jìn)一步分析DBN分效果,本文選用受試者工作特征曲線(receiver operation characteristic, ROC)曲線作為評(píng)定指標(biāo)[21],圖3為不同特征提取方式下的ROC曲線結(jié)果,表3列出了每條ROC曲線下的面積。結(jié)果顯示,三種不同分類器的ROC曲線下面積有所不同,同是SVM分類器,使用多分辨率直方圖特征的分類效果優(yōu)于使用紋理特征的效果,而提出的DBN分類器在SPN圖像良惡性分類任務(wù)當(dāng)中,分類效果優(yōu)于SVM分類器的分類效果。
4 結(jié) 語
本文通過對(duì)以前所做工作的簡(jiǎn)單總結(jié),闡述了孤立性肺結(jié)節(jié)(SPN)圖像良惡性分類的問題,提出了一種基于深度置信網(wǎng)絡(luò)模型的SPN圖像良惡性分類方法。該方法的主要優(yōu)勢(shì)在于可以使用無良惡性類標(biāo)的SPN數(shù)據(jù)進(jìn)行初始的無監(jiān)督訓(xùn)練,由于SPN圖像良惡性差異有時(shí)不明顯,有些細(xì)節(jié)特征難以提取,深度置信網(wǎng)絡(luò)能夠?qū)PN圖像底層特征有更好的抽象提取。最后經(jīng)過具體的實(shí)驗(yàn)對(duì)比發(fā)現(xiàn),提出的基于深度置信網(wǎng)絡(luò)模型的分類器對(duì)SPN圖像良惡性分類取得了比SVM分類器更好的效果。在今后的研究工作當(dāng)中,將以優(yōu)化深度學(xué)習(xí)模型性能為主要目的,密切關(guān)注深度學(xué)習(xí)方法和理論的研究發(fā)展,再對(duì)SPN圖像分類問題做進(jìn)一步的研究。
參 考 文 獻(xiàn):
[1] AO D C F, DE Sampaio W B, SILVA A C, et al. Automatic Detection of Solitary Lung Nodules Using Quality Threshold Clustering, Genetic Algorithm and Diversity Index[J]. Artificial Intelligence in Medicine, 2014, 60(3):165-177.
[2] 劉明,姜格寧. 孤立性肺結(jié)節(jié)的良惡性鑒別及處理策略[J]. 中國(guó)胸心血管外科臨床雜志, 2014(1):102-106.
[3] MUKHOPADHYAY S. A Segmentation Framework of Pulmonary Nodules in Lung CT Images[J]. Journal of Digital Imaging, 2016, 41(4):1-18.
[4] TAKAHIRO Nakajima,KAZUHIRO Yasufuku. Early Lung Cancer:Methods for Detection[J]. Clinics in Chest Medicine, 2013, 34(3):373-383.
[5] AGARWAL R, SHANKHADHAR A, SAGAR R K. Detection of Lung Cancer Using Content Based Medical Image Retrieval Advanced Computing & Communication Technologies (ACCT)[C]// 2015 Fifth International Conference on. IEEE, 2015:48-52.
[6] SUMIAKI M, YOSHIHARU O, TAKATOSHI A. Computer-aided Detection of Lung Nodules on Multidetector CT Inconcurrent-reader and Second-reader Modes:A Comparative Study[J]. European Journal of Radiology, 2013:1332–1337.
[7] KESHANI M, AZIMIFAR Z, TAJERIPOUR F, et al. Lung Nodule Segmentation and Recognition Using SVM Classifier and Active Contour Modeling:A Complete Intelligent System[J]. Computers in Biology & Medicine, 2013, 43(4):287-300.
[8] 韓書娜, 幺宏偉, 范劍英,等. 指紋圖像分割與增強(qiáng)算法[J]. 哈爾濱理工大學(xué)學(xué)報(bào), 2011, 16(1):98-101.
[9] BUM-CHAE Kim, YU Sub Sung, HEUNG-Il Suk. Deep Feature Learning for Pulmonary Nodule Classification in a Lung CT[C] //2016 4th International Winter Conference on Brain-Computer Interface. IEEE, 2016:1-3.
[10]JU W, XIANG D, ZHANG B, et al. Correction to Random Walk and Graph Cut for Co-Segmentation of Lung Tumor on PET-CT Images[J]. Image Processing IEEE Transactions on, 2016, 25(3):1192-1192.
[11]劉露, 劉宛予, 楚春雨,等. 胸部CT圖像中孤立性肺結(jié)節(jié)良惡性快速分類[J]. 光學(xué)精密工程, 2009, 17(8):2060-2068.
[12]HINTON, G. E., OSINDERO, S., Teh, Y.A Fast Learning Algorithm for Deep Belief Nets[J]. Neural Computation, 2006(18):1527-1554.
[13]李雨童, 姚登舉, 李哲,等. 基于R的醫(yī)學(xué)大數(shù)據(jù)挖掘系統(tǒng)研究[J]. 哈爾濱理工大學(xué)學(xué)報(bào), 2016,21(2):38-43.
[14]SALAKHUTDINOV, Ruslan, A. Mnih, G. Hinton. Restricted boltzmann machines for collaborative filtering[C]// Proceedings of the 24th international conference on Machine learning ACM, 2007:791-798.
[15]IBRAHIM A O, SHAMSUDDIN S M, AHMAD N B, et al. Hybrid NSGA-II of Three-Term Backpropagation network for multiclass classification problems[C]//International Conference on Computer and Information Sciences. 2014:1-6.
[16]DONG N, SHANK E A, JOJIC V. A deep framework for bacterial image segmentation and classification[C]//International Conference on Internet Multimedia Computing and Service. ACM, 2015:306-314.
[17]ZIBA M, TOMCZAK J M, GONCZAREK A. RBM-SMOTE: Restricted Boltzmann Machines for Synthetic Minority Oversampling Technique[M]. Intelligent Information and Database Systems. Springer International Publishing, 2015:377-386.
[18]HINTON G E.Training Products of Experts by Minimizing Contrastive Divergence[J]. Neural Computation, 2002, 14(8):1771-1800.
[19]WEN Hui, XIE Weixin, JIHONG Pe1i, et al. An Incremental Learning Algorithm for the Hybrid RBF-BP Network Classifier[J]. EURASIP Journal on Advances in Signal Processing, 2016(1):1-15.
[20]ABDEL-ZAHER A M, ELDEIB A M. Breast Cancer Classification Using Deep Belief Networks[J]. Expert Systems with Applications, 2015, 46:139-144.
[21]潘清,陳卉,馬宇晶,等. 影像學(xué)診斷評(píng)價(jià)中的參數(shù)法ROC曲線分析[J]. 中國(guó)醫(yī)學(xué)影像技術(shù), 2011, 27(8):1694-1697.