盤安思,徐勝舟,程時(shí)宇,佘逸飛
(中南民族大學(xué) 計(jì)算機(jī)科學(xué)學(xué)院 & 湖北省制造企業(yè)智能管理工程技術(shù)研究中心,武漢 430074)
乳腺癌是女性中最常見的癌癥,也是癌癥死亡的主要原因[1].盡早發(fā)現(xiàn)并診斷對患者后期的治療和康復(fù)具有重要意義[2].早期癌癥腫塊的發(fā)現(xiàn)是治療過程的決定性步驟之一,在阻止甚至是控制疾病進(jìn)展方面發(fā)揮著關(guān)鍵作用.目前乳腺癌檢查技術(shù)主要包括乳腺查體、超聲、X線攝片、磁共振成像(Magnetic Resonance Imaging, MRI)等.X線攝片可以發(fā)現(xiàn)乳腺中的簇狀微鈣化和腫物,是鑒別和篩查癌組織最有效和最主要的診斷工具.然而,由于乳腺X線攝片是單通道的灰度圖像,往往存在對比度較低、不同組織的邊界不明顯、同一組織特征不明顯等問題,使得早期的癌性病變在病理和顏色密度上較難被發(fā)現(xiàn).在早期診斷中,需要具有豐富經(jīng)驗(yàn)的臨床醫(yī)生的反復(fù)閱讀并確認(rèn),加重了醫(yī)生的工作量.計(jì)算機(jī)輔助診斷系統(tǒng)(Computer Aided Diagnosis, CAD)可以在短時(shí)間內(nèi)檢測到乳腺X攝片中的病變,加快對特定患者的治療進(jìn)程.
當(dāng)前國內(nèi)外學(xué)者針對醫(yī)學(xué)影像識(shí)別(包括乳腺X線攝片)進(jìn)行了廣泛研究,相繼提出了眾多識(shí)別算法,大致可分為兩類:第一類是基于傳統(tǒng)機(jī)器學(xué)習(xí)的識(shí)別方法,第二類是基于深度學(xué)習(xí)的識(shí)別方法.傳統(tǒng)機(jī)器學(xué)習(xí)方法在進(jìn)行乳腺圖像的識(shí)別時(shí),首先需要通過人工的方式提取乳腺圖像中腫塊的特征,再將提取到的特征作為機(jī)器學(xué)習(xí)方法的輸入.PRATIWI等[3]基于灰度共生矩陣的徑向基人工網(wǎng)絡(luò)進(jìn)行乳腺腫塊影像的自動(dòng)分類,與人工神經(jīng)網(wǎng)絡(luò)相比,對乳腺圖像中良/惡性腫塊的識(shí)別準(zhǔn)確率提高了2%.ZHANG等[4]基于單類核主成分分析方法,放大不同類別樣本之間的特征差異,縮小同類樣本之間的特征差異,然后對乳腺影像進(jìn)行特征提取,再使用核主成分分析方法進(jìn)行置信度評(píng)分和分類,該方法在包含361個(gè)乳腺影像的數(shù)據(jù)集上,準(zhǔn)確率達(dá)到了92%.
雖然基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法對乳腺圖像的識(shí)別取得了一定的成果,但它需要人工提取圖像的特征,所提取特征的有效性會(huì)直接影響到識(shí)別結(jié)果.另外,乳腺X線攝片是單通道的灰度圖像,對比度較低,特征的手動(dòng)提取需要深厚的醫(yī)學(xué)背景和豐富的臨床經(jīng)驗(yàn),增加了對腫塊進(jìn)行特征提取和識(shí)別的難度.
近年來,深度學(xué)習(xí)方法在計(jì)算機(jī)視覺和模式識(shí)別等應(yīng)用領(lǐng)域取得了很大進(jìn)展,成為當(dāng)前的研究熱點(diǎn)之一.一些學(xué)者應(yīng)用深度學(xué)習(xí)技術(shù)進(jìn)行乳腺腫塊圖像的識(shí)別.孫澤宇等[5]在采樣制作的切塊數(shù)據(jù)集上利用遷移學(xué)習(xí)的方法,使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)對乳腺良性腫塊、惡性腫塊以及鈣化病灶進(jìn)行分類,達(dá)到93%的準(zhǔn)確率.孫利雷等[6]使用不同尺寸卷積核的雙路CNN模型對不同粒度的特征進(jìn)行提取,并用于乳腺X線攝片良性腫塊與惡性腫塊的識(shí)別;ZHU等[7]基于稀疏標(biāo)簽分配的深度多實(shí)例網(wǎng)絡(luò)對乳腺X線攝片切片進(jìn)行是否含有惡性腫塊的識(shí)別;KOOI等[8]使用自己設(shè)計(jì)的CNN模型,在乳腺X線攝片數(shù)據(jù)集上取得超過仿射醫(yī)生的軟組織病變分類結(jié)果.深度學(xué)習(xí)技術(shù)是一種最小化使用圖像處理和手工提取特征的機(jī)器學(xué)習(xí)算法,其最重要的優(yōu)點(diǎn)是通過自動(dòng)提取圖像中的低級(jí)和高級(jí)特征,并在相鄰層之間對這些特征進(jìn)行非線性變換,得到特征圖,然后將特征圖輸入到分類器中,這樣就可以用不同的特征圖來提取圖像中的形狀、紋理、顏色和密度等信息.
為進(jìn)一步提升對乳腺X線攝片的識(shí)別性能,本文對深度學(xué)習(xí)中的經(jīng)典模型VGG16做了改進(jìn),并與其他的CNN模型進(jìn)行識(shí)別性能的比較.
從本質(zhì)上來講,利用CNN對乳腺X線攝片進(jìn)行識(shí)別是一個(gè)邏輯回歸的過程.在CNN中,卷積層使用多個(gè)卷積核對輸入的圖像進(jìn)行卷積運(yùn)算,得到多個(gè)特征圖.將捕獲到的圖像特征送入分類器進(jìn)行邏輯回歸,最后輸出兩個(gè)概率值,以此判斷輸入的圖像是否含有腫塊.
通常CNN需要在大量的標(biāo)注圖像上進(jìn)行訓(xùn)練以達(dá)到理想的識(shí)別效果,但標(biāo)注好的乳腺X線攝片數(shù)量非常有限,而且目前國內(nèi)尚無專門用于乳腺腫塊圖像識(shí)別的公用數(shù)據(jù)庫.本文采用美國南弗洛里達(dá)大學(xué)的The Digital Database for Screening Mammography(DDSM)[9]數(shù)據(jù)集來評(píng)估乳腺腫塊圖像識(shí)別算法的性能.通過模板匹配算法[10],從該數(shù)據(jù)庫中獲得879幅感興趣區(qū)域(Region of Interest, ROI).由于其數(shù)量仍相對有限,因此使用相關(guān)技術(shù)對其進(jìn)行數(shù)據(jù)增強(qiáng).
SIMONYAN等在LeNet[11]和AlexNet[12]的基礎(chǔ)上提出了VGGNets[13]模型,使用更多的卷積層,增加了網(wǎng)絡(luò)的深度,同時(shí)使用更小的卷積核和更小的步長,在當(dāng)年的ILSVRC競賽中取得了巨大的成功.原始的VGG16模型結(jié)構(gòu)如圖1(a)所示,主要包括5個(gè)卷積層模塊,2個(gè)全連接層和1個(gè)輸出層.每個(gè)卷積層模塊中包含2個(gè)或3個(gè)卷積層,以及1個(gè)最大池化層.在CNN模型中,大量的卷積層被疊加以優(yōu)化提取到的特征,增加卷積層的個(gè)數(shù)可以提高模型的識(shí)別能力,有助于提高優(yōu)化效果[14].然而,增加更多的卷積層需要更多的訓(xùn)練數(shù)據(jù)和更高的計(jì)算能力,這會(huì)顯著增加訓(xùn)練的復(fù)雜度[15].網(wǎng)絡(luò)的深度應(yīng)與數(shù)據(jù)集的大小成正比,否則會(huì)造成訓(xùn)練的欠擬合或過擬合[16].基于以上原則,本文對VGG16模型進(jìn)行改進(jìn),設(shè)計(jì)一個(gè)精簡的VGG16(Simple VGG16, SVGG16)模型.模型結(jié)構(gòu)如圖1(b)所示,保留了VGG16的整體架構(gòu),將卷積層模塊中卷積的層數(shù)設(shè)置為1,降低模型的復(fù)雜度.卷積層采用多個(gè)卷積核對輸入圖像進(jìn)行卷積運(yùn)算,分別提取圖像的低級(jí)和高級(jí)特征.
(a)原始的VGG16模型
(b)SVGG16模型圖1 乳腺腫塊圖像識(shí)別模型結(jié)構(gòu)圖Fig.1 The model structure diagrams of breast mass image recognition
盡管在卷積過程中使用較多的卷積核可以提取圖像中更多的特征,但是有很多特征可能是冗余的[17].因此,為了降低特征的冗余性,SVGG16模型的卷積層中,卷積核的個(gè)數(shù)分別設(shè)置為32, 64, 128, 256, 512(VGG16的卷積層模塊中卷積核個(gè)數(shù)分別為64, 128, 256, 512, 512).與ImageNet數(shù)據(jù)集相比,乳腺圖像數(shù)據(jù)集相對很小,為抑制訓(xùn)練的過擬合,只保留一個(gè)全連接層,神經(jīng)元個(gè)數(shù)設(shè)置為1024,并增加失活率為0.5的Dropout[18].SVGG16輸入層的輸入為125×125大小的單通道ROI圖像,輸出層的神經(jīng)元個(gè)數(shù)為2,分別代表了輸入圖像中含有腫塊和不含腫塊的概率.如果含有腫塊的概率大于不含腫塊的概率,則認(rèn)為該圖像含有腫塊,反之則認(rèn)為該圖像不含有腫塊.在卷積層模塊中,卷積核大小為3×3像素,步長和填充均為1,采用修正線性單元(Rectified Linear Unit, ReLU)作為卷積層和全連接層的激活函數(shù).與原始VGG16模型相比,SVGG16使用更少的卷積層和卷積核個(gè)數(shù).
與其他深度學(xué)習(xí)方法類似,數(shù)據(jù)增強(qiáng)不僅可以有效緩解數(shù)據(jù)量不足導(dǎo)致的過擬合現(xiàn)象,同時(shí)還能有效提高模型的訓(xùn)練效果,尤其是對于像乳腺X線攝片訓(xùn)練樣本數(shù)量不足的情況.本文采取的數(shù)據(jù)增強(qiáng)策略是先對原圖像按逆時(shí)針方向每間隔30°旋轉(zhuǎn)一次,得到12倍的增強(qiáng)數(shù)據(jù),再對旋轉(zhuǎn)圖像進(jìn)行水平翻轉(zhuǎn),得到原樣本數(shù)24倍的增強(qiáng)樣本.
把不包含腫塊的正常的ROI的實(shí)際標(biāo)簽設(shè)為陰性(Negative),包含腫塊(良性或者惡性)的ROI的實(shí)際標(biāo)簽設(shè)為陽性(Positive).對測試集的預(yù)測標(biāo)簽與實(shí)際標(biāo)簽進(jìn)行比較可以得到混淆矩陣.真陽性(True Positive, TP)是被正確識(shí)別為陽性的ROI數(shù)量;假陰性(False Negative, FN)是實(shí)際為陽性,卻被識(shí)別為陰性的ROI數(shù)量;假陽性(False Positive, FP)是實(shí)際上是陰性,卻被識(shí)別為陽性的ROI數(shù)量;真陰性(True Negative, TN)是被正確識(shí)別為陰性的ROI數(shù)量.
本文使用準(zhǔn)確度Acc、精確度Pre和敏感度Sen以及F1_score等指標(biāo)來評(píng)估CNN模型對ROI的識(shí)別能力,其定義如下:
準(zhǔn)確度Acc值越高,說明樣本數(shù)據(jù)中被正確識(shí)別的比例越高;精確度Pre表示在模型識(shí)別為腫瘤的所有樣本中,實(shí)際上也是腫瘤的樣本數(shù)百分比;敏感度Sen表示真實(shí)情況下所有腫瘤樣本中,識(shí)別正確的樣本百分比.F1_score是精確度和敏感度的協(xié)調(diào)平均值.除了上述4個(gè)指標(biāo),本文還使用當(dāng)前最常用的受試者操作曲線(Receiver Operating Characteristic Curve,ROC)[19]和曲線下的面積(Area Under the Curve, AUC)作為模型性能的評(píng)估標(biāo)準(zhǔn).受試者操作曲線ROC表示真陽性率TPR和假陽性率FPR之間的關(guān)系.AUC是基于ROC曲線下的面積來度量模型的總體性能. AUC在區(qū)間[0, 1]范圍取值,其值越高則說明模型的分類識(shí)別性能越高.
本文對來自DDSM數(shù)據(jù)集的879幅乳腺X線攝片ROI進(jìn)行腫塊和非腫塊的識(shí)別實(shí)驗(yàn),其中703幅ROI用作訓(xùn)練樣本來訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)模型,剩余的176幅ROI則作為測試樣本,數(shù)據(jù)劃分方式如表1所示.
表1 數(shù)據(jù)集劃分與增強(qiáng)Tab.1 Dataset split and augmentation
本文模型SVGG16在Keras上實(shí)現(xiàn),并采用隨機(jī)梯度下降(Stochastic Gradient Descent, SGD)優(yōu)化器進(jìn)行訓(xùn)練.在訓(xùn)練過程中,動(dòng)量值、學(xué)習(xí)率和最大迭代輪次等超參的值分別設(shè)置為0.9,0.001和60.對比模型包括AlexNet、VGGNets以及ResNet50等,保留這些對比模型的原始結(jié)構(gòu),只修改最后輸出層的神經(jīng)元個(gè)數(shù)并設(shè)置為2.本文使用的數(shù)據(jù)預(yù)處理方式如文獻(xiàn)[13],訓(xùn)練集中每個(gè)像素減去在整個(gè)訓(xùn)練集上計(jì)算的灰度均值.通過減均值操作,消除像素值之間的公共部分,以凸顯個(gè)體之間的特征和差異.
各種網(wǎng)絡(luò)模型在原始訓(xùn)練集和數(shù)據(jù)增強(qiáng)后的訓(xùn)練集上的實(shí)驗(yàn)結(jié)果分別如表2和表3所示.+aug表示進(jìn)行數(shù)據(jù)增強(qiáng).從表2中可以看出,在不使用數(shù)據(jù)增強(qiáng)的實(shí)驗(yàn)中,AlexNet和SVGG16的識(shí)別準(zhǔn)確率Acc相同,都為83.52%,這個(gè)結(jié)果高于相同訓(xùn)練方法下VGG16的82.38%、VGG19的81.25%和ResNet50的78.40%.這是因?yàn)楹笕N模型更深、結(jié)構(gòu)更復(fù)雜,訓(xùn)練數(shù)據(jù)較少導(dǎo)致了過擬合.
表2 原始數(shù)據(jù)實(shí)驗(yàn)結(jié)果Tab.2 Experimental results with original data
在進(jìn)行數(shù)據(jù)增強(qiáng)之后,如表3所示,所有模型的實(shí)驗(yàn)結(jié)果都得到了提升,這驗(yàn)證了數(shù)據(jù)增強(qiáng)對提升模型訓(xùn)練效果的有效性.數(shù)據(jù)增強(qiáng)之后,SVGG16在準(zhǔn)確率Acc、精確度Pre、敏感度Sen和F1_score等所有指標(biāo)中都是最高的,分別達(dá)到了90.34%、89.87%、88.75%和0.89.因此,SVGG16的識(shí)別性能優(yōu)于其他模型.
表3 數(shù)據(jù)增強(qiáng)實(shí)驗(yàn)結(jié)果Tab.3 Experimental results with data augmentation
在計(jì)算效率方面:沒有使用數(shù)據(jù)增強(qiáng)時(shí),訓(xùn)練集數(shù)據(jù)只含有703幅ROI,VGG16和SVGG16的計(jì)算效率分別為2.48 s/epoch和0.36 s/epoch;進(jìn)行24倍數(shù)據(jù)增強(qiáng)之后,訓(xùn)練集的數(shù)據(jù)量達(dá)到了16872幅ROI,VGG16和SVGG16的計(jì)算效率分別為51.38 s/epoch和6.93 s/epoch.SVGG16的計(jì)算效率明顯高于VGG16模型.
為進(jìn)一步定量分析實(shí)驗(yàn)結(jié)果,圖2展示了各個(gè)模型的混淆矩陣.在子圖中,橫軸表示乳腺X線攝片ROI實(shí)際的標(biāo)簽值(0表示非腫塊,1表示腫塊),縱軸表示模型預(yù)測的標(biāo)簽值.在腫塊和非腫塊的識(shí)別任務(wù)中,目標(biāo)是盡可能地識(shí)別出腫塊,即陽性樣本,同時(shí)保證較少的陰性樣本被錯(cuò)誤地識(shí)別.從圖2中可知,對于陽性樣本,SVGG16預(yù)測正確的個(gè)數(shù)最多,為71個(gè),較VGG16和VGG19分別高了2個(gè)和5個(gè).因此,SVGG16對含有腫塊的陽性樣本的正確識(shí)別能力要優(yōu)于其他模型.
圖2 各種模型的混淆矩陣Fig.2 Confusion matrices of various models
類似地,對于度量值A(chǔ)UC,圖3中給出了SVGG16、AlexNet、VGG16以及VGG19和ResNet50的ROC曲線圖.從圖3中可以看出,SVGG16的ROC曲線包含住了其他對比的方法,AUC值最高,為0.95.從整體上再次證明了SVGG16模型的性能要優(yōu)于另外4種已有的CNN模型.
圖3 各種模型的ROC曲線圖Fig.3 The ROC curves of various models
為了更深入地了解CNN模型的性能,圖4展示了模型識(shí)別的ROI個(gè)例.其中第1行是被VGG16預(yù)測錯(cuò)誤,而被SVGG16預(yù)測正確的陰性ROI;第2行是被VGG16預(yù)測錯(cuò)誤,而被SVGG16預(yù)測正確的陽性ROI;第3行是SVGG16預(yù)測錯(cuò)誤的陰性ROI;第4行是SVGG16預(yù)測錯(cuò)誤的陽性ROI.對于區(qū)域呈絲狀的陰性樣本,如第1行的后3個(gè)ROI,VGG16誤判為陽性;對于腫塊區(qū)域比較彌散的陽性ROI,如第2行,SVGG16的識(shí)別能力要優(yōu)于VGG16;對于如第3行的對比度較高且區(qū)域較大的陰性ROI,SVGG16容易錯(cuò)誤地識(shí)別為陽性;對于如第4行的腫塊區(qū)域較小的ROI,SVGG16的識(shí)別能力也有待提升.
圖4 乳腺腫塊識(shí)別個(gè)例展示Fig.4 Presentation of breast mass recognition instance
本文基于VGG16設(shè)計(jì)了一個(gè)精簡的卷積神經(jīng)網(wǎng)絡(luò)模型SVGG16,用于乳腺X攝片ROI中腫塊的分類識(shí)別.首先構(gòu)造一個(gè)由卷積層和池化層構(gòu)成的卷積神經(jīng)網(wǎng)絡(luò),然后對來自DDSM數(shù)據(jù)庫中的703幅ROI圖像進(jìn)行數(shù)據(jù)增強(qiáng)后作為訓(xùn)練樣本對網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,并使用176幅ROI圖像進(jìn)行測試.結(jié)果表明,本文提出的SVGG16在準(zhǔn)確度、精確度、敏感度和F1_score等指標(biāo)上分別達(dá)到了90.34%、89.87%、88.75%和0.89,對乳腺腫塊圖像識(shí)別的性能要明顯優(yōu)于其他已有的CNN模型,在臨床的輔助診斷中能夠?qū)崿F(xiàn)乳腺X線攝片中腫塊與非腫塊的良好識(shí)別.