国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

乳腺X線圖像計算機輔助診斷技術(shù)綜述

2022-03-02 08:31陳智麗潘以軒
計算機工程與應(yīng)用 2022年4期
關(guān)鍵詞:腫塊乳腺卷積

陳智麗,高 皓,潘以軒,2,邢 風(fēng),3

1.沈陽建筑大學(xué) 信息與控制工程學(xué)院,沈陽110168

2.中國建筑第八工程局有限公司 總包協(xié)調(diào)部,江蘇 蘇州215000

3.深圳市贏時勝信息技術(shù)股份有限公司AMS事業(yè)部,北京100032

隨著人口老齡化的加劇,癌癥已逐漸成為危害人類身體健康的主要問題。世界衛(wèi)生組織國際癌癥研究機構(gòu)(IARC)發(fā)布的GLOBOCAN2018 報告顯示:2018 年全球有1 810 萬新發(fā)癌癥病例,其中乳腺癌排在新發(fā)病例的第二位[1]。在乳腺癌患者中,99%為女性,男性僅占1%??梢?,乳腺癌是危害女性健康的主要殺手。全球乳腺癌的發(fā)病率從上世紀(jì)70年代末開始就一直呈上升趨勢且趨于年輕化。我國乳腺癌發(fā)病的高峰年齡已提前到了40~49 歲,并且30~39 歲的乳腺癌發(fā)病率已達(dá)到了每10 萬人中有13 位患者,這一數(shù)據(jù)是美國該年齡段發(fā)病率的兩倍[2]。早發(fā)現(xiàn)、早診斷、早治療是延長患者生命,提高生活質(zhì)量的重要方式,因此乳腺癌的早期篩查和及時治療十分重要。

目前,乳腺檢查主要分為病理檢查和無創(chuàng)檢查兩種。乳腺病理檢查是利用細(xì)胞病理學(xué)檢查和組織病理學(xué)檢查,對乳腺病變的良惡性實現(xiàn)最終的確診;無創(chuàng)乳腺檢查主要分為乳房觸診檢查和乳腺影像學(xué)檢查。目前主要乳腺影像學(xué)檢查包括超聲影像(ultrasound imaging)、乳腺X 線攝影(mammography)、核磁共振成像(MRI)、計算機斷層掃描(CT)、正電子發(fā)射型計算機斷層顯像(PET)等。乳腺X 線攝影檢查在醫(yī)學(xué)放射學(xué)中已經(jīng)應(yīng)用很多年[3]。雖然現(xiàn)在逐漸產(chǎn)生了很多其他先進(jìn)的技術(shù)方法,但是乳腺X 線攝影仍是目前最簡單且最有效的,可以發(fā)現(xiàn)早期乳腺癌病變特征的檢查工具,也是現(xiàn)在唯一可以查出隱匿性癌癥與早期原位癌的技術(shù)方法。在臨床環(huán)境中,美國放射學(xué)會制定了BI-RADS(American College of Radiology’s Breast Imaging Reporting and Data System)[4]對乳腺X線圖像進(jìn)行主觀評估。BI-RADS分為7個等級,BI-RADS 0到BI-RADS 6依次描述乳腺內(nèi)腫塊和鈣化等異常表現(xiàn)的嚴(yán)重程度,數(shù)字越大,惡性程度越大。

在早期,乳腺X 線攝影技術(shù)廣泛應(yīng)用,醫(yī)生需要在實踐中學(xué)習(xí)積累大量的臨床經(jīng)驗,進(jìn)而可以解讀患者的X光片所反映的乳腺結(jié)構(gòu)和病理信息。因此,醫(yī)生在診斷時具有主觀性,且每位醫(yī)生的經(jīng)驗水平也不盡相同,面對變化多樣的乳腺異常結(jié)構(gòu),即使是專家也很難立刻做出準(zhǔn)確判斷,容易出現(xiàn)漏診和誤診的情況。隨著計算機的發(fā)展與普及,逐步成熟的計算機技術(shù)為醫(yī)學(xué)圖像分析與處理提供了足夠的計算能力,能夠一定程度上減少對醫(yī)生經(jīng)驗水平的依賴。20世紀(jì)中期,以美國學(xué)者Ledley為首的研究團隊首次將數(shù)學(xué)模型引入到臨床醫(yī)學(xué)[5],初步提出了計算機輔助診斷(computer aided diagnosis,CAD)技術(shù)的數(shù)學(xué)模型,為CAD技術(shù)在醫(yī)療領(lǐng)域的發(fā)展開創(chuàng)了先河,開始了CAD技術(shù)的初步研究,在一定程度上輔助醫(yī)生判讀醫(yī)學(xué)圖像,排除了人為主觀因素的影響,提高了診斷的準(zhǔn)確率和效率。利用自動、精確、定量的計算機輔助圖像分析技術(shù),可以有效幫助臨床醫(yī)生和研究者高效準(zhǔn)確地處理海量醫(yī)學(xué)圖像。

乳腺X 線圖像中乳腺病變通常分為四種類型[6]:腫塊、鈣化、不對稱和結(jié)構(gòu)變形。乳腺腫塊和微鈣化是臨床中比較常見的病變。微鈣化是乳腺組織內(nèi)微小的鈣沉積異常,表現(xiàn)為高對比度的小亮點,并以聚簇狀方式呈現(xiàn);乳腺腫塊則是灰白色的區(qū)域,其形狀通??梢悦枋鰹闄E圓形、不規(guī)則或分葉狀等,邊界情況通??梢悦枋鰹檫吔缜逦?、模糊或針狀等。雖然微鈣化點相對于腫塊而言較小,但是由于腫塊的大小、形狀的多樣性以及個體乳腺密度的不同,腫塊可能隱藏在乳腺組織中,檢測難度更大。相較于鈣化而言,乳腺腫塊的檢測是一項更具有挑戰(zhàn)性的工作。

1 乳腺X線圖像數(shù)據(jù)集及評價標(biāo)準(zhǔn)

1.1 乳腺X線圖像數(shù)據(jù)集

目前,受諸多因素影響,已公開的醫(yī)學(xué)圖像數(shù)據(jù)集少之又少。特別是乳腺X 線圖像的數(shù)據(jù)集更是寥寥無幾,主要原因有以下幾點:一是乳腺X 線圖像數(shù)據(jù)集需要由專業(yè)的放射科醫(yī)生進(jìn)行標(biāo)注,對醫(yī)生的專業(yè)性要求很高;二是因為我國乳腺癌普查還沒有全面推廣,相對大型的數(shù)據(jù)庫都來自國外。表1是目前已公開的乳腺X線圖像數(shù)據(jù)集[7],但是對于深度學(xué)習(xí)的方法,乳腺X線圖像的采集問題仍是需要解決的難點。

表1 已公開的乳腺X線圖像數(shù)據(jù)集Table 1 Public datasets of mammographic images

1.2 評價指標(biāo)

對于乳腺X 線圖像病變檢測、分割和分類,根據(jù)研究的重點不同,常采用以下幾種不同的評價指標(biāo):召回率(Recall),又稱查全率;精確度(Precision),又稱查準(zhǔn)率;靈敏度(Sensitivity,SEN),又稱真陽性率(true positive rate,TPR);特異性(Specificity,SPE),又稱真陰性率(true negative rate,TNR);準(zhǔn)確率(Accuracy,Acc);F1 度量(F1-score)等。

對于二分類問題,可將分類結(jié)果進(jìn)行如下劃分:真陽性(true positive,TP)表示樣本本身為陽性且預(yù)測結(jié)果也為陽性;假陽性(false positive,F(xiàn)P)表示樣本本身為陰性而預(yù)測結(jié)果為陽性;真陰性(true negative,TN)表示樣本本身為陰性且被正確判斷為陰性;假陰性(false negative,F(xiàn)N)表示樣本本身為陽性而預(yù)測結(jié)果為陰性。分類結(jié)果的“混淆矩陣”(confusion matrix)如表2所示。

表2 分類結(jié)果混淆矩陣Table 2 Confusion matrix of classification results

另外,經(jīng)常采用受試者工作特征(receiver operating characteristic,ROC)曲線來分析不同分類器的好壞。ROC曲線的x軸表示假陽性率(false positive rate,F(xiàn)PR),y軸表示真陽性率(true positive rate,TPR),ROC 曲線下面積用AUC(area under curve)表示,其面積越大代表分類器的性能越好,理想狀況下的AUC 為1。圖1 是ROC曲線與AUC的示意圖。由于ROC曲線不能解決在一張圖像上對多個異常評價的問題,對ROC曲線進(jìn)行變形,引入自由響應(yīng)接受者操作特征曲線(free-response receiver operating characteristic curve,F(xiàn)ROC)[15],以對每張圖像的任意異常進(jìn)行評價。FROC 曲線的x軸是FP/image_num(image_num代表測試圖像張數(shù)),y軸是真陽性率。

圖1 ROC曲線與AUC示意圖Fig.1 Examples of ROC curve and AUC

此外,還使用P-R(Precision-Recall)曲線對模型進(jìn)行分析,P-R曲線的x軸為Recall(召回率),反映分類器正確識別出的正樣本數(shù)與真實正樣本數(shù)的比例,y軸為Precision(精確度),反映分類器正確識別出的正樣本數(shù)與識別出的正樣本數(shù)的比例。圖2 是P-R 曲線示意圖。P-R 曲線下面積為平均精度(average precision,AP),反映模型在不同召回率下最高精確度的平均值,各類別AP的均值(mean AP,mAP)代表平均精度的均值。

圖2 P-R曲線示意圖Fig.2 Examples of P-R curve

在圖像分割技術(shù)中,經(jīng)常用到交并比(intersection over union,IoU)這一評價指標(biāo),見式(7),其中分子是圖像的金標(biāo)準(zhǔn)與分割結(jié)果的交集,即TP,分母是圖像的金標(biāo)準(zhǔn)與分割結(jié)果的并集,即TP+FN+FP,如圖3所示。此外,還采用Dice系數(shù)這一像素級評價指標(biāo),見式(8),其取值范圍在0~1 之間,Dice 越接近1,證明分割效果越好。式(9)為IoU和Dice系數(shù)之間的關(guān)系式。

圖3 IoU示意圖Fig.3 IoU diagram

2 應(yīng)用傳統(tǒng)方法的乳腺X線圖像計算機輔助診斷

隨著計算機技術(shù)的不斷發(fā)展,計算機輔助診斷受到醫(yī)學(xué)界的廣泛關(guān)注。圖4 為乳腺X 線圖像計算機輔助檢測與分類診斷的工作流程,主要包括乳腺X線圖像預(yù)處理、病變檢測、感興趣區(qū)域分割、特征提取和選擇、良惡性病變分類等,檢測和診斷結(jié)果將提供給放射科醫(yī)生作為參考,以得到最后的診斷結(jié)果。經(jīng)過臨床實驗證明,乳腺X線圖像計算機輔助診斷技術(shù)可以有效地提升乳腺癌診斷的靈敏度與準(zhǔn)確率,大大減少漏診和誤診,避免貽誤患者的最佳治療時間或造成過度治療。

圖4 乳腺X線圖像計算機輔助診斷工作流程圖Fig.4 Workflow of computer aided diagnosis of mammographic images

2.1 乳腺X線圖像預(yù)處理

在進(jìn)行乳腺X 線圖像分析時,因為病灶的形態(tài)較小,又與乳腺腺體相連,而胸肌組織的灰度與病變的灰度相似,不易區(qū)分,所以診斷所需的乳腺X 線圖像往往需要很大的分辨率,如果直接處理原始圖像需要很長的運行時間,因此對醫(yī)學(xué)圖像進(jìn)行預(yù)處理是十分必要的。在乳腺X 線圖像的病變診斷中主要從以下幾方面對圖像進(jìn)行預(yù)處理:去除背景和胸肌組織等干擾區(qū)域、去除噪聲、圖像增強及圖像大小的調(diào)整等。

Akselrod-Ballin 等人[16]分割乳房組織,通過去除背景與胸肌并相應(yīng)地裁剪圖像完成對圖像的預(yù)處理。Moayedi等人[17]通過掃過圖像并剪切均值和方差小于某個閾值的水平和垂直方向的區(qū)域來刪除具有明顯結(jié)構(gòu)噪聲的深色背景區(qū)域,然后根據(jù)局部方差和諸如直方圖拉伸之類的點操作的差異,從背景中分離出乳腺紋理,根據(jù)垂直和水平梯度的像素能量和區(qū)域增長算法,實現(xiàn)胸肌組織與乳腺組織的分割。Vikhe等人[18]基于小波的降噪以及自適應(yīng)閾值技術(shù)進(jìn)行腫塊檢測的增強和分割,實驗結(jié)果表明,可疑區(qū)域的形狀可以很好地保留,并且可以與高對比度區(qū)域和背景清晰地區(qū)分,不會模糊邊緣。

由于乳腺X線攝影圖像存在一些斑點噪聲,導(dǎo)致圖像的對比度和分辨率較低,腫塊和鈣化點與噪聲點的邊界劃分不清晰,這就需要濾波處理來去除噪聲。目前去除噪聲的方法主要有均值濾波[19]、中值濾波[20]、各向異性擴散濾波[21]等。Hamissi等人[22]采用2D中值濾波方法來減少噪聲,并進(jìn)行對比度調(diào)整以增加圖像的對比度。Rizzi等人[23]根據(jù)圖像統(tǒng)計參數(shù)(即平均灰度像素值和標(biāo)準(zhǔn)偏差),通過小波濾波器對乳腺X 線圖像進(jìn)行閾值化處理。值得一提的是,與其他方法不同,該方法采用了不同的子小波,以提高細(xì)節(jié)的可見性并有助于特征的檢測,而不會扭曲其外觀和形狀,特別是,雙正交小波由于其在圖像去噪中的良好性能而用于預(yù)處理階段。

圖像增強算法在圖像預(yù)處理階段被用于改善圖像對比度和抑制噪聲,以恢復(fù)圖像大多數(shù)隱藏特征,提高圖像質(zhì)量。Papadopoulos等人[24]在檢測乳腺X線圖像中的微鈣化時,在預(yù)處理階段評估了五種圖像增強算法,它們分別是對比受限的自適應(yīng)直方圖均衡化[25-26]、局部范圍修改[27]、冗余離散小波[28]、線性拉伸[29]和收縮算法。實驗結(jié)果表明,局部范圍修改(AUC=0.932)和基于小波的線性拉伸(AUC=0.926)方法通過適當(dāng)?shù)膮?shù)調(diào)整,在MIAS數(shù)據(jù)庫中實現(xiàn)了最高性能。以上的圖像增強方法有一個普遍的現(xiàn)象,就是在圖像增強的同時放大噪聲,而如果先去除噪聲再進(jìn)行圖像增強,微鈣化點就容易淹沒于背景和噪聲中,導(dǎo)致假陽性過高。Jain 等人[30]通過組合的方法來抑制高密度脈沖噪聲,然后將具有多態(tài)自適應(yīng)增益的非線性增強算子傳遞到已經(jīng)去除噪聲的圖像上,以增強乳腺病變的對比度,實驗結(jié)果顯示圖像質(zhì)量得到提高,在合理抑制背景的情況下增強感興趣區(qū)域。Sharma等人[31]在預(yù)處理階段,將原始數(shù)據(jù)集中的大尺寸乳腺X 線圖像通過最近鄰插值法縮小到1 024×1 024像素,然后通過二值化對圖像背景進(jìn)行處理,最后裁剪提取128×128固定大小的感興趣區(qū)域。

近年來,乳腺X 線成像技術(shù)發(fā)展迅速,全域數(shù)字乳腺X線攝影如今已經(jīng)取代了傳統(tǒng)的模擬膠片時代,圖像質(zhì)量顯著提高,除個別圖像外,噪聲較少??紤]噪聲點與鈣化點相似,在執(zhí)行病變檢測任務(wù)時,可不去除噪聲。但是由于胸肌與腫塊有相似的灰度特征,在病變檢測之前,一般仍要去除胸肌、標(biāo)簽等干擾,并且對圖像進(jìn)行歸一化處理,增強圖像的對比度。

2.2 乳腺X線圖像病變檢測

2.2.1 腫塊病變檢測

Mudigonda等人[32]提出了一種基于密度分層的腫塊檢測方法,通過分析乳腺X線圖像定向結(jié)構(gòu)信息進(jìn)行腫塊檢測。由于不同種類腫塊的紋理密度不同,導(dǎo)致檢測效果不同。該方法對于良性腫塊的檢測成功率較低,僅為63%;而對于惡性腫塊的檢測敏感度非常高,使得整體的檢測準(zhǔn)確率達(dá)到74%。Varela等人[33]在不同尺寸下使用模孔濾波器對乳腺X線圖像進(jìn)行處理,通過選擇最優(yōu)尺寸來提高腫塊檢測算法的靈敏度和特異性。在基于病變和基于病例兩種情況下對模型進(jìn)行評估,當(dāng)每幅圖像的假陽性為1.02時,靈敏度分別達(dá)到了88%和94%。

Eltonsy等人[34]提出了形態(tài)學(xué)同心層分析策略,這種方法的優(yōu)點是在保持假陽性率盡可能低的同時,惡性腫塊的檢出率高于95%,但是這種方法在處理低對比度圖像時漏檢率高。目前,基本所有方法使用的人工設(shè)計的特征集都是由腫塊固有特征衍生出來的。當(dāng)使用這些方法直接處理致密腺體型乳腺X線圖像時,往往會出現(xiàn)誤判(假陽性區(qū)域過多)和漏判(真陽性率較低)的情況。Gao 等人[35]嘗試通過形態(tài)成分分析(morphological component analysis,MCA)的方式將乳腺X線圖像分解為分段平滑分量和紋理分量,提取分段平滑分量,可以抑制圖像中血管和乳腺組織的干擾,然后改進(jìn)了同心層標(biāo)準(zhǔn)的腫塊檢測方案,實現(xiàn)對隱藏在乳腺組織中對比度低的腫塊的檢測,提升腫塊的檢出率。此外還引入腫塊區(qū)域的高斯特征和紋理特征,進(jìn)一步減少誤報率。

上述基于傳統(tǒng)方法的腫塊檢測技術(shù),由于主要提取圖像的底層特征,很難檢測對比度較低的腫塊。目前應(yīng)用傳統(tǒng)方法的腫塊檢測主要存在致密性腺體導(dǎo)致假陽性過高,以及對病灶區(qū)域過度檢測等問題。

2.2.2 微鈣化病變檢測

眾所周知,相較于腫塊,乳腺的微鈣化更小,數(shù)字乳腺X 線攝影技術(shù)由于其優(yōu)越的靈敏度可以改善微鈣化的檢測[36]。Oliver 等人[37]提出了一種基于知識的方法,可以自動檢測乳腺X 線圖像中的單個微鈣化和團簇。具體做法是首先創(chuàng)建單詞字典,單詞字典由包含微鈣化的圖像與一組濾波器進(jìn)行卷積得到。該字典可代替表示已知微鈣化的病例,隨后將其用于表示未知圖像,通過將含有微鈣化的正樣本與負(fù)樣本與字典中的單詞進(jìn)行卷積以生成訓(xùn)練數(shù)據(jù),并將其用作GentleBoost 分類器的輸入。最后用訓(xùn)練好的分類器進(jìn)行微鈣化檢測,進(jìn)而擴展微鈣化檢測方法用于檢測鈣化簇。實驗評估采用ROC 曲線分析(用于微鈣化檢測)和FROC 分析(用于微鈣化簇檢測),使用兩個數(shù)字化數(shù)據(jù)庫和一個全域數(shù)字?jǐn)?shù)據(jù)庫,實驗結(jié)果充分證明了該方法的有效性。Rizzi 等人[23]提出了兩階段分解小波濾波用于檢測微鈣化。第一階段根據(jù)圖像統(tǒng)計數(shù)據(jù)(平均灰度像素值和標(biāo)準(zhǔn)偏差)對乳腺X 線圖像進(jìn)行閾值化,保留所有可疑微鈣化,并降低背景噪聲。而第二階段為了定位奇異點,重構(gòu)圖像采用另一種小波分解,每個分解層次采用硬閾值技術(shù)處理,來識別真實的微鈣化,以減少假陽性檢測。該方法的性能在MIAS 數(shù)據(jù)庫上進(jìn)行驗證,F(xiàn)ROC分析在假陽性率為1的情況下,靈敏度能達(dá)到98%左右。

Yu 等人[38]結(jié)合基于模型特征和統(tǒng)計紋理特征對簇狀微鈣化進(jìn)行檢測。首先,使用小波濾波器和兩個閾值檢測可疑的微鈣化區(qū)域;然后,從可疑區(qū)域提取基于馬爾可夫隨機場和分形模型的紋理特征,以及統(tǒng)計紋理特征,并通過反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)對其進(jìn)行檢測。使用MIAS 數(shù)據(jù)集中的20 張包含微鈣化簇的圖像進(jìn)行測試,經(jīng)FROC曲線分析,假陽性率是1.0時的敏感度能達(dá)到90%,結(jié)果表明了組合基于模型特征和統(tǒng)計紋理特征能夠有效地進(jìn)行微鈣化簇檢測。Malar等人[39]使用極限學(xué)習(xí)機(extreme learning machine,ELM)對微鈣化進(jìn)行檢測,并將其與使用灰度空間相關(guān)性矩陣和Gabor 濾波技術(shù)提取的不同特征向量進(jìn)行比較,對MIAS 數(shù)據(jù)庫55 張圖像中的120 個感興趣區(qū)域進(jìn)行訓(xùn)練。結(jié)果表明,與貝葉斯分類器和支持向量機(support vector machine,SVM)等其他方法相比,ELM有更好的檢測性能,準(zhǔn)確度達(dá)到94%,并且訓(xùn)練時間顯著減少。另外,ELM還避免了局部最小值、學(xué)習(xí)率不正確和過度擬合等問題。Cheng等人[40]使用模糊邏輯技術(shù)檢測微鈣化。他們使用全局和本地信息生成模糊圖像和增強圖像,然后通過曲線檢測算法去除不相關(guān)的乳腺結(jié)構(gòu),最后使用迭代閾值定位微鈣化。

在臨床中,微鈣化點的大小、形狀、分布等特征為醫(yī)生的診斷提供重要參考信息,精準(zhǔn)的微鈣化檢測是計算機輔助診斷系統(tǒng)的關(guān)鍵步驟。然而乳腺X 線圖像組織復(fù)雜,背景不均勻,且噪聲與微鈣化相類似,使得微鈣化檢測工作仍存在一定困難。

2.3 乳腺病變區(qū)域分割

乳腺病變區(qū)域分割是乳腺X 線圖像計算機輔助診斷技術(shù)的基礎(chǔ)工作,是后續(xù)乳腺病變特征提取和分類的前提。有關(guān)臨床資料顯示,腫塊的邊緣特征反映了其生長方式和生物學(xué)特征。一般來說,形狀規(guī)則的腫塊為良性;相反,惡性腫塊往往具有不規(guī)則的邊緣。因此分割算法的準(zhǔn)確性,對后續(xù)的特征分析和分類有很大影響。已有很多研究者關(guān)注并投入到乳腺X 線圖像乳腺病變區(qū)域分割這一領(lǐng)域[41]。

基于傳統(tǒng)方法的乳腺X 線圖像腫塊檢測和分割算法主要有區(qū)域增長[42-43]、主動輪廓算法[44]、閾值分割[45]、分水嶺方法、水平集方法[46]、邊緣檢測等。Kupinski 等人[47]根據(jù)區(qū)域增長算法提出了兩種新的病變分割方法,一種是徑向梯度指數(shù)(radial gradient index,RGI)算法,另一種是概率算法。這兩種方法通過利用形狀約束規(guī)范化所分析的可疑區(qū)域,以解決與常規(guī)區(qū)域增長相關(guān)的問題,并且通過使用單個基于特征或概率的效用函數(shù)來簡化可疑區(qū)域選擇過程。這兩種新方法明顯優(yōu)于常規(guī)的區(qū)域增長分割,在交并比為0.3時,常規(guī)的區(qū)域增長技術(shù)僅確定了62%的病變,而基于RGI和基于概率的分割方法分別正確地分割了92%和96%的病變。Xu 等人[48]提出使用迭代閾值法來提取可疑區(qū)域,通過Canny邊緣檢測提取粗糙的腫塊區(qū)域,最后使用主動輪廓對腫塊進(jìn)行精準(zhǔn)分割,實驗表明該算法比常規(guī)方法具有更好的性能。另外,Yu等人[49]結(jié)合中值濾波、形態(tài)學(xué)和Sobel邊緣檢測等操作獲得腫塊初始的粗糙邊緣,然后使用梯度矢量流(gradient vector flow snake,GVF-Snake)和梯度圖調(diào)整分割出最終腫塊。

由于乳腺X 線圖像中的惡性病變具有不規(guī)則的外觀,呈現(xiàn)針刺形狀,影響診斷,Karssemeijer 等人[50]提出了一種基于像素方向圖統(tǒng)計分析的分割方法,如果發(fā)現(xiàn)指向某個區(qū)域的像素增加,尤其是在許多方向上發(fā)現(xiàn)這種增加時,則將該區(qū)域標(biāo)記為可疑,使用多尺度方法在每個像素處確定圖像強度圖的方向。在給定的比例下,可以從三階二階高斯導(dǎo)數(shù)運算符的輸出獲得準(zhǔn)確的基于線的方向的估計,而在其他情況下,圖像噪聲會生成隨機方向。像素方向圖用于構(gòu)造兩個對直線的徑向模式敏感的算子。使用分類器對這些運算符的輸出進(jìn)行組合,可以檢測出針刺形狀。這種方法檢測出90%的惡性病例,但是假陽性率較高。

為了降低病變區(qū)域背景與前景灰度分布相近帶來的影響,不少學(xué)者提出了基于無邊緣活動輪廓模型的乳腺腫塊分割方法。Tunal? 等人[51]對圖像添加了低值像素,對采用的邊緣停止函數(shù)Chan-Vese 主動輪廓算法進(jìn)行了改進(jìn),有效地對乳腺X線圖像中的良性和惡性腫塊進(jìn)行了分割,使用DDSM(digital database for screening mammography)數(shù)據(jù)集中的60張圖像進(jìn)行驗證,最終的分割結(jié)果交并比達(dá)到75.1%。Dubey等人[52]比較了兩種不同的半自動方法,即水平集方法和基于控制的分水嶺方法,應(yīng)用這兩種方法對腫塊區(qū)域進(jìn)行分割。實驗結(jié)果表明,標(biāo)記控制的分水嶺分割方法顯示出比水平集更好的結(jié)果。Chu等人[53]使用形態(tài)學(xué)增強技術(shù)對乳腺X線圖像進(jìn)行預(yù)處理并消除背景,應(yīng)用簡單線性迭代聚類(simple linear iterative clustering,SLIC)方法對腫塊可疑區(qū)域進(jìn)行分割,將腫塊與背景分組,利用基于規(guī)則的分類方法對可疑區(qū)域進(jìn)行預(yù)篩選,并應(yīng)用正則化水平集對潛在病變輪廓進(jìn)行細(xì)化。實驗結(jié)果表明,該方法可以通過降低假陽性率的方法來提高靈敏度。Jen等人[54]提出基于新型異常檢測分類器(abnormality detection classifier,ADC)的乳腺X 線圖像異常特征檢測方法,對分割后的乳腺X 線圖像使用灰度值量化的方法提取五個特征來檢測感興趣區(qū)域,應(yīng)用主成分分析(principal component analysis,PCA)來確定權(quán)重。實驗結(jié)果表明,將該方法與特征權(quán)重調(diào)整相結(jié)合進(jìn)行檢測,在MIAS 數(shù)據(jù)集和DDSM 數(shù)據(jù)集上的靈敏度分別為88%和86%。Davies等人[55]使用局部閾值化處理從圖像中正常的乳腺結(jié)構(gòu)背景中分割出鈣化層,并對分割對象進(jìn)行分析,提取出鈣化簇。

上述傳統(tǒng)的病變區(qū)域分割方法大致可以分為基于區(qū)域、基于閾值、基于邊緣、基于特征模型、基于特定理論等幾類??紤]病變區(qū)域往往形狀不規(guī)律,邊界不規(guī)則,且病變內(nèi)部存在灰度異質(zhì)等情況,單獨依靠某一類分割方法很難得到理想的結(jié)果,綜合不同方法以提高分割精度是今后研究的趨勢。此外,病變檢測方法常與分割算法相結(jié)合,在確定存在病變的同時分割出病變區(qū)域,以提升計算機輔助診斷效果。

2.4 乳腺病變的特征提取、選擇與分類

特征提取的目的是通過一系列的運算,從原始圖像數(shù)據(jù)中抽象出對解決分類問題有效的特征表達(dá)。傳統(tǒng)意義上的特征提取主要包括:基于人工設(shè)計的圖像特征表達(dá)和基于淺層學(xué)習(xí)的圖像特征表達(dá)。幾種常見的人工設(shè)計的特征提取方法有顏色(灰度)特征、紋理特征和局部特征提取方法。顏色(灰度)特征對圖像大小、方向和視角變化不敏感,計算過程簡單,易于獲取。紋理特征刻畫的是圖像或感興趣區(qū)域的顏色和亮度在空間上的分布規(guī)律。

2.4.1 腫塊的特征提取、選擇與分類

Rangayyan等人[56]采用邊緣銳度特征描述腫塊邊緣點灰度的變化程度,并與緊密度和傅里葉描述符等形狀特征相結(jié)合,實現(xiàn)腫塊良惡性分類。Yang等人[57]首先對腫塊進(jìn)行邊緣分割,然后將分形維數(shù)用于腫塊良惡性的分類,取得了較好的結(jié)果。Rashe 等人[58]提出基于多分辨率小波分解的方法將腫塊識別為良性或惡性。首先將圖像進(jìn)行多級小波分解,然后取每級變換的低頻系數(shù)作為圖像特征。Nanni等人[59]分別使用局部三值模式和局部相位量化直方圖作為圖像特征,對腫塊進(jìn)行良惡性分類。Verma等人[60]提出了基于模糊神經(jīng)網(wǎng)絡(luò)的乳腺X線圖像特征提取系統(tǒng),在基于熵、標(biāo)準(zhǔn)差和像素的特征組合的基礎(chǔ)上對乳腺微鈣化圖像進(jìn)行良惡性分類。Eltoukhy等人[61]提出一種統(tǒng)計測試的方法。首先,將分解一組乳腺X線圖像后獲得的系數(shù)用于構(gòu)建K×N矩陣,其中K是圖像數(shù)量,N是每個圖像的系數(shù)數(shù)量,根據(jù)其分類能力對要素(列)進(jìn)行排名;然后,應(yīng)用動態(tài)閾值來優(yōu)化特征數(shù)量,從而可以有效地實現(xiàn)分類準(zhǔn)確率。該方法取決于提取可以最大程度上區(qū)分不同類別的特征。

紋理特征是識別圖像中感興趣區(qū)域的重要特征。Mudigonda等人[62]比較整個腫塊區(qū)域和僅包含腫塊邊緣的帶狀區(qū)域的紋理特征和梯度特征在腫塊良惡性分類上的性能,發(fā)現(xiàn)從僅包含腫塊邊緣的帶狀區(qū)域提取的紋理特征具有較好的分類性能,在MIAS數(shù)據(jù)和本地數(shù)據(jù)組合的數(shù)據(jù)庫上準(zhǔn)確率達(dá)到了76%。Jagadeesh 等人[63]提出兩種復(fù)雜的特征提取方法,首先使用Sech 模板方法選擇乳腺中的可疑區(qū)域進(jìn)行閾值化分割,然后使用灰度共生矩陣(gray-level co-occurrence matrix,GLCM)和光密度特征提取局部強度關(guān)系和離散光度分布的信息。Punitha 等人[64]提出了使用優(yōu)化區(qū)域生長技術(shù)的自動檢測乳腺腫塊的方法,其中使用名為DFO(dragon fly optimization)的群體優(yōu)化技術(shù)生成初始種子點和閾值。使用GLCM和灰度游程矩陣(gray-level run-length matrix,GLRLM)技術(shù)從分割的圖像中提取紋理特征,并將其輸入到使用反向傳播算法訓(xùn)練的前饋神經(jīng)網(wǎng)絡(luò)(feed forward neural network,F(xiàn)FNN)分類器中,將圖像分為良性和惡性。使用DDSM數(shù)據(jù)庫評估提出的檢測技術(shù)的性能,將得到的ROC 分析結(jié)果與其他區(qū)域生長方法進(jìn)行了比較,該系統(tǒng)的靈敏度高達(dá)98.1%,特異性達(dá)到97.8%。

2.4.2 微鈣化的特征提取、選擇與分類

用于乳腺X 線圖像微鈣化點特征提取與識別的方法很多,主要有應(yīng)用小波變換的微鈣化點提取技術(shù)、應(yīng)用形態(tài)學(xué)的微鈣化點提取技術(shù)和應(yīng)用統(tǒng)計學(xué)習(xí)的微鈣化點檢測技術(shù)等。萬柏坤等人[65]首次應(yīng)用基于統(tǒng)計學(xué)習(xí)理論的支持向量機算法實現(xiàn)了乳腺X 線圖像中的微鈣化檢測。使用ANN與SVM算法對214個微鈣化點進(jìn)行檢測,實驗結(jié)果表明SVM 算法具有更準(zhǔn)確的檢出率。Pal 等人[66]提出了鈣化的多階段檢測系統(tǒng),利用特征選擇技術(shù)從87 個鈣化特征中挑選出一組良好的特征。使用反向傳播神經(jīng)網(wǎng)絡(luò)找到鈣化和正常區(qū)域,然后在這些圖像的每個可疑像素處計算鈣化點的局部密度(稱為山勢),并將山峰的峰值用于將乳腺X線圖像分類為鈣化或正常。在17 張乳腺X 線圖像上進(jìn)行了測試,結(jié)果表明該系統(tǒng)運行良好,并且對于每張異常圖像,能夠非常準(zhǔn)確地定位鈣化區(qū)域。對于乳腺X 線圖像中的簇狀微鈣化,Kim 等人[67]采用紋理分析方法進(jìn)行檢測,他們將提出的與周圍區(qū)域相關(guān)的紋理分析方法與傳統(tǒng)的紋理分析方法(如空間灰度相關(guān)方法、灰度相關(guān)方法)進(jìn)行比較,利用這些方法提取的紋理特征將感興趣區(qū)域分為包含簇狀微鈣化和正常組織。選用三層反向傳播神經(jīng)網(wǎng)絡(luò)作為分類器,用ROC曲線作為評價指標(biāo),實驗結(jié)果表明,在分類精度和算法復(fù)雜度方面,周圍區(qū)域依賴方法優(yōu)于傳統(tǒng)的紋理分析方法。Chen 等人[68]提出一種基于拓?fù)涮卣鞯娜橄傥⑩}化簇良惡性分類方法,在不同尺度下,構(gòu)建微鈣化簇的圖形表示,進(jìn)而應(yīng)用圖形學(xué)理論提取微鈣化簇的拓?fù)涮卣鳎詈髴?yīng)用k近鄰分類器區(qū)分良性和惡性微鈣化簇,在MIAS和DDSM數(shù)據(jù)集上均取得了較好的分類結(jié)果。

綜上,可以看出乳腺病變的分類主要集中于對腫塊和微鈣化這兩類病變的良惡性分類。上文中的病變分類方法只針對某一類病變,無法對其他類病變進(jìn)行良惡性分類。但是在乳腺癌的實際臨床診斷中,往往需要綜合考慮腫塊、微鈣化等多類病變,需要同時對多類病變進(jìn)行良惡性診斷。目前面向多類病變分類方法的研究較少,分類結(jié)果也較低,是今后的研究方向。

2.5 總結(jié)

目前,應(yīng)用傳統(tǒng)方法的乳腺X線圖像分析和計算機輔助診斷面臨兩個問題:一是基于人工設(shè)計特征的醫(yī)學(xué)圖像分析方法具有一定的主觀性,需要具備一定的醫(yī)學(xué)診斷知識,而且不能有效地提取出圖像中的高維特征,無法滿足復(fù)雜函數(shù)模型建模的要求;二是基于傳統(tǒng)方法的病變檢測和分割方法是對一種或者幾種乳腺病變的顯著特征進(jìn)行特征提取,針對特征明顯的病變有很好的檢測能力,然而實際中面對外觀多樣的乳腺病變情況泛化能力低,不能有較強的魯棒性,很容易造成漏檢。因此,將不同的模型提取的特征進(jìn)行融合,可以彌補模型自身的局限性,結(jié)合不同的特征可以更好地擬合出病變特點,能夠更好地提高檢測的精度,但是增加了算法的復(fù)雜度,容易出現(xiàn)過擬合的情況。綜上,基于傳統(tǒng)方法的乳腺X線圖像分析仍存在一些問題,尚不能很好地應(yīng)用在實際臨床診斷中。

3 應(yīng)用深度學(xué)習(xí)方法的乳腺X線圖像病變檢測與分類診斷

3.1 深度學(xué)習(xí)

人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)是受到動物視覺皮層組織的啟發(fā)而產(chǎn)生的一系列可訓(xùn)練的多層結(jié)構(gòu),而各種各樣的深度結(jié)構(gòu)則衍生于傳統(tǒng)的前饋ANN。Hirose 等人[69]提出了被用于分層結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)的人工神經(jīng)網(wǎng)絡(luò)反向傳播算法,掀起了機器學(xué)習(xí)的第一次浪潮,使基于統(tǒng)計模型的機器學(xué)習(xí)重新煥發(fā)了生機,隨之而來的是淺層學(xué)習(xí)在機器學(xué)習(xí)中的廣泛應(yīng)用。這些淺層結(jié)構(gòu)雖然相比于過去基于人工規(guī)則的系統(tǒng)展現(xiàn)出很大的優(yōu)越性,但當(dāng)處理復(fù)雜問題時,則表現(xiàn)出特征學(xué)習(xí)能力不足、維數(shù)災(zāi)難、易陷入局部最優(yōu)等缺點。

自2006 年Hinton 等人[70]首次提出深度學(xué)習(xí)的概念以來,機器學(xué)習(xí)相關(guān)的應(yīng)用迅速增長,解決了上述淺層結(jié)構(gòu)長期對研究者的困擾。研究發(fā)現(xiàn)多隱層網(wǎng)絡(luò)具有優(yōu)異的特征學(xué)習(xí)能力,能學(xué)習(xí)得到數(shù)據(jù)中更本質(zhì)的特征[71]。深度學(xué)習(xí)利用分層結(jié)構(gòu)處理復(fù)雜的高維數(shù)據(jù),每層由包含特征檢測器的單元組成,低層檢測簡單特征,并反饋給高層,從而檢測出更復(fù)雜的特征。深度學(xué)習(xí)算法可以直接從訓(xùn)練數(shù)據(jù)提取特征,使得特征提取、特征選擇及特征分類三個核心步驟可以在同一個深層結(jié)構(gòu)的最優(yōu)化中實現(xiàn),從而極大地減少特征提取的工作量以及主觀因素的影響。深度學(xué)習(xí)相關(guān)研究掀起了機器學(xué)習(xí)研究的第二次浪潮。

深度學(xué)習(xí)算法最早應(yīng)用的領(lǐng)域便是圖像處理。最初,卷積神經(jīng)網(wǎng)絡(luò)等神經(jīng)網(wǎng)絡(luò)在時間延遲網(wǎng)絡(luò)[72]、支票讀取系統(tǒng)[73]等小規(guī)模的應(yīng)用問題上取得了當(dāng)時最好的結(jié)果。在1996 年,Sahiner 等人[74]第一次利用包含一個輸入層、兩個隱藏層和一個輸出層構(gòu)成的卷積神經(jīng)網(wǎng)絡(luò),結(jié)合反向傳播算法更新卷積神經(jīng)網(wǎng)絡(luò)權(quán)值參數(shù),實現(xiàn)了對人工標(biāo)注的乳腺腫塊區(qū)域和乳腺正常組織區(qū)域的分類。由于當(dāng)時深度學(xué)習(xí)網(wǎng)絡(luò)對像素數(shù)量巨大的圖像內(nèi)容理解不理想,使其在計算機視覺領(lǐng)域的相關(guān)研究一直停滯不前。圖形處理器(graphics processing unit,GPU)和并行處理算法的發(fā)展,特別是2012年的ImageNet比賽中出現(xiàn)的AlexNet[75],使深度學(xué)習(xí)在圖像處理領(lǐng)域的應(yīng)用日益增多。隨著深度學(xué)習(xí)模型和算法的不斷發(fā)展和優(yōu)化,深度學(xué)習(xí)在乳腺X線圖像分析領(lǐng)域的應(yīng)用也愈加廣泛[76]。

目前應(yīng)用廣泛的深度學(xué)習(xí)模型有自編碼器(autoencoder,AE)[77]、深度置信網(wǎng)絡(luò)(deep belief networks,DBN)[78]、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)[79]、深度殘差網(wǎng)絡(luò)(residual neural network,ResNet)[80]和密集連接網(wǎng)絡(luò)(dense convolutional network,DenseNet)[81]等。

3.1.1 自編碼器

自編碼器是人工神經(jīng)網(wǎng)絡(luò)的一種形式,用于無監(jiān)督學(xué)習(xí)模型,主要分為降噪自編碼器(denoising autoencoder,DAE)和稀疏自編碼器(sparse autoencoder,SAE)。自編碼器由編碼器(encoder)和解碼器(decoder)兩部分組成,通過隱藏層減少維度空間,在輸出層重構(gòu)輸入圖像以學(xué)習(xí)圖像數(shù)據(jù)的特征表示。深度自編碼器的概念是Hinton 等人[70]對單層自編碼器的結(jié)構(gòu)進(jìn)行改進(jìn)后提出的,并給出了具體的預(yù)訓(xùn)練以及參數(shù)調(diào)優(yōu)的方法。目前,自編碼器廣泛應(yīng)用于乳腺X線圖像的分割與檢測。

3.1.2 受限玻爾茲曼機與深度置信網(wǎng)絡(luò)

受限玻爾茲曼機(restricted Boltzman machines,RBM)是一個雙向圖模型,由Smolensky[82]在1986 年提出,并且被廣泛用于特征提取、特征選擇與圖像分類。Nie 等人[83]在2016 年提出了卷積受限波爾茲曼機(convolutional restricted Boltzman machines,CRBM)[84],并將其應(yīng)用到了眼周識別領(lǐng)域??蝶惼嫉热薣85]提出了稀疏受限玻爾茲曼機(sparse restricted Boltzman machine,SRBM),通過歸一化輸入數(shù)據(jù)均值決定稀疏系數(shù)及稠密數(shù)據(jù)集(稀疏系數(shù)超過閾值的數(shù)據(jù)集),自動完成原始稠密數(shù)據(jù)集到稀疏數(shù)據(jù)集的轉(zhuǎn)化。判別式受限玻爾茲曼機(discriminative restricted Boltzmann machine,DRBM)[86]可以看作是多個受限玻爾茲曼機以級聯(lián)的方式構(gòu)成的一種深度學(xué)習(xí)框架,可以直接用于分類,相當(dāng)于深度學(xué)習(xí)的最后一層,目前已經(jīng)成功應(yīng)用在數(shù)字識別、文本識別等領(lǐng)域。

深度置信網(wǎng)絡(luò)是一個概率生成模型,建立了一個觀察數(shù)據(jù)和標(biāo)簽之間的聯(lián)合分布,具有靈活性和易拓展的優(yōu)點。它的核心部分在于非監(jiān)督貪心逐層訓(xùn)練算法。這種算法能夠在某種程度上避免局部最優(yōu)的問題,而且無監(jiān)督學(xué)習(xí)的訓(xùn)練方式使其具備對未標(biāo)記數(shù)據(jù)進(jìn)行訓(xùn)練的能力,從而有效解決以誤差反向傳播為代表的淺層學(xué)習(xí)結(jié)構(gòu)的局限性(如局部最優(yōu)、過擬合和無法訓(xùn)練未標(biāo)記數(shù)據(jù)等)。

3.1.3 卷積神經(jīng)網(wǎng)絡(luò)

卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一種最成功的深度學(xué)習(xí)模型,尤其是應(yīng)用在面向分類任務(wù)的監(jiān)督學(xué)習(xí)時,性能尤其突出。Litjen 等人[87]在2017 年使用CNN 實現(xiàn)了多種圖像處理任務(wù)。早在1989 年,LeCun 等人[88]就提出了CNN,其為多層感知器的變形,和ANN 類似,也是由許多基礎(chǔ)單元堆疊組成的。CNN是一種包含卷積層的深度神經(jīng)網(wǎng)絡(luò),其網(wǎng)絡(luò)架構(gòu)包括非線性卷積層、池化層和全連接層。與常規(guī)神經(jīng)網(wǎng)絡(luò)不同的是CNN的層次具有寬度、高度和深度,CNN最大的特點是采用了權(quán)值共享的策略,其權(quán)值共享的網(wǎng)絡(luò)結(jié)構(gòu)使之更類似于生物神經(jīng)網(wǎng)絡(luò),不僅降低了網(wǎng)絡(luò)模型的復(fù)雜度,而且減少了權(quán)值的數(shù)量[89]。將合適的輸入數(shù)據(jù)輸入到CNN中即可對其進(jìn)行訓(xùn)練,CNN 會逐層地計算參數(shù)并生成一個最終的輸出。訓(xùn)練的目的是使網(wǎng)絡(luò)的預(yù)測輸出和實際輸出之間的差異最小化,訓(xùn)練的誤差會通過反向傳播算法反向流向整個網(wǎng)絡(luò)從而更新網(wǎng)絡(luò)的參數(shù)。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)技術(shù)中最具代表性的網(wǎng)絡(luò)結(jié)構(gòu)之一,該結(jié)構(gòu)特別適用于分析、處理圖像任務(wù),并在計算機視覺領(lǐng)域取得了突破性的進(jìn)展,甚至在很多視覺分析任務(wù)(如手寫字體識別、人臉識別、物體識別等)中都取得了可以和人類認(rèn)知相比擬的結(jié)果。

3.2 應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的乳腺X線圖像病變檢測

3.2.1 應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的腫塊檢測

Dhungel等人[90]提出了一種使用級聯(lián)的深度學(xué)習(xí)和隨機森林分類器(random forest,RF)檢測乳腺腫塊的方法。首先將多尺度深度置信網(wǎng)絡(luò)(multi-scale deep belief networks,m-DBN)與高斯混合模型(Gaussian mixture model,GMM)相結(jié)合,選擇可疑區(qū)域。之后將候選框輸入級聯(lián)網(wǎng)絡(luò),主要是兩個深度卷積神經(jīng)網(wǎng)絡(luò)的級聯(lián),級聯(lián)網(wǎng)絡(luò)產(chǎn)生的特征被支持向量機使用,這種特定圖像區(qū)域和SVM的組合被稱為R-CNN[91]。最后由兩級隨機森林分類器級聯(lián)處理經(jīng)過深度學(xué)習(xí)分析的區(qū)域,從級聯(lián)分類器選擇的區(qū)域提取形態(tài)和紋理特征,再使用關(guān)聯(lián)成分分析(connected component analysis,CCA)將在隨機森林分類器中獲得的區(qū)域合并在一起,產(chǎn)生新的結(jié)果。在DDSM-BCRP 數(shù)據(jù)集和INbreast 數(shù)據(jù)集上進(jìn)行測試,實驗結(jié)果表明該方法在有效地減少假陽性的同時,可以保持較高的真陽性檢測率。

Ren 等人[92]提出了Faster R-CNN,引入一個區(qū)域建議網(wǎng)絡(luò)(region proposal network,RPN)[93]。RPN是一種全卷積網(wǎng)絡(luò),與Fast R-CNN 共享全圖像卷積特征,對RPN 進(jìn)行端到端的訓(xùn)練,以生成高質(zhì)量的區(qū)域建議,具有更快的檢測速度和更高的檢測質(zhì)量。Akselrod-Ballin等人使用Faster R-CNN 模型進(jìn)行了一系列實驗,分別為乳腺腫塊的檢測與分類和乳腺腫塊和鈣化的檢測與分類。Akselrod-Ballin 等人[94]對Faster R-CNN 進(jìn)行了改進(jìn),首先對圖像進(jìn)行預(yù)處理,分割乳腺組織,去除背景和胸肌,并相應(yīng)地剪裁圖像;然后將多個重疊的子圖像用于訓(xùn)練和測試修改后的Faster R-CNN,將子圖像獲得的結(jié)果整合到整個圖像中;最后產(chǎn)生具有置信度概率分?jǐn)?shù)的檢測和分類結(jié)果。另外,Akselrod-Ballin 等人[16]還提出了在Faster R-CNN 基礎(chǔ)上構(gòu)建多級特征融合,將底層的特征與高級語義特征相結(jié)合,在DDSM數(shù)據(jù)集和INbreast 數(shù)據(jù)集上進(jìn)行訓(xùn)練,得到了AUC 為0.97 和0.91 的好結(jié)果,與之前的模型相比,具有更高的檢測速度和檢測精度。Ribli 等人[95]提出了一種無需任何人工干預(yù)即可在乳腺X 線圖像上檢測和分類良惡性病變的系統(tǒng)。該系統(tǒng)運用遷移學(xué)習(xí)的方法,使用在ImageNet數(shù)據(jù)集上預(yù)訓(xùn)練的VGG16網(wǎng)絡(luò)參數(shù),結(jié)合Faster R-CNN在DDSM 和INbreast 數(shù)據(jù)集上進(jìn)行訓(xùn)練,得到AUC 為0.95,在數(shù)字乳腺攝影DREAM挑戰(zhàn)賽中排名第二。

大部分的CNN網(wǎng)絡(luò)模型規(guī)定輸入圖像的大小都小于乳腺X 線圖像的大小,直接對圖像進(jìn)行下采樣,會造成圖像部分信息的丟失,尤其不適合小病變檢測。Jung等人[96]使用RetinaNet作為基礎(chǔ)模型,針對乳腺病變中的小腫塊進(jìn)行檢測,通過旋轉(zhuǎn)、翻轉(zhuǎn)、剪裁等方式,對數(shù)據(jù)進(jìn)行增廣,在INbreast數(shù)據(jù)集上進(jìn)行訓(xùn)練。實驗結(jié)果證明RetinaNet能夠降低假陽性率,提高腫塊檢測的準(zhǔn)確率,對小腫塊有比較好的檢測效果。

Redmon等人[97]提出了一種新的目標(biāo)檢測方法YOLO(you only look once)。該網(wǎng)絡(luò)使用整個圖像的特征來預(yù)測每個邊界框,同時還可以預(yù)測圖像中所有目標(biāo)類的所有邊界框,可以實現(xiàn)端到端的訓(xùn)練和實時速度,同時保持較高的平均精度。YOLO 系統(tǒng)將輸入的圖像劃分為S×S個網(wǎng)格,如果目標(biāo)的中心落入某個網(wǎng)格單元,則該網(wǎng)格單元負(fù)責(zé)檢測該目標(biāo),每個網(wǎng)格單元檢測目標(biāo)邊界框并輸出這些邊界框的目標(biāo)置信度分?jǐn)?shù)。Al-Masni等人[98-99]對YOLO 模型進(jìn)行了改進(jìn),提出一種區(qū)域深度學(xué)習(xí)技術(shù),用于腫塊的自動檢測和分類。該系統(tǒng)主要分為4個階段:對圖像進(jìn)行預(yù)處理,使用24個卷積層(內(nèi)核大小為3×3)進(jìn)行特征提取,使用置信度模型進(jìn)行腫塊檢測,最后使用全連接神經(jīng)網(wǎng)絡(luò)(fully connected neural network,F(xiàn)C-NN)進(jìn)行腫塊分類。一組帶有腫塊RoI(region of interest)及其類型信息的乳腺X線圖像用于訓(xùn)練YOLO。訓(xùn)練后的基于YOLO的CAD系統(tǒng)可以檢測腫塊并將其類型分為良性或惡性。實驗結(jié)果顯示所提出的基于YOLO的CAD系統(tǒng)能夠以96.33%的整體精度檢測腫塊位置,良性和惡性病變分類準(zhǔn)確度為85.52%。Al-Masni 等人聲明該系統(tǒng)是能夠同時進(jìn)行檢測和分類的CAD 系統(tǒng),且能夠克服一些具有挑戰(zhàn)性的乳腺癌病例,例如存在于胸肌或密集區(qū)域的腫塊。YOLO網(wǎng)絡(luò)以其出色的檢測速度而廣受歡迎,YOLOv3[100]的速度比RCNN快1 000倍,比Faster R-CNN快100倍。Djebbar等人[101]使用YOLOv3 網(wǎng)絡(luò)對腫塊進(jìn)行檢測和分類,對DDSM數(shù)據(jù)集進(jìn)行擴充,最后實驗整體的檢測精度達(dá)到99.7%,良性和惡性病變分類精度達(dá)到97.0%。

有時由于高昂的成本和放射線專家的缺乏,導(dǎo)致乳腺X線圖像并不包括專業(yè)醫(yī)生標(biāo)注的病變的位置信息,輸入的數(shù)據(jù)只有圖像中病變類別的注釋信息,這樣的訓(xùn)練稱為弱監(jiān)督學(xué)習(xí)。Choukroun 等人[102]描述了一種弱監(jiān)督學(xué)習(xí)系統(tǒng)。提出的方法主要利用深層多實例學(xué)習(xí)(multiple instance learning,MIL)卷積神經(jīng)網(wǎng)絡(luò),通過全分辨率處理乳腺X 線圖像。這種方法僅需要提供整個圖像的標(biāo)簽,就可以根據(jù)評分對整個圖像進(jìn)行分類,并在弱標(biāo)簽數(shù)據(jù)集上進(jìn)行訓(xùn)練的同時以全分辨率定位病變。該方法在INbreast 數(shù)據(jù)集和不公開的數(shù)據(jù)集上進(jìn)行了驗證,得到了理想的檢測和分類結(jié)果。Hwang等人[103]提出一種弱監(jiān)督的自遷移學(xué)習(xí)框架(self-transfer learning,STL)。該框架使用加權(quán)損失函數(shù)作為目標(biāo)函數(shù)共同學(xué)習(xí)分類器和定位器,隨著訓(xùn)練的不斷進(jìn)行,增加定位器與訓(xùn)練器的訓(xùn)練比重,防止定位器陷入局部最優(yōu)狀態(tài)。STL框架不需要在圖像上標(biāo)注位置信息,僅在圖像級標(biāo)記的數(shù)據(jù)集下即可實現(xiàn)RoI的準(zhǔn)確定位,也不需要任何類型的預(yù)訓(xùn)練網(wǎng)絡(luò),而且分類網(wǎng)絡(luò)和本地化網(wǎng)絡(luò)之間的權(quán)重共享。實驗結(jié)果顯示STL 框架在分類與定位檢測方面,明顯優(yōu)于其他方法。

對比傳統(tǒng)的腫塊檢測方法,深度學(xué)習(xí)方法可以省略特征提取的工作,由網(wǎng)絡(luò)根據(jù)損失函數(shù)自動優(yōu)化參數(shù),學(xué)習(xí)合適的特征,以提升檢測性能。例如一階段的YOLO網(wǎng)絡(luò)對腫塊病變進(jìn)行檢測時,不但具有較高的精度,而且對比其他網(wǎng)絡(luò)檢測速度更快。但是因為醫(yī)學(xué)影像已知數(shù)據(jù)量少,不能滿足深度學(xué)習(xí)的訓(xùn)練要求,所以遷移學(xué)習(xí)不可或缺。

3.2.2 應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的微鈣化檢測

Mordang 等人[104]為了克服微鈣化點像素與其他乳腺組織像素大類不平衡(微鈣化點像素樣本過少)的問題,采用了使用兩個CNN的強反差挖掘策略,并與當(dāng)前檢測微鈣化點效果最好的級聯(lián)分類器進(jìn)行了比較??紤]到CAD系統(tǒng)的性能受不同傳感器采集的乳腺X線圖像的噪聲特性和外觀的影響,他們使用了三個不同的數(shù)據(jù)庫。結(jié)果表明,使用CNN的CAD系統(tǒng)對微鈣化點的敏感性明顯高于使用級聯(lián)分類器的CAD系統(tǒng)。Wang等人[105]開發(fā)了一種深度神經(jīng)網(wǎng)絡(luò)(deep neural network,DNN)用于檢測乳腺X 線圖像中的微鈣化簇,該網(wǎng)絡(luò)既考慮到微鈣化的局部圖像特征,也學(xué)習(xí)到反映圖像周圍信息的上下文特征。網(wǎng)絡(luò)由兩部分組成,一部分用于提取局部特征,另一部分用于學(xué)習(xí)上下文信息。最后將兩部分提取到的特征進(jìn)行組合,對微鈣化的位置進(jìn)行定位。檢測結(jié)果說明,深度學(xué)習(xí)提取到的特征比人工制作的特征具有更好的性能。Samala 等人[106]設(shè)計了深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(deep learning convolution neural network,DLCNN),以區(qū)分乳腺X 線圖像中的真實鈣化和假陽性。用DLCNN網(wǎng)絡(luò)訓(xùn)練和測試時,數(shù)據(jù)集為手動標(biāo)記的真實微鈣化,并在排除真實鈣化的可疑區(qū)域選取假陽性,通過改變卷積層中的濾波器數(shù)量、濾波器內(nèi)核大小和梯度計算參數(shù)來選擇DLCNN 網(wǎng)絡(luò)結(jié)構(gòu)。然而選擇DLCNN網(wǎng)絡(luò)并不是簡單的問題,它的參數(shù)量眾多,因此訓(xùn)練和測試時計算時間較長,需要更高性能的計算機進(jìn)行操作。Cao等人[107]利用改進(jìn)的Faster R-CNN完成乳腺腫塊和鈣化的檢測。采用最新的焦點損失函數(shù)[108]代替Faster R-CNN 原始的損失函數(shù),以減少原始Faster R-CNN 產(chǎn)生的誤報。ResNet50 作為模型的主干網(wǎng)絡(luò),使用DDSM、INbreast和BCDR三個公共數(shù)據(jù)集和一個私人數(shù)據(jù)集中的數(shù)據(jù)隨機劃分進(jìn)行訓(xùn)練和測試。通過不同數(shù)據(jù)集之間的檢測結(jié)果的對比發(fā)現(xiàn),不同數(shù)據(jù)集之間專業(yè)醫(yī)生標(biāo)記的微鈣化的方式存在差異,會對模型的檢測準(zhǔn)確性和靈敏度有一定的影響。

由上可見,深度學(xué)習(xí)方法比傳統(tǒng)方法的特征提取能力更為顯著。由于微鈣化點非常小,在構(gòu)建微鈣化檢測網(wǎng)絡(luò)時,要重點提升網(wǎng)絡(luò)對微小目標(biāo)的檢測準(zhǔn)確率,可通過多尺度特征融合、合理的錨框設(shè)計、放大小目標(biāo)特征等方法提高小目標(biāo)檢測精度。表3 綜合比較了基于深度學(xué)習(xí)的乳腺X線圖像病變檢測方法。

表3 基于深度學(xué)習(xí)的乳腺X線圖像病變檢測方法比較Table 3 Comparison of abnormality detection methods in mammograms based on deep learning

3.3 應(yīng)用深度神經(jīng)網(wǎng)絡(luò)的乳腺X線圖像分割

Dhungel等人[109]使用了CNN與DBN結(jié)合淺層學(xué)習(xí)模型的混合模型,成功地在淺層學(xué)習(xí)模型的基礎(chǔ)上大幅度提升了對乳腺X 線圖像病變區(qū)域分割的準(zhǔn)確率。該混合模型的Dice系數(shù)為0.90,而淺層學(xué)習(xí)模型的Dice系數(shù)只有0.86。此外,Dhungel等人[110]同樣測試了DBN結(jié)合淺層學(xué)習(xí)模型對乳腺X 線圖像的分割結(jié)果,最終的Dice系數(shù)為0.88。由此可以看出DBN作為一個在結(jié)構(gòu)上包含多層非線性運算單元的概率模型,在處理圖像數(shù)據(jù)時具有更強的建模和表征能力,相比高斯混合模型的Dice系數(shù)提升了0.02。由結(jié)果可以看出,在推理和訓(xùn)練時間方面,條件隨機場(conditional random field,CRF)模型比結(jié)構(gòu)支持向量機(structured support vector machine,SSVM)快,這表明將CRF 模型與深度學(xué)習(xí)潛在特征結(jié)合使用時,具有很強的優(yōu)勢。

Kallenberg等人[111]在卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上改進(jìn)形成了卷積稀疏自編碼器(convolutional sparse autoencoder,CSAE)。這是一種無監(jiān)督的學(xué)習(xí)方式,采用了種群稀疏和存在稀疏相結(jié)合的稀疏方式,可以在未被標(biāo)記的樣本中學(xué)習(xí)到多層次的特征,在乳腺密度數(shù)據(jù)集和紋理數(shù)據(jù)集上的分割結(jié)果都遠(yuǎn)遠(yuǎn)優(yōu)于傳統(tǒng)的需要大量先驗知識的閾值分割方法,而且性能相比CNN 也有一定的提高。Petersen等人[112]提出了一種使用稀疏化激活函數(shù)的多尺度去噪自編碼器(multiscale denoising autoencoder,MS-DAE),并將其應(yīng)用于乳腺密度分割。他們通過與人工的BI-RADS 和類似Byng[113]的半自動密度評分對比,評估其方法的臨床應(yīng)用價值。結(jié)果表明,在分割任務(wù)中,多尺度去噪自編碼器可以有效自動地學(xué)習(xí)豐富的特征表示,且自動密度評分優(yōu)于人工分級。

Yan等人[114]提出了基于區(qū)域的腫塊分割技術(shù),采用嵌套和密集跳躍連接的卷積編碼器-解碼器來對候選腫塊區(qū)域進(jìn)行分割,通過一系列嵌套的密集卷積塊來建立連接,增強特征融合,防止反向傳播期間中間部分出現(xiàn)梯度消失問題,確保更好的分割精度。這樣的結(jié)構(gòu)遵循U-Net++實現(xiàn)了具有嵌套和跳躍連接的深度架構(gòu),與最近提出的條件殘差U-Net[115]、條件GAN[116]、級聯(lián)U-Net[117]一樣,都是標(biāo)準(zhǔn)U-Net[118]的擴展。它們在本質(zhì)上一樣,都是從編碼器到解碼器的快捷連接,將下采樣的特征圖與同維度上采樣的特征圖拼接,實現(xiàn)高低層次特征的融合。Min 等人[119]提出一種同時進(jìn)行乳腺X 線圖像腫塊檢測和分割的系統(tǒng),不需要人工處理。該系統(tǒng)基于多尺度形態(tài)學(xué)進(jìn)行篩選,將灰度圖轉(zhuǎn)換成偽彩色圖像,以增強可疑區(qū)域的對比度;然后利用Mask R-CNN進(jìn)行傳遞學(xué)習(xí),同時檢測和分割偽彩色圖像的腫塊,在INbreast數(shù)據(jù)集上進(jìn)行評估,Dice系數(shù)為0.88。

Cao等人[120]為了幫助醫(yī)生有效識別腫塊和鈣化,提出基于深度學(xué)習(xí)的綜合解決方案來進(jìn)行腫塊檢測和鈣化分割。對于腫塊和鈣化的檢測,首先將Faster R-CNN與特征金字塔[121]、焦點損失函數(shù)和非局部神經(jīng)網(wǎng)絡(luò)[122]相結(jié)合,將該方法與同類型的方法在三個公共數(shù)據(jù)集(CBIS-DDSM、BCDR和INbreast數(shù)據(jù)庫)和一個內(nèi)部數(shù)據(jù)集上進(jìn)行比較,最佳的檢測結(jié)果mAP=0.933,Recall=0.976。對于鈣化分割,首先設(shè)計了窗口調(diào)整、乳腺區(qū)域提取等預(yù)處理;然后進(jìn)行鈣化分割,將U-Net 模型[123]進(jìn)行組歸一化(group normalization,GN)[124],包括三個上采樣階段和三個具有跳躍連接的下采樣階段。每個階段都有兩個卷積層,每個卷積層后面都有一組歸一化和ReLU[125]。因為醫(yī)生一般對鈣化的標(biāo)注區(qū)域比實際的鈣化點要大得多,常用的交并比并不是很好的評價指標(biāo),所以該論文使用新的實驗指標(biāo)——預(yù)測交集(intersection over prediction,IoP)在內(nèi)部數(shù)據(jù)集上進(jìn)行驗證。論文將組歸一化后的U-Net模型與經(jīng)過批處理歸一化(batch normalization,BN)和層歸一化(layer normalization,LN)的U-Net模型進(jìn)行對比。當(dāng)每幅圖片的假陽性高于1 時,經(jīng)過組歸一化的U-Net 的召回率高于其他兩種類型的U-Net 網(wǎng)絡(luò),為0.737。此外,論文還根據(jù)鈣化的標(biāo)簽面積和形狀對標(biāo)簽進(jìn)行劃分,“血管”形狀的鈣化檢測結(jié)果最好,當(dāng)每幅圖片的假陽性不小于1 時,“血管”形狀的鈣化召回率為0.971,其次是大面積的鈣化,最后是點樣鈣化。實驗結(jié)果表明該方法解決了不同的放射科醫(yī)生之間由于鈣化標(biāo)注不一致和標(biāo)簽不完善導(dǎo)致的問題。

上文的U-Net網(wǎng)絡(luò)盡管使用有限的數(shù)據(jù)集訓(xùn)練,卻能在乳腺X線圖像分割中取得良好的表現(xiàn)。但是,目前對U-Net模型的改進(jìn)有限,模型的準(zhǔn)確率和穩(wěn)定性還有待進(jìn)一步提高。各種分割方法的比較見表4。

3.4 應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)的乳腺X線圖像分類

傳統(tǒng)的特征提取需要靠人工設(shè)計的特征來表達(dá)圖像中的內(nèi)容,而深度神經(jīng)網(wǎng)絡(luò)則可以自動地提取圖像中的優(yōu)質(zhì)特征,這對于乳腺X 線圖像分類來說,避免了征象不明顯和難以提取高維特征的問題,有利于對圖像中的病變進(jìn)行良惡性分類。目前已有堆棧式自編碼器和不同結(jié)構(gòu)的CNN模型被用于乳腺X線圖像中病變的良惡性分類。此外,深度學(xué)習(xí)模型大多可以和非負(fù)矩陣分解(nonnegative matrix factor,NMF)[126]、多核學(xué)習(xí)(multiple kernel learning,MKL)[127]、Liebenberg-Marquardt 學(xué)習(xí)函數(shù)[128]、支持向量機等方法相結(jié)合,從而達(dá)到優(yōu)化分類的效果。

為了解決醫(yī)學(xué)圖像數(shù)據(jù)集樣本數(shù)量偏小的問題,Carneiro 等人[129]利用未配準(zhǔn)的乳腺X 線圖像的多視圖(CC位和MLO位)以及分割后的微鈣化和腫塊區(qū)域,采用ImageNet 預(yù)訓(xùn)練單獨的CNN 模型,然后使用從分割后的圖像和多視圖中學(xué)習(xí)到的特征,訓(xùn)練最終的CNN分類器。最終,該分類器使用BI-RADS 評分來估計患者患乳腺癌的風(fēng)險,在INbreast和DDSM數(shù)據(jù)集上進(jìn)行測試,將微鈣化和腫塊病例分為良性或惡性(每個病例至少具有微鈣化或腫塊)。在INbreast數(shù)據(jù)集上的AUC=0.91±0.05,在DDSM數(shù)據(jù)集上的AUC=0.97±0.03。Arevalo等人[130]采用了CNN 結(jié)合SVM 分類器對乳腺X 線圖像中的腫塊進(jìn)行分類,得到的AUC為0.86,而利用人工提取特征結(jié)合SVM的分類方法的AUC僅僅為0.799,表明了應(yīng)用深度學(xué)習(xí)的特征提取方法,特別是CNN 的特征提取性能要優(yōu)于傳統(tǒng)的人工特征提取,其分類性能較傳統(tǒng)方法有了很大的提高。Arevalo等人[131]在他們之前工作的基礎(chǔ)上,對CNN的卷積層數(shù)進(jìn)行了調(diào)整,探索不同數(shù)量的卷積層對特征提取結(jié)果的影響,發(fā)現(xiàn)在一定程度內(nèi)加深網(wǎng)絡(luò)的深度能提升模型的分類性能。

Fonseca等人[132]采用了一種用于乳腺X線圖像的結(jié)構(gòu)搜索過程技術(shù)[133],評估了改進(jìn)型HT-L3 CNN 網(wǎng)絡(luò)的性能。網(wǎng)絡(luò)搜索空間有729個備選結(jié)構(gòu),用72小時找到了其中三種最好的結(jié)構(gòu)。使用得到的最優(yōu)結(jié)構(gòu)自動提取特征,并用其訓(xùn)練SVM 分類器。Kooi 等人[134]與Huynh 等人[135]利用遷移學(xué)習(xí)從醫(yī)學(xué)圖像中提取腫瘤信息,使用CNN 首先通過非醫(yī)學(xué)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。分類過程分為兩個階段:首先,應(yīng)用隨機森林和生成似然圖像來檢測候選區(qū)域,從而進(jìn)行進(jìn)一步檢查;然后將這些圖像用作參考系統(tǒng)和CNN 的種子點。實驗結(jié)果表明,添加位置、上下文信息等手動設(shè)計的特征能提高卷積神經(jīng)網(wǎng)絡(luò)的性能。Jiao 等人[136]使用CNN 在LSVRC(large scale visual recognition competition)圖像集上訓(xùn)練,然后使用乳腺腫塊圖像進(jìn)行微調(diào)。腫塊的特征被提取于模型的不同層次,然后通過兩個SVM分類器進(jìn)行決策,最終融合不同的決策結(jié)果來完成分類。Lévy等人[137]使用經(jīng)過遷移學(xué)習(xí)的CNN 對預(yù)分割后的腫塊進(jìn)行分類,CNN模型的層數(shù)由少到多逐漸增加。并且研究了數(shù)據(jù)增強和數(shù)據(jù)背景信息對實驗結(jié)果的影響,得出了加倍異常邊框?qū)δ[塊的二值分類有影響的結(jié)論。

Wang等人[138]采用堆棧去噪自編碼器分別在有腫塊的乳腺X 線圖像和無腫塊的乳腺X 線圖像上回顧性分析微鈣化點。使用深度學(xué)習(xí)模型對圖像進(jìn)行分割,針對腫塊和微鈣化分離或組合的這三種情況分別提取到15、26、41個微鈣化和腫塊特征。在他們的工作中輸入比較分類器的是特征而不是原始圖像,并就分類和識別乳腺病變的性能和精度與SVM、k近鄰和線性分解分析方法進(jìn)行了比較,結(jié)果表明組合的方法準(zhǔn)確度高于標(biāo)準(zhǔn)微鈣化判別方法。Bekker 等人[139]從事乳腺微鈣化簇的良惡性分類,使用CC 和MLO 兩個視圖,每個視圖的簡單分類器作為其初始決策,決策結(jié)果通過一個單神經(jīng)元層,非線性組合得到全局決策。Fotin 等人[140]采用CNN模型和傳統(tǒng)的采用直方圖、梯度、紋理和形狀特征結(jié)合決策樹的方法對乳腺X線圖像分類的特異度進(jìn)行對比,應(yīng)用CNN模型的平均感興趣區(qū)域特異度對于疑似惡性腫瘤與惡性腫瘤分別為0.893和0.930,而傳統(tǒng)的分類方法的特異度對于疑似惡性腫瘤與惡性腫瘤分別為0.832和0.852。由此可見CNN 能夠在很大程度上提高病變分類的準(zhǔn)確率、靈敏度和特異度。Dubrovina 等人[141]將組織分類應(yīng)用于胸大肌、纖維腺組織等乳腺組織分割。他們將常規(guī)CNN 的全連接層轉(zhuǎn)變?yōu)榫矸e層,通過這種方式在保持了分類精度的同時,極大地提高了運算速度。

由上可見,卷積神經(jīng)網(wǎng)絡(luò)的分類能力要優(yōu)于傳統(tǒng)方法,然而融合卷積神經(jīng)網(wǎng)絡(luò)提取的深層特征與傳統(tǒng)方法提取的特征有助于提高分類結(jié)果。在進(jìn)行腫塊與鈣化病變的良惡性分類時,將形狀、紋理等傳統(tǒng)特征與CNN模型進(jìn)行融合效果會更好。表5 將上述基于深度學(xué)習(xí)的各種乳腺X線圖像分類方法進(jìn)行對比。

表5 基于深度學(xué)習(xí)的乳腺X線圖像分類方法對比Table 5 Comparison of mammographic image classification methods based on deep learning

3.5 總結(jié)

目前,隨著計算機存儲和數(shù)據(jù)處理能力的增強,如何從大數(shù)據(jù)中挖掘出所需的信息成為首要的問題。深度學(xué)習(xí)可以充分利用大數(shù)據(jù),以有監(jiān)督和無監(jiān)督的方式學(xué)習(xí)數(shù)據(jù)特征,成為大數(shù)據(jù)時代的強大推動力?!按髷?shù)據(jù)+深度學(xué)習(xí)模型”目前已成為研究熱點,未來將應(yīng)用于各個領(lǐng)域。而對于乳腺X線圖像分析而言,一個重要的問題則是大規(guī)模數(shù)據(jù)集的收集,有限的數(shù)據(jù)量成為深度學(xué)習(xí)在乳腺X 線圖像計算機輔助診斷中的發(fā)展阻礙。許多研究者已嘗試應(yīng)用數(shù)據(jù)增廣、遷移學(xué)習(xí)、小樣本學(xué)習(xí)等方法解決數(shù)據(jù)缺乏的問題。

此外,深度學(xué)習(xí)依賴于含有多隱藏層的人工神經(jīng)網(wǎng)絡(luò),如何衡量分析精度和網(wǎng)絡(luò)運行復(fù)雜度之間的關(guān)系也是今后研究的一個方向。為了更好地提取特征,有效的訓(xùn)練算法和持續(xù)的優(yōu)化策略,設(shè)定和微調(diào)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)在深度學(xué)習(xí)中對于特征學(xué)習(xí)非常重要[142]。算法自身的改進(jìn)和硬件系統(tǒng)性能的提升,結(jié)合復(fù)雜推理表示學(xué)習(xí)的系統(tǒng),引入操作大量向量的新范式來代替基于規(guī)則的表達(dá)式操作,與其他方法的融合等,都能使深度學(xué)習(xí)的能力得到提升。

醫(yī)學(xué)圖像CAD系統(tǒng)為臨床醫(yī)生提供具有參考價值的輔助信息,可以幫助臨床醫(yī)生快速、準(zhǔn)確、高效地做出診斷決策。作為機器學(xué)習(xí)領(lǐng)域的新興技術(shù),深度學(xué)習(xí)可在很大程度上改進(jìn)淺層學(xué)習(xí)中存在的問題,大幅提高CAD 系統(tǒng)對醫(yī)學(xué)圖像特征學(xué)習(xí)的能力。因此,深度學(xué)習(xí)應(yīng)用于乳腺X 線圖像CAD 系統(tǒng),將成為乳腺X 線圖像計算機輔助診斷技術(shù)發(fā)展的新方向。

4 總結(jié)與前景展望

乳腺X線圖像分析作為醫(yī)學(xué)圖像分析的一個分支,有著和大多病癥相似卻又不同的處理方式。病理的復(fù)雜性和病灶X線表現(xiàn)的差異性,使得人們需要在專門的領(lǐng)域研究相關(guān)的圖像處理技術(shù)和病變診斷技術(shù)。本文從傳統(tǒng)方法和深度學(xué)習(xí)兩方面全面綜述和分析了乳腺X 線圖像計算機輔助診斷技術(shù)的發(fā)展現(xiàn)狀。首先討論了應(yīng)用傳統(tǒng)方法的乳腺X線圖像分析中的病變檢測、分割和分類方法;之后從深度學(xué)習(xí)的基本理論出發(fā),結(jié)合乳腺X線圖像分析領(lǐng)域這一應(yīng)用方向,探討深度學(xué)習(xí)在乳腺X線圖像分析方面的應(yīng)用潛力;隨后介紹了幾種常見的深度神經(jīng)網(wǎng)絡(luò),在此基礎(chǔ)上結(jié)合深度學(xué)習(xí)在乳腺X線圖像病變檢測、分割和分類等方面的應(yīng)用,闡述了深度學(xué)習(xí)的優(yōu)勢。

隨著乳腺X 線圖像計算機輔助診斷技術(shù)研究的深入,目前的研究還存在以下問題或改進(jìn)方向:

(1)應(yīng)用傳統(tǒng)方法的乳腺X線圖像計算機輔助診斷技術(shù)在特征提取方面存在瓶頸。傳統(tǒng)方法以定義提取有效的特征為前提,不需要復(fù)雜的訓(xùn)練過程,可以快速地進(jìn)行結(jié)果預(yù)測,但是傳統(tǒng)方法只提取了圖像的淺層特征,對于具有不同密度特征的乳腺組織,產(chǎn)生了大量的不確定信息。另外,傳統(tǒng)方法一般只提取一種或者幾種人工設(shè)計的特征,泛化能力低,不能應(yīng)用在其他的數(shù)據(jù)集中,模型的魯棒性差。將不同的模型提取的特征進(jìn)行融合,可以彌補模型自身的局限性,結(jié)合不同的特征可以更好地擬合出病變特點,但是其算法復(fù)雜度增加,還可能出現(xiàn)過擬合的情況。

(2)乳腺X 線圖像病變區(qū)域和正常組織對比度較低。乳腺病變周圍組織形式豐富(如致密組織、胸肌組織等),乳腺腫塊可能隱藏在周圍腺體中,在檢測時容易受到噪聲和周圍組織的影響。因此無論是傳統(tǒng)方法還是深度學(xué)習(xí)方法,在檢測前對圖像進(jìn)行對比度增強等預(yù)處理是十分必要的。在預(yù)處理過程中還要注意在減少噪聲的同時,增強圖像的視覺效果,保留圖像中的微小病變。

(3)醫(yī)生對乳腺X 線圖像中病變的標(biāo)注習(xí)慣不同,缺乏標(biāo)準(zhǔn)的標(biāo)注信息。例如,參考已知的數(shù)據(jù)集,乳腺微鈣化標(biāo)注的信息參差不齊,微鈣化的標(biāo)注信息很大程度上取決于放射科醫(yī)生標(biāo)記的偏好,對于聚集在一起的微鈣化點,有的醫(yī)生偏好標(biāo)成一處,有的醫(yī)生將它們標(biāo)記成小點。這種情況限制了模型的學(xué)習(xí),影響模型的準(zhǔn)確率和靈敏度。

(4)缺乏大型公開的、已經(jīng)標(biāo)注的高質(zhì)量乳腺X 線圖像數(shù)據(jù)庫。無論是深度學(xué)習(xí)方法還是傳統(tǒng)方法,都需要大量的標(biāo)注后的數(shù)據(jù)進(jìn)行訓(xùn)練。如何利用無監(jiān)督或者半監(jiān)督學(xué)習(xí)、小樣本學(xué)習(xí)、數(shù)據(jù)增廣以及遷移學(xué)習(xí)等方式緩解目前數(shù)據(jù)匱乏的問題,是深度學(xué)習(xí)方法在乳腺X線圖像分析應(yīng)用中的一個研究方向。

(5)人工定義特征與深度特征的融合或有助于提高深度學(xué)習(xí)模型性能。利用傳統(tǒng)方法提取人工定義的病變的顯著特征,并將其遷移到深度學(xué)習(xí)模型進(jìn)行分析,比使用單一方法效果要好。針對醫(yī)學(xué)圖像來說,相對于速度而言,模型檢測或分類的準(zhǔn)確率和精度是非常重要的評價指標(biāo)。

對于逐年升高的乳腺癌發(fā)病率和死亡率,女性對于乳腺癌的篩查意識也在提高。乳腺X 線圖像計算機輔助診斷技術(shù)可輔助放射科醫(yī)生做出更準(zhǔn)確的診斷,結(jié)合BI-RADS分級標(biāo)準(zhǔn)對乳腺X線圖像進(jìn)行評估,有效降低醫(yī)生閱片的壓力以及不同醫(yī)生之間診斷的差異,從而提高乳腺癌診斷的效率和準(zhǔn)確率,使更多的患者得以早發(fā)現(xiàn)、早治療,進(jìn)而降低患者的死亡率。

在未來,隨著深度學(xué)習(xí)理論研究的不斷深入,可以對深度學(xué)習(xí)的高級語義特征進(jìn)行更具體的分析,加上獲取到大規(guī)模的高質(zhì)量數(shù)據(jù)集,利用先進(jìn)的網(wǎng)絡(luò)模型對病變的檢測和分類診斷性能會有大幅度的提升。因此,應(yīng)用人工智能技術(shù)的醫(yī)學(xué)圖像分析與診斷,特別是乳腺X線計算機輔助診斷技術(shù)具有廣闊的發(fā)展空間和研究價值,需要科研人員繼續(xù)探索和努力。

猜你喜歡
腫塊乳腺卷積
乳腺結(jié)節(jié)狀病變的MRI診斷
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
頸部腫塊256例臨床診治分析
乳腺假血管瘤樣間質(zhì)增生1例并文獻(xiàn)復(fù)習(xí)
卷積神經(jīng)網(wǎng)絡(luò)的分析與設(shè)計
從濾波器理解卷積
乳房有腫塊、隱隱作痛,怎么辦
體檢查出乳腺增生或結(jié)節(jié),該怎么辦
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
紅外乳腺治療儀治療乳腺增生的療效觀察