潘德潤 秦耿耿 陳衛(wèi)國*
乳腺癌是全球女性最常見的癌癥,也是女性癌癥死亡的主要原因[1]。乳腺癌如能在早期發(fā)現(xiàn)并及時治療,其治療效果也是惡性腫瘤中最佳的[2]。乳腺X線攝影是乳腺癌篩查和診斷的主要手段,可協(xié)助臨床醫(yī)生早期發(fā)現(xiàn)并及時治療乳腺癌,從而顯著降低其死亡率[3-4]。乳腺X線影像診斷通常是通過放射科醫(yī)生瀏覽每幅影像,從中識別出腫塊、鈣化、結(jié)構(gòu)扭曲及非對稱致密影等常見異常征象,同時還需要結(jié)合病人的臨床信息,這要耗費醫(yī)生大量的精力。2006年,Hinton等[5]提出了“深度學習”的概念,它源于對人工神經(jīng)網(wǎng)絡(luò)的研究,含有多個隱藏層的多層感知器是一種深度學習結(jié)構(gòu),能夠通過模擬人腦的層次結(jié)構(gòu)將數(shù)據(jù)從低層傳遞到高層,為最終的表示引入更多的語義信息[6]。深度學習方法已在文本、語音識別及自然圖像的分類、檢測等方面取得了重大突破[7-8]。因此,針對醫(yī)學影像(非自然圖像)領(lǐng)域開發(fā)出基于深度學習的計算機輔助診斷(computer aided diagnosis,CAD)系統(tǒng),為放射科醫(yī)生提供診斷的第二意見,以提高診斷敏感性和特異性[9-10],這對于乳腺癌的早期篩查及診斷尤為重要。
基于深度學習的計算機乳腺癌輔助檢測/診斷系統(tǒng)對于數(shù)據(jù)的需求是很大的,在設(shè)計、評估和調(diào)整CAD系統(tǒng)的過程中,研究人員往往需要大量的數(shù)字化乳腺X線圖像[11],它們對于比較不同研究的結(jié)果也很重要[12-13],公開的數(shù)據(jù)集可以為研究人員開發(fā)、評估和對比評價提供一個共同基礎(chǔ)。
1.1 乳腺X線攝影數(shù)字化數(shù)據(jù)集 (digital database for screening mammography,DDSM) DDSM是目前最大的乳腺X線圖像公共數(shù)據(jù)集,也最為常用[14]。該數(shù)據(jù)集是由南佛羅里達大學等機構(gòu)收集了1988—1999年2 620例病例,共10 480幅圖像。數(shù)字化圖像是通過掃描膠片獲得的,格式為無損JPEG格式,圖像大小為3 000×4 800像素,分辨率為42μm,包括內(nèi)外斜位(medial lateral oblique view,MLO)和頭尾位(carnio-caudal view,CC)視圖,具有正常、良性和惡性病變的圖像,異常病例均含有像素水平的標簽。它還包含每個興趣區(qū)(ROI)的類型,如鈣化或腫塊,大多數(shù)乳腺X線圖像只包含一個ROI。DDSM包含病人的年齡、乳腺密度和乳腺影像報告和數(shù)據(jù)系統(tǒng) (breast imaging reporting and data system,BIRADS)注釋,圖像注釋中還包括病灶在像素水平上的邊界。用戶可在 DDSM數(shù)據(jù)集的網(wǎng)頁(http://marathon.csee.usf.edu/Mammography/Database.html)上使用搜索引擎定義乳腺密度、掃描設(shè)備、病變病理及BI-RADS評估等關(guān)鍵詞來搜索符合標準的病例。DDSM的主要用途是促進CAD算法之間的比較[15]。另外,一些研究者[16-17]經(jīng)過驗證指出DDSM的精確度不適用于驗證分割算法。
1.2 INbreast數(shù)據(jù)集 INbreast是公開可用的全視野數(shù)字乳腺X線攝影 (full-field digital mammography,FFDM)數(shù)據(jù)集(http://medicalresearch.inescporto.pt/breastresearch/GetINbreastDatabase.html), 由波爾圖CHSJ乳腺中心提供。該數(shù)據(jù)集包括篩查、診斷和隨訪病例的圖像。圖像于2008年4月—2010年7月期間獲得,共115例病例,其中90例有每側(cè)乳腺2個體位(MLO和CC)的圖像,其余25例為乳腺切除術(shù)的女性,僅有單側(cè)乳腺的2個體位的圖像,共410幅圖像。圖像大小根據(jù)病人乳腺大小分為3 328×4 084或2 560×3 328像素,分辨率為70μm,保存為DICOM格式,同一病人圖像之間的對應(yīng)關(guān)系與隨機生成的病人身份標識一起保存。該數(shù)據(jù)集包含正常圖像,含有腫塊和鈣化、結(jié)構(gòu)扭曲、非對稱致密影及多種異常征象的乳腺X線圖像,此外還提供了病人的年齡、家族史、乳腺密度和BI-RADS分類的信息。INbreast數(shù)據(jù)集的優(yōu)點是具備精確的輪廓注釋,便于對評估腫塊形態(tài)的算法進行訓練及驗證。
1.3 乳腺X線圖像分析協(xié)會數(shù)據(jù)集(mammographic image analysis society,MIAS) MIAS的數(shù)字化圖像數(shù)據(jù)集是最早的公共數(shù)據(jù)集(https://www.repository.cam.ac.uk/handle/1810/250394)[18], 目前仍被廣泛應(yīng)用于研究中。該數(shù)據(jù)集包含161例病例,322幅數(shù)字化MLO圖像,原始圖像由分辨率為50μm的膠片掃描獲得,然后經(jīng)過縮小、剪裁后得到1 024×1 024像素的圖像,格式為PNG。該數(shù)據(jù)集包含正常圖像以及良性、惡性病變的多種征象圖像,具有毛刺腫塊的圖像在數(shù)據(jù)集中占很高的比例。
在這3種數(shù)據(jù)集中,DDSM具有豐富的病例類型,可以很好地訓練深度學習模型,但它的數(shù)字化圖像是通過掃描膠片獲得的,會產(chǎn)生一些偽影,且精確度不足[19],會將某些目標像素錯誤地分配給背景而影響準確度。而INbreast為FFDM數(shù)據(jù)集,具有精確的輪廓注釋,但病例數(shù)量相對較少。MIAS數(shù)據(jù)集的缺點是數(shù)字化圖像的對比度分辨率較低。
最近,一些研究人員和賽智生物網(wǎng)絡(luò)等組織發(fā)起了乳腺數(shù)字化夢想挑戰(zhàn) (DREAM Challenge),挑戰(zhàn)分為2個項目[20]:①開發(fā)一種可以分析數(shù)字乳腺X線圖像的預(yù)測算法;②開發(fā)能夠同時分析數(shù)字乳腺X線圖像和臨床信息的預(yù)測算法。他們收集了超過640 000幅乳腺X線圖像作為競賽數(shù)據(jù)集,并與病人的臨床數(shù)據(jù)和標準結(jié)果關(guān)聯(lián),挑戰(zhàn)數(shù)據(jù)集不包含ROI的注釋。挑戰(zhàn)者利用數(shù)字化圖像和臨床數(shù)據(jù)集來開發(fā)預(yù)測模型,提交的模型將通過驗證數(shù)據(jù)集進行評分。該競賽的獲勝團隊在DDSM和DREAM挑 戰(zhàn) 數(shù) 據(jù) 集 (https://www.synapse.org/Digital_Mammography_DREAM_Challenge)上分多個階段對深度卷積神經(jīng)網(wǎng)絡(luò)進行訓練,他們用改進后的視覺幾何組(visual geometry group,VGG)網(wǎng)絡(luò)在以病灶為中心的補丁中對檢測器網(wǎng)絡(luò)進行預(yù)訓練,然后以完全卷積的方式將其插入更大的網(wǎng)絡(luò)中,并以端到端的方式在完整圖像上對網(wǎng)絡(luò)進行微調(diào)。該團隊的預(yù)測模型在2個挑戰(zhàn)項目中分別達到了80.3%和80.4%的準確度。
該競賽創(chuàng)造了一個數(shù)據(jù)訪問簡單的開放社區(qū),同時激勵參賽者共同協(xié)作并實時共享結(jié)果,從中選拔出性能優(yōu)異的深度學習技術(shù)及分類器,這無疑在很大程度上加快了深度學習技術(shù)在乳腺癌篩查領(lǐng)域的發(fā)展速度。
隨著深度學習的發(fā)展,目前已經(jīng)有許多研究者采用深度學習方法來構(gòu)建新型CAD系統(tǒng)[21-22]。同機器學習方法一樣,深度學習也分為監(jiān)督學習與非監(jiān)督學習。如卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)就是一種監(jiān)督學習下的深度學習模型,而深度置信網(wǎng)絡(luò)(deep belief nets,DBN)是一種非監(jiān)督學習下的深度學習模型?;贑NN的模型往往需要對ROI進行詳細的注釋[23-24],這耗費了大量的時間和費用,在監(jiān)督學習尤其是醫(yī)學成像方面造成了很大的困難。因此,一些研究者對弱監(jiān)督學習方法進行了研究[25-26],如多示例學習(multiple instance learning,MIL),它僅需要研究者提供整幅圖像的標簽,大大減少了訓練成本。
3.1 CNN CNN是深度學習模型的代表性結(jié)構(gòu),也是目前深度學習的研究熱點。它是一種前饋型人工神經(jīng)網(wǎng)絡(luò)[6],具有多層網(wǎng)絡(luò)結(jié)構(gòu),通常包含輸入層、卷積層、激活函數(shù)、池化層和全連接層。
CNN具有強大的特征提取能力,可以提取較高等級的特征。Jiao等[6]在2016年開發(fā)了基于CNN的CAD系統(tǒng),對乳腺癌的腫塊進行了分類。它主要包含一個CNN和一個決策機制。在訓練過程中,用CNN提取了高級別和中等級別的特征,組合后對模型進行訓練,并且將CNN自動提取的強度信息與深度特征結(jié)合起來,從而更好地模擬醫(yī)生的診斷過程,取得了較好的效果。
另一方面,一些研究者研發(fā)了基于CNN的變型技術(shù)。2017年,Al-Masni等[27]提出了一種以區(qū)域深度學習技術(shù)為基礎(chǔ)的CAD系統(tǒng),該技術(shù)是一種基于ROI的 CNN,稱之為 YOLO(You Only Look Once)。YOLO是一種代表性的端到端訓練算法,它在具有ROI信息的乳腺X線圖像數(shù)據(jù)集中進行訓練,并直接優(yōu)化檢測性能。此外,YOLO學習目標的概括性表示具有很強的通用性,可以同時檢測多種目標。YOLO還可以同時學習ROI和背景,因此他們提出的CAD系統(tǒng)可以在一個CNN中完成特征提取并對乳腺腫塊檢測和分類,是一種快速、準確的目標檢測器[28]。
還有一些研究者提出了減弱對ROI注釋依賴性的CNN。Li等[20]采用全卷積設(shè)計開發(fā)了一種對完整乳腺X線圖像進行乳腺癌診斷的端到端訓練算法。該算法完全使用CNN,因此可以輸入任意大小的圖像。此外,它只需要在訓練的第一階段對病變進行注釋,訓練模型識別局部補丁后,就可以將完整圖像分類網(wǎng)絡(luò)的權(quán)重初始化,之后該模型即可遷移為一個全圖分類器,可在沒有ROI注釋的情況下進行端到端訓練,這大大減少了對病變注釋的依賴性。與以往的方法相比,這種設(shè)計簡單且性能更加優(yōu)越。
3.2 MIL MIL是一種弱監(jiān)督學習方法,它是監(jiān)督學習的變體,將圖像表示為多示例包,基于包成分標簽進行分類[29-30],這樣避免了對詳細的醫(yī)學圖像注釋的需求,大大降低了訓練成本?!鞍焙锌勺償?shù)量的示例(補?。?,即使只有其中一個示例屬于陽性,包也會被標記為陽性。只有當包中所有示例均為陰性時才會被標記為陰性。MIL的目標是僅基于訓練階段的包標簽來分類未知的包或示例。
2016年,Quellec等[31]提出了一種新型的乳腺X線圖像計算機輔助檢測與診斷系統(tǒng),該系統(tǒng)依賴MIL范例,僅使用整體圖像水平的標簽。他們首先將乳腺自適應(yīng)地分割為多個區(qū)域,然后從每個區(qū)域中提取檢測到的病變特征并合并,進而把乳腺X線圖像分類為正?;虍惓?。2017年,Choukroun等[10]描述了弱監(jiān)督學習的計算機輔助檢測和診斷系統(tǒng),通過一個建立于MIL范例上的新型深度學習框架解決了乳腺X線圖像異常結(jié)果的檢測和分類問題。他們首先將圖像分解為多個示例,通過選擇最高陽性概率的示例完成檢測任務(wù),另外每個示例通過預(yù)訓練網(wǎng)絡(luò)產(chǎn)生一個特征向量,然后預(yù)測其類別概率,最后將所有示例的概率匯總得出整個“包”的類別概率。該方法的特點是可以用MIL自動發(fā)現(xiàn)乳腺X線圖像中的判別性示例。該系統(tǒng)的結(jié)果可與在完全注釋的數(shù)據(jù)集中進行訓練的監(jiān)督方法相媲美。Zhu等[32]也提出一種端到端訓練的深度MIL神經(jīng)網(wǎng)絡(luò),用于在沒有ROI注釋的情況下對乳腺X線圖像進行分類。其目標是預(yù)測整個乳腺X線圖像中是否包含惡性腫塊。該研究同時使用了CNN來高效地獲取所有示例的特征。
3.3 DBN DBN是根據(jù)生物神經(jīng)網(wǎng)絡(luò)的研究及淺層神經(jīng)網(wǎng)絡(luò)發(fā)展而來的,屬于雙向深度網(wǎng)絡(luò)[33]。DBN由多層神經(jīng)元構(gòu)成,其關(guān)鍵組成元件是受限玻爾茲曼機。2016年,Dhungel等[34]使用一種深度學習和隨機森林識別器級聯(lián)的算法來檢測乳腺X線圖像中的可疑區(qū)域,該算法的第一階段由多尺度DBN[5]級聯(lián)高斯混合模型[35]組成,網(wǎng)絡(luò)選出候選區(qū)域后由深度CNN進一步處理,篩選出的區(qū)域由隨機森林分類器進行分析。2017年,Al-Antari等[36]提出了一種基于DBN進行乳腺癌診斷的CAD系統(tǒng),該系統(tǒng)包括腫塊自動檢測、ROI提取、特征提取和DBN分類模塊,其目標是識別正常、良性和惡性乳腺組織。他們首先通過無監(jiān)督學習對受限玻爾茲曼機進行預(yù)訓練,然后根據(jù)反向傳播算法來調(diào)整權(quán)重并微調(diào)該網(wǎng)絡(luò)。DBN的優(yōu)點是可以利用所有提取的特征,并從中選擇突出特征,研究結(jié)果表明該網(wǎng)絡(luò)比傳統(tǒng)的CAD系統(tǒng)具有更高的準確度。
深度學習技術(shù)在乳腺癌影像篩查領(lǐng)域已經(jīng)有了諸多進展。傳統(tǒng)的CAD系統(tǒng)沒有深度網(wǎng)絡(luò),系統(tǒng)性能較差,僅能提取淺層特征。而近期提出的深度學習在乳腺癌篩查的應(yīng)用中已經(jīng)能夠逐漸接近經(jīng)驗豐富的放射科醫(yī)師的診斷水平[37]。然而,目前的深度學習技術(shù)對ROI注釋的依賴性還沒有得到很好的解決,因此未來幾年可能會有更多關(guān)于減弱對ROI注釋需求的深度學習技術(shù)的研究。另一方面,對MIL和DBN領(lǐng)域的研究相對較少,盡管它們避免了注釋ROI的繁瑣工作,但其系統(tǒng)性能尚待提高。還有研究者[32,34]將多種深度學習技術(shù)聯(lián)合運用,對乳腺X線圖像中可疑區(qū)域進行檢測和分類,這在一定程度上改善了模型的性能。此外,還需創(chuàng)建大型公共可用的數(shù)據(jù)集,使其圖像具有較高的精確度、分辨率及多樣性的特點,這將有助于訓練出性能優(yōu)越的CAD模型。