仵晨陽 何 瑤
(西安郵電大學計算機學院 西安 710121)
食管癌(Esophageal Cancer,EC)是消化系統(tǒng)的惡性腫瘤,在世界范圍內(nèi)的不同的國家和地區(qū),它的發(fā)病率以及死亡率差別較大。
2018年世界癌癥的統(tǒng)計中估計[1],全球癌癥病發(fā)約有1270萬例,其中有760萬例患者死亡。美國癌癥協(xié)會估計[2],預計2019 年,美國的癌癥病發(fā)將約為176萬例,以及死亡患者約為60萬例。通過我國國家中央癌癥登記處提供的高質量數(shù)據(jù)可知[3],2015 年將有新發(fā)癌癥約429 萬例,以及約281 萬例的癌癥死亡;其中肺癌、食道癌、肝癌和胃癌是死亡的主要原因。我國在2017 年[4]的癌癥病例約380萬例,農(nóng)村地區(qū)的癌癥死亡率高于城市地區(qū)(110.3 vs.102.5)。國內(nèi)外流行病學研究表明,遺傳因素、生活習慣、致癌化學物質的暴露頻率和外界生物因素等均可引起食管癌的發(fā)生[5~7]。在食管癌的發(fā)病人群中,其西方國家的人群主要是患以腺癌為主,而在亞洲人群中,特別是中國人群,主要患以鱗狀細胞癌為主,即食管癌鱗癌,主要占90%以上[8]。而在本文中主要研究的是食管鱗癌。
而對于食管癌的檢查和診斷方法的廣泛關注,這導致與食道癌相關的醫(yī)學圖像數(shù)量的顯著增加,同時增加了放射科醫(yī)師篩查和診斷的負擔。因此,這就需要一種改進食管癌診斷水平的方法[9~10]。而計算機輔助診斷技術(Computer-Aided Diagnosis,CAD)則成為了生物醫(yī)學研究的重點[11~12],使用計算機輔助診斷醫(yī)學影像可以幫助醫(yī)生準確判斷疾病的類型以及病灶的區(qū)域,提高閱片效率。
本文的目的是基于食管癌的X 線醫(yī)學圖像,研究食管癌病灶的分割方法。根據(jù)食管癌X 線醫(yī)學圖像的特點,首先對食管癌的病灶區(qū)域利用傳統(tǒng)分割技術JSEG算法、分水嶺算法、N-Cuts算法以及深度分割網(wǎng)絡-U-Net 網(wǎng)絡[13]進行分割;然后利用分割結果較好的U-Net 網(wǎng)絡結合插值算法進行分割輪廓的改進,為了得到更精準的食管癌病灶區(qū)域,這樣對以后的食管癌病灶類別的研究奠定了基礎。
本文將食管癌X 射線醫(yī)學影像作為實驗對象,其中根據(jù)食管癌病理形態(tài)和X射線的特點,一般將其分為縮窄型、蕈傘型、潰瘍型和髓質型這四類。
食管癌圖像前景和背景較為簡單,但不同個體的食管癌病灶部分及病灶于管腔的位置差異會很大,因此提高分割精度也并非易事。而本文主要針對食管癌圖像的分割進行研究,其中主要有以下兩個部分:一是基于食管癌影像的做U-Net網(wǎng)絡的分割研究,去除骨骼組織的干擾;二是對分割結果做進一步的改進,改善了U-Net網(wǎng)絡的分割線上小區(qū)域的分離點的缺點,分割出完整的、清晰的、不失真的病灶區(qū)域,最大限度地保留了病灶信息的完整性。具體過程如圖1所示。
圖1 整體框架圖
JSEG 算 法 是 由Deng 和Manjunath[14~15]提 出 的基于圖像的顏色和紋理的彩色圖像的分割算法,該算法充分地考慮了圖像顏色的相似性和空間分布等因素。其分割算法主要包含了兩個步驟:顏色量化和空間分割。顏色量化過程實質上減少了圖像中原始顏色的數(shù)量,從而降低了算法的復雜性??臻g分割階段主要包括種子選擇,區(qū)域增長和區(qū)域合并等階段。此過程中的食管癌分割結果如圖2(b)所示。
分水嶺算法是由L.Vincent[16]所提出的基于數(shù)學形態(tài)學以及拓撲理論的圖像分割方法。該算法是利用灰度表示地貌高。而在食管癌圖像病灶的分割中,我們可以利用灰度和地貌之間的相似性來類比,來研究食管癌圖像的灰度的空間變化。分水嶺算法具有較強的邊緣檢測能力,并且對圖像中顯示的細小邊緣也表現(xiàn)出良好的分割效果。其分割結果如圖2(c)所示。
Normalized cut(N-cut)方法是由Shi J 和Malik J[17]提出的基于圖劃分(Graph partitioning)的語義分割方法之一。通常,基于圖劃分的語義分割方法將食管癌的病灶圖像抽象為圖(Graph)G={V,E,W},V 為圖節(jié)點的集合,E 是兩個節(jié)點之間的邊集,W(i,j)為兩個節(jié)點之間的權重集。然后使用基于圖理論中的理論及算法對食管癌圖像的病灶區(qū)域進行語義分割。通過這個過程得到的食管癌分割結果如圖2(d)所示。
圖2 傳統(tǒng)分割算法的分割過程
本文中使用U-Net 網(wǎng)絡對食管癌圖像進行管腔及病灶區(qū)域的進行分割,U-Net 網(wǎng)絡結構,也叫做編碼器-解碼器結構。U-Net分割網(wǎng)絡具體是由收縮路徑(contracting path)和擴張路徑(expanding path)組成,如圖3(a)所示。在網(wǎng)絡中,其收縮路徑被用來獲取食管癌圖像中病灶區(qū)域的上下文信息(context),擴張路徑被用來對對食管癌圖像中的病灶區(qū)域進行精確的定位(localization),而且這兩條路徑相互對稱,該網(wǎng)絡的優(yōu)勢為能夠用極少食管癌圖像進行端對端訓練。U-net網(wǎng)絡中使用完全不同的圖像特征融合方法:拼接。
由于U-Net網(wǎng)絡輸出的食管癌分割圖像,在病灶部分,或者在食管與骨骼相接的部分,沒有很好地達到預期分割效果,使其輪廓圖小部分的不連續(xù)。為了改善U-Net 網(wǎng)絡輸出的分割線上小區(qū)域的分離點的缺點,本文提出U-Net網(wǎng)絡結合插值法的方法,以改善分割結果,使其最大限度地得到其連續(xù)的病灶輪廓,如圖3(b)所示。而基于曲線或者直線的插值過程就是在其間斷的兩點間尋找到符合其線條規(guī)律的數(shù)值的過程,這個過程僅需要對分割線的小區(qū)域分離點進行插值填充。并且此過程不同于擬合的操作,插值函數(shù)是要經(jīng)過原本樣本數(shù)據(jù)點,而擬合函數(shù)則是盡可能地尋找使新的數(shù)據(jù)點逼近其他樣本點的過程。為達到本文的預期效果,在食管癌影像的小部分病灶沒有分割到的情況下,采用插值法得到它的預期分割位置。
圖3 U-Net網(wǎng)絡對比圖
常用的四種插值方法分別是:最近鄰插值法、線性插值法、二次插值法以及三次插值法。在本文中,分別對這四種插值方法進行研究,并且通過實驗對比分析,得出與U-Net網(wǎng)絡相結合的最優(yōu)的分割算法。
在基于U-Net 網(wǎng)絡和U-Net 網(wǎng)絡結合插值法的食管癌圖像分割之后,對于如何量化對圖像分割結果的評價,本文采用了以下四個指標。
GT(ground truth)圖像:理論分割結果的圖像,用于與結果圖像進行比較。本文所用的GT圖像是通過課題組成員手工勾畫出來,作為理論值。
分割精度:分割出的精確區(qū)域占GT 圖像中實際區(qū)域的百分比,計算公式如式(1)所示。
其中Rs為課題組成員手工勾畫出的分割圖像的參考區(qū)域,Ts表示通過算法分割獲得到的圖像的實際區(qū)域,|Rs-Ts|表示不正確劃分的像素數(shù)量。
過分割率:分割在GT 圖像參考區(qū)域之外的像素點的比率,且計算公式如式(2)所示。
其中Os為本不應該包含在分割結果中的像素數(shù),但實際上是分割結果中的像素數(shù)。
欠分割率:分割在GT 圖像參考區(qū)域中缺失的像素比率,且計算的公式如式(3)所示。
其中Us為本應包含在分割結果中的像素數(shù),但實際不包含在分割結果中的像素數(shù)。
IOU:是由模型生成的目標窗口與原標記窗口之間的重疊率,即分割結果Ts與GT 圖像理論值Rs交集比上其并集。計算的公式如式(4)所示。
將上文所描述的傳統(tǒng)分割算法JSEG 算法、分水嶺算法、N-Cuts算法和U-Net網(wǎng)絡分割技術作對比,選取一種更適合食管癌圖像分割的算法。分割結果如圖4所示。
圖4 多種分割算法的結果對比
由圖4 可以直觀看出,U-Net 網(wǎng)絡相較于其他傳統(tǒng)的分割算法,對于食管癌圖像的分割效果較好。由于病灶外的骨骼組織的干擾,JSEG 算法、分水嶺算法以及N-Cuts 算法都在骨骼和食管輪廓模糊的部分,沒有達到很好的分離效果,舍棄掉了部分管腔邊緣的信息,而U-Net網(wǎng)絡可以達到在模糊部分較好的分割效果??梢钥闯?,在U-Net網(wǎng)絡的分割線上還有小區(qū)域的分離點,這就需要在此結果上對其進行進一步改進。
將U-Net網(wǎng)絡與插值法相結合,可以消除小區(qū)域的分離點,得到連續(xù)的分割圖像,達到提高分割效率的目的。實驗中將U-Net 網(wǎng)絡結合最近鄰插值法的方法記為U-Net_NNI,U-Net 網(wǎng)絡結合線性插值法的方法記為U-Net_LI,U-Net網(wǎng)絡結合二次插值法的方法記為U-Net_QI,U-Net網(wǎng)絡結合三次插值法的方法記為U-Net_CI。
Net 網(wǎng)絡訓練食管癌分割模型的過程中,采用45 張圖片進行訓練,剩余圖片進行測試,模型迭代100 次,模型準確率達到99.84%。U-Net 網(wǎng)絡模型結合4 種插值方法的結果,如圖5(e)所示,可以直觀地看出,U-Net_QI不適用于食管癌的分割。
圖5 改進的U-Net網(wǎng)絡結果對比
本實驗對圖5 的分割結果進行上文中提到的SA、OR、UR、IOU 這4種分割評價指標進行評價,對所有圖片采用4 種分割方法進行計算,并取其平均值,如表1 所示。圖6 顯示了最優(yōu)分割算法的結果對比圖。
表1 對分割方法的評估
圖6 最優(yōu)分割算法的結果對比圖
本文通過U-Net 網(wǎng)絡以及U-Net 網(wǎng)絡結合插值方法的結果的對比,得出U-Net網(wǎng)絡結合線性插值的方法相較于U-Net 網(wǎng)絡對于食管癌影像的分割更優(yōu),雖然其分割精度為97.459%,降低了0.002%,過分割率為5.127%,升高了0.824%,但IOU 值達到了91.284%,升高了1.876%,欠分割率達到了3.588%,降低了2.699%。綜上所述,綜合SA、OR、UR、IOU 這4種分割評價指標的結果,得出網(wǎng)絡U-Net_LI 更適用于食管癌影像的分割,達到了預期目的。
本文提出了一種基于食管癌X 線影像的自動分割的方法。該方法針對食管癌圖像特點,利用U-Net 網(wǎng)絡結合線性插值的方法,將食管癌圖像骨骼與病灶模糊的區(qū)域更高效的分割。實驗結果表明,本文方法優(yōu)于其他的分割結果,達到了改善U-Net 網(wǎng)絡小區(qū)域分離點的這一缺點。本文工作給醫(yī)生的閱片及病灶的診斷帶來了極大的便利,具有一定的應用價值。