国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于U-net的直腸癌智能分割

2020-09-15 16:30譚俊杰鐘妤黃澤斌
計(jì)算機(jī)時(shí)代 2020年8期
關(guān)鍵詞:圖像分割直腸癌

譚俊杰 鐘妤 黃澤斌

摘要:近年來(lái),隨著醫(yī)學(xué)影像與大數(shù)據(jù)的發(fā)展,通過(guò)人工智能來(lái)處理圖像,從而給醫(yī)生帶來(lái)輔助性的診斷參考成為廣大學(xué)者的研究熱點(diǎn)。文章利用U-net網(wǎng)絡(luò)對(duì)直腸癌CT影像進(jìn)行智能分割,加入了圖像增強(qiáng)、批歸一化等技巧緩解過(guò)擬合現(xiàn)象,并通過(guò)多次實(shí)驗(yàn)確定最佳初始學(xué)習(xí)速率和卷積核數(shù)目,在驗(yàn)證集上的Dice系數(shù)達(dá)到0.9329。實(shí)驗(yàn)表明,U-Net對(duì)小數(shù)據(jù)集的醫(yī)學(xué)圖像分割有很好效果,對(duì)正負(fù)樣本極度偏斜的數(shù)據(jù)集,使用Dice系數(shù)可以準(zhǔn)確地衡量分割的相似程度。

關(guān)鍵詞:直腸癌;圖像分割:U-net:Dice系數(shù)

中圖分類(lèi)號(hào):TP301.6 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1006-8228(2020)08-18-03

0 引言

近年來(lái),我國(guó)直腸癌發(fā)病率呈顯著上升趨勢(shì),特別是在大城市,已躍居惡性腫瘤發(fā)病率排行榜前三位。研究顯示,有65%的患者的發(fā)病時(shí)間是在40歲之后,其中男女比例為23:1,并且發(fā)病率最高的人群年齡分布在40歲-50歲。

醫(yī)學(xué)圖像分割是臨床診斷和治療的關(guān)鍵技術(shù),能夠提供準(zhǔn)確可靠的診斷依據(jù)。隨著深度學(xué)習(xí)中圖像翻譯算法的普遍應(yīng)用,醫(yī)學(xué)圖像分割技術(shù)也獲得了巨大的進(jìn)展。尤其在U-Net網(wǎng)絡(luò)結(jié)構(gòu)被提出后,該網(wǎng)絡(luò)一直在醫(yī)學(xué)圖像分割領(lǐng)域表現(xiàn)優(yōu)秀,眾多研究者利用此模型進(jìn)行醫(yī)學(xué)圖像分割[1],并在此基礎(chǔ)上提出改進(jìn)。本文研究來(lái)自于第七屆“泰迪杯”數(shù)據(jù)挖掘挑戰(zhàn)賽B題,對(duì)直腸CT影像中的腫瘤分割問(wèn)題提出一種基于深度學(xué)習(xí)U-Net網(wǎng)絡(luò)結(jié)構(gòu)的分割方法。

1 數(shù)據(jù)預(yù)處理

1.1 數(shù)據(jù)清洗與劃分

本數(shù)據(jù)集共有107個(gè)病例,3029張CT影像及對(duì)應(yīng)的掩模圖,數(shù)據(jù)樣本為512×512像素。而且每個(gè)病例有1745張CT影像序列。其中,有腫瘤區(qū)域的CT影像僅有860張且腫瘤區(qū)域在CT影像中占比較小,屬于正負(fù)樣本不平衡的數(shù)據(jù)集。因此,在劃分?jǐn)?shù)據(jù)集時(shí),為使訓(xùn)練集、驗(yàn)證集和測(cè)試集的正負(fù)樣本分布盡可能地相近,將病例數(shù)作為劃分對(duì)象,訓(xùn)練集、驗(yàn)證集、測(cè)試集的個(gè)數(shù)分別設(shè)置為65個(gè)(即0.6)、16個(gè)和26個(gè)。

通過(guò)掩模圖,可觀(guān)察出腫瘤位置均在圖像的一定區(qū)域內(nèi),因此,本文運(yùn)用OpenCV庫(kù)計(jì)算出腫瘤區(qū)域的最大最小像素值。經(jīng)統(tǒng)計(jì),長(zhǎng)為126-382,寬為202-458的像素范圍能包含所有腫瘤特征。因此,最終將數(shù)據(jù)集裁剪成256x256大小的影像,即過(guò)濾了無(wú)關(guān)特征,同時(shí)節(jié)省資源,減少計(jì)算量。

1.2 圖像增強(qiáng)

由于劃分后的訓(xùn)練集只有1820張CT影像,對(duì)深度學(xué)習(xí)而言遠(yuǎn)遠(yuǎn)不足。因此,需要通過(guò)圖像增強(qiáng)[2]技術(shù)擴(kuò)充訓(xùn)練集樣本量,本文使用水平翻轉(zhuǎn)、垂直翻轉(zhuǎn)、90度旋轉(zhuǎn)以及翻轉(zhuǎn)和旋轉(zhuǎn)的組合將訓(xùn)練集樣本量擴(kuò)充至原來(lái)的6倍。圖像增強(qiáng)對(duì)模型性能的訓(xùn)練有很大的提升,既可以減少過(guò)擬合現(xiàn)象的發(fā)生,又能提升模型的泛化能力。效果如圖l所示。

2 U-Net模型訓(xùn)練

2.1 窗寬和窗位

由于CT影像的格式為DICOM,首先利用RadiAntDICOM Viewer軟件得出每個(gè)病例CT序列的最佳窗寬和窗位,其次利用SimpleITK庫(kù)讀取CT影像的HU值,將HU值儲(chǔ)存為數(shù)組后設(shè)置其最佳窗寬和窗位,使用灰度直方圖均衡化技術(shù)提高具體器官的對(duì)比度。最后在模型訓(xùn)練前,對(duì)樣本數(shù)據(jù)做均值方差歸一化,大幅度減少計(jì)算量。

2.2 U-Net結(jié)構(gòu)

U-Net網(wǎng)絡(luò)結(jié)構(gòu)是全卷積神經(jīng)網(wǎng)絡(luò)[3](FCN)基礎(chǔ)的改進(jìn),主要包括卷積、池化和反卷積三大步驟。其中,卷積操作中每一個(gè)卷積塊包括兩次卷積,然后是最大值池化操作,通過(guò)10次卷積操作后先結(jié)合對(duì)應(yīng)大小的特征圖進(jìn)行反卷積操作使圖像大小翻倍而通道數(shù)縮減一倍,再進(jìn)行兩次卷積操作,激活函數(shù)為ReLU。

本文針對(duì)醫(yī)學(xué)圖像數(shù)據(jù)集對(duì)U-Net網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行超參數(shù)調(diào)整,由于腫瘤占圖像范圍區(qū)域小,提取的特征數(shù)太多易導(dǎo)致過(guò)擬合。經(jīng)過(guò)多次實(shí)驗(yàn),本文對(duì)256×256大小的輸入圖像初始提取兩個(gè)特征,每經(jīng)過(guò)一次最大值池化,提取的特征數(shù)翻倍。每個(gè)卷積核的大小設(shè)置為3x3,其中步長(zhǎng)為l,Padding設(shè)置為same,這樣即可保證卷積后的圖像與原來(lái)圖像大小一致。反卷積操作后再經(jīng)過(guò)一層卷積層,卷積核大小為1x1,利用Sigmoid函數(shù)進(jìn)行二分類(lèi)。U-net網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

本文在卷積和反卷積操作后加入批歸一化( Batch_Normalization)的操作,使上一層傳遞到下一層的參數(shù)分布保持一致,這既能加快訓(xùn)練速度,防止低層次神經(jīng)網(wǎng)絡(luò)的梯度在反向傳播中消失,又能減少參數(shù)初始化的影響。

2.3 衡量指標(biāo)

考慮到這個(gè)數(shù)據(jù)集中陽(yáng)性和陰性樣本的極端不平衡,因此本文模型的衡量指標(biāo)選擇使用Dice系數(shù)Ⅲ,模型的損失函數(shù)是1-Dice系數(shù)。兩個(gè)輪廓區(qū)域所包含的點(diǎn)集分別用A、B來(lái)表示,通過(guò)計(jì)算公式可知,它可以衡量A、B的相似程度。

2.4 超參數(shù)

本文使用Adam算法優(yōu)化損失函數(shù),它結(jié)合了AdaGrad和RMSProp兩種優(yōu)化算法的特點(diǎn),能對(duì)每次梯度的學(xué)習(xí)速率進(jìn)行調(diào)整,同時(shí)后期不會(huì)使學(xué)習(xí)速率衰減至很小而導(dǎo)致模型無(wú)法學(xué)習(xí)。

經(jīng)過(guò)多次實(shí)驗(yàn),本文設(shè)置的初始學(xué)習(xí)速率為1x10-5,雖然小的學(xué)習(xí)速率需要更多的訓(xùn)練次數(shù),但模型結(jié)果會(huì)比較好;而較大的學(xué)習(xí)速率使學(xué)習(xí)曲線(xiàn)大幅震蕩,甚至還可能導(dǎo)致梯度朝著錯(cuò)誤的方向更新。

每次迭代傳入8張CT圖和對(duì)應(yīng)的掩模圖進(jìn)模型中訓(xùn)練,若批量( Batch)設(shè)置過(guò)小,模型需要消耗更多時(shí)間訓(xùn)練,且會(huì)使批歸一化的效果不明顯;若批量設(shè)置過(guò)大,雖然加快訓(xùn)練速度,但更容易出現(xiàn)過(guò)擬合。

3 實(shí)驗(yàn)結(jié)果

3.1 模型結(jié)果

本文使用Tensorflow為后端的Keras框架結(jié)構(gòu)搭建U-Net網(wǎng)絡(luò)[5],并在服務(wù)器上使用GPU對(duì)加速模型訓(xùn)練。模型參數(shù)共有31507個(gè),訓(xùn)練一次所花費(fèi)的時(shí)間為44秒,最終在第45次訓(xùn)練結(jié)束后,訓(xùn)練集上的Dice系數(shù)達(dá)到0.9803,驗(yàn)證集上的Dice系數(shù)達(dá)到0.9329,訓(xùn)練曲線(xiàn)如圖3所示。

3.2 結(jié)果分析

通過(guò)觀(guān)察訓(xùn)練曲線(xiàn),模型沒(méi)有明顯過(guò)擬合,且梯度更新較大,在前10次訓(xùn)練中,訓(xùn)練集和驗(yàn)證集上的Dice相似,甚至出現(xiàn)欠擬合,原因在于使用圖像增強(qiáng)技巧加大了模型的訓(xùn)練難度。訓(xùn)練10次后,學(xué)習(xí)速率出現(xiàn)緩和,但后來(lái)又比之前更加陡峭地上升,并且在第40次訓(xùn)練結(jié)束后過(guò)擬合越來(lái)越明顯。

學(xué)習(xí)率越來(lái)越陡峭,這說(shuō)明過(guò)擬合程度已經(jīng)逐漸增大。并且當(dāng)Dice值大于1后,模型會(huì)學(xué)習(xí)更多其他區(qū)域的特征而導(dǎo)致嚴(yán)重過(guò)擬合。因此當(dāng)前訓(xùn)練集上的Dice系數(shù)大于1時(shí),應(yīng)停止訓(xùn)練。

在圖4中,第一行為測(cè)試集中隨機(jī)一個(gè)病例的5張CT影像,第二行是對(duì)應(yīng)的掩模圖,第三行是模型的預(yù)測(cè)結(jié)果。通過(guò)觀(guān)察得出U-Net模型能準(zhǔn)確分類(lèi)出有無(wú)腫瘤的CT影像,但預(yù)測(cè)的腫瘤邊緣不夠細(xì)致,而且存在一定的過(guò)擬合。同時(shí),預(yù)測(cè)圖中非腫瘤區(qū)域是灰白色,說(shuō)明CT圖像與輪廓濾波器進(jìn)行卷積運(yùn)算時(shí),還不能把腫瘤區(qū)域和非腫瘤區(qū)域的輪廓區(qū)分得很明顯,模型還需要進(jìn)一步改進(jìn)。

4 總結(jié)

本文基于深度學(xué)習(xí)中U-Net網(wǎng)絡(luò)對(duì)直腸癌腫瘤區(qū)域進(jìn)行圖像智能分割。經(jīng)過(guò)超參數(shù)調(diào)整后,驗(yàn)證集上的Dice系數(shù)達(dá)到0.9329,可以準(zhǔn)確區(qū)分有無(wú)腫瘤的CT影像,一定程度上能夠給予醫(yī)生輔助性的診斷參考意見(jiàn),減輕醫(yī)生的工作負(fù)擔(dān)。但預(yù)測(cè)的腫瘤區(qū)域輪廓不夠細(xì)致,且模型容易出現(xiàn)過(guò)擬合,主要原因在于模型的訓(xùn)練樣本還不夠充足和豐富,相信在樣本量增大后,模型一定有顯著提升。

參考文獻(xiàn)(References):

[1]吳銳帆,代海洋,楊坦,江穎,蔡志杰.直腸癌淋巴結(jié)轉(zhuǎn)移的智能診斷研究[J].數(shù)學(xué)建模及其應(yīng)用,2019.8(4):30-37

[2]李雯.基于深度卷積神經(jīng)網(wǎng)絡(luò)的CT圖像肝臟腫瘤分割方法研究[D].中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院,2016.

[3]周魯科,朱信忠.基于U-net網(wǎng)絡(luò)的肺部腫瘤圖像分割算法研究[J].信息與電腦(理論版),2018.5:41-44

[4]袁甜,程紅陽(yáng),陳云虹,張海榮,王文軍.基于U-Net網(wǎng)絡(luò)的肺部CT圖像分割算法[J].自動(dòng)化與儀器儀表,2017.6:59-61

[5]張凱文.基于U-Net的肝臟CT圖像分割研究[D].華南理工大學(xué),2019.

作者簡(jiǎn)介:譚俊杰(1997-),男,廣東佛山人,本科,主要研究方向:深度學(xué)習(xí)、數(shù)據(jù)挖掘

通訊作者:黃澤斌(2000-),男,廣東普寧人,本科,主要研究方向:數(shù)據(jù)科學(xué),數(shù)據(jù)挖掘

猜你喜歡
圖像分割直腸癌
腹腔鏡下直腸癌前側(cè)切除術(shù)治療直腸癌的效果觀(guān)察
一種改進(jìn)的分水嶺圖像分割算法研究
一種圖像超像素的快速生成算法
基于魯棒性的廣義FCM圖像分割算法
直腸癌術(shù)前放療的研究進(jìn)展
COXⅠ和COX Ⅲ在結(jié)直腸癌組織中的表達(dá)及其臨床意義
GRP及GRPR在結(jié)直腸癌中的表達(dá)及意義