胡俊, 李平
(華僑大學(xué) 信息科學(xué)與工程學(xué)院, 福建 廈門 361021)
利用醫(yī)學(xué)影像進(jìn)行疾病的篩查與診斷已經(jīng)成為臨床上不可或缺的手段,這既給醫(yī)生帶來了幫助,也帶來了繁重的工作負(fù)擔(dān)[1].X光胸片是臨床診斷肺部疾病最常用的手段,將計(jì)算機(jī)輔助診斷(CAD)技術(shù)應(yīng)用于X光胸片的診斷,具有重要的現(xiàn)實(shí)意義[2].圖像分割是CAD技術(shù)的基礎(chǔ)步驟,其精確性會影響計(jì)算機(jī)對疾病的判斷.由于X光胸片存在對比度低、邊緣模糊、組織投影重疊等問題,因此,對肺野進(jìn)行精確分割頗具難度[3].
X光胸片的肺野分割問題一直受到國內(nèi)外眾多學(xué)者的關(guān)注.張繼武等[4]通過水平集方法,提高了肺野的分割精度,但無法排除背景信息的干擾;Candemir等[5]提出一種改進(jìn)的圖片分割算法,通過設(shè)計(jì)的形態(tài)模板獲取圖割法參數(shù)來完成肺野分割,雖分割效果良好,但受限于模型結(jié)構(gòu),泛化能力較差;佘廣南等[6]提出一種基于密集特征匹配的全自動分割模型,該方法無需人工參與,結(jié)果較為精確,可對弱、偽邊界區(qū)域進(jìn)行分割,但容易陷入局部極值;Matsuyama[7]提出一種基于迭代聚類的X光胸片肺區(qū)分割算法,該算法高效快捷、泛化性強(qiáng),但分割精度較差;秦子亮等[8]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的X光胸片肺野分割方法,該方法將肺野分割問題轉(zhuǎn)換成對圖像塊的分類問題,提高了分割精度;Kim等[9]提出一種自注意力機(jī)制的肺野自動分割方法,在U-net網(wǎng)絡(luò)[10]的基礎(chǔ)上引入注意力機(jī)制,提升了網(wǎng)絡(luò)學(xué)習(xí)目標(biāo)區(qū)域圖像特征的能力,取得了較好的分割效果;Singh等[11]提出一種基于Deeplabv3+的X光胸片肺野自動分割方法,該模型訓(xùn)練速度較快,但對于病變嚴(yán)重的胸片圖像,分割效果較差.
由于U-net網(wǎng)絡(luò)在醫(yī)學(xué)圖像分割任務(wù)中展現(xiàn)出的卓越性能,被國內(nèi)外眾多學(xué)者應(yīng)用于各自的研究領(lǐng)域中.Abid等[12]設(shè)計(jì)了雙U-net網(wǎng)絡(luò)架構(gòu),用以獲取高分辨率和冗余信息,從而提升對皮膚圖像中病變區(qū)域分割的精確性和穩(wěn)定性;Li等[13]將2個(gè)對抗性網(wǎng)絡(luò)集成到U-net網(wǎng)絡(luò)中,利用注意力模塊引導(dǎo)分割過程,以提升對胰腺CT圖像的分割精度;Hussain等[14]利用多輸入多輸出模塊和改進(jìn)的跳躍連接,對U-net網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行優(yōu)化,將不同卷積塊的輸出進(jìn)行級聯(lián)設(shè)計(jì),以減小特征提取時(shí)的信息損失,從而提升對血管分割的精確性.
綜上可知,學(xué)者們主要從傳統(tǒng)圖像分割和深度學(xué)習(xí)兩個(gè)角度對胸片肺野分割問題展開研究.基于此,本文針對利用U-net網(wǎng)絡(luò)進(jìn)行X光胸片肺野分割時(shí),受限于特征提取能力不足而導(dǎo)致結(jié)果不精確的問題,提出一種多尺度殘差注意力U型網(wǎng)絡(luò)(MRAU-net)模型.
MRAU-net網(wǎng)絡(luò)結(jié)構(gòu),如圖1所示.MRAU-net網(wǎng)絡(luò)沿用了U-net網(wǎng)絡(luò)編-解碼的架構(gòu)思想,其整體結(jié)構(gòu)分為11個(gè)分塊,除了輸入、輸出模塊外,其余分塊均融合了2個(gè)改進(jìn)的殘差模塊;在下采樣階段,利用多尺度信息融合(MIF)模塊提升了網(wǎng)絡(luò)對多尺度圖像特性信息的挖掘與融合能力;在上采樣階段,利用通道和空間雙注意力(CSDA)模塊指導(dǎo)網(wǎng)絡(luò)進(jìn)行更準(zhǔn)確、高效的特征整合和肺區(qū)預(yù)測.與U-net網(wǎng)絡(luò)相比,殘差模塊加深了網(wǎng)絡(luò)的體系結(jié)構(gòu),提升了網(wǎng)絡(luò)對X光胸片圖像的肺野特征提取與預(yù)測能力.
圖1 MRAU-net網(wǎng)絡(luò)結(jié)構(gòu)圖
在編碼器部分,網(wǎng)絡(luò)由4個(gè)相似的分塊組成.每個(gè)分塊均以MIF模塊為起始,從而增加網(wǎng)絡(luò)對多尺度信息的獲取.利用稠密塊和2個(gè)改進(jìn)的殘差模塊,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),實(shí)現(xiàn)對多尺度信息的進(jìn)一步挖掘.稠密塊的結(jié)構(gòu)與殘差模塊的基本單元相同,由3×3的膨脹卷積層、批標(biāo)準(zhǔn)層(BN)及LeakyRelu激活層組成,這樣能保持網(wǎng)絡(luò)結(jié)構(gòu)的一致性,便于網(wǎng)絡(luò)對數(shù)據(jù)進(jìn)行處理.利用1個(gè)2×2的最大池化層(Maxpooling),實(shí)現(xiàn)圖像下采樣,特征圖的數(shù)量在每次下采樣后會增加一倍.此外,為了防止過擬合,還在每個(gè)分塊中添加了比率為0.5的Dropout層.
在解碼器部分,同樣包含4個(gè)相似分塊.每個(gè)分塊通過1個(gè)3×3的轉(zhuǎn)置卷積層實(shí)現(xiàn)圖像上采樣,每經(jīng)過一次轉(zhuǎn)置卷積,特征圖數(shù)量會減少一半,而特征圖尺寸會增加一倍.同時(shí),利用CSDA模塊對上采樣過程進(jìn)行指導(dǎo),幫助網(wǎng)絡(luò)剔除無用信息,有利于網(wǎng)絡(luò)對目標(biāo)進(jìn)行準(zhǔn)確定位.通過Concatenate層連接來自編碼器和轉(zhuǎn)置卷積的特征映射,實(shí)現(xiàn)高、低維圖形特征的結(jié)合,補(bǔ)償下采樣過程中的信息損失.同樣,為了防止過擬合,在每個(gè)分塊中添加了比率為0.5的Dropout層.
在編碼器和解碼器之間,利用1個(gè)MIF模塊、1個(gè)稠密塊及2個(gè)改進(jìn)的殘差模塊構(gòu)建連接橋,完成編碼器和解碼器之間的信息傳遞.利用1個(gè)3×3的膨脹卷積層和1個(gè)Sigmoid激活層,將特征圖映射到目標(biāo)、背景的分割中,并輸出分割結(jié)果圖.
原始?xì)埐顗K和改進(jìn)殘差塊的結(jié)構(gòu),如圖2所示.由圖2可知:殘差模塊使用了一種類似于跳躍連接的結(jié)構(gòu),用以實(shí)現(xiàn)淺層信息向深層的傳遞,稱為短路鏈接或快捷鏈接[15].由于原始?xì)埐钅K缺乏對數(shù)據(jù)的處理,使提取的特征比較繁雜,對有效特征的提取能力稍顯不足[16].利用膨脹卷積層、修正的激活層(LeakyRelu函數(shù))及批標(biāo)準(zhǔn)(BN)層對原始?xì)埐顗K進(jìn)行改進(jìn).
(a) 原始?xì)埐顗K (b) 改進(jìn)殘差塊
利用膨脹卷積替換普通卷積,能提升殘差模塊的特征提取能力.同時(shí),對各個(gè)膨脹卷積層的膨脹率進(jìn)行鋸齒化設(shè)計(jì),可以弱化柵格效應(yīng)[17].為了避免神經(jīng)元“死亡”對網(wǎng)絡(luò)訓(xùn)練造成負(fù)面影響,將殘差模塊中的Relu函數(shù)用LeakyRelu函數(shù)替代.通過在殘差模塊中添加批標(biāo)準(zhǔn)層,實(shí)現(xiàn)對輸入數(shù)據(jù)的標(biāo)準(zhǔn)化.BN層可將同一批次的訓(xùn)練數(shù)據(jù)規(guī)范到相同量綱下,增加樣本數(shù)據(jù)間的相似性.這既能提升網(wǎng)絡(luò)學(xué)習(xí)、收斂的速率,又能防止過擬合,抑制梯度消失現(xiàn)象和梯度爆炸現(xiàn)象.
MIF模塊結(jié)構(gòu),如圖3所示.受Inception模塊[18]的啟發(fā),設(shè)計(jì)的MIF模塊利用4條支路對輸入數(shù)據(jù)進(jìn)行特征提取,除直連支路外,其余3條支路執(zhí)行1×1,3×3膨脹卷積和批標(biāo)準(zhǔn)化的不同組合,這樣組合的目的在于:1) 增加網(wǎng)絡(luò)深度、寬度;2) 用小尺寸卷積的堆疊實(shí)現(xiàn)大尺寸卷積的功能,除了能獲取更全面的信息,還能減少參數(shù)量,加快學(xué)習(xí)進(jìn)程;3) 利用不同深度的支路,獲取多尺度信息.而直連通路則能實(shí)現(xiàn)信息的無損傳遞,類似于殘差結(jié)構(gòu)中的短路連接.
圖3 MIF模塊結(jié)構(gòu)
注意力模型按照原理可以劃分為空間注意力模型和通道注意力模型.空間注意力模型按照區(qū)域的重要程度分配權(quán)重,使網(wǎng)絡(luò)著重學(xué)習(xí)圖像的重要區(qū)域;而通道注意力模塊,則基于通道的顯著程度分配學(xué)習(xí)權(quán)重,使網(wǎng)絡(luò)能著重學(xué)習(xí)顯著通道對應(yīng)的特征圖.
就二維圖像而言,假設(shè)卷積后得到的特征圖尺寸為H×W×C,H,W,C分別為長、寬和通道數(shù)(特征圖數(shù)量).空間注意力模型基于所有特征圖,首先生成一張熱力圖,此時(shí),特征圖尺寸由H×W×C變?yōu)镠×W×1;然后,基于熱力圖,標(biāo)定圖像中各區(qū)域的重要程度,并按照重要程度分配不同的學(xué)習(xí)權(quán)重;最后,將相同權(quán)重配比作用到所有特征圖上.而通道注意力模型首先將每一張?zhí)卣鲌D壓縮成一個(gè)數(shù),并用該數(shù)代表相應(yīng)通道,此時(shí),特征圖尺寸由H×W×C變成1×1×C;然后,基于數(shù)值定義各通道的顯著性;最后,按照通道的顯著程度給對應(yīng)特征圖分配學(xué)習(xí)權(quán)重.
CSDA模塊結(jié)構(gòu)圖,如圖4所示.圖4中:GAvg Pooling為全局平均池化;GMax Pooling為全局最大池化.利用CSDA模塊可以增強(qiáng)網(wǎng)絡(luò)對目標(biāo)位置、形態(tài)等有效特征信息的捕獲能力,還能抑制無用信息,加快網(wǎng)絡(luò)的學(xué)習(xí)過程,解決網(wǎng)絡(luò)在有限算力下的信息過載問題.
圖4 CSDA模塊結(jié)構(gòu)圖
對于神經(jīng)網(wǎng)絡(luò),從X光胸片圖像中學(xué)到有利于肺野分割的圖像信息,具有一定的難度[19].由于可用于訓(xùn)練的有效樣本量較少,想要取得良好的肺野分割效果頗具挑戰(zhàn).對于小數(shù)據(jù)集,可以通過數(shù)據(jù)增強(qiáng)手段,獲取足夠的訓(xùn)練樣本,保證網(wǎng)絡(luò)對于數(shù)據(jù)的基本需求[20].此外,還可以通過設(shè)計(jì)合適的損失函數(shù),提升網(wǎng)絡(luò)對有效圖像特征的挖掘能力,增加網(wǎng)絡(luò)的肺野分割性能.
X光胸片肺野分割算法流程,如圖5所示.該算法主要包括2個(gè)部分:1) 數(shù)據(jù)預(yù)處理,包括數(shù)據(jù)增強(qiáng)和圖像預(yù)處理;2) 對MRAU-net網(wǎng)絡(luò)進(jìn)行設(shè)計(jì),并利用預(yù)處理后的圖像數(shù)據(jù)對網(wǎng)絡(luò)進(jìn)行訓(xùn)練和預(yù)測.由于MRAU-net網(wǎng)絡(luò)是一種端到端的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),因此,無需其他操作,既可獲得X光胸片的肺野分割二值結(jié)果圖.
圖5 X光胸片肺野分割算法流程
數(shù)據(jù)預(yù)處理包括數(shù)據(jù)增強(qiáng)和圖像預(yù)處理.數(shù)據(jù)增強(qiáng)是在訓(xùn)練神經(jīng)網(wǎng)絡(luò)的過程中,應(yīng)對可供訓(xùn)練的有效樣本不足的情況下,普遍使用的一種數(shù)據(jù)處理手段[21].
就神經(jīng)網(wǎng)絡(luò)而言,只需要對圖像數(shù)據(jù)做一些細(xì)微的改變,即可使網(wǎng)絡(luò)將改變后的圖像認(rèn)定為不同的圖像數(shù)據(jù)[22].同時(shí),神經(jīng)網(wǎng)絡(luò)具有平移、旋轉(zhuǎn)等不變性,無論目標(biāo)處于圖像中的哪個(gè)位置、何種狀態(tài),都不干擾網(wǎng)絡(luò)進(jìn)行穩(wěn)定的預(yù)測.因此,常規(guī)的數(shù)據(jù)增強(qiáng)手段包括旋轉(zhuǎn)、平移、縮放、剪切、翻轉(zhuǎn)、加噪聲、顏色變換等[23].
使用的Montgomery數(shù)據(jù)集和Shenzhen數(shù)據(jù)集包含800張X光胸片圖像,其中,704張有對應(yīng)的掩膜圖像.通過左右翻轉(zhuǎn)、上下翻轉(zhuǎn)、-70°~70°隨機(jī)旋轉(zhuǎn)、平移、剪裁、旋轉(zhuǎn)加剪裁等操作,生成了4 652張具有對應(yīng)掩模圖的X光胸片圖像數(shù)據(jù).
通過數(shù)據(jù)增強(qiáng),提升數(shù)據(jù)集的樣本數(shù)量;而利用圖像預(yù)處理,則可以提升數(shù)據(jù)集的樣本質(zhì)量.圖像預(yù)處理包括圖像尺寸、灰度標(biāo)準(zhǔn)化.對于數(shù)據(jù)增強(qiáng)后的數(shù)據(jù)集,圖像尺寸不具備一致性,所以,需要對圖像執(zhí)行標(biāo)準(zhǔn)化,將圖像尺寸規(guī)范到相同大小.此外,為了減少網(wǎng)絡(luò)訓(xùn)練的計(jì)算量,提升學(xué)習(xí)效率,還需將圖像的像素灰度區(qū)間由0~255調(diào)整到0~1之間.
對于二分類問題,通常會用0和1來區(qū)分樣本數(shù)據(jù)的類別.以圖像分割為例,用1標(biāo)記前景,用0標(biāo)記背景.就單目標(biāo)分割任務(wù)而言,利用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)分割,本質(zhì)上是對圖像中所有像素點(diǎn)類別的二分類預(yù)測[24].
在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的末端,采用Sigmoid函數(shù)作為激活函數(shù).Sigmoid函數(shù)通過處理所有輸入特征數(shù)據(jù),輸出一個(gè)對二分類結(jié)果的預(yù)測概率,該概率值分布在0~1之間,代表網(wǎng)絡(luò)預(yù)測樣本為正樣本的可能性,數(shù)值越大,表示網(wǎng)絡(luò)認(rèn)為樣本是正樣本的可能性越大.在單目標(biāo)分割任務(wù)中,圖像中所有像素點(diǎn)類別的預(yù)測經(jīng)由Sigmoid函數(shù)會得到相應(yīng)的概率值,此概率值表示網(wǎng)絡(luò)將像素點(diǎn)預(yù)測為前景的可能性[25].
對于二分類問題,最常用的損失函數(shù)為二元交叉熵?fù)p失,其作用原理如下.
(1)
當(dāng)y=0時(shí),表示將該像素點(diǎn)被預(yù)測為背景的概率;當(dāng)y=1時(shí),表示該像素點(diǎn)被預(yù)測為前景的概率,即
(2)
(3)
根據(jù)極大似然估計(jì)原理,將上述兩種情況進(jìn)行整合,可得
(4)
在式(4)的基礎(chǔ)上,在等號兩邊引入對數(shù)函數(shù),對數(shù)函數(shù)并不會改變原式的單調(diào)性,即
(5)
于是,定義損失函數(shù)L=-lgP(y|x),則可以得到二元交叉熵?fù)p失函數(shù)Lbce的表達(dá)式為
(6)
式(6)中:無論實(shí)際標(biāo)簽值為0或1,Lbce均表示網(wǎng)絡(luò)的輸出與標(biāo)簽值的誤差,且誤差越大,損失函數(shù)的數(shù)值越大.由于對數(shù)函數(shù)的作用,損失值的變化是非線性的,這樣能使網(wǎng)絡(luò)的輸出更容易擬合真實(shí)樣本的標(biāo)簽值.
采用Montgomery數(shù)據(jù)集和Shenzhen數(shù)據(jù)集對圖像分割算法進(jìn)行研究.為評判文中方法的分割性能,共進(jìn)行3組實(shí)驗(yàn).第1組為消融實(shí)驗(yàn),以展示兩個(gè)主要改進(jìn)點(diǎn)(MIF模塊和CSDA模塊)對網(wǎng)絡(luò)性能提升的貢獻(xiàn);第2組實(shí)驗(yàn)采用文中方法對不同X光胸片進(jìn)行肺野分割,通過對結(jié)果進(jìn)行對比分析,評判文中方法的有效性;第3組實(shí)驗(yàn)采用不同方法對相同數(shù)據(jù)集進(jìn)行肺野分割,通過對結(jié)果進(jìn)行對比分析,評判文中方法的優(yōu)越性.
實(shí)驗(yàn)使用工作站的操作系統(tǒng)為Ubuntu 20.03,運(yùn)行環(huán)境為Python 3.6,在Tensorflow 2.0深度學(xué)習(xí)框架上搭建神經(jīng)網(wǎng)絡(luò)并進(jìn)行訓(xùn)練、測試.實(shí)驗(yàn)環(huán)境及參數(shù)配置,如表1所示.
表1 實(shí)驗(yàn)環(huán)境及參數(shù)配置
消融實(shí)驗(yàn)將未加入MIF模塊和CSDA模塊的網(wǎng)絡(luò)作為基線模型(Baseline),為了評估X光胸片肺野的分割質(zhì)量,引入靈敏度(Isen)、特異性(Ispe)、Dice系數(shù)(D)及交并比(IoU)4個(gè)評價(jià)指標(biāo)作為參考標(biāo)準(zhǔn).靈敏度反映肺野中被正確分類的像素比例,特異性反映背景中被正確分類的像素比例,Dice系數(shù)和交互比反映分割結(jié)果與金標(biāo)準(zhǔn)的相似性,其表達(dá)式分別為
Isen=NTP/(NTP+NFN),
(7)
Ispe=NTN/(NTN+NFP),
(8)
D=2NTP/(2NTP+NFP+NFN),
(9)
IoU=NTP/(NTP+NFP+NFN).
(10)
式(7)~(10)中:NTP為肺野中被正確分類的像素?cái)?shù)量;NFN為將肺野分成背景的像素點(diǎn)數(shù)量;NTN為背景中被正確分類的像素?cái)?shù)量;NFP為將背景分成肺野的像素?cái)?shù)量.
4個(gè)評價(jià)指標(biāo)的數(shù)值均不大于1,數(shù)值越高,表示分割得越準(zhǔn)確,發(fā)生錯(cuò)誤分割的情況越少.不同模塊組合在X光胸片數(shù)據(jù)集的評價(jià)結(jié)果,如表2所示.
表2 不同模塊組合在X光胸片數(shù)據(jù)集的評價(jià)結(jié)果
由表2可知:文中方法添加的MIF模塊和CSDA模塊對網(wǎng)絡(luò)的肺野分割性能均有一定程度的提升,相較而言,CSDA模塊對網(wǎng)絡(luò)性能提升的效果優(yōu)于MIF模塊;此外,將MIF模塊和CSDA模塊搭配使用,能進(jìn)一步提升網(wǎng)絡(luò)的肺野分割性能.
將原始X光胸片數(shù)據(jù)集進(jìn)行隨機(jī)打亂,按照8∶1∶1的比例對訓(xùn)練集、驗(yàn)證集和測試集進(jìn)行劃分,并對訓(xùn)練集進(jìn)行數(shù)據(jù)增強(qiáng),得到的訓(xùn)練集、驗(yàn)證集和測試集分別包含4 512,70,70張X光胸片圖像.
將文中方法在增強(qiáng)后的訓(xùn)練集上進(jìn)行訓(xùn)練,并在驗(yàn)證集上進(jìn)行驗(yàn)證.訓(xùn)練的迭代次數(shù)設(shè)置為50個(gè)Epoch.網(wǎng)絡(luò)訓(xùn)練階段Loss值(L)和準(zhǔn)確率(η)變化曲線,如圖6所示.
(a) Loss值 (b) 準(zhǔn)確率
由圖6可知:訓(xùn)練集的Loss值曲線能快速且平滑地下降,在8個(gè)Epoch附近就基本收斂,最終Loss值穩(wěn)定在0.05左右;雖然在30個(gè)Epoch附近開始出現(xiàn)輕微的過擬合,但在整個(gè)訓(xùn)練過程中,驗(yàn)證集的Loss值能快速跟隨訓(xùn)練集Loss值的變化而變化;此外,驗(yàn)證集的準(zhǔn)確率也能緊密跟隨訓(xùn)練集準(zhǔn)確率的變化,這表明文中方法對X光胸片圖像具有較強(qiáng)的學(xué)習(xí)和預(yù)測能力,展示了良好的肺野分割性能.
網(wǎng)絡(luò)訓(xùn)練結(jié)束后,采用文中方法在測試集上進(jìn)行肺野分割實(shí)驗(yàn),結(jié)果如圖7所示.
由圖7可知:文中方法實(shí)現(xiàn)了對X光胸片肺野的精確分割,所得肺野形態(tài)完整且邊緣平滑,有效排除了圖像中不同亮度、對比度及骨骼、血管等組織投影對分割過程的干擾,不易受到弱、偽邊界的影響,得到圖像對角點(diǎn)及凹陷區(qū)域的分割結(jié)果也較精確.
(a) 圖像1 (b) 圖像1分割結(jié)果 (c) 圖像2 (d) 圖像2分割結(jié)果 (e) 圖像3 (f) 圖像3分割結(jié)果
利用上述4種評判指標(biāo)進(jìn)行分割結(jié)果的數(shù)據(jù)分析.文中方法對不同X光胸片的分割結(jié)果,如表3所示.由表3可知:在不同的X光胸片上,測得的4個(gè)評價(jià)指標(biāo)均獲得了較高的數(shù)值,這表明文中方法在不同X光胸片上均得到了較精確的肺野分割結(jié)果,說明文中方法的有效性.
表3 文中方法對不同X光胸片的分割結(jié)果
設(shè)置同一組網(wǎng)絡(luò)參數(shù),采用U-net網(wǎng)絡(luò)[10],Attention-Unet網(wǎng)絡(luò)[9],Deeplabv3+網(wǎng)絡(luò)[11]和文中方法,在相同X光胸片數(shù)據(jù)集上進(jìn)行肺野分割實(shí)驗(yàn).不同方法的分割結(jié)果對比,如圖8所示.
(a) 原圖 (b) 金標(biāo)準(zhǔn) (c) U-net (d) Attention-Unet (e) Deeplabv3+ (f) 文中方法
由圖8可知:U-net網(wǎng)絡(luò)對模糊邊緣區(qū)域的分割效果較差,產(chǎn)生了大片的假陽性區(qū)域;Attention-Unet網(wǎng)絡(luò)的肺野分割效果優(yōu)于U-net網(wǎng)絡(luò),但其對邊緣的分割不夠準(zhǔn)確;Deeplabv3+網(wǎng)絡(luò)保留了更多的細(xì)節(jié)信息,展現(xiàn)了更好的肺野分割效果,但對偽邊界區(qū)域的分割仍不夠精確;相較于其他3種網(wǎng)絡(luò),文中方法所得的肺野形態(tài)更完整且邊緣更平滑,展示了更好的分割效果,說明文中方法具有更強(qiáng)的肺野分割性能.
對4種方法的分割結(jié)果進(jìn)行評價(jià),得到4種方法在不同數(shù)據(jù)集上的評價(jià)結(jié)果,如表4所示.
由表4可知:在Shenzhen數(shù)據(jù)集上,文中方法的靈敏度和特異性分別為0.991 9和0.991 0,在Montgomery數(shù)據(jù)集上,文中方法的靈敏度和特異性分別達(dá)到0.993 0和0.995 7,說明在肺野分割過程中,文中方法具有更低的錯(cuò)誤率;文中方法的Dice系數(shù)和交并比在兩個(gè)數(shù)據(jù)集上的均值都最高,表明文中方法對X光胸片肺野具有更高的分割準(zhǔn)確性和穩(wěn)定性;文中方法在X光胸片肺野分割任務(wù)上的性能優(yōu)于其他3種方法,與U-net網(wǎng)絡(luò)相比,分割效果提升明顯,交并比平均提升了3.86%,說明文中方法具有更強(qiáng)的特征捕獲能力,彰顯了更好的網(wǎng)絡(luò)性能.
表4 4種方法在不同數(shù)據(jù)集上的評價(jià)結(jié)果
為了解決利用U-net網(wǎng)絡(luò)進(jìn)行X光胸片肺野分割時(shí),受限于特征提取能力不足而導(dǎo)致分割結(jié)果不精確的問題,提出一種基于MRAU-net網(wǎng)絡(luò)的X光胸片肺野分割方法.該方法采用改進(jìn)的殘差模塊提升U-net網(wǎng)絡(luò)圖像特征捕獲能力,利用MIF模塊幫助網(wǎng)絡(luò)獲取豐富的多尺度特征信息,通過CSDA模塊改善網(wǎng)絡(luò)的預(yù)測性能,加速網(wǎng)絡(luò)訓(xùn)練,減少了訓(xùn)練過程中的過擬合現(xiàn)象,避免了梯度消失和梯度爆炸等問題的發(fā)生.通過實(shí)驗(yàn)對比可知,文中方法展示出了優(yōu)秀的肺野分割性能,相較于U-net網(wǎng)絡(luò),文中方法在分割準(zhǔn)確性上有了顯著提升,充分說明了文中方法的優(yōu)越性.