謝豐雪,楊帆,馮維,曾雷雷,繆月紅,雷平貴
1.貴州醫(yī)科大學生物與工程學院,貴州貴陽 550025;2.貴州醫(yī)科大學大健康學院,貴州貴陽 550025;3.貴州醫(yī)科大學附屬醫(yī)院影像科,貴州貴陽 550004
目前CT是臨床上廣泛使用的影像診斷設(shè)備,但檢查過程中CT輻射會對患者的身體造成一定的傷害。因此,Naildich 等[1]提出應(yīng)用低劑量CT(Low-Dose Computed Tomography,LDCT)作為肺癌高危人群的篩查,以減少輻射對人體的危害。另外在一項I類臨床實驗中證實采用LDCT為高危人群進行肺癌篩查可以將肺癌死亡率降低20%左右[2]。然而,臨床上LDCT圖像有明顯的噪聲、偽影以及對比度低等問題,這影響了醫(yī)生的診斷,可能會造成誤診、錯診或漏診[3-4]。為解決這些問題,有研究提出改善LDCT圖像質(zhì)量的方法,如懲罰加權(quán)最小二乘法(Penalized Weighted Least-Squares,PWLS)[5]、非局部均值(Non-Local Mean,NLM)濾波法[6]、局部自適應(yīng)雙邊濾波算法[7]、弦圖降噪算法[8]、基于稀疏表達的小波技術(shù)[9]等。雖然這些方法在一定程度上提高了CT圖像質(zhì)量,但對于復雜的醫(yī)學圖像,去噪效果還有待提高。近幾年,深度學習方法廣泛應(yīng)用于醫(yī)學圖像的處理和分析[10-11],其中一些方法被用于CT圖像的去噪,如Green等[12]提出一種局部一致性的非局部均值(Locally-Consistent Non-Local Means,LC-NLM)去噪算法,該方法可實現(xiàn)LDCT圖像的降噪并保留圖像的精細細節(jié);Kuanar等[13]提出通過基于RegNet的自動編碼器網(wǎng)絡(luò)結(jié)構(gòu)來消除CT圖像的噪聲;Heinrich等[14]運用XCAT軟件來模擬LDCT噪聲模型,并提出采用殘差U-net 網(wǎng)絡(luò)對LDCT 圖像進行去噪;Baguer 等[15]和Leuschner等[16]分析和評估了不同深度學習方法對于LDCT圖像去噪的表現(xiàn)。
LDCT 圖像噪聲復雜,以往深度學習方法基于單尺度的圖像特征提取有限,圖像去噪性能還需進一步提升。本研究在U-net 模型的基礎(chǔ)上提出多尺度并行殘差U-net(Multiscale Parallel Residual U-net,MPR U-net)的深度學習方法對LDCT 圖像進行去噪,該方法采用多尺度結(jié)構(gòu)進行不同尺度的特征提取,在上下采樣路徑使用殘差結(jié)構(gòu),改善隨著網(wǎng)絡(luò)結(jié)構(gòu)加深而梯度消失的問題,旨在去除圖像噪聲的同時盡可能保留LDCT圖像信息。
1.1.1 數(shù)據(jù)集本研究的實驗數(shù)據(jù)來自公開的LoDoPaB-CT 挑戰(zhàn)賽數(shù)據(jù)庫[17],該數(shù)據(jù)集包括752 名受試者標準劑量的CT圖像和對應(yīng)的模擬LDCT投影數(shù)據(jù),各42 895 張。其中,標準劑量CT 圖像來自于LIDC/IDRI 數(shù)據(jù)庫[18]中正常劑量胸部CT 掃描;對應(yīng)的模擬LDCT投影數(shù)據(jù)中添加的噪聲為泊松噪聲,用于模擬LDCT掃描時的噪聲。
1.1.2 預處理將數(shù)據(jù)集劃分為3個部分,其中訓練集632名受試者,共35820張圖像,驗證集60名受試者,共3522張,測試集60名受試者,共3553張圖像。對模擬LDCT投影數(shù)據(jù)采用濾波反投影重建算法(Filtered Back Projection,FBP)[19]進行重建,重建結(jié)果如圖1所示。
圖1 圖像重建Figure 1 Image reconstruction
1.2.1 模型結(jié)構(gòu)本研究提出的MPR U-net 深度學習模型如圖2 所示,其輸入和輸出圖像尺寸均為128 像素×128 像素,該模型主要由多尺度并行模塊、殘差連接、上下采樣路徑組成。其中,多尺度并行模塊如圖3 所示,分別采用1×1、3×3、5×5的卷積核對輸入圖像進行卷積操作,不同的卷積核擁有不同的感受視野,可以幫助提取到不同程度的特征;殘差連接包含3×3 卷積層(Convolution, Conv)、歸一化層(Batch Normalization Layer, BN)[20]與線性整流激活函數(shù)(Rectified Linear Unit,ReLU)[21];下采樣路徑階段采用最大值池化(2×2)進行下采樣,上采樣路徑階段采用步長為2,卷積核尺寸2×2的反卷積恢復圖像尺寸。在上下采樣路徑之間使用4個跳躍連接,用于深層與淺層結(jié)構(gòu)的特征信息傳遞。
圖2 MPR U-net模型結(jié)構(gòu)Figure 2 MPR U-net model architecture
圖3 多尺度并行模塊Figure 3 Multiscale parallel module
1.2.2 實施細節(jié)采用Matlab R2020b 深度學習工具箱,并使用4 塊NVIDIA RTX 2080 Ti 顯卡對所提出的模型進行訓練。訓練過程中,使用Adam(Adaptive moment Estimation)優(yōu)化器對模型參數(shù)進行優(yōu)化[22],網(wǎng)絡(luò)初始學習率為0.001,BatchSize 為128,Epoch 為100,每個Epoch結(jié)束后隨機打亂數(shù)據(jù),并將學習率下降為原來的0.98倍。
1.2.3 評估方法采用峰值信噪比(Peak Signal-to-Noise Ratio, PSNR)和結(jié)構(gòu)相似性系數(shù)(Structural Similarity, SSIM)來評估模型的去噪效果。PSNR 主要用于評價實驗結(jié)果與參考圖像之間的質(zhì)量好壞,PSNR 的值越大,實驗結(jié)果圖像的質(zhì)量越高,公式如下所示:
其中,x為參考圖像;為實驗結(jié)果;L是圖像的像素值取值范圍,對于LoDoPaB-CT數(shù)據(jù),L=1.0。SSIM主要用于評價實驗結(jié)果與參考圖像之間的結(jié)構(gòu)相似程度,取值范圍為0~1,值越大圖像越相似,公式如下所示:
其中,M為樣本數(shù);uj分別表示參考圖像x和實驗結(jié)果的均值;σ2j、分別表示x、的方差;C1=(K1L)2,C2=(K2L)2是為了避免公式除零的兩個常數(shù),K1=0.01,K2= 0.03。
本研究從測試結(jié)果中隨機選取2 名受試者的部分圖像展示去噪效果,圖中紅框區(qū)域顯示了放大后圖像的去噪表現(xiàn),如圖4所示。從圖中可以看出相對于FBP,所提方法明顯提升圖像的質(zhì)量,并去除大部分噪聲,其結(jié)果與標準劑量圖像相似。
圖4 FBP重建圖像、標準圖像和本文方法重建圖像比較Figure 4 Comparison among images reconstructed by FBP,standard images and images obtained by the proposed method
運用PSNR與SSIM對測試集進行評估,表1為本研究所提的MPR U-net深度學習模型與FBP及其它深度學習方法的指標結(jié)果。與FBP比較,本研究提出的方法去噪效果提升明顯,PSNR和SSIM均高于FBP。與U-net模型相比,所提的多尺度結(jié)構(gòu)與殘差連接相組合的方法可以進一步提升模型的去噪性能。同時與最新LDCT圖像深度學習去噪方法Learned Primal-Dual[16,23]比較,雖然PSNR略低于該方法,但SSIM相較于該方法得到提升。主要原因在輸入數(shù)據(jù)時采用多尺度的結(jié)構(gòu)幫助提取了更多圖像特征,更有利于恢復圖像原本信息;另外該指標表明MPR U-net得到的結(jié)果與標準劑量圖像最相似,因為SSIM越高,圖像失真越小,越接近原始參考圖像。然而本研究僅針對模擬的LDCT圖像去噪,缺乏實際的LDCT掃描數(shù)據(jù),后續(xù)研究需要采集更多的真實數(shù)據(jù),進一步提升PSNR。
表1 不同方法的PSNR與SSIM比較Table 1 Comparison of PSNR and SSIM among different methods
LDCT 圖像去噪的重點在于去除噪聲的同時保留有用的臨床診斷信息。本研究提出MPR U-net 深度學習模型對LDCT圖像進行去噪,相較傳統(tǒng)去噪算法,能有效去除噪聲并保留圖像細節(jié),在測試集上PSNR 和SSIM 分別達到38.22 dB 和0.966,平均處理時間只需0.03 s,其中SSIM 高于最新深度學習方法(Learned Primal-Dual)。
LDCT 圖像的噪聲出現(xiàn)位置與程度不確定,采用單尺度的特征提取方式不能有效獲取圖像的全部特征,因此本研究在U-net 深度學習模型基礎(chǔ)上引入多尺度并行特征提取模塊加大網(wǎng)絡(luò)的感受野,獲取更多圖像特征信息,并利用跳躍連接方式傳遞特征信息,減少輸入與輸出之間特征圖的差異,提升模型的去噪性能。另外通過殘差連接讓淺層特征輸出直接參與到深層特征輸入中,改善隨著網(wǎng)絡(luò)層數(shù)加深帶來的梯度消失問題,進一步提升網(wǎng)絡(luò)性能。
本研究針對LDCT圖像,提出MPR U-net深度學習模型對其去噪。該模型融入多尺度并行殘差結(jié)構(gòu),相較傳統(tǒng)方法有較高的PSNR與SSIM。與最新深度學習方法相比具有更高的SSIM,在去除噪聲的同時具有更高的結(jié)構(gòu)相似性。未來研究中,將繼續(xù)對模型結(jié)構(gòu)進行優(yōu)化,收集更多真實的LDCT數(shù)據(jù),進一步提升LDCT圖像的質(zhì)量,幫助醫(yī)生更準確地診斷疾病。