陳世恩 連旭燦
[中圖分類號]R563.1 [文獻標識碼]A
電子計算機斷層掃描(computed tomography,CT)圖片的采集速度快、可以被廣泛應用各類病毒性肺炎的篩查和診斷。但是CT圖像中切片數(shù)量多,需要花費醫(yī)生較長的時間來分析診斷。利用人工智能(artificial intelligence,AI)技術,被證實可以高效地輔助醫(yī)生進行快速地篩查和診斷。圖像增強技術作為一種樣本數(shù)據(jù)增強技術,也常被用于深度學習中。由于醫(yī)學圖像的特異性,一些常見的數(shù)據(jù)增強技術并不適用于CT圖像。本文擬采用的CT圖像增強技術包括了:中值濾波、直方圖均衡和小波變換。
采用胸部cT圖像在對新冠肺炎(corona virus disease 2019,COVID-19)提供準確、快速、廉價的篩查和檢測方面很有前景。在本文中,研究采用了一個開源的COVID-CT數(shù)據(jù)集,其中包含275個COVID-19檢測呈陽性的CT圖像,有助于使用深度學習方法分析病人的CT圖像并預測其是否患有新冠的相關研究和發(fā)展。研究采用的相關數(shù)據(jù)和代碼:https:∥github.com/UCSD-A14H/COVID-CT。首先對數(shù)據(jù)集進行分配,訓練集與測試集按8:2比例隨機分配CT圖片。由于本次研究的數(shù)據(jù)集較小,在學習過程中很容易出現(xiàn)過擬合現(xiàn)象。為了防止此類現(xiàn)象的發(fā)生,我們采用了殘差網(wǎng)絡(residual network,ResNet-34)進行學習,并對其進行參數(shù)優(yōu)化。研究除了采用CT圖像增強技術外,還進行了參數(shù)的優(yōu)化研究。研究采用的優(yōu)化器是二分類問題中常用的Adam算法(adaptive moment estimation,Adam)和隨機梯度下降法(stochasticgradient descent,SGD)兩種優(yōu)化器。模型的學習率經(jīng)過實驗得出:當學習率為0.0006時可以獲得最佳的準確率。模型采用的批處理參數(shù)(batch-size)為64,完成一次整個數(shù)據(jù)集的訓練為1個epoch,我們將epoch設定為50。
3.1 SGD不同圖像增強方法結果對比圖
研究將原圖按照三種圖像增強方法分別增強后,并將原圖和增強后的數(shù)據(jù)進行混合學習。在使用SGD優(yōu)化器得出的學習結果如下圖1所示。
圖1 SGD不同圖像增強方法結果對比圖注:SGD為隨機梯度下降法
從圖1可以直觀地觀察到,采用不同的圖像增強方法對于提高識別準確率的作用較小,識別的準確率一直保持在0.8附近。最佳的準確率為0.82。
3.2 Adam不同圖像增強方法結果對比圖
將SGD優(yōu)化器更換為Adam優(yōu)化器后,得出的結果如下圖2所示。
圖2 Adam不同圖像增強方法結果對比圖
注:Adam為Adam算法
從圖2可以看出,準確率仍然是在0.8附近。最佳的準確率為0.84。
3.3運行50epoch的時間對比圖
對比采用Adam和SGD優(yōu)化器后發(fā)現(xiàn)兩者學習時間有較大的差異,見圖3。
圖3 運行50epoch的時間對比圖
從圖3中可以采用Adam優(yōu)化器在8個epoch后可以顯著降低學習時間。
本文采用不同優(yōu)化器Adam和SGD,并對比研究了采用不同圖像增強方法時CT肺炎圖片識別準確率不同。研究得出CT圖像增強方法不能有效地提高識別準確率,采用優(yōu)化器Adam可有效地降低學習時間。下一步擬增加普通肺炎CT圖片數(shù)據(jù)并對網(wǎng)絡進行進一步地優(yōu)化,以獲得更高的識別準確率。