魏榕劍,邵劍飛,溫 劍,馮宇航,葉 榕
(昆明理工大學(xué) 信息工程與自動化學(xué)院,云南 昆明 650500)
2019 年新型冠狀病毒感染(COVID-19)是由嚴(yán)重急性呼吸綜合征冠狀病毒2 型(SARS-CoV-2)引起的一種疾病,已影響到全球人口的健康[1].根據(jù)世界衛(wèi)生組織數(shù)據(jù),截至2022 年6 月,全球已有超過5.39 億人確診感染新冠病毒,導(dǎo)致約631 萬人死亡[2].胸部計算機(jī)斷層(Computed Tomography,CT)掃描圖像已被證明是檢測間質(zhì)性肺炎的基本方法,這是COVID-19 的一個顯著特征[3].基于深度學(xué)習(xí)的計算成像技術(shù)在評估新冠病毒感染陽性病例方面有很好的發(fā)展前景[4].由于SARS-CoV-2可以導(dǎo)致新冠病毒感染和嚴(yán)重的肺損傷,使用胸部成像技術(shù)可以將新冠病毒感染與細(xì)菌性肺炎和其他呼吸道感染[社區(qū)獲得性肺炎(Community Acquired Pneumonia,CAP)]區(qū)分開,對于制定病毒感染控制決策和診斷及治療至關(guān)重要.
肺炎是一種影響肺部空間的感染,由細(xì)菌、病毒和真菌等各種病原體引起,與感染相關(guān)的癥狀范圍很廣,包括呼吸急促、發(fā)燒、排痰和咳嗽[5].CAP會導(dǎo)致持續(xù)性咳嗽和呼吸困難,癥狀和新冠病毒感染有相似之處.因此,需要一個強(qiáng)大的人工智能(Artificial Intelligence,AI)算法模型,該模型可以從CT圖像中檢測到各種臨床癥狀相似的呼吸系統(tǒng)疾病并對其進(jìn)行分類,以便能夠制定正確的治療方案.
肺部疾病診斷的標(biāo)準(zhǔn)成像方式包括磁共振成像(Magnetic Resonance Imaging,MRI)、胸部X 光(Chest X Ray,CXR)和CT.MRI 和CT 掃描是評估肺部疾病的黃金標(biāo)準(zhǔn),但MRI 更昂貴,涉及輻射暴露,而且在全球范圍內(nèi)并不容易獲得[6].相比之下,CT 更易獲得,且能更好地顯示肺部疾病特征.因此,CT 是心胸和肺部疾病最常見的影像診斷技術(shù)之一.隨著未來肺炎大流行的預(yù)期,放射科醫(yī)生的工作量將會增加,迫切需要新的自動化圖像分析工具助力放射科醫(yī)生的定性評估.醫(yī)學(xué)影像數(shù)據(jù)量非常大,為從根本上解決醫(yī)學(xué)影像數(shù)據(jù)的快速處理和傳輸,本文利用深度學(xué)習(xí)技術(shù)對新冠病毒感染患者影像數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)新冠病毒感染與CAP 肺炎的分類任務(wù)[7].
本文基于輕量級CNN 模型MobileNetV2,提出一種基于MobileNetV2 網(wǎng)絡(luò)改進(jìn)的MobileNetV2-SELN 結(jié)構(gòu),對MobileNetV2 結(jié)構(gòu)中的Block 模塊進(jìn)行改進(jìn);針對肺炎CT 圖像不同組織成像不同的特點(diǎn),用GroupNorm 替代BatchNorm2d,使模型能更好地獲取肺炎特征;使用SGD 優(yōu)化器對模型進(jìn)行優(yōu)化.實(shí)驗(yàn)采用Kaggle 競賽網(wǎng)站公共數(shù)據(jù)集進(jìn)行訓(xùn)練和測試,結(jié)果表明該模型的分類準(zhǔn)確率更高.
世界各地已經(jīng)有很多研究者提出CNN 模型,根據(jù)COVID-19 陽性患者的各種醫(yī)療數(shù)據(jù)對其進(jìn)行識別或分類.為使用計算機(jī)技術(shù)了解和助力治療這種疾病,世界各地科研組織已經(jīng)公開發(fā)布許多不同格式的大型新冠病毒感染數(shù)據(jù)集,并開展研究.研究的重點(diǎn)技術(shù)之一是使用AI,特別是基于深度學(xué)習(xí)(Deep Learning,DL)的模型,依據(jù)胸片和CT圖像檢測COVID-19.文獻(xiàn)[8]將新冠病毒感染的CT 圖像分為新冠病毒感染、甲型流感病毒性肺炎和健康3 類.數(shù)據(jù)集由618 張圖片組成,其中包括110 名新冠病毒感染患者的219 幅圖片,224 例甲型流感病毒性肺炎患者的224 幅圖片,以及175 名健康人的175 幅圖片.利用三維深度學(xué)習(xí)模型對圖像進(jìn)行分類,總體分類準(zhǔn)確率達(dá)到87.6%.
文獻(xiàn)[9]提出了一種用于自然圖像語義分割的全卷積網(wǎng)絡(luò)(Fully Convolutional Networks,F(xiàn)CN).首先,卷積運(yùn)算是逐層堆疊的,以提取輸入圖像的分層特征圖;然后,使用特征地圖的最后一層生成指示像素屬于哪個類別的像素概率分?jǐn)?shù)圖.文獻(xiàn)[10]在沒有分割的情況下使用DenseNet-169 CNN 檢測新冠病毒感染和非新冠病毒感染CT 切片,其實(shí)驗(yàn)結(jié)果顯示該系統(tǒng)的準(zhǔn)確率為79.5%,F(xiàn)1 評分為76%.使用聯(lián)合分割,分類準(zhǔn)確率提高到83.3%,F(xiàn)1評分為84.6%.文獻(xiàn)[11]提出了一種特征選擇方法,并結(jié)合深度森林模型,依據(jù)胸部CT 圖像對新冠病毒感染和CAP 進(jìn)行分類,其實(shí)驗(yàn)結(jié)果表明,與其他廣泛使用的機(jī)器學(xué)習(xí)方法相比,該方法具有更好的性能.文獻(xiàn)[12]對1 658 例新冠病毒感染和1 027例CAP 肺疾病患者進(jìn)行了薄層CT 掃描,對所有圖像進(jìn)行預(yù)處理,得到感染區(qū)域和肺部區(qū)域的分割,用于提取特定位置的特征,并提出了一種感染大小感知隨機(jī)森林方法(ISARF).該方法首先自動將受試者分成感染病灶不同大小范圍的組,然后在每組中利用隨機(jī)森林進(jìn)行分類.其實(shí)驗(yàn)結(jié)果表明,在5次交叉驗(yàn)證下,該方法的敏感度為0.907,特異度為0.833,準(zhǔn)確率為0.879.綜上所述,目前對新冠病毒感染和CAP 進(jìn)行分類仍舊是當(dāng)前研究的熱點(diǎn),各種經(jīng)典的CNN 模型在該分類任務(wù)中取得了較好的成績,達(dá)到90%以上的分類精度.傳統(tǒng)CNN 模型在COVID-19 和CAP 胸部CT 圖片分類和檢測仍是研究的熱點(diǎn),利用深度學(xué)習(xí)和CNN 模型進(jìn)行胸部CT 圖像分類的最終目的是輔助臨床醫(yī)生進(jìn)行診斷,精度還需提升.因此,本文基于輕量級MobileNetV2模型,提出了MobileNetV2-SELN 結(jié)構(gòu),對COVID-19 與CAP 兩種疾病的CT 圖像進(jìn)行分類.
2.1 MobileNetV2 結(jié) 構(gòu)MobileNet 是Google 為嵌入式設(shè)備提出的輕量級深度神經(jīng)網(wǎng)絡(luò)模型[13].目前有兩個版本:MobileNet-V1 和MobileNetV2.它們的主要模塊如圖1 所示.MobileNet-V1 采用深度可分離卷積的方法,與傳統(tǒng)的3D 卷積相比,大大減少了卷積核的冗余度.它不僅優(yōu)化了時延,減小了模型的規(guī)模,而且提高了模型的識別精度[14].MobileNet-V2 在Mobile Net-V1 結(jié)構(gòu)的基礎(chǔ)上,增加了線性瓶頸層和反向殘差結(jié)構(gòu),既能加速收斂,又能防止退化.鑒于Mobile Net-V1 中潛在的梯度消失風(fēng)險,本文基于MobileNet-V2 進(jìn)行了改進(jìn).
圖1 MobileNet-V1 和MobileNet-V2 的結(jié)構(gòu)模塊Fig.1 Structural modules of MobileNet-V1 and MobileNet-V2
2.2 SELN-Block為了使網(wǎng)絡(luò)獲得更具魯棒性的特征表示以提升分類精度,本文增加了一個重加權(quán)層解決,并有效地利用通道依賴.SENet[15]聚焦于通道關(guān)系,并提出了一種新穎的體系結(jié)構(gòu)單元:壓縮和激勵塊,即SE 塊(見圖2),它通過顯式地對通道之間的相互依賴進(jìn)行建模,自適應(yīng)地重新校準(zhǔn)通道特征映射.壓縮操作聚合空間維度H×W上的特征映射以產(chǎn)生通道描述符.該描述符嵌入了信道化特征響應(yīng)的全局分布,使得來自網(wǎng)絡(luò)的全局接受場的信息能夠被其較低層利用.這是通過使用全局平均池生成信道化響應(yīng)實(shí)現(xiàn)的.
圖2 壓縮操作和激勵操作圖解[15]Fig.2 Illustration of compression operation and excitation operation[15]
首先,進(jìn)行壓縮操作,從形式上講,擠壓操作是通過公式(1)實(shí)現(xiàn)的.
式 中:uc(i,j)為通道c在位置(i,j)處的像素值,F(xiàn)sq為壓縮操作,Zc為通道c中的響應(yīng),H和W表示二維卷積層空間維度,H表示高度,W表示寬度.
然后是激勵操作.在該操作中,通過注意力機(jī)制為每個通道學(xué)習(xí)的激勵產(chǎn)生各自的權(quán)重.為了降低塊復(fù)雜度和提高泛化能力,通過兩個全連接(Fully Convolutional,F(xiàn)C)層參數(shù)化注意力機(jī)制.第一層FC 層使用ReLU 作為激活函數(shù),第二層使用Sigmoid 作為激活函數(shù).激勵操作通過公式(2)實(shí)現(xiàn).
式中:W1、W2為 FC 層權(quán)重,F(xiàn)ex為激勵操作,s為通道權(quán)重.
最后,特征映射U被重新加權(quán)以生成SE 塊的輸出(見圖3).重新加權(quán)的要素地圖將直接饋送到后續(xù)圖層.
圖3 模型優(yōu)化前后的瓶頸跨結(jié)構(gòu)對比Fig.3 Comparison of bottleneck span structure before and after model optimization
式中:sc和uc為通道c中的權(quán)重和特征映射,F(xiàn)scale為重新加權(quán)的操作,x?為重新加權(quán)的特征映射.
整個SE 塊[16]可以看作是一種動態(tài)的特征提取機(jī)制,它通過信道化的關(guān)注處理一些層,以更多地關(guān)注對分類有幫助的特征映射.因此,SE 塊[15]可以提高網(wǎng)絡(luò)的表示能力,這對于COVID-19 和CAP 分類是有用的.
在提出的網(wǎng)絡(luò)中,每個瓶頸塊使用SE 塊(見圖3).圖3(a)顯示了原始瓶頸塊Block,圖3(b)描述了SELN-Block 塊的模型結(jié)構(gòu).在每個瓶頸之后添加SE 塊,其中由瓶頸模塊進(jìn)行SE 塊變換.根據(jù)肺炎CT 圖像的特點(diǎn),GroupNorm 替代BatchNorm2d.使用的SELN-Block 模塊不同于原來的Block.在第一個FC 層之后,添加了批歸一化[16],這可以通過減少內(nèi)部協(xié)變量偏移加速SELN-Block 模塊的訓(xùn)練.
2.3 SGD 優(yōu)化器隨機(jī)梯度下降(Stochastic Gradient Descent,SGD)是訓(xùn)練神經(jīng)網(wǎng)絡(luò)最廣泛使用的優(yōu)化算法.該算法采用小批量訓(xùn)練數(shù)據(jù),而不是每次迭代的全部數(shù)據(jù),作為梯度下降(Gradient Descent,GD)算法的替代算法,降低了算法的計算量.
隨機(jī)梯度下降法每次用單個訓(xùn)練樣本的損失接近平均損失,即
因此,隨機(jī)梯度下降法用單個訓(xùn)練數(shù)據(jù)即可對模型參數(shù)進(jìn)行一次更新,大大加快了收斂速率.本文采用隨機(jī)梯度下降法.
3.1 數(shù)據(jù)集為了驗(yàn)證本文提出的融合SE 與多尺度卷積的分類模型的性能,本文基于Python 平臺,對模型進(jìn)行了對比實(shí)驗(yàn).為了更加全面地對模型進(jìn)行實(shí)驗(yàn),本文以Kaggle 挑戰(zhàn)賽網(wǎng)站的數(shù)據(jù)集為基礎(chǔ)數(shù)據(jù)集,數(shù)據(jù)集中的數(shù)據(jù)分為3 類:新冠病毒感染圖片(COVID-19)、正常肺部圖片(Normal)和社區(qū)獲得性肺炎(CAP),并對數(shù)據(jù)集進(jìn)行整理,形成5 個數(shù)據(jù)集進(jìn)行實(shí)驗(yàn).表1 為本文使用COVID-19 分類數(shù)據(jù)集的詳細(xì)信息.
表1 分類數(shù)據(jù)集信息Tab.1 Information of categorical datasets
表1 中,每個數(shù)據(jù)集中的樣本總數(shù)量不一樣,不同類型的數(shù)據(jù)間數(shù)量差距也比較大.利用這些數(shù)據(jù)集可以對模型分類準(zhǔn)確率進(jìn)行評估,驗(yàn)證本文模型的性能.這些數(shù)據(jù)為CT 圖片,圖片的格式絕大多數(shù)為png 格式,剩下的為jpg 格式.
3.2 實(shí)驗(yàn)環(huán)境本文使用的計算機(jī)硬件系統(tǒng)配置為CPU:Intel Core i7-10750H,RAM:16 GB,GPU:Nvidia GeForce RTX2060,6 GB 專用內(nèi)存.PyCharm集成了強(qiáng)大的神經(jīng)網(wǎng)絡(luò)庫和虛擬環(huán)境的管理,因此使用PyCharm 2021.1.1 專業(yè)版.使用PyTorch 深度學(xué)習(xí)框架進(jìn)行模型的搭建.使用基于GPU 提供的支持并行計算的Nvida Cuda Core 技術(shù),在PyCharm環(huán)境下實(shí)現(xiàn)了GPU 加速,通過這種方式加快輕量型卷積神經(jīng)網(wǎng)絡(luò)的模型運(yùn)行速度.
3.3 實(shí)驗(yàn)結(jié)果本文以DenseNet-121、VGG-19 以及原始MobileNet-V2 模型作為對比模型分析本文模型的性能.
3.3.1 模型的參數(shù)量對比 本文基于輕量級模型進(jìn)行優(yōu)化,引入SE 塊和多尺度卷積對原始模型進(jìn)行優(yōu)化,無疑會增加模型的參數(shù)數(shù)量.4 個模型的參數(shù)量如表2 所示.
表2 4 個模型的參數(shù)量Tab.2 Parameter quantities for four models
從表2 中可得出,本文模型的參數(shù)量比DenseNet-121 和VGG-19 的參數(shù)量小,但是因?yàn)樵谀P椭刑砑恿薙E 塊和多尺度卷積,因此模型參數(shù)量比原始的MobileNet-V2 模型參數(shù)量大.
3.3.2 本文模型的準(zhǔn)確率對比分析 如圖4 和5所示,利用表1 中5 個數(shù)據(jù)量不相同的數(shù)據(jù)集進(jìn)行測試,以測試模型性能以及不同數(shù)據(jù)量模型的表現(xiàn).模型的訓(xùn)練準(zhǔn)確率和測試準(zhǔn)確率呈現(xiàn)整體上升趨勢,其中,在數(shù)據(jù)集3 上,由于該數(shù)據(jù)集數(shù)據(jù)量較少,模型中加入的SE 網(wǎng)絡(luò)需要大量數(shù)據(jù)集進(jìn)行訓(xùn)練和特征提取,從而改善模型性能,因此模型訓(xùn)練和測試的準(zhǔn)確率在前50 次迭代中波動較大,但隨著訓(xùn)練次數(shù)的增加,準(zhǔn)確率隨之提高.模型在數(shù)據(jù)量較大的數(shù)據(jù)集上進(jìn)行訓(xùn)練時,模型的分類準(zhǔn)確率較高,訓(xùn)練過程更加穩(wěn)定.從實(shí)驗(yàn)結(jié)果來看,本文模型的準(zhǔn)確率在數(shù)據(jù)量較大的數(shù)據(jù)集上表現(xiàn)得比較平穩(wěn),但是數(shù)據(jù)量較小時變化比較快.
圖4 本文模型在不同數(shù)據(jù)集上的訓(xùn)練準(zhǔn)確率對比Fig.4 Comparison of training accuracy of the model proposed in this paper on different datasets
圖5 本文模型在不同數(shù)據(jù)集上的測試準(zhǔn)確率對比Fig.5 Comparison of the test accuracy of the model proposed in this paper on different datasets
因此,結(jié)合本文模型在這5 個數(shù)據(jù)集上的準(zhǔn)確率進(jìn)行分析,數(shù)據(jù)量對模型訓(xùn)練過程的有一定的影響,數(shù)據(jù)量大模型的訓(xùn)練更穩(wěn)定,但最終分類準(zhǔn)確率相差不大.
3.3.3 本文模型的損失對比分析 損失是衡量模型的性能的一個指標(biāo),單位為1,損失越小模型性能越優(yōu).如圖6 和7 所示,在5 個數(shù)據(jù)集上,模型的訓(xùn)練損失和測試損失整體呈下降趨勢,其中,本文模型在訓(xùn)練初期,訓(xùn)練損失非常大,隨著迭代次數(shù)不斷增加,損失逐漸減小,且當(dāng)?shù)螖?shù)大于60次后,模型損失將到最低,模型的測試損失也整體呈下降趨勢.模型雖然經(jīng)過改進(jìn),但本質(zhì)上仍然是深度學(xué)習(xí)網(wǎng)絡(luò),對數(shù)據(jù)量具有一定的依賴性.數(shù)據(jù)集中數(shù)據(jù)量大小在一定程度上影響模型的訓(xùn)練.模型在數(shù)據(jù)量較小的數(shù)據(jù)集上進(jìn)行訓(xùn)練時,模型的損失下降波動較大;數(shù)據(jù)量較大時雖然模型訓(xùn)練初期的損失較大,但是損失下降過程表現(xiàn)得更平穩(wěn),最終損失降到較低水平.從5 個數(shù)據(jù)集上訓(xùn)練損失結(jié)果來看,本文模型損失下降率受數(shù)據(jù)集數(shù)據(jù)量大小的影響比較明顯,數(shù)據(jù)量大,損失在訓(xùn)練過程中下降平穩(wěn);反之,數(shù)據(jù)量較小的數(shù)據(jù)集,損失在訓(xùn)練過程中下降的波動較大.
圖6 本文模型在不同數(shù)據(jù)集上的訓(xùn)練損失對比Fig.6 Comparison of training losses of the model proposed in this paper on different datasets
圖7 本文模型在不同數(shù)據(jù)集上的測試損失對比Fig.7 The model proposed in this article is contrasting the test loss on different data sets
通過圖4~7 的數(shù)據(jù),容易看出,隨著迭代次數(shù)增加,模型的分類準(zhǔn)確率逐漸增加,但是當(dāng)數(shù)據(jù)集的數(shù)據(jù)量較小時,在模型訓(xùn)練初期,準(zhǔn)確率會產(chǎn)生較大的波動,但隨著迭代次數(shù)增加,準(zhǔn)確率逐漸提升.因?yàn)楸疚脑谀P偷暮诵钠款i塊中加入了SE 網(wǎng)絡(luò),網(wǎng)絡(luò)的本質(zhì)是對提取到的特征進(jìn)行重新加權(quán),使網(wǎng)絡(luò)能更好地融合高維度特征與低維度特征,特征提取是模型對數(shù)據(jù)集進(jìn)行特征提取的過程,數(shù)據(jù)集數(shù)據(jù)量越大,模型能提取的特征越完整.所以,模型的訓(xùn)練損失與測試損失在數(shù)據(jù)量少的數(shù)據(jù)集上表現(xiàn)得波動較大,在數(shù)據(jù)量大的數(shù)據(jù)集上表現(xiàn)得較平穩(wěn).
3.3.4 不同模型的訓(xùn)練平均準(zhǔn)確率對比分析 為有效驗(yàn)證模型的性能以及泛化效果,本文在5 個數(shù)據(jù)集上對不同模型進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)中4 個模型的平均分類準(zhǔn)確率如表3 所示.從表3 中可得出,本文的模型平均訓(xùn)練準(zhǔn)確率與VGG-19 這種模型參數(shù)數(shù)量較大的模型準(zhǔn)確率比較接近,雖然本文提出模型的準(zhǔn)確率稍低于參數(shù)量大的模型,結(jié)合展現(xiàn)模型參數(shù)數(shù)量的表2 來看,本文的模型在不犧牲較大準(zhǔn)確率的情況下減小了模型的參數(shù)量.同時結(jié)合原始MobileNet-V2 模型來看,本文的改進(jìn)提升了準(zhǔn)確率,分類準(zhǔn)確率更高.
表3 不同數(shù)據(jù)集上不同模型訓(xùn)練平均準(zhǔn)確率對比Tab.3 Comparison of the average accuracy of different model training on different datasets
本文提出的基于肺炎CT 圖像檢測肺炎的改進(jìn)的輕量級模型MobileNetV2-SELN 模型在CAP肺炎、COVID-19 和正常肺分類中取得了較好的效果.該模型與經(jīng)典DenseNet-121 等模型相比,參數(shù)量較少,經(jīng)過實(shí)驗(yàn)驗(yàn)證,模型的準(zhǔn)確率沒有降低.基于MobileNet-V2 進(jìn)行改進(jìn)的方法使得原模型的參數(shù)量增加,但分類準(zhǔn)確率的提升較為明顯.在接下來的工作中,研究將采用不同數(shù)據(jù)集來驗(yàn)證模型都的泛化能力,并深入研究其他肺部疾病CT 圖像特征,融入Transformer 和強(qiáng)化學(xué)習(xí)技術(shù)提升其他肺部疾病檢測準(zhǔn)確率.