馬粵盼 趙希梅 張寧
摘要:針對傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)模型復(fù)雜度高、參數(shù)量大,網(wǎng)絡(luò)分類的精度和效率不佳等問題,提出一種應(yīng)用于醫(yī)學(xué)超聲圖像中肝硬化識別的深度學(xué)習(xí)方法(E-EfficientNet)。在EfficientNet網(wǎng)絡(luò)模型中,將模塊MBConv中的注意力機(jī)制SENet模塊替換為一種不降維的ECANet模塊,避免降維操作導(dǎo)致的特征信息缺失,增強(qiáng)通道學(xué)習(xí)能力并降低模型復(fù)雜度;將可變形卷積融入EfficientNet網(wǎng)絡(luò),利用可變形卷積核能夠依據(jù)目標(biāo)形態(tài)自適應(yīng)調(diào)整變化的特點(diǎn),充分學(xué)習(xí)圖像細(xì)節(jié),提升算法的泛化能力和特征提取能力;對有限樣本進(jìn)行數(shù)據(jù)增強(qiáng),避免訓(xùn)練過程中出現(xiàn)過擬合,并使用Leaky ReLU作為激活函數(shù)保留圖像負(fù)值特征信息,提高對肝硬化的識別效果。實(shí)驗(yàn)結(jié)果表明,該模型復(fù)雜度低,在肝硬化識別中準(zhǔn)確率為98.9%。
關(guān)鍵詞:EfficientNet;MBConv;注意力機(jī)制;可變形卷積;Leaky ReLU
中圖分類號:TP391 文獻(xiàn)標(biāo)志碼:A
肝硬化是一種慢性進(jìn)行性肝病,由一種或多種原因引起的彌漫性肝損害,早期的發(fā)現(xiàn)和治療可以預(yù)防癌變等并發(fā)癥的出現(xiàn),超聲檢測在預(yù)防和排查肝硬化疾病中有著重要的作用[1]。目前,計(jì)算機(jī)輔助診斷[2](Computer Aided Diagnosis,CAD)技術(shù)在醫(yī)學(xué)圖像處理領(lǐng)域發(fā)展迅速[3],在肝臟影像處理方面應(yīng)用廣泛,可以降低醫(yī)生由于主觀因素導(dǎo)致的誤判,提高診斷效率。隨著近幾年卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[4]在醫(yī)學(xué)圖像分析領(lǐng)域的飛速發(fā)展[5-6],針對超聲圖像中肝硬化的識別和分類[7-8]大多采用基于卷積特征自動提取的深度學(xué)習(xí)算法[9-10]。比如,根據(jù)LBP的局部二進(jìn)制特征抽取與稀疏表達(dá)技術(shù)建立的肝臟疾病鑒別方法[11],得到接近98%的檢測準(zhǔn)確率;基于數(shù)據(jù)增強(qiáng)的多尺度多特征卷積神經(jīng)網(wǎng)絡(luò)的新方法[12],對測試集的分類具有較好的效果。隨著卷積神經(jīng)網(wǎng)絡(luò)模型的復(fù)雜化,模型層數(shù)由淺變深,參數(shù)量和計(jì)算量極速增加,造成了網(wǎng)絡(luò)運(yùn)行效率低,復(fù)雜度高,時(shí)間耗費(fèi)長等問題。本文以EfficientNet[13]為基礎(chǔ),提出一種基于有效通道注意力EfficientNet的肝硬化識別方法(E-EfficientNet),優(yōu)化原網(wǎng)絡(luò)中的注意力機(jī)制,增強(qiáng)通道學(xué)習(xí)能力并降低網(wǎng)絡(luò)復(fù)雜度,并能增強(qiáng)網(wǎng)絡(luò)的魯棒性;在模型中加入可變形卷積,使網(wǎng)絡(luò)擁有自適應(yīng)的感受野,提高網(wǎng)絡(luò)的學(xué)習(xí)能力;在此基礎(chǔ)上采用Leaky ReLU激活函數(shù),保留更多特征信息從而提高識別準(zhǔn)確率。為驗(yàn)證所提方法的有效性,將其與E-VGG[14]、E-ResNet[15]等網(wǎng)絡(luò)模型進(jìn)行實(shí)驗(yàn)對比,結(jié)果證明本研究提出的E-EfficientNet方法在準(zhǔn)確率、正確率和召回率等指標(biāo)都優(yōu)于其他方法。
1 相關(guān)理論
1.1 EfficientNet網(wǎng)絡(luò)
EfficientNet是使用神經(jīng)架構(gòu)搜索[16]設(shè)計(jì)的新基礎(chǔ)結(jié)構(gòu)。該網(wǎng)絡(luò)提出一種簡單高效的組合縮放方式,利用一個(gè)固定的比例因子對網(wǎng)絡(luò)的寬度、深度和分辨率縮放獲得一系列EfficientNets模型,增加網(wǎng)絡(luò)的寬度、深度和分辨率都是為了提高網(wǎng)絡(luò)的泛化能力,增大感受野,從而捕捉到更細(xì)粒度的特征信息。
1.2 通道注意力網(wǎng)絡(luò)
近幾年興起的注意力機(jī)制在圖像處理領(lǐng)域中取得了重要的突破。有效通道注意力網(wǎng)絡(luò)(Efficient-Channel-Attention-Networks,ECANet)[17]是在壓縮和激勵(lì)網(wǎng)絡(luò)(Squeeze-and-Excitation-Networks,SENet)[18]的基礎(chǔ)上改進(jìn)得到的。SENet模塊通過學(xué)習(xí)的方式獲取到不同特征通道的重要程度,從而按照重要程度去提升或者抑制信息特征。流程結(jié)構(gòu)如圖1,首先傳入一個(gè)特征圖X,H、W、C分別為高度、寬度和通道尺寸,利用兩個(gè)全連接層和一個(gè)σ操作(Sigmoid函數(shù))對各信道進(jìn)行單獨(dú)的全局平均池化。兩個(gè)全連接層通過降維和升維控制模型復(fù)雜性以更好的捕捉跨通道交互,最終得到C個(gè)權(quán)重用于對應(yīng)的通道加權(quán),得到具有新權(quán)值的特征圖X'。
ECANet模塊的流程結(jié)構(gòu)如圖2所示,與SENet模塊相比,ECANet模塊將兩層全連接層換成了卷積核大小為k的一維卷積,避免降維操作,有效實(shí)現(xiàn)局部跨信道交互,降低模型復(fù)雜度。在不降低維度的情況下進(jìn)行全局平均池化,利用每個(gè)通道及k的鄰近來預(yù)測通道的權(quán)值,捕捉本地跨信道的交互信息。一維卷積核的大小k(k≤9)表示一個(gè)局域間的交互覆蓋,與通道維數(shù)C成正比并可以自適應(yīng)確定其最優(yōu)值。
1.3 可變形卷積
傳統(tǒng)的卷積操作是對輸入的特征圖在固定位置進(jìn)行采樣,卷積核通常具有固定尺寸和大小,對未知的變化適應(yīng)性差,只局限于模型自身的幾何變換,對于數(shù)據(jù)集較少、形變復(fù)雜的樣本卷積效果較差??勺冃尉矸e[19]在感受野中引入了可以根據(jù)數(shù)據(jù)情況自適應(yīng)學(xué)習(xí)的偏移量,使卷積核根據(jù)學(xué)習(xí)目標(biāo)的實(shí)際情況進(jìn)行自我調(diào)整,從而更好的提取輸入特征。如圖3所示,(a)中圓點(diǎn)表示常規(guī)卷積的感受野位置,(b)、(c)和(d)代表加上偏移量后的新的感受野位置,(c)和(d)是(b)的特殊情況,表明在添加偏移量后可變形卷積核的位置是可以根據(jù)當(dāng)前需要識別的圖像內(nèi)容來進(jìn)行自適應(yīng)調(diào)整。
1.4 激活函數(shù)Leaky ReLU
卷積神經(jīng)網(wǎng)絡(luò)的分類問題中,最常采用的激活函數(shù)是ReLU,因其形式簡單且高度非線性,在使用隨機(jī)梯度下降法時(shí)計(jì)算效率高,提高了模型的收斂性。但ReLU在輸入值接近零或?yàn)樨?fù)時(shí),函數(shù)的梯度變?yōu)榱悖咕W(wǎng)絡(luò)無法執(zhí)行反向傳播,導(dǎo)致神經(jīng)元不能更新參數(shù),只能丟棄特征圖中一部分負(fù)值特征信息。Leaky ReLU是ReLU的變體,具有ReLU所有的優(yōu)點(diǎn)[20],并且可以保留圖像的負(fù)值特征信息,如圖4所示。ReLU中,x<0時(shí)函數(shù)值為0。Leaky ReLU給出了一個(gè)負(fù)數(shù)梯度值,對輸入小于0部分的反應(yīng)有所變化,解決了一部分有用的負(fù)特征信息被丟棄的問題,減輕了ReLU的稀疏性。
2 本文算法E-EfficientNet
2.1 改進(jìn)的MBConv模塊
EfficientNe網(wǎng)絡(luò)主要由16個(gè)重復(fù)堆疊的移動翻轉(zhuǎn)瓶頸卷積(Mobile inverted Bottleneck Convolution,MBConv)模塊構(gòu)成。為了在降低模型復(fù)雜度時(shí)有效提高肝硬化樣本的識別率,改進(jìn)了MBConv模塊,如圖5所示。在MBConv模塊中,首先進(jìn)行Conv1×1的升維操作,通過深度可分離卷積(Depthwise Convolution)[21-22]減少網(wǎng)絡(luò)參數(shù),加快網(wǎng)絡(luò)運(yùn)行效率,注意力機(jī)制SENet模塊負(fù)責(zé)調(diào)整特征矩陣,通過學(xué)習(xí)自動獲取每個(gè)特征通道的重要程度,更好的保留重要的特征信息,最后利用Conv1×1降維輸出。改進(jìn)的MBConv模塊在調(diào)整注意力機(jī)制時(shí),用ECANet模塊替換原模型中的SENet模塊。ECANet模塊作為一種不降維的局部跨通道交互方法,在保證自動學(xué)習(xí)獲取到每個(gè)通道的重要程度的同時(shí)能有效降低模型的復(fù)雜度,實(shí)現(xiàn)了性能上的提優(yōu)。
2.2 有效通道注意力EfficientNet(E-EfficientNet)
由于醫(yī)學(xué)圖像具有特殊性,為使網(wǎng)絡(luò)模型充分學(xué)習(xí)到目標(biāo)的特征信息,在提高分類精度時(shí)不影響網(wǎng)絡(luò)的運(yùn)行效率,提出一種新的網(wǎng)絡(luò)模型E-EfficientNet(圖6)。與原網(wǎng)絡(luò)相比,E-EfficientNet網(wǎng)絡(luò)卷積核、步長和池化層不發(fā)生改變,模型初始將卷積核為3×3的常規(guī)卷積升級成3×3的可變形卷積,使網(wǎng)絡(luò)更好的適應(yīng)肝硬化樣本信息的多樣性,提高網(wǎng)絡(luò)的泛化能力。經(jīng)過可變形卷積網(wǎng)絡(luò)提取特征后,目標(biāo)圖片進(jìn)入重復(fù)堆疊的改進(jìn)的MBConv模塊。由于融入了ECANet模塊,改進(jìn)的MBConv模塊可以讓網(wǎng)絡(luò)更好地保留重要信息,忽略次要信息,從而更加準(zhǔn)確分類識別肝硬化樣本。
3 實(shí)驗(yàn)結(jié)果與分析
3.1 實(shí)驗(yàn)環(huán)境與參數(shù)設(shè)置
實(shí)驗(yàn)開發(fā)環(huán)境為Windows 10(64位)操作系統(tǒng),內(nèi)存32GB,顯卡NVIDIA GeForce GTX 1080Ti,基于Anaconda3 中的 Spyder3.6平臺下的pytorch1.2.0進(jìn)行實(shí)驗(yàn),提取樣本的Matlab版本為 R2018b。各網(wǎng)絡(luò)模型采用的實(shí)驗(yàn)參數(shù):epoch的訓(xùn)練輪數(shù)為100輪,學(xué)習(xí)率為0.001,優(yōu)化器使用隨機(jī)梯度下降法,每次輸入的樣本批量大小的batchsize為16,激活函數(shù)為Leaky ReLU。
3.2 數(shù)據(jù)選擇和處理
實(shí)驗(yàn)所需的數(shù)據(jù)集全部來自青島大學(xué)附屬醫(yī)院肝膽影像科,根據(jù)臨床醫(yī)師指示采集肝硬化標(biāo)本及正常肝標(biāo)本。在B超影像中,正常肝臟的回聲為微小而均勻的小斑點(diǎn),肝硬化的回聲則增粗增密并且輕度紊亂。實(shí)驗(yàn)使用Matlab對已獲得的樣本進(jìn)行感興趣區(qū)域ROI(Regions Of Interest)的提取,見圖7,提取后的正常肝和肝硬化樣本如圖8所示,共采集到1 200份樣本。
由于醫(yī)學(xué)數(shù)據(jù)數(shù)量有限且獲取耗費(fèi)時(shí)間和精力,所以在原有的1200張?jiān)紭颖镜幕A(chǔ)上進(jìn)行數(shù)據(jù)增強(qiáng),將樣本隨機(jī)旋轉(zhuǎn)不同角度,從而得到更多的樣本數(shù)量,如圖9所示。本次實(shí)驗(yàn)的訓(xùn)練集包括正常肝樣本2 000張,肝硬化樣本1 000張,測試集包括正常肝樣本和肝硬化樣本各500張。
3.4 實(shí)驗(yàn)結(jié)果
3.4.1 加入不同方法的實(shí)驗(yàn)對比 首先設(shè)置4組實(shí)驗(yàn)分別測試可變形卷積和Leaky ReLU激活函數(shù)。見表1,實(shí)驗(yàn)1為原EfficientNet網(wǎng)絡(luò),實(shí)驗(yàn)2是加入可變形卷積后的網(wǎng)絡(luò),對肝硬化樣本的識別率、正確率和召回率各提高了1.52%、1.03%和1.12%。實(shí)驗(yàn)3使用Leaky ReLU作為激活函數(shù),保留對分類有效的部分負(fù)值特征,較原網(wǎng)絡(luò)各項(xiàng)指標(biāo)分別提升了1.24%、1.69%和1.01%,由于保留負(fù)值信息,從而增加了較少的參數(shù)量,使模型的訓(xùn)練時(shí)間增加了28 s。實(shí)驗(yàn)4為將二者都加入得到的網(wǎng)絡(luò),總體識別率提高了2.63%,正確率和召回率分別提高了2.49%,2.25%。
將實(shí)驗(yàn)4的網(wǎng)絡(luò)與不同注意力機(jī)制融合后對肝硬化樣本重新分析,用CA(Coordinate Attention)模塊[23]和ECANet模塊分別替換網(wǎng)絡(luò)中的SENet模塊得到C-EfficientNet、E-EfficientNet模型,見表2。C-EfficientNet網(wǎng)絡(luò)與原網(wǎng)絡(luò)相比,準(zhǔn)確率提高了1.52%,正確率和召回率各提高了0.76%,0.77%,用時(shí)增加84 s,E-EfficientNet模型在各項(xiàng)指標(biāo)上分別提高了2.15%,1.61%和1.55%,時(shí)間縮短了30 s。由實(shí)驗(yàn)結(jié)果可知,將模型與ECANet模塊結(jié)合后可以更好地關(guān)注重要信息,肝硬化樣本識別效果和模型的運(yùn)行效率均得到提升。
3.4.2 不同分類方法對比 為了更好的評估E-EfficientNet網(wǎng)絡(luò)在肝硬化識別中的性能,將本文方法分別與VGG和ResNet兩種網(wǎng)絡(luò)結(jié)合得到E-VGG和E-ResNet,并與E-EfficientNet測試對比,結(jié)果見表3。改進(jìn)后的3個(gè)新模型在各項(xiàng)指標(biāo)上都得到不同程度的提升。E-VGG和E-ResNet網(wǎng)絡(luò)的識別率各提升了4.42%和4.92%,正確率、召回率和分類效率均有所提高;E-EfficientNet網(wǎng)絡(luò)的識別率達(dá)到98.9%,相比原網(wǎng)絡(luò)提升4.77%,時(shí)間損耗更少,正確率和召回率分別達(dá)到99.38%和97.8%,在針對肝硬化識別的實(shí)驗(yàn)中,與不同網(wǎng)絡(luò)模型結(jié)合對提高網(wǎng)絡(luò)識別效果是有效的。
3.4.3 模型復(fù)雜度對比 卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算復(fù)雜度時(shí)需要考慮時(shí)間復(fù)雜度和空間復(fù)雜度。時(shí)間復(fù)雜度是指模型的運(yùn)算次數(shù),決定了模型訓(xùn)練或預(yù)測的時(shí)間,用浮點(diǎn)運(yùn)算次數(shù)Flops(FLoating-point OPerations)表示。卷積神經(jīng)網(wǎng)絡(luò)整體的時(shí)間復(fù)雜度是所有卷積層時(shí)間復(fù)雜度的總和
其中,D是神經(jīng)網(wǎng)絡(luò)的卷積層的數(shù)量,指網(wǎng)絡(luò)的深度;l為第l個(gè)卷積層;M表示每個(gè)卷積核輸出特征圖的邊長;K是每個(gè)卷積核的邊長;C代表每個(gè)卷積核的通道數(shù)。
卷積神經(jīng)網(wǎng)絡(luò)的空間復(fù)雜度為
空間復(fù)雜度為總參數(shù)量與各層輸出特征圖之和,與卷積核的尺寸K、通道數(shù)C和層數(shù)D相關(guān),與輸入圖片的尺寸無關(guān)。如果模型具有較高的空間復(fù)雜度,會使模型的訓(xùn)練和預(yù)測花費(fèi)較長時(shí)間,且參數(shù)量較多,訓(xùn)練模型所需要的數(shù)據(jù)量越大,導(dǎo)致模型的訓(xùn)練更容易過擬合,無法更好地驗(yàn)證模型有效性。
與其他6種模型的復(fù)雜度比較結(jié)果見表4,改進(jìn)后的VGG、ResNet和EfficientNet模型網(wǎng)絡(luò)參數(shù)明顯減少,證明E-EfficientNet模型的魯棒性和有效性,相較于其他網(wǎng)絡(luò)模型擁有更低的復(fù)雜度和更高的運(yùn)算效率。
4 結(jié)論
本文提出一個(gè)新的網(wǎng)絡(luò)模型E-EfficientNet應(yīng)用于醫(yī)學(xué)圖像肝硬化的識別,利用可變形卷積能夠根據(jù)目標(biāo)形態(tài)自適應(yīng)調(diào)整感受野的特點(diǎn),充分學(xué)習(xí)特征信息,采用Leaky ReLU作為激活函數(shù)保留圖像負(fù)值信息,提高圖像的分類效果,保證模型的有效性和魯棒性與改進(jìn)后的VGG、ResNet等進(jìn)行對比實(shí)驗(yàn)和數(shù)據(jù)分析,本文方法在降低模型復(fù)雜度的情況下提高了識別率,并在效率和性能上都有一定的提升。后續(xù)實(shí)驗(yàn)將進(jìn)一步優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),提高識別率,并應(yīng)用于其他臨床超聲圖像中。
參考文獻(xiàn)
[1]MITREA D, LUPSOR M P, NEDEVSCHI S,et al. Discovering the cirrhosis grades from ultrasound images by using textural features and clustering methods[C]// 36th International Conference on Telecommunications and Signal Processing (TSP). Rome, 2013: 633-637.
[2]DOI K.Computer-aided diagnosis in medical imaging: historical review, current status and future potential[J]. Computerized Medical Imaging and Graphics, 2007, 31(4-5): 198-211.
[3]LITJENS G, KOOI T, BEJNORDI B E, et al. A survey on deep learning in medical image analysis[J]. Medical Image Analysis, 2017, 42: 60-88.
[4]周飛燕, 金林鵬, 董軍. 卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 計(jì)算機(jī)學(xué)報(bào), 2017, 40(6): 1229-1251.
[5]張順,龔怡宏,王進(jìn)軍.深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計(jì)算機(jī)視覺領(lǐng)域的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),2019,42(3):453-482.
[6]蘇賦,呂沁,羅仁澤.基于深度學(xué)習(xí)的圖像分類研究綜述[J].電信科學(xué),2019,35(11):58-74.
[7]PANIGRAHI S, NANDA A, SWARNKAR T. Deep learning approach for image classification[C]// 2nd International Conference on Data Science and Business Analytics (ICDSBA). Changsha, 2018: 511-516.
[8]LI Q, YANG Y J, GUO Y W, et al. Performance evaluation of deep learning classification network for image features[J]. IEEE Access, 2021, 9: 9318-9333.
[9]鞠維欣,趙希梅,魏賓,等.基于深度學(xué)習(xí)的肝硬化識別[J].青島大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,31(4):54-61.
[10] 李海強(qiáng),趙希梅,魏賓,等.基于多特征融合和ELM的肝病多分類識別[J].青島大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,31(4):42-48.
[11] 韓秀芝,趙希梅,于可歆,等.一種基于LBP特征提取和稀疏表示的肝病識別算法[J].中國生物醫(yī)學(xué)工程學(xué)報(bào),2017,36(6):647-653.
[12] 劉夢倫,趙希梅,魏賓.基于多尺度多特征卷積神經(jīng)網(wǎng)絡(luò)的肝硬化識別[J].計(jì)算機(jī)仿真, 2020,37(12):375-381.
[13] TAN M X, LE Q V. Efficientnet: Rethinking model scaling for convolutional neural networks[C]// 36th International Conference on Machine Learning (ICML). Long Beach, 2019: 6105-6114.
[14] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[DB/OL]. [2022-02-14]. https://arxiv.53yu.com/abs/1409.1556.
[15] HE K M, ZHANG X Y, REN S Q, et al. Deep residual learning for image recognition[C]// 2016 IEEE Conference on Computer Vision and Pattern Recognition. Seattle, 2016: 770-778.
[16] WISTUBA M, RAWAT A, PEDAPATI T. A survey on neural architecture search[DB/OL]. [2022-02-14] https://arxiv.org/abs/1905.01392
[17] WANG Q L, WU B G, ZHU P F, et al. ECA-Net: Efficient channel attention for deep convolutional neural networks[C]// 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition(CVPR). Seattle, 2020: 11531-11539.
[18] HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]// 31st IEEE/CVF Conference on Computer Vision and Pattern Recognition. Salt Lake City, 2018: 7132-7141.
[19] DAI J F, QI H Z, XIONG Y W, et al. Deformable convolutional networks[C]// IEEE International Conference on Computer Vision. Venice, 2017: 764-773.
[20] HE K M, ZHANG X Y, REN S Q, et al. Delving deep into rectifiers: Surpassing human-level performance on imagenet classification[C]// IEEE International Conference on Computer Vision. Santiago, 2015: 1026-1034.
[21] 劉夢倫,趙希梅,魏賓.基于MobileNet V2-ELM的肝硬化識別[J].青島大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,32(4):17-21.
[22] CHOLLET F. Xception: Deep learning with depthwise separable convolutions[C]// 30th IEEE/CVF Conference on Computer Vision and Pattern Recognition. Honolulu, 2017: 1800-1807.
[23] HOU Q B, ZHOU D Q, FENG J S. Coordinate attention for efficient mobile network design[C]// IEEE/CVF Conference on Computer Vision and Pattern Recognition. Electr Network, 2021: 13713-13722.
Liver Cirrhosis Recognition Based on Efficient Channel Attention EfficientNet
MA Yue-pana, ZHAO Xi-meia,b , ZHANG Ninga
(a. College of Computer Science and Technology,b. Shandong Province Key Laboratory of Digital
Medicine and Computer-assisted Surgery,Qingdao University,Qingdao 266071,China)
Abstract: Aiming at the problems of high complexity, large number of parameters and poor accuracy and efficiency of the traditional convolutional neural network model, a deep learning method (E-EfficientNet) for liver cirrhosis identification in medical ultrasound images was proposed. In the EfficientNet network model, the attention mechanism SENet module in MBConv was replaced by ECANet module that does not reduce the dimension, so as to avoid the loss of feature information caused by the dimensionality reduction operations, reduce the complexity of the model and enhance the channel learning ability. The deformable convolution was integrated into the EfficientNet network, and the deformable convolution kernel was adaptively adjusted and changed according to the image content, so as to fully learn the image details and improve the generalization ability and feature extraction ability of the algorithm. The data of limited samples was enhanced, over fitting was avoided in the training process, and Leaky ReLU was used as the activation function to save image negative feature information to improve the recognition effect of liver cirrhosis. The experimental results show that the complexity of the model is low, and the accuracy in liver cirrhosis recognition reaches 98.9%.
Keywords: EfficientNet;MBConv;attention mechanism;deformable convolution;Leaky ReLU
收稿日期:2022-03-16
基金項(xiàng)目:國家自然科學(xué)基金(批準(zhǔn)號:62006134)資助。
通信作者:趙希梅,女,博士,副教授,主要研究方向?yàn)橛?jì)算機(jī)軟件及計(jì)算機(jī)應(yīng)用,自動化技術(shù)。E-mail:xmzhao_qdu@163.com