婁潤東,陳俊彪,侯宏花,劉艷莉,田 珠,張鵬程,桂志國
(1.中北大學(xué) 生物醫(yī)學(xué)成像與影像大數(shù)據(jù)山西省重點實驗室,山西 太原 030051; 2.中國兵器工業(yè)試驗測試研究院,陜西 華陰 714200;3.中北大學(xué) 信息與通信工程學(xué)院,山西 太原 030051)
在現(xiàn)代醫(yī)學(xué)診斷中,細胞圖像分類發(fā)揮著重要的作用.通過對細胞圖像的分類,可以快速得到細胞的部分狀態(tài)信息,對病理的診斷和確定有著重要的意義.因此,長期以來醫(yī)學(xué)診斷的發(fā)展都是人們關(guān)注的重點研究課題.
我國對于醫(yī)學(xué)診斷中的細胞分類研究也十分重視.隨著新技術(shù)的發(fā)展和應(yīng)用,原有的細胞分類方法在分類效率等方面的缺陷逐漸暴露出來.為了推動細胞分類工作的發(fā)展,本文擬通過分析細胞分類方法目前存在的問題,研究一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類新方法M-ResNet.
細胞圖像分類是現(xiàn)代醫(yī)學(xué)診斷中常用的一種技術(shù)方法.目前細胞分類方法已經(jīng)發(fā)展的比較成熟,可以滿足不同條件下的需求.在應(yīng)用的過程中,現(xiàn)有的細胞分類方法也存在著一定的不足.
細胞學(xué)檢查法最早應(yīng)用于早期宮頸癌的排查工作.通過對細胞圖像的分析實現(xiàn)對細胞生理信息的判斷,可以有效提高早期宮頸癌的排查效率和準確率.但該類方法不僅需要大量專業(yè)技術(shù)人員,而且工作效率低下[1].采用計算機輔助細胞學(xué)檢測的方法不僅可以提高篩選效率,也能夠有效降低誤診率和假陰性率[2].
經(jīng)過多年發(fā)展,計算機輔助的細胞圖像分類方法已經(jīng)比較成熟.目前應(yīng)用于細胞分類的方法主要有兩種,分別是基于細胞核特征構(gòu)建的分類方法和多圖像裁剪分類方法.但這兩種方法的應(yīng)用都存在一定的局限性.基于細胞核特征構(gòu)建的分類方法缺乏一定的準確率,而多圖像裁剪分類則容易造成信息冗余或丟失等[3-4].因此,人們需要推動新的細胞分類方法的發(fā)展.深度卷積神經(jīng)網(wǎng)絡(luò)憑借自身的優(yōu)勢受到了人們的廣泛關(guān)注.
針對原有的細胞分類方法存在的缺陷,人們提出了基于卷積神經(jīng)網(wǎng)絡(luò)的細胞分類方法.作為人工神經(jīng)網(wǎng)絡(luò)的一種,卷積神經(jīng)網(wǎng)絡(luò)(CNN)在降低模型復(fù)雜度和權(quán)值數(shù)量的同時,可以有效保持圖像的高度不變形.因此,卷積神經(jīng)網(wǎng)絡(luò)在圖像識別等領(lǐng)域的應(yīng)用受到了人們的廣泛關(guān)注[5-6].
針對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)存在的向前傳輸神經(jīng)元輸出值持續(xù)增大的問題,Glorot等人提出了Xavier算法初始化CNN[7-8].但該方法仍未完全克服網(wǎng)絡(luò)的不穩(wěn)定性.因此,蔡楠等人提出了一種基于核主成分分析的方法,用于實現(xiàn)初始化CNN的權(quán)重[9].這些方法對于卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)優(yōu)化和應(yīng)用都有很重要的意義.
近年來,卷積神經(jīng)網(wǎng)絡(luò)在細胞分類中廣泛應(yīng)用.實踐經(jīng)驗表明:CNN在宮頸癌變的識別中可以發(fā)揮出重要的作用.CNN的應(yīng)用方法比較多樣,例如根據(jù)多模態(tài)數(shù)據(jù)、細胞圖像、陰道鏡圖像等都可以實現(xiàn)癌變識別的目的[10-12].在重疊圖像的識別方面,CNN也有著獨特的應(yīng)用[13].為了克服卷積神經(jīng)網(wǎng)絡(luò)在圖像特征提取方面存在的準確率問題,趙越等人提出了一種將特征提取器和分類器聯(lián)級為整體的CNN 分類器,并驗證了其應(yīng)用效果,明顯提升了細胞分類的準確率[14].上述研究都表明CNN可以有效提高細胞分類的效率和質(zhì)量.
現(xiàn)有的基于卷積神經(jīng)網(wǎng)絡(luò)的細胞分類方法在復(fù)雜背景和含有雜質(zhì)的細胞分類方向上存在著比較大的局限性.對此,本文以深度學(xué)習(xí)的理論為基礎(chǔ),根據(jù)卷積神經(jīng)網(wǎng)絡(luò)的算法特點,提出了一種適用于細胞分類的深度卷積神經(jīng)網(wǎng)絡(luò)的算法優(yōu)化方法,并進行了其在細胞分類中的應(yīng)用實驗.
CNN提供了一種端到端的深度學(xué)習(xí)模型,模型中的參數(shù)可以通過傳統(tǒng)的梯度下降法進行訓(xùn)練,經(jīng)過訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)到圖像的特征,并且完成對圖像特征的提取和分類.與傳統(tǒng)的機器學(xué)習(xí)算法相比,采用深度學(xué)習(xí)算法可以免去分割提取特征的繁瑣過程,讓算法流程變得簡單,同時也避免了傳統(tǒng)算法中由于預(yù)處理、分割、特征提取等操作造成的誤差,使得細胞的識別率比傳統(tǒng)的機器學(xué)習(xí)要高.
模型的深度在圖像分類中發(fā)揮著至關(guān)重要的作用,這導(dǎo)致ImageNet競賽的參賽模型都非常深.在追求網(wǎng)絡(luò)深度的時候,出現(xiàn)了一個新的問題:梯度消失/梯度爆炸.后來,通過歸一初始化和中間歸一化解決了這一問題,使得數(shù)十層的網(wǎng)絡(luò)在反向傳播的隨機梯度下降上能夠收斂.當(dāng)深層網(wǎng)絡(luò)能夠收斂時,一個退化問題又出現(xiàn)了,ResNet網(wǎng)絡(luò)通過深度殘差框架解決了這個退化問題.
ResNet模型的出現(xiàn)是CNN史上一個里程碑事件,ResNet可以訓(xùn)練出更深的CNN模型,從而實現(xiàn)更高的準確度.變化主要體現(xiàn)在ResNet直接使用stride=2的卷積做采樣,并且用global average pool層替換了全連接層.為了保持網(wǎng)絡(luò)層的復(fù)雜度,ResNet采用了一個重要的設(shè)計原則:當(dāng)特征圖的大小降低一半時,特征圖的數(shù)量將會增加一倍.
ResNet模型的核心是通過建立前面層與后面層之間的“短路連接”(shortcuts,skip connection),這有助于訓(xùn)練過程中梯度的反向傳播,從而訓(xùn)練出更深的CNN網(wǎng)絡(luò).
對于短路連接,當(dāng)輸入和輸出維度一致時,可以直接將輸入加到輸出上.可表示為
(1)
式中:F是殘差函數(shù),表示學(xué)習(xí)得到的殘差,xi表示殘差單元的輸入,xL表示殘差單元的輸出,f是激活函數(shù)ReLU.
當(dāng)維度不一致時,不可以直接相加.ResNet采用stride=2的卷積,然后再相加,可表示為
(2)
式中:Ws是對xl做一個變換,使其維度與F的維度匹配.
學(xué)習(xí)得到的殘差是F,原始的學(xué)習(xí)特征是F+x.從直觀上來看,殘差學(xué)習(xí)F相比原始的直接學(xué)習(xí)特征F+x更容易.當(dāng)殘差為0時,此時相當(dāng)于對輸入做恒等映射,至少能保證網(wǎng)絡(luò)的性能不會下降,實際上殘差也不會為0,這就會使得輸出層在輸入特征的基礎(chǔ)上學(xué)習(xí)到新的特征,從而擁有更好的性能.
從數(shù)學(xué)角度來分析,采用鏈式規(guī)則可以求得梯度函數(shù)
(3)
盡管ResNet模型使用了“短路連接”來實現(xiàn)特征重用(feature reuse),但是由于短連接的數(shù)量比較少,特征重用的作用并沒有達到最好的狀態(tài),通過簡單地堆疊殘余塊來構(gòu)建網(wǎng)絡(luò)不可避免地限制了其優(yōu)化能力.本文提出了深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類新方法M-ResNet,下面將詳細介紹改進細節(jié).
M- ResNet整體結(jié)構(gòu)圖和ResNet50基本一樣,如圖1 所示,整體結(jié)構(gòu)由5部分構(gòu)成,分別是:conv1,conv2_x,conv3_x,conv4_x,conv5_x.每部分由指定個數(shù)的block組成,圖1 中每部分堆疊的矩形的個數(shù)即表示對應(yīng)的block數(shù)量,總共有16個block,每個block為3層,所以有16×3=48層.開始有一個7×7×64的卷積,最后有一個用于分類的fc層,所以M-ResNet總共有50層.
圖1 M-ResNet整體結(jié)構(gòu)圖Fig.1 Overall structure diagram of M-ResNet
本文以conv2_x為例進行分析,conv3_x,conv4_x,conv5_x與之相同,如圖2 所示.主線結(jié)構(gòu)圖(除a,b的連線外)為原始ResNet中的conv2_x結(jié)構(gòu)圖,a,b連線表示本文新添加的嵌套快捷連接.
圖2 conv2_x殘差圖Fig.2 Residual graph of conv2_x
相比ResNet,M-ResNet使用了一種比ResNet連接更多的機制,將conv_2x中的前兩個block輸出的特征圖全部疊加到第3個block輸出的特征圖上作為conv_3x的輸入.M-ResNet是將原先的block殘差塊進行再一次的嵌套快捷連接,疊加的方式是通過元素級的相加.conv_2x中有3個普通快捷連接和2個嵌套快捷連接,共5個快捷連接,conv3_x,conv4_x,conv5_x分別有7,11,5個快捷連接,所以M-ResNet共有28個快捷連接,相比ResNet50的16個快捷連接,多出12個嵌套快捷連接,詳細情況如表1 所示.
表1 快捷連接的分布情況Tab.1 The distribution of the shortcut connection
在同一個模塊中,最后一層的輸出公式推導(dǎo)為
x1=H0(x0),x2=H1(x1).
(4)
將x1代入x2表達式得
x2=H1(H0(x0)).
(5)
以此類推
xl=H0(x0)+H1(x1)+…+Hl-1(xl-1),
(6)
xl=H0(x0)+…+Hl-1(Hl-2(…H0(x0)…)),
(7)
式中:xi表示第i層的輸出,也就是第i+1層的輸入,Hi(xi)表示對xi進行一系列操作:卷積,批歸一化,ReLU.
通過上文中對創(chuàng)業(yè)型中小企業(yè)的剖析,我們能夠?qū)ζ浒l(fā)展的具體過程做出一個十分明確的劃分。每一個創(chuàng)業(yè)型中小企業(yè)都應(yīng)該對自己的真實實力有一個正確的認知,并且根據(jù)自己的具體實力為自己不同階段的發(fā)展做出一份詳細的企業(yè)戰(zhàn)略管理規(guī)劃。只有創(chuàng)業(yè)型中小企業(yè)明確自己的發(fā)展目標,重點研發(fā)和發(fā)揚自己的核心技術(shù),不斷加強企業(yè)人力管理以及相應(yīng)的企業(yè)結(jié)構(gòu)管理,以及及時提升企業(yè)的整體競爭實力等等的目標,才能夠使得企業(yè)真正得到可持續(xù)性發(fā)展??偠灾?,創(chuàng)新型中小企業(yè)應(yīng)當(dāng)不斷對自己相關(guān)的管理規(guī)劃和結(jié)構(gòu)進行整改和創(chuàng)新,只有這樣,企業(yè)才能夠在激烈的競爭環(huán)境之下更好的生存。
本文通過分析深度學(xué)習(xí)的理論,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的算法特點,對基于深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類算法進行了優(yōu)化.為了驗證優(yōu)化后算法M-ResNet的效果,本文進行了實驗分析.實驗共分為3部分進行,分別是數(shù)據(jù)集預(yù)處理、網(wǎng)絡(luò)訓(xùn)練和結(jié)果分析.該測試方法也是目前廣泛采用的實驗測試方法,可以對實驗效果進行比較全面的分析.
本文采用的數(shù)據(jù)集是來自海萊烏科技大學(xué)(Herlev University Hospital,HUH)和丹麥科技大學(xué)(Technical Un iversity of Denmark,TUD)搜集的Herlev巴氏涂片新版數(shù)據(jù)集.總共917個單獨的巴氏涂片細胞圖像,分別為淺表鱗狀上皮、中層鱗狀上皮、柱狀上皮、輕度中度重度非典型增生和原位癌共7類細胞.
圖3 所示為Herlev數(shù)據(jù)集中的7類細胞圖像示例,其中a,b,c類為正常細胞,d,e,f,g類為異常細胞.
圖3 數(shù)據(jù)集中典型示例Fig.3 Typical examples of data sets
數(shù)據(jù)集預(yù)處理是細胞分類的首要工作,是指通過對數(shù)據(jù)集的增強、均衡等工作,實現(xiàn)對數(shù)據(jù)集的擴充.一般而言,神經(jīng)網(wǎng)絡(luò)需要大量的參數(shù),不少的神經(jīng)網(wǎng)絡(luò)的參數(shù)都是數(shù)以百萬計的,而使得這些參數(shù)可以正確工作就需要大量的數(shù)據(jù)進行訓(xùn)練,尤其對于宮頸癌數(shù)據(jù)集,不僅數(shù)據(jù)量少,而且權(quán)威認證的更是少之又少.本文選用的Herlev數(shù)據(jù)集數(shù)據(jù)量并不是很大,所以本文通過旋轉(zhuǎn)對數(shù)據(jù)集進行擴充.增加訓(xùn)練的數(shù)據(jù)量,不僅僅是網(wǎng)絡(luò)訓(xùn)練的需要,而且可以使得神經(jīng)網(wǎng)絡(luò)具有更強的泛化能力,更好地適用于細胞分類,同時提高模型的魯棒性.
在本次實驗中,共選取了3 878幅細胞圖像,其中包括1 058幅正常細胞圖像和2 820幅異常細胞圖像.為了實現(xiàn)分類工作,圖像處理采用旋轉(zhuǎn)統(tǒng)一處理的方法,形成統(tǒng)一大小的圖像.對于大小不足的圖像,則采用外圍像素點填充0的處理方法.預(yù)處理結(jié)果為訓(xùn)練集圖像3 528幅和測試集圖像350幅,如表2 所示.
表2 訓(xùn)練集和測試集分布Tab.2 Distribution of training set and test set
在進行數(shù)據(jù)集預(yù)處理的過程中,本文發(fā)現(xiàn)柱狀上皮細胞和重度非典型增生細胞在區(qū)分特征上有比較高的相似度.這一現(xiàn)象可能會導(dǎo)致后續(xù)圖像分類中出現(xiàn)一定的錯誤.
每類細胞選用50張樣本進行測試,正確率、召回率和F值是評價網(wǎng)絡(luò)優(yōu)劣的重要指標.其定義分別為
(8)
(9)
(10)
其中,識別出的個體總數(shù)即為識別出的正確細胞個數(shù)加上識別出的判斷錯誤的細胞個數(shù);測試集中存在的個體總數(shù)即為本文選取的各類細胞的樣本(50張).正確率是評估識別出的細胞中判斷正確的細胞所占的比例;召回率是指召回目標類別的比例;F值是綜合前兩者的評估指標,用于綜合反映整體的指標.
在完成預(yù)處理工作后,本文采用M-ResNet對宮頸細胞數(shù)據(jù)集進行分類識別.設(shè)備要求:① 在Window10 X64系統(tǒng)上進行;② GeForce GTX1080 Ti GPU顯卡;③ 內(nèi)存15 G.該實驗在TensorFlow框架下進行訓(xùn)練.本文的迭代次數(shù)為20 000,動量為0.9,學(xué)習(xí)率為0.000 1.
為了防止過擬合,提高模型的泛化能力,在模型訓(xùn)練的過程中,將訓(xùn)練集按照5∶1的比例進一步地劃分為訓(xùn)練集(train samples)和驗證集(validation samples).在本文中,訓(xùn)練集的數(shù)量為2 943,驗證集的數(shù)量為585.
如圖4 所示,本文的M-ResNet模型以宮頸細胞圖像及其標簽作為輸入,通過網(wǎng)絡(luò)的學(xué)習(xí),得到一個模型文件,最后輸入測試集,得到帶有標簽和概率的結(jié)果圖像.
圖4 整體框架流程圖Fig.4 Typical examples of data sets
完成數(shù)據(jù)集預(yù)處理、訓(xùn)練和測試工作后,本文對所得到的圖像數(shù)據(jù)進行了統(tǒng)一處理,并對基于深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類新方法M-ResNet的應(yīng)用結(jié)果進行了分析.圖5 為7類細胞的分類效果圖.圖5中標出了每個宮頸細胞的細胞核,并標注該細胞屬于哪種宮頸細胞類型及細胞屬于所標類型的概率.圖5中,所屬細胞類型及其概率分別為:(a)normalSuperficiel 1.0,(b)Normal intermediate 1.0,(c)Normal columnar 0.99,(d)Light dysplastic 1.0,(e)Moderate dysplastic 0.99,(f)Severe dysplastic 0.99,(g)Carcinoma in situ 0.99.
圖5 分類結(jié)果圖Fig.5 The results of assortment
通過對表3的測試結(jié)果進行數(shù)據(jù)分析,本文發(fā)現(xiàn)在細胞分類結(jié)果中共有淺表鱗狀上皮、中層鱗狀上皮、柱狀上皮、輕度非典型增生和重度非典型增生5類細胞分類完全正確.但在中度非典型增生和原位癌細胞分類中則存在一定的錯誤,均有2幅圖像分類錯誤,占比4%.從整體數(shù)據(jù)分析來看,數(shù)據(jù)集的分類平均錯誤率為1.14%(1~98.86%).與改進之前的ResNet的分類方法平均錯誤率4.29%(1~95.71%)相比,降低了3.15%,正確率有極大的提高[16].
表3 測試集正確率Tab.3 Accurary of the test set
識別出的宮頸細胞個體總數(shù)等于測試集中存在的宮頸細胞個體總數(shù),所以求得的正確率、召回率和F值是一樣的,如表4 所示.可以看出M-ResNet的查全率和查準率都比ResNet要高的多.
為了進一步對M-ResNet的網(wǎng)絡(luò)性能進行分析,記錄了訓(xùn)練過程中的loss值變化,并給出了loss曲線圖,如圖6 所示.可以看出,在經(jīng)過10 000次訓(xùn)練之后,M-ResNet算法的損失值區(qū)域平緩,幾乎沒有升降,相比ResNet算法更加穩(wěn)定.
表4 客觀評價指標Tab.4 Objective evaluation criteria
圖6 Loss曲線圖Fig.6 Graph of Loss
綜上所述,本文所設(shè)計的基于深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類新方法M-ResNet在采用合理數(shù)據(jù)處理的情況下,可以滿足細胞分類高精確度和高效率的要求,對于細胞分類的發(fā)展有著重要的意義.
宮頸細胞分類對醫(yī)學(xué)診斷和醫(yī)學(xué)圖像處理有著重要的意義.針對現(xiàn)有的細胞分類方法中存在的效率低、正確率偏低等問題,本文以深度學(xué)習(xí)理論為基礎(chǔ),研究了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類新方法M-ResNet,并采用Herlev數(shù)據(jù)集對該方法進行了測試.測試結(jié)果表明:該方法在提高細胞分類正確率和工作效率方面有著明顯的作用.但對于中度非典型增生和原位癌的具體識別工作還有待進一步提高,可作為下一步研究的主要工作目標.