李文勝
(湖南電子科技職業(yè)學院,湖南 長沙 410220)
銀屑病(Psoriasis,PS),又稱“牛皮癬”,是一種以表皮細胞過度增殖及免疫性炎癥為特征的慢性反復發(fā)作性疾病。該病具有病程長、頑固性、常見性以及外觀丑陋等特性,且病程后期可侵犯多種臟器,被世界衛(wèi)生組織列入世界十大頑癥之一。
銀屑病是不能夠完全治愈的,基本上每位患者都會復發(fā),需要長期跟蹤治療。銀屑病的診療難度非常高,病種主要包括尋常型銀屑病、關節(jié)型銀屑病、膿胞型銀屑病和紅皮病型銀屑病等四種類型。在做診斷時,不僅要考慮到外觀因素,還要綜合考慮心血管、心理、胃腸道、自身免疫等多個方面,因此,如何對疑似患者是否患上銀屑病以及患上何種銀屑病進行準確且快速地診斷是目前的一大難題。該問題屬于典型的分類問題。本文提出一種基于深度殘差網(wǎng)絡(Deep residual network,ResNet)的銀屑病分類診斷模型,通過訓練得到一個ResNet-34 模型來對銀屑病進行分類診斷,有效地提高了銀屑病的識別率。
在深度學習中,卷積神經(jīng)網(wǎng)絡(Convolutional Neural Network,CNN)是目前處理醫(yī)學圖像問題的主要手段。人們普遍認為CNN深度越深(參數(shù)越多),則CNN 的非線性表達能力就越強,可以進行更加復雜的特征模式的提取,理論上可以取得更好的結果。然而大量的研究表明,傳統(tǒng)的CNN 結構隨著層數(shù)加深到一定程度之后,越深的網(wǎng)絡反而效果更差,過深的網(wǎng)絡竟然使分類的準確率下降了,即出現(xiàn)網(wǎng)絡退化問題(Degradation problem)。為了解決這一問題,何凱明等人在2015年提出了著名的深度殘差網(wǎng)絡(ResNet)。ResNet由一個個地殘差單元相互組合而成(如圖1所示),其特點是容易優(yōu)化,并且能夠通過增加相當?shù)纳疃葋硖岣邷蚀_率。其內部的殘差塊使用了跳躍連接(短路機制),緩解了在深度神經(jīng)網(wǎng)絡中增加深度帶來的梯度消失或梯度擴散等問題。
圖1 深度殘差網(wǎng)絡
本文提出的基于ResNet-34 的銀屑病分類診斷流程如圖2所示。把患病部位的照片上傳到某一應用系統(tǒng)或APP 中,系統(tǒng)或APP 調用預先訓練好的并已經(jīng)部署完畢的ResNet-34 對該圖片進行分類診斷,系統(tǒng)給出是否患上銀屑病以及患上何種銀屑病的結論。
圖2 基于ResNet-34的銀屑病分類診斷流程
由于銀屑病的病癥較為復雜、發(fā)病的位置也多種多樣,醫(yī)生或患者在對患者的患病部位進行拍照時容易受到光照、拍攝設備以及設備像素等因素的影響,導致獲得的銀屑病患者圖像數(shù)據(jù)經(jīng)常存在大量的噪聲以及圖片格式不一致等問題,不便于進行進一步處理,為此本文從數(shù)據(jù)增強、圖片大小調整和圖片格式編碼等三個方面來對樣本圖片進行預處理,使之滿足ResNet-34的輸入要求,從而為ResNet-34的訓練做好準備。
2.1.1 銀屑病圖片數(shù)據(jù)增強
數(shù)據(jù)增強也稱為數(shù)據(jù)擴增,是指在不實質性的增加數(shù)據(jù)的情況下,讓有限的數(shù)據(jù)產(chǎn)生等價于更多數(shù)據(jù)的價值。對于圖片數(shù)據(jù)而言,目前常用的數(shù)據(jù)增強方法主要有旋轉、平移、縮放和邊緣填充等幾種,下面給出對銀屑病圖片進行數(shù)據(jù)增強的核心代碼。
2.1.2 銀屑病圖片大小調整
統(tǒng)一調整圖片的大小,便于后面采用ResNet-34模型進行深度學習。本文以調整data_augmentation 文件夾生成的新的銀屑病圖片為例,下面給出了對銀屑病圖片大小進行調整的核心代碼。
2.1.3 tfrecord編碼
ResNet-34 模型的輸入只能接受數(shù)值類型的數(shù)據(jù),因此,我們還需要對圖片進行編碼,即轉換成tfrecord 格式。tfrecord 是TensorFlow官方推薦的標準格式,能夠將圖片數(shù)據(jù)和標簽一起存儲成二進制文件,從而在TensorFlow 中實現(xiàn)快速地復制、移動、讀取和存儲操作。訓練ResNet-34 的時候,通過建立隊列系統(tǒng),可以預先將tfrecord格式的銀屑病數(shù)據(jù)加載進隊列,隊列會自動實現(xiàn)數(shù)據(jù)隨機或有序地進出棧,并且隊列系統(tǒng)和模型訓練是獨立進行的,這可以加速ResNet-34 的讀取和訓練。下面給出了將銀屑病圖片轉換成tfrecord格式的核心代碼。
本文構建了一個34層的深度殘差網(wǎng)絡(ResNet-34)來提取銀屑病的特征,如圖3 所示。ResNet-34 限定輸入的圖片像素大小為224×224。在ResNet-34 中,首先采用一個大小為7×7的卷積核以2個步長對原始輸入的圖像進行特征提取,得到一個大小為112×112的特征圖,緊接著采用最大池化(Max Pooling)技術來對特征進行壓縮,然后經(jīng)過四組大小分別為3、4、6和3的殘差塊進行多次反復的特征提取。其中,所有殘差組中的卷積核大小都為3×3,每組殘差塊中的第一個卷積核采用2 個步長進行特征提取,其他卷積核采用1 個步長進行特征提取。此外,同組殘差塊所采用的卷積核通道數(shù)均相同,分別為64、128、256 和512。各組輸出的特征圖大小依次為56×56、28×28、14×14、7×7。最后經(jīng)過平均池化和全連接層,采用Softmax函數(shù)進行分類映射,對輸入圖像是否屬于銀屑病進行分類診斷。
圖3 用于的銀屑病分類診斷的ResNet-34結構
本文提出的ResNet-34 模型采用交叉熵作為損失函數(shù)來評估模型的準確性,采用Adam 算法作為訓練過程中的優(yōu)化策略,采用Softmax函數(shù)實現(xiàn)銀屑病的多分類診斷,下面進行詳細闡述。
2.3.1 損失函數(shù)
文中采用交叉熵作為損失函數(shù),交叉熵能夠衡量同一個隨機變量中的兩個不同概率分布的差異程度,在本文中表示為銀屑病的真實概率分布與預測概率分布之間的差異。交叉熵的值越小,ResNet-34 的預測效果就越好。其計算公式為:
2.3.2 優(yōu)化器
本文采用Adam(Adaptive Moment Estimation)算法進行ResNet-34 的訓練。Adam 算法是一種在深度學習模型中將Momentum算法和RMSProp算法結合起來使用的優(yōu)化算法,在訓練的初始階段,我們首先初始化梯度的累積量和平方累積量:
然后在第t輪訓練中,我們計算得到Momentum算法和RMSProp算法的參數(shù)更新:
其中,v和v分別是損失函數(shù)在前-1 輪迭代過程中累積的梯度動量,β 是梯度累積的一個指數(shù),一般設置值為0.9。Momentum 算法和RMSProp 算法主要是基于梯度的移動指數(shù)加權平均來進行訓練,但是這種訓練方式在迭代開始的初期會導致梯度優(yōu)化的擺動幅度過大,不利于算法收斂。
所以需要對上面求得的幾個值做偏差修正:
通過式⑷可以求得在第t 輪迭代過程中,參數(shù)梯度累積量的修正值。接下來,可以根據(jù)Momentum算法和RMSProp 算法的結合來對模型的權重和偏置進行更新:
在Adam 算法中,參數(shù)β所對應的是Momentum算法中的β 值,一般取0.9;參數(shù)β所對應的是RMSProp 算法中的β 值,一般我們取0.999,ε 是一個平滑項,一般取值為10,而學習率α 則需要我們在訓練的時候進行微調。綜上所述,Adam 算法的偽代碼可以表述為:
當ResNet-34訓練完成之后,我們采用Softmax函數(shù)實現(xiàn)銀屑病的分類診斷。Softmax 函數(shù)主要用于多分類過程中,它將多個神經(jīng)元的輸出映射到(0,1)區(qū)間內看成概率來理解,從而實現(xiàn)多分類。ResNet-34 模型的輸出有五個值,代表四種常見的銀屑病類型(尋常型、關節(jié)型、膿胞型和紅皮病型)和正常人群(沒有患病)。因此,對于每一個樣本,依據(jù)Softmax函數(shù)的定義可知,它屬于類別i的概率為:
我們以2017年1月到2019年12月為一個時間周期,從湖南中醫(yī)藥大學附屬醫(yī)院的皮膚科獲取銀屑病患者數(shù)據(jù),并將其作為我們構建分類診斷模型的數(shù)據(jù)集。我們要求病人在活檢前沒有接受過系統(tǒng)的免疫抑制治療或停止PUVA/UV 治療至少一月以上,局部治療至少停止二周以上,且無其他皮膚病及系統(tǒng)性疾病,共篩選得到數(shù)據(jù)樣本40000份。
我們在一臺8 核16 線程的計算機上進行了實驗。其中,CPU 型號為Intel Core i9-9960X @ 3.10GHz,內存為16G,操作系統(tǒng)為Ubuntu 16.04 LTS 64 位。在ResNet-34 模型中激活函數(shù)選用relu 函數(shù),采用深度學習框架TensorFlow 和Anaconda 平臺實現(xiàn)了文中提出的基于深度殘差網(wǎng)絡的銀屑病分類診斷模型。此外,為了避免模型過擬合,我們在40000份銀屑病數(shù)據(jù)樣本上采用k 折交叉驗證(在文中k 取值為10)來評估ResNet-34 的預測性能,選出性能最好狀態(tài)下的超參數(shù),得到最終的模型。
本文將多分類問題轉換為二分類問題來進行實驗評價,轉換的方法是采用一對其余(One-vs-Rest)的方法:將其中一個類標記為正例,然后將剩余的其他類都標記成反例。由于本文ResNet-34 的輸出為5 類結果(4 類為銀屑病,1 類為正常),因此只需要構建5 個分類器就可以實現(xiàn)問題的轉換。然后采用目前常用的精確率、召回率和ROC 曲線等指標來評價基于ResNet-34 進行銀屑病分類診斷的性能。此外,我們將ResNet-34 和目前性能較好的卷積神經(jīng)網(wǎng)絡VGG19在銀屑病診斷上的性能做橫向比較,以評價本文模型的優(yōu)越性。
圖4給出了ResNet-34和VGG19在銀屑病數(shù)據(jù)集上分類診斷的召回率比較結果。從圖4 中可以看到,隨著銀屑病數(shù)據(jù)集規(guī)模的增大,兩種方法的召回率都有不同程度的上升。但總的來看,本文方法的召回率總是高于基于VGG19的診斷方法,平均來看,本文方法的召回率比VGG19 高出約9.5%。分析其原因可知,這是由于:①相比于VGG19 而言,ResNet-34 的深度更深,可以更好更豐富地提取銀屑病的特征;②ResNet-34 通過引入殘差的概念,在網(wǎng)絡結構中加入了恒等映射連接,有效地解決了網(wǎng)絡深度增加所帶來的性能退化問題,因此取得了更好的性能表現(xiàn)。
圖4 召回率比較(ResNet-34 VS VGG19)
最后,為了綜合衡量ResNet-34 和VGG19 兩種方法對于銀屑病分類診斷的特異性和敏感性,下面畫出它們的ROC 曲線。對于每個測試樣本,ResNet-34 和VGG19在進行每次分類時都會得到一個“Score”值(分值),表示該樣本多大概率上屬于正例(或負例)。我們要畫出ROC 曲線,則需要一系列關于True positive rate 和False positive rate 的值。文中通過如下的步驟來實現(xiàn):
⑴ 從高到低將“Score”值排序并依此作為閾值threshold;
⑵ 對于每個閾值,“Score”值大于或等于這個threshold 的測試樣本被認為正例,其它為負例。從而形成一組預測數(shù)據(jù)。
⑶將觀測數(shù)據(jù)的值進行連線,則可以得到ROC曲線。
圖5給出了兩種方法進行銀屑病分類診斷的ROC曲線比較結果,ROC 曲線下的面積稱為AUC(Area Under Curve)。AUC 值(面積)越大的分類器,性能越好。在圖5 中,紅色線條下方的AUC 值表示VGG19的分類性能,黑色線條下方的AUC 值表示ResNet-34的分類性能,顯然后者的AUC值要大于前者。這表明ResNet-34 的性能明顯好于基于VGG19 的方法,可以應用到真實環(huán)境下的銀屑病分類診斷任務中去。
圖5 ROC-AUC比較(ResNet-34 VS VGG19)
文中提出一種基于深度殘差網(wǎng)絡的銀屑病分類診斷模型,通過設計一個34層的殘差網(wǎng)絡來實現(xiàn)銀屑病的精準診斷,最后的實驗結果也驗證了所提模型的有效性。在下一步工作中,我們將繼續(xù)對銀屑病的癥狀、證型以及用藥規(guī)律等進行分析,將銀屑病的診斷、治療和用藥等一體化過程構建成知識圖譜,并進一步提出一種基于圖卷積神經(jīng)網(wǎng)絡的銀屑病用藥推薦模型,從而對醫(yī)生的診療工作提供更好的決策支持。