程龍,秦航,余晶,蔣紅兵 ,宋寧寧△
(1.南京醫(yī)科大學(xué)附屬南京醫(yī)院(南京市第一醫(yī)院) 臨床醫(yī)學(xué)工程處,南京 210006;2.南京市急救中心,南京 210003)
肺癌是發(fā)病率和致死率最高的癌癥之一[1-3],在我國,肺癌的5年生存率低于20%[4-5]。臨床治療時,醫(yī)生會依據(jù)患者當(dāng)前的癌癥分期,制定不同的治療方案,并對療效進(jìn)行評估。
縱膈淋巴結(jié)是否轉(zhuǎn)移與肺癌分期具有重要聯(lián)系,是臨床診斷中最受關(guān)注的一個方面。當(dāng)排除遠(yuǎn)處轉(zhuǎn)移的情況之后,確定是否合并有縱膈淋巴結(jié)轉(zhuǎn)移,對確定治療方案起到?jīng)Q定性作用。因此,縱膈淋巴結(jié)良惡性分類對于肺癌治療具有重大意義。
超聲彈性成像技術(shù)配合超聲內(nèi)鏡引導(dǎo)下的經(jīng)支氣管鏡針吸活檢術(shù)[6-8](endobronchial ultrasound-guided transbronchial needle aspiration,EBUS-TBNA)對肺門及縱膈腫大淋巴結(jié)診斷、肺癌分期等方面都具有提高診斷效率的作用。相關(guān)研究表明,傳統(tǒng)方法利用超聲彈性成像對縱膈淋巴結(jié)性質(zhì)進(jìn)行診斷時,計算超聲彈性圖像中藍(lán)色部分面積更具有診斷價值[9-10]。然而該方法需要手動勾畫縱膈淋巴結(jié),然后計算目標(biāo)淋巴結(jié)中藍(lán)色部分面積比例,來確定縱膈淋巴結(jié)的性質(zhì),工作量大,且準(zhǔn)確率及效率依賴于臨床醫(yī)生的經(jīng)驗。
目前,國內(nèi)外采用深度學(xué)習(xí)的方法對縱膈淋巴結(jié)超聲彈性圖像進(jìn)行分類的研究較少。國內(nèi)上,王洪凱等[11]采用機器學(xué)習(xí)算法對PET/CT縱膈淋巴結(jié)性質(zhì)進(jìn)行了判定;徐少偉等[12]提出基于卷積神經(jīng)網(wǎng)絡(luò)和注意力機制的兩步級聯(lián)的胸部CT縱膈淋巴結(jié)分割算法,通過引入醫(yī)學(xué)先驗和增強通道、空間多級特征來提高縱膈淋巴結(jié)分割性能。國外,Wang等[13]采用機器學(xué)習(xí)和深度學(xué)習(xí)算法對非小細(xì)胞肺癌的PET/CT縱膈淋巴結(jié)性質(zhì)進(jìn)行了分類;Wallis等[14]使用深度學(xué)習(xí)中的CNN網(wǎng)絡(luò)對PET/CT圖像的病理性縱膈淋巴結(jié)進(jìn)行了識別;Choi等[15]使用生成對抗網(wǎng)絡(luò)對胸部CT圖像的縱膈淋巴結(jié)進(jìn)行了分析;Wang等[16]比較了深度學(xué)習(xí)方法和四種機器學(xué)習(xí)方法對PET/CT圖像中的非小細(xì)胞肺癌(NSCLC)縱隔淋巴結(jié)轉(zhuǎn)移進(jìn)行分類。
為提高準(zhǔn)確率及效率,本研究提出一種深度學(xué)習(xí)方法,對縱膈淋巴結(jié)超聲彈性圖像進(jìn)行自動分類。與傳統(tǒng)方法相比,該方法無需手動勾畫目標(biāo)淋巴結(jié)和計算藍(lán)色部分面積,有效提高了診斷效率和診斷準(zhǔn)確率,可作為臨床輔助診斷的重要工具。
本研究樣本均來自南京市第一醫(yī)院,共收集了2016年6月至2020年8月呼吸科提供的294例患者的369張縱膈淋巴結(jié)圖像,其中男性208人,女性86人,年齡從27歲到83歲。淋巴結(jié)通過EBUS-TBNA穿刺組織方法進(jìn)行了良惡性標(biāo)記。
由EBUS-TBNA技術(shù)得到縱膈淋巴結(jié)圖像,經(jīng)臨床醫(yī)師進(jìn)行勾畫,得到感興趣區(qū)域(region of interest,ROI)。采用隨機裁剪的方式將圖像裁剪為224×224像素。圖1為圖像預(yù)處理前后的縱膈淋巴結(jié)圖像。將裁剪好的369張縱膈淋巴結(jié)圖像按照8∶2的比例劃分為訓(xùn)練集與測試集,訓(xùn)練集用來訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)模型,測試集用來測試模型性能。
圖1 圖像預(yù)處理
本研究采用PyTorch作為深度學(xué)習(xí)框架,使用Python3.8作為編程語言,在CPU為Intel(R) Core(TM)i5-7300HQ 環(huán)境下訓(xùn)練,利用NVIDIA CUDA與cuDNN進(jìn)一步加速運算。將算法學(xué)習(xí)率設(shè)置為0.0001,批量大小為4,Iteration為1 000。在每次訓(xùn)練結(jié)束后將損失率與準(zhǔn)確率記錄在CSV文件中,創(chuàng)建折線圖反映結(jié)果變化,根據(jù)該變化在訓(xùn)練過程中調(diào)整超參數(shù),以防止過擬合現(xiàn)象。
為解決卷積神經(jīng)網(wǎng)絡(luò)中的退化問題,本研究采用的模型為殘差網(wǎng)絡(luò)(ResNet),運用殘差學(xué)習(xí)理論對卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行改良,通過加入恒等映射與連續(xù)卷積結(jié)構(gòu)形成殘差模塊以提取高維特征。圖2為殘差學(xué)習(xí)原理圖。
圖2 殘差學(xué)習(xí)原理Fig.2 Residual learning principle
因本研究數(shù)據(jù)較少,所以采用遷移學(xué)習(xí)方法,以防止過擬合。遷移學(xué)習(xí)采用的網(wǎng)絡(luò)模型為ResNet34模型,由一個7*7的卷積層、池化層,以及一系列3*3的卷積層搭成殘差網(wǎng)絡(luò),最后由一個平均池化層與全連接層得到分類結(jié)果。
訓(xùn)練集損失能夠反映出該分類模型在訓(xùn)練集上的擬合能力,用于表示訓(xùn)練集在模型中的預(yù)測結(jié)果與真實結(jié)果的誤差。使用ResNet模型進(jìn)行訓(xùn)練,得到最終的訓(xùn)練集損失結(jié)果,見圖3。
圖3 訓(xùn)練集損失Fig.3 Train loss
由圖3可知,訓(xùn)練集損失呈逐漸下降趨勢,隨訓(xùn)練次數(shù)的增加,下降趨勢逐漸變緩,最終在100個epoch左右波動。
測試集準(zhǔn)確率可驗證測試集的準(zhǔn)確性,是評價網(wǎng)絡(luò)效果的主要標(biāo)準(zhǔn)。使用ResNet網(wǎng)絡(luò)進(jìn)行訓(xùn)練,得到最終的測試集準(zhǔn)確率結(jié)果,見圖4。
圖4 測試集準(zhǔn)確率Fig.4 Test accuracy
由圖4可知,測試集準(zhǔn)確率呈增加趨勢,在實驗初期準(zhǔn)確率有顯著提高,當(dāng)準(zhǔn)確率增至60%時增幅減緩,隨后逐漸提高到75%左右開始小幅波動。
傳統(tǒng)方法和深度學(xué)習(xí)方法均以EBUS-TBNA 穿刺病理結(jié)果作為縱膈淋巴結(jié)良惡性的診斷標(biāo)準(zhǔn);若EBUS-TBNA 穿刺病理結(jié)果無法確定淋巴結(jié)的性質(zhì),后續(xù)手術(shù)病理、經(jīng)驗治療和影像學(xué)隨訪需至少3個月,方可確定淋巴結(jié)的性質(zhì)。
傳統(tǒng)方法通過計算圖像的藍(lán)色區(qū)域面積,利用SPSS Statics23軟件構(gòu)建受試者工作曲線(ROC),尋找最佳截斷值,通過比較圖像藍(lán)色部分面積與最大約登指數(shù),得出其準(zhǔn)確度、靈敏度、特異度分別為69.1%、68.7%、69.0%。
本研究使用ResNet網(wǎng)絡(luò)對縱膈淋巴結(jié)圖像進(jìn)行訓(xùn)練,將369張圖片按照8∶2劃分為訓(xùn)練集與測試集,以保證分類結(jié)果的客觀性,得到測試集準(zhǔn)確度、靈敏度、特異度分別為83.3%、78.6%、84.4%。兩種方法對比結(jié)果見表1。
表1 兩種方法結(jié)果比較Table 1 Comparison of the results of the two methods
由表1可知,本研究準(zhǔn)確率比傳統(tǒng)方法提高6%左右,可作為臨床輔助診斷的重要工具。而且深度學(xué)習(xí)分類模型能夠?qū)崿F(xiàn)實時診斷,在做支氣管鏡檢查時可為醫(yī)生取樣提供重要參考。今后可通過擴大樣本量、提高圖像質(zhì)量、優(yōu)化深度學(xué)習(xí)算法等,以進(jìn)一步提高分類的準(zhǔn)確率。
本研究利用ResNet網(wǎng)絡(luò)設(shè)計分類算法,相對于傳統(tǒng)計算藍(lán)色部分面積比例法,可得到最高87.7%,平均75.1%的準(zhǔn)確率,高于傳統(tǒng)藍(lán)色部分面積法的69.1%,體現(xiàn)了深度學(xué)習(xí)在縱膈淋巴結(jié)的良惡性識別方面的優(yōu)勢。然而,在使用卷積神經(jīng)網(wǎng)絡(luò)對縱膈淋巴結(jié)進(jìn)行分類時,還存在以下問題:
(1)樣本尺寸不統(tǒng)一。超聲彈性圖像樣本大小不一致,導(dǎo)致在選取裁剪框時,可能會出現(xiàn)關(guān)鍵信息丟失。
(2)樣本分辨率較低。樣本圖像整體清晰度較低、存在噪聲,圖像有效信息較原始超聲圖像低,在后期訓(xùn)練時會產(chǎn)生較大誤差。
(3)樣本數(shù)量少。本研究共收集縱膈淋巴結(jié)圖像369幅,可能導(dǎo)致訓(xùn)練的過擬合,致使訓(xùn)練效果下降。
(4)網(wǎng)絡(luò)模型分類準(zhǔn)確率不高。本研究所使用到的卷積神經(jīng)網(wǎng)絡(luò)模型為ResNet34模型,可能存在冗余問題,影響網(wǎng)絡(luò)的訓(xùn)練效果。
(5)訓(xùn)練結(jié)果波動較大。ResNet網(wǎng)絡(luò)可以在測試集上實現(xiàn)最高為87.7%的準(zhǔn)確率,而平均準(zhǔn)確率卻只有75.1%,結(jié)果波動較大。
在后續(xù)工作中,考慮從以下幾個方面改進(jìn),以提高分類準(zhǔn)確率:(1)進(jìn)一步擴大樣本量。在患者進(jìn)行超聲檢查時,多角度、多層次地對病患部位進(jìn)行拍攝,以達(dá)到增加樣本量的目的;或與其他醫(yī)院進(jìn)行合作,收集更多樣本,以達(dá)到更好的訓(xùn)練效果。(2)直接從超聲系統(tǒng)中導(dǎo)出原始高清的超聲彈性圖像,再進(jìn)行訓(xùn)練,以提高分類效果。(3)重新規(guī)劃網(wǎng)絡(luò)結(jié)構(gòu),提高其特征提取能力,提升訓(xùn)練效果。目前的研究主要是基于ResNet網(wǎng)絡(luò)的遷移學(xué)習(xí)方法,對于網(wǎng)絡(luò)本身架構(gòu)并未進(jìn)行太多改動,后續(xù)可通過加入其他卷積模塊,構(gòu)建具有針對性、特異性的卷積神經(jīng)網(wǎng)絡(luò),以達(dá)到更理想的效果。