莫瑩君,郭瑞斌
(1.湖南省第二人民醫(yī)院超聲科,湖南 長沙 410000;2.中國人民解放軍國防科技大學(xué)智能科學(xué)學(xué)院,湖南 長沙 410073)
腎囊腫是泌尿外科常見疾病,為腎臟內(nèi)大小不等、與周圍組織分界清晰的囊性包塊,其內(nèi)含有淡黃色透明液體。腎囊腫發(fā)病率約10%,且隨年齡增長而逐漸升高,在70歲以上人群中的發(fā)病率>35%[1]。目前,超聲是觀察囊腎腫大小、部位及數(shù)量的主要手段。隨著現(xiàn)代醫(yī)療技術(shù)的快速發(fā)展,超聲數(shù)據(jù)每年以30%的速度增長,導(dǎo)致醫(yī)師工作量及工作壓力激增?;谌斯ぶ悄?artificial intelligence, AI)的醫(yī)學(xué)影像自動診斷是解決此種醫(yī)療困境的可行方案[2-3];利用深度學(xué)習(xí)(deep learning, DL)技術(shù)自動診斷疾病漸趨廣泛[4-11]。本研究觀察基于聲像圖的深度殘差網(wǎng)絡(luò)ResNet模型自動診斷腎囊腫的應(yīng)用價值。
1.1 一般資料 收集2018年6月—2019年12月3 670例于湖南省第二人民醫(yī)院接受腎臟超聲檢查患者,男2 569例,女1 101例,年齡40~85歲,平均(62.6±13.2)歲。納入標(biāo)準(zhǔn):聲像圖質(zhì)量滿足研究要求。排除標(biāo)準(zhǔn):①腸氣干擾明顯;②重度肥胖,聲衰減明顯;③腎臟明顯萎縮,邊界不清。
1.2 儀器與方法 采用Siemens ACUSMON S2000超聲儀,腹部探頭,頻率3~5 MHz。檢查當(dāng)日晨囑患者禁食。囑患者側(cè)臥,行常規(guī)經(jīng)腹超聲檢查,觀察腎臟大小、形態(tài)及回聲等;發(fā)現(xiàn)腎囊腫時,觀察其大小、邊緣、內(nèi)部回聲及血流情況。
1.3 構(gòu)建數(shù)據(jù)集 由6名超聲科醫(yī)師(主治醫(yī)師4名,主任醫(yī)師、副主任醫(yī)師各1名,平均工作年限12.5年)觀察腎臟聲像圖,經(jīng)綜合評判后共診斷2 024例單側(cè)腎單發(fā)囊腫(圖1A),余1 646例為正常腎(圖1B)。每例選取2幅腎臟聲像圖構(gòu)建數(shù)據(jù)集,共包含7 340幅圖像,將其分為訓(xùn)練集(6 294幅,含3 238幅腎囊腫、3 056幅正常腎)和測試集(1 046幅,含810幅腎囊腫、236幅正常腎);聲像圖分辨率均為490×350。
1.4 基于聲像圖自動診斷腎囊腫方法
1.4.1 梯度方向直方圖(histogram of oriented gradients, HOG)+支持向量機(jī)(support vector machines, SVM)方法 利用Python數(shù)字圖像處理包skimage提取數(shù)據(jù)集中聲像圖的HOG特征,在訓(xùn)練集上用Python機(jī)器學(xué)習(xí)庫sklearn對提取的HOG特征進(jìn)行SVM模型訓(xùn)練,再利用訓(xùn)練好的模型對測試集聲像圖進(jìn)行分類,得到自動腎囊腫診斷結(jié)果。
1.4.2 基于深度殘差網(wǎng)絡(luò)ResNet模型 利用深度殘差網(wǎng)絡(luò)[12]對腎臟聲像圖進(jìn)行自動診斷,流程見圖2,即輸入原腎臟聲像圖,分別以ResNet18、ResNet34及ResNet50 3種深度殘差網(wǎng)絡(luò)模型進(jìn)行處理后,輸出是否為腎囊腫的診斷結(jié)果。利用交叉熵?fù)p失進(jìn)行模型訓(xùn)練,設(shè)定學(xué)習(xí)率(learning rate, LR)為0.05,采用小批量隨機(jī)梯度下降(mini-batch SGD)算法對模型參數(shù)進(jìn)行更新[13-14]。
1.5 統(tǒng)計(jì)學(xué)分析 采用SPSS 17.0統(tǒng)計(jì)分析軟件。以超聲醫(yī)師診斷結(jié)果為金標(biāo)準(zhǔn),采用四格表法分別計(jì)算4種方法(HOG+SVM、ResNet18、ResNet34及ResNet50)診斷腎囊腫的敏感度、特異度及準(zhǔn)確率,并以χ2檢驗(yàn)比較其敏感度、特異度及準(zhǔn)確率。繪制4種方法診斷腎囊腫的受試者工作特征(receiver operating characteristic, ROC)曲線,獲得曲線下面積(area under the curve, AUC)。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
測試集中,ResNet34、ResNet50模型診斷腎囊腫的敏感度、特異度及準(zhǔn)確率均高于HOG+SVM方法及ResNet18模型(P均<0.01),且ResNet50模型的特異度和準(zhǔn)確率均高于ResNet34模型(P均<0.05),見表1。
表1 4種方法用于診斷測試集腎囊腫的效能比較[%(幅)]
ROC曲線顯示,HOG+SVM方法及ResNet18、ResNet34、ResNet50模型自動診斷腎囊腫的AUC分別為0.731[95%CI(0.691,0.771)]、0.754[95%CI(0.715,0.792)]、0.851[95%CI(0.819,0.884)]及0.892[95%CI(0.865,0.920)]。見圖3。
大數(shù)據(jù)驅(qū)動的AI技術(shù)已逐漸用于臨床診斷疾病。本研究觀察基于聲像圖的深度殘差網(wǎng)絡(luò)ResNet模型自動診斷腎囊腫的價值?;诔晥D像自動診斷腎囊腫是一個分類問題,每幅腎臟聲像圖有一個確定的類別,即腎囊腫或正常腎。模型訓(xùn)練需要高質(zhì)量的標(biāo)記數(shù)據(jù)集。本研究構(gòu)建包含腎囊腫和正常腎的聲像圖數(shù)據(jù)集,以對3種不同結(jié)構(gòu)的ResNet模型進(jìn)行訓(xùn)練和測試,并與基于傳統(tǒng)DL方法的HOG+SVM方法進(jìn)行對比分析。
HOG+SVM是基于DL的傳統(tǒng)圖像分類方法。HOG是利用圖像梯度信息提取特征值的方法,SVM則為按監(jiān)督學(xué)習(xí)方式對數(shù)據(jù)進(jìn)行二元分類的廣義線性分類器。提取聲像圖的HOG特征,并與SVM特征分類相結(jié)合,是實(shí)現(xiàn)腎囊腫圖像分類的經(jīng)典方法。深度殘差網(wǎng)絡(luò)ResNet是一種具有特殊結(jié)構(gòu)的深度神經(jīng)網(wǎng)絡(luò)模型,其核心設(shè)計(jì)是引入跨層連接構(gòu)造本體映射及殘差映射,并利用殘差塊減少計(jì)算和參數(shù)量,實(shí)現(xiàn)深度網(wǎng)絡(luò)對圖像高層次特征的提??;不同層數(shù)ResNet結(jié)構(gòu)中的核心組分——?dú)埐顗K可分為兩類,即殘差塊1和殘差塊2,殘差塊2的卷積核堆疊層數(shù)較殘差塊1更多,網(wǎng)絡(luò)層次更深。ResNet18中有8層殘差塊1,ResNet34中有16層殘差塊1,ResNet50中有16層殘差塊2。
本研究以HOG+SVM方法及3種ResNet模型在測試集中自動診斷腎囊腫,結(jié)果表明,ResNet34、ResNet50模型診斷腎囊腫的敏感度、特異度及準(zhǔn)確率均高于HOG+SVM方法及ResNet18模型,ResNet50模型的特異度和準(zhǔn)確率均高于ResNet34模型,且ResNet50模型的AUC最高。對于自動診斷腎囊腫,深度殘差網(wǎng)絡(luò)ResNet模型與傳統(tǒng)HOG+SVM方法相比具有優(yōu)勢,這是由于ResNet通過激活函數(shù)和提升隱藏層數(shù)量引入了非線性,大幅提升了模型的表現(xiàn)力,使自動分類性能提高。ResNet50模型診斷腎囊腫效能更好,其主要原因在于深度神經(jīng)網(wǎng)絡(luò)中卷積核的重要作用之一為局部連接,即對某一局部進(jìn)行感知,亦稱為“局部感受野”,網(wǎng)絡(luò)越深,卷積核堆疊獲得的感受野越大,接收的特征越全面,更便于提取具有全局語義的特征。ResNet50中有16層殘差塊2,網(wǎng)絡(luò)層次更深,更有利于自動診斷腎囊腫。
綜上,基于聲像圖的深度殘差網(wǎng)絡(luò)ResNet模型自動診斷腎囊腫的效能較好,尤以ResNet50模型更佳;但現(xiàn)階段該模型尚未能用于臨床,有待進(jìn)一步探索、改進(jìn)。