蔣正鋒,許 昕
1廣西民族師范學(xué)院數(shù)理與電子信息工程學(xué)院,廣西 崇左 532200;2廣西南寧市悅美韓星醫(yī)療門診部,廣西 南寧530023
COVID-19是一種傳染性極強(qiáng)的流行疾?。?-2],全球各國都采用防疫措施與大面積施打疫苗來控制疫情的蔓延[3],但傳播性更強(qiáng)的變異病毒的出現(xiàn)加大了疫情控制的難度。國家衛(wèi)健委發(fā)布最新版本的《新型冠狀病毒感染的肺炎診療方案》[4],把COVID-19影像學(xué)特征的臨床表現(xiàn)作為疑似病例診斷、臨床分型的依據(jù)。核酸檢測(cè)是快速發(fā)現(xiàn)COVID-19患者的一種方法,但檢測(cè)結(jié)果成陽性[5]可能晚于肺部CT影像[6]的表現(xiàn),也存在假陰性與漏檢的情況,CT影像在COVID-19患者的確診、隔離、療效評(píng)價(jià)與預(yù)后各個(gè)方面具有重要意義。
臨床醫(yī)生通過閱讀CT圖像,根據(jù)其獲取的信息對(duì)患者進(jìn)行診斷,這種傳統(tǒng)的人工診斷方式具有一定的局限性[7]。近年來深度學(xué)習(xí)技術(shù)以其特有的特征提取與識(shí)別能力,逐漸成為醫(yī)學(xué)領(lǐng)域的研究熱點(diǎn)之一,如胸片質(zhì)控[8]、肺結(jié)節(jié)檢測(cè)[9-11]、肺癌診斷[12-13]等諸多肺部疾病中逐漸得到臨床認(rèn)可,也促進(jìn)了醫(yī)學(xué)影像技術(shù)的發(fā)展。近期,阿里巴巴達(dá)摩醫(yī)院醫(yī)療人工智能(AI)團(tuán)隊(duì)基于最新的診療方案[14-16],與其他機(jī)構(gòu)合作,成功建立了基于AI的對(duì)患者肺部CT圖像進(jìn)行分析和解釋的模型,準(zhǔn)確率達(dá)到96%以上,為醫(yī)生的診斷提供了依據(jù);阿里達(dá)摩院與阿里云共同研發(fā)了根據(jù)患者多維信息來幫助醫(yī)生制定治療方案的輔助診斷系統(tǒng);上海市公共衛(wèi)生臨床中心和依圖醫(yī)療共同合作開發(fā)的業(yè)界首個(gè)COVID-19 智能輔助診斷系統(tǒng)[17],實(shí)現(xiàn)對(duì)肺部定量化分析;也有鐘南山等專家聯(lián)合開發(fā)了基于物聯(lián)網(wǎng)的COVID-19 智能診治輔助系統(tǒng)nCapp[18],對(duì)不同的患者制定不同的治療方案;張康教授團(tuán)隊(duì)研發(fā)的融合深度學(xué)習(xí)、遷移學(xué)習(xí)和語義分割技術(shù)等多種技術(shù)的篩查、診斷與預(yù)測(cè)系統(tǒng),它在20 s內(nèi)完成檢測(cè)和診斷過程,并且準(zhǔn)確率達(dá)到90%以上。目前大型公司或國家級(jí)研究團(tuán)隊(duì)研發(fā)的COVID-19輔助診斷模型準(zhǔn)確度都在90.00%以上[19-20],但診斷模型采用的技術(shù)或解決問題方案對(duì)外是封閉的,外界無法獲悉診斷系統(tǒng)的相關(guān)技術(shù),不能更進(jìn)一步的研究與擴(kuò)展。
本文主要研究深度學(xué)習(xí)技術(shù)構(gòu)建小樣本的COVID-19輔助診斷模型,所采用的技術(shù)或方案可進(jìn)一步的研究與擴(kuò)展,創(chuàng)新性地將遷移學(xué)習(xí)技術(shù)應(yīng)用于基于CT影像的COVID-19輔助診斷模型,構(gòu)建基于小樣本訓(xùn)練的診斷模型的,縮短了模型的訓(xùn)練時(shí)間;同時(shí),提出多參數(shù)如激活函數(shù)、損失函數(shù)、優(yōu)化算法、學(xué)習(xí)率和樣本批次大小逐步融合優(yōu)化策略,從而有效提高模型診斷準(zhǔn)確率?,F(xiàn)報(bào)道如下。
為了更容易提取樣本的相關(guān)信息,一般需對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理。數(shù)據(jù)預(yù)處理包括了歸一化技術(shù)、非線性變換、特征提取、離散輸入、目標(biāo)編碼、缺失數(shù)據(jù)的處理和數(shù)據(jù)集的劃分等[20]。本文構(gòu)建的COVID-19 影像學(xué)數(shù)據(jù)集預(yù)處理包括尺寸大小統(tǒng)一、像素值歸一化、訓(xùn)練集和測(cè)試集的劃分等,其中用于訓(xùn)練模型的樣本占整個(gè)影像學(xué)數(shù)據(jù)集的80%,而測(cè)試集樣本數(shù)量占整個(gè)影像學(xué)數(shù)據(jù)集的20%,用來評(píng)估預(yù)測(cè)模型的性能。COVID-19影像學(xué)數(shù)據(jù)集有412個(gè)樣本為訓(xùn)練集,測(cè)試集樣本個(gè)數(shù)為105。影像學(xué)數(shù)據(jù)集中原始樣本尺寸大小不同,需預(yù)處理成統(tǒng)一的224×224大小,影像學(xué)數(shù)據(jù)集劃分(表1)。
表1 COVID-19 影像學(xué)數(shù)據(jù)集的劃分Tab.1 Division of COVID-19 imaging data set
COVID-19 影像學(xué)數(shù)據(jù)集包含早期、進(jìn)展期和重癥期3個(gè)類別的樣本,分別給這3種類別的樣本標(biāo)注為0、1、2。COVID-19小樣本影像學(xué)數(shù)據(jù)集在CT表現(xiàn)的分布情況顯示,訓(xùn)練集中CT影像學(xué)表現(xiàn)為早期、進(jìn)展期和重癥期的樣本分別為116、156、140,而測(cè)試集中早期、進(jìn)展期和重癥期的樣本分別30、39、26(表2)。
表2 COVID-19影像學(xué)數(shù)據(jù)集在CT表現(xiàn)的分布情況Tab.2 Distribution of the COVID-19 imaging data set on CT manifestations
《新型冠狀病毒肺炎診療方案(試行第八版·修訂版)》將COVID-19的臨床分型分別為輕型、普通型、重型和危重型[4]。臨床分型的CT影像學(xué)表現(xiàn):(1)輕型臨床癥狀輕微,影像學(xué)未見肺炎表現(xiàn),而既往研究表明,病變以小斑影片狀、亞段或節(jié)段性分布為主,肺外帶表現(xiàn)為磨玻璃樣密度結(jié)節(jié)狀斑片或片狀影,空氣支氣管征和血管增粗表現(xiàn)。(2)普通型在影像學(xué)上可見肺炎表現(xiàn),病灶增多、范圍擴(kuò)大,涉及多個(gè)肺葉,下葉居多。病灶變密實(shí),雙肺多發(fā)磨玻璃影,部分實(shí)變或結(jié)構(gòu)扭曲影內(nèi)支氣管柱狀增粗,下葉背側(cè)肺底弧形肺不張。(3)重型和危重型肺部影像學(xué)顯示24~48 h病灶明顯進(jìn)展>50%,肺實(shí)質(zhì)廣泛滲出、實(shí)變,實(shí)變影為主,肺結(jié)構(gòu)扭曲,支氣管擴(kuò)張,亞段性肺不張,嚴(yán)重時(shí)呈“白肺”[21-24]。
神經(jīng)網(wǎng)絡(luò)模型的參數(shù)是權(quán)重和閾值,訓(xùn)練模型是通過訓(xùn)練樣本和學(xué)習(xí)算法反復(fù)調(diào)整權(quán)重和閾值模型參數(shù)值,使實(shí)際輸出與理想輸出的誤差較少,最后得到神經(jīng)網(wǎng)絡(luò)解決問題所需要的參數(shù)。訓(xùn)練模型的學(xué)習(xí)算法中,具有代表性的是誤差反向傳播BP算法,廣泛應(yīng)用于神經(jīng)網(wǎng)絡(luò)中。
評(píng)估模型的方法有驗(yàn)證和交叉驗(yàn)證,不同的評(píng)估方法也決定數(shù)據(jù)集的劃分。評(píng)價(jià)分類模型有混淆矩陣、準(zhǔn)確率、精確率、召回率、特異性等各項(xiàng)指標(biāo)(表3)。
表3 評(píng)估模型常見的指標(biāo)Tab.3 Common indicators of evaluation models
機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法的實(shí)際應(yīng)用中,訓(xùn)練集和測(cè)試集具有獨(dú)立相同分布這種假設(shè)難以成立,主要原因是帶標(biāo)記的樣本數(shù)據(jù)數(shù)量有限和不同數(shù)據(jù)的分布會(huì)發(fā)生變化。遷移學(xué)習(xí)技術(shù)作為一個(gè)種新的學(xué)習(xí)框架應(yīng)運(yùn)而生,它放寬了對(duì)數(shù)據(jù)集分布的約束,采用參數(shù)遷移的方式,避免繁雜的數(shù)據(jù)預(yù)處理工作,加快模型的訓(xùn)練。機(jī)器學(xué)習(xí)與遷移學(xué)習(xí)間不同的學(xué)習(xí)方式的圖示顯示[7]:機(jī)器學(xué)習(xí)的學(xué)習(xí)方式需從頭開始學(xué)習(xí)每一個(gè)任務(wù);而遷移學(xué)習(xí)的學(xué)習(xí)方式在目標(biāo)任務(wù)所需訓(xùn)練數(shù)據(jù)很少的情況下,從一個(gè)或者多個(gè)源任務(wù)中抽取知識(shí)和經(jīng)驗(yàn)遷移到另一個(gè)目標(biāo)任務(wù)中(圖1)。
圖1 機(jī)器學(xué)習(xí)與遷移學(xué)習(xí)間不同的學(xué)習(xí)方式Fig.1 Differences between machine learning and transfer learning.
遷移學(xué)習(xí)涉及到兩個(gè)常用的概念,即域和任務(wù)。域分為源域和目標(biāo)域。域和任務(wù)的概念將遷移學(xué)習(xí)分類別,按遷移場(chǎng)景來分類,可以分為歸納式遷移學(xué)習(xí)[25]、直推式遷移學(xué)習(xí)[26-28]和無監(jiān)督遷移學(xué)習(xí)[29]。傳統(tǒng)機(jī)器學(xué)習(xí)與各種不同遷移學(xué)習(xí)之間的關(guān)系(表4)。
表4 傳統(tǒng)機(jī)器學(xué)習(xí)與各種不同遷移學(xué)習(xí)之間的關(guān)系Tab.4 Relationship between traditional machine learning and various transfer learning
遷移學(xué)習(xí)研究還存在著各種各樣的挑戰(zhàn),域適配問題、多源遷移學(xué)習(xí)問題、深度遷移學(xué)習(xí)、異構(gòu)遷移學(xué)習(xí)等是遷移學(xué)習(xí)領(lǐng)域研究的熱門。目前多數(shù)研究主要集中在監(jiān)督學(xué)習(xí)上,無監(jiān)督或半監(jiān)督學(xué)習(xí)中遷移學(xué)習(xí)在未來可能受到越來越多的關(guān)注。
COVID-19診斷模型的結(jié)構(gòu)顯示,原始VGG-16特征提取網(wǎng)絡(luò)部分遷移到診斷模型上,與全連接層構(gòu)成基于VGG-16網(wǎng)絡(luò)的智能診斷模型(圖2)。它由兩部分組成,第一部分是從VGG-16遷移過來的特征提取層,主要包括卷積層和池化層,同時(shí)包含已訓(xùn)練好的參數(shù),第二部分是多參數(shù)融合優(yōu)化的全連接網(wǎng)絡(luò)層。影像學(xué)數(shù)據(jù)集樣本通過第一個(gè)部分的特征提取層來訓(xùn)練第二部分的全連接層,縮短了模型的訓(xùn)練時(shí)間。
圖2 COVID-19診斷模型結(jié)構(gòu)Fig.2 COVID-19 diagnostic model structure.
5.1.1 簡(jiǎn)單全連接層神經(jīng)元個(gè)數(shù)的比較 診斷模型第一部分與輸出層之間增加一層神經(jīng)網(wǎng)絡(luò),對(duì)神經(jīng)元個(gè)數(shù)分別為512、1024、2048 進(jìn)行了驗(yàn)證。學(xué)習(xí)率設(shè)置為0.00003,樣本批次為29,迭代次數(shù)為30,選擇AdaGradOptimizer優(yōu)化器,損失函數(shù)為均方差,選擇relu作為激活函數(shù),比較不同數(shù)量神經(jīng)元對(duì)模型的影響。
增加的這層神經(jīng)網(wǎng)絡(luò)中不同神經(jīng)元個(gè)數(shù)對(duì)構(gòu)建的COVID-19診斷模型的影響結(jié)果顯示:根據(jù)準(zhǔn)確率隨訓(xùn)練樣本的迭代次數(shù)的變化曲線(圖3A),迭代次數(shù)達(dá)到12時(shí),3條曲線都達(dá)到了較高的準(zhǔn)確率,且非常接近;根據(jù)損失函數(shù)的收斂曲線(圖3B),隨迭代次數(shù)的增加損失函數(shù)值逐漸收斂,收斂速度最快的是藍(lán)色的收斂曲線。實(shí)驗(yàn)表明,全連接層中第一層神經(jīng)元個(gè)數(shù)設(shè)計(jì)為2048。
圖3 不同神經(jīng)元個(gè)數(shù)的識(shí)別準(zhǔn)確率與損失函數(shù)的變化曲線Fig.3 Variation curves of recognition accuracy and loss function for different numbers of neurons.
5.1.2 損失函數(shù)的比較 學(xué)習(xí)率設(shè)置為0.00003,樣本批次為29,迭代次數(shù)為30,選擇AdaGradOptimizer 優(yōu)化器,選擇relu作為激活函數(shù),比較交叉熵和均方差作用于簡(jiǎn)單全連接層對(duì)模型的影響。損失函數(shù)為均方差。
訓(xùn)練模型迭代次數(shù)與準(zhǔn)確率之間的曲線關(guān)系顯示(圖4A),紅色曲線是損失函數(shù)為交叉熵時(shí)訓(xùn)練集的準(zhǔn)確率曲線,紫色曲線是損失函數(shù)為均方差函數(shù)時(shí)訓(xùn)練集的準(zhǔn)確率曲線,比較兩條曲線可知,迭代次數(shù)12之前,損失函數(shù)為交叉熵的準(zhǔn)確率高于損失函數(shù)為均方差的準(zhǔn)確率。迭代次數(shù)與損失函數(shù)值的曲線關(guān)系顯示(圖4B),損失函數(shù)為交叉熵時(shí)曲線的收斂速度快。對(duì)比交叉熵、均方差的準(zhǔn)確率變化曲線和損失函數(shù)的收斂曲線可知,選擇交叉熵作為網(wǎng)絡(luò)的損失函數(shù)。
圖4 不同損失函數(shù)的識(shí)別準(zhǔn)確率與損失函數(shù)的變化曲線Fig.4 Relationship between the recognition accuracy of different loss functions and the loss function.
5.1.3 不同學(xué)習(xí)率 學(xué)習(xí)率為0.00003,樣本批次為29,迭代次數(shù)為30,選擇AdaGradOptimizer 優(yōu)化器,選擇relu作為激活函數(shù),損失函數(shù)為交叉熵,比較不同學(xué)習(xí)率(0.00001、0.00002、0.00003、0.00004、0.00005、0.0001、0.0002、0.0003)對(duì)模型的影響。
學(xué)習(xí)率分別為0.00001、0.00002、0.00003時(shí)準(zhǔn)確率隨迭代次數(shù)變化的曲線顯示(圖5A),學(xué)習(xí)率為0.00003時(shí)準(zhǔn)確率是最早達(dá)到最高點(diǎn)。學(xué)習(xí)率分別為0.00003、0.00004、0.00005 時(shí)隨迭代次數(shù)變化的準(zhǔn)確率曲線顯示,學(xué)習(xí)率為0.00003與0.00005的準(zhǔn)確率曲線幾乎是重合的,在迭代次數(shù)3之前,它們都比學(xué)習(xí)率為0.00004的準(zhǔn)確率高(圖5B)。學(xué)習(xí)率分別為0.0001、0.0002和0.0003時(shí)隨迭代次數(shù)變化的準(zhǔn)確率曲線顯示,其中學(xué)習(xí)率為0.0003的準(zhǔn)確率曲線存在波動(dòng),學(xué)習(xí)率為0.0001與0.0002的準(zhǔn)確率曲線幾乎是重合在一起,在迭代次數(shù)2之前,學(xué)習(xí)率為0.0001的準(zhǔn)確率稍高(圖5C)。學(xué)習(xí)率分別為0.00003、0.00005和0.0001時(shí)隨迭代次數(shù)變化的準(zhǔn)確率曲線(圖5D)。綜上實(shí)驗(yàn)結(jié)果,選擇學(xué)習(xí)率為0.0001來訓(xùn)練診斷模型。
圖5 不同學(xué)習(xí)率的識(shí)別準(zhǔn)確率變化曲線Fig.5 Change curve of recognition accuracy rate with different learning rates.
5.1.4 批次大小 學(xué)習(xí)率設(shè)置為0.0001,迭代次數(shù)為30,優(yōu)化器采用AdaGradOptimizer,激活函數(shù)為relu,損失函數(shù)為交叉熵,比較不同的批次大?。?0、15、20和29)對(duì)模型的影響。
不同樣本批次大小的準(zhǔn)確率與損失函數(shù)的變化曲線(圖6)。批次大小分別為10、15、20、29時(shí)準(zhǔn)確率隨迭代次數(shù)增加的四條變化曲線顯示,批次大小為15的準(zhǔn)確率最先達(dá)到最高點(diǎn),并且沒有波動(dòng)(圖6A)。批次大小分別為10、15、20、29時(shí)損失函數(shù)的收斂曲線顯示,批次大小為15時(shí)收斂曲線較平穩(wěn),且較早到達(dá)最低點(diǎn)(圖6B)。該實(shí)驗(yàn)結(jié)果表明,選擇樣本批次大小為15。
圖6 不同樣本批次大小的準(zhǔn)確率與損失函數(shù)的變化曲線Fig.6 Variation curves of accuracy and loss function for different sample batch sizes.
5.1.5 優(yōu)化器的選擇 學(xué)習(xí)率為0.0001,樣本批次大小是15,迭代次數(shù)為30,激活函數(shù)為relu,損失函數(shù)為交叉熵,比較不同優(yōu)化器(AdagradOptimizer、AdamOptimizer、GradientDescentOptimizer和RMSPropOptimizer)對(duì)模型的影響。
不同優(yōu)化器的準(zhǔn)確率與損失函數(shù)的變化曲線(圖7)。分別使用AdagradOptimizer、AdamOptimizer、GradientDescentOptimizer 和RMSPropOptimizer 時(shí) 準(zhǔn)確率的變化曲線(圖7A)顯示,其中AdamOptimizer、GradientDescentOptimizer 和RMSPropOptimizer 優(yōu) 化器的準(zhǔn)確率變化曲線都有波動(dòng),AdagradOptimizer優(yōu)化器的準(zhǔn)確率變化曲線較平穩(wěn),并較早到達(dá)最高值。不同優(yōu)化器損失函數(shù)的收斂曲線(圖7B)顯示,其中使用AdamOptimizer和RMSPropOptimizer優(yōu)化器時(shí)損失函數(shù)收斂曲線出現(xiàn)波動(dòng),而使用AdagradOptimizer 和GradientDescentOptimizer優(yōu)化器時(shí)損失函數(shù)收斂曲線在迭代次數(shù)2 之前就到了最低點(diǎn)。優(yōu)化器選擇AdagradOptimizer。
圖7 不同優(yōu)化器的準(zhǔn)確率與損失函數(shù)變化曲線Fig.7 Curves of accuracy and loss function of different optimizers.
綜合上述所有實(shí)驗(yàn)結(jié)果分析,設(shè)計(jì)簡(jiǎn)單的全連接層,參考表5簡(jiǎn)單全連接層神經(jīng)網(wǎng)絡(luò)模型參數(shù)。
表5 簡(jiǎn)單全連接層神經(jīng)網(wǎng)絡(luò)模型參數(shù)Tab.5 Model parameters of simple fully connected layer neural network
在簡(jiǎn)單全連接層基礎(chǔ)上通過增加一層,以提高模型的準(zhǔn)確率,神經(jīng)元個(gè)數(shù)分別設(shè)置為128、256、512、1024進(jìn)行實(shí)驗(yàn)驗(yàn)證。學(xué)習(xí)率為0.0001,樣本批次大小是15,迭代次數(shù)為30,優(yōu)化器采用AdagradOptimizer,激活函數(shù)為relu,損失函數(shù)為交叉熵,比較新增加這層不同數(shù)量神經(jīng)元對(duì)模型的影響。
神經(jīng)元個(gè)數(shù)分別為128、256、512、1024時(shí)識(shí)別準(zhǔn)確率的變化曲線顯示,神經(jīng)元個(gè)數(shù)為256時(shí)準(zhǔn)確率變化曲線存在波動(dòng),神經(jīng)元個(gè)數(shù)為128、512、1024的準(zhǔn)確率變化曲線較穩(wěn)定,迭代次數(shù)達(dá)到2時(shí),3條曲線都達(dá)到最高的準(zhǔn)確率(圖8)。
圖8 不同神經(jīng)元個(gè)數(shù)識(shí)別準(zhǔn)確率的變化曲線Fig.8 Variation curve of the recognition accuracy of different neuron numbers.
神經(jīng)元個(gè)數(shù)分別為128、256、512、1024時(shí)損失函數(shù)的收斂曲線顯示,4條曲線的收斂速度差不多,神經(jīng)元個(gè)數(shù)為128和256時(shí)損失函數(shù)的收斂曲線存在波動(dòng),而神經(jīng)元個(gè)數(shù)為512和1024時(shí)收斂曲線較平穩(wěn)(圖9)。經(jīng)綜合考量,這一層神經(jīng)元個(gè)數(shù)設(shè)計(jì)為128。
圖9 不同神經(jīng)元個(gè)數(shù)損失函數(shù)的收斂曲線Fig.9 Convergence curves of loss functions for different neuron numbers.
綜上實(shí)驗(yàn)結(jié)果,設(shè)計(jì)全連接層神經(jīng)網(wǎng)絡(luò)模型,其中每層神經(jīng)元個(gè)數(shù)、激活函數(shù)、優(yōu)化器、學(xué)習(xí)率大小、損失函數(shù)和批次大小等參數(shù)(表6),最終設(shè)計(jì)的診斷模型結(jié)構(gòu)(圖2)。
表6 全連接層神經(jīng)網(wǎng)絡(luò)模型參數(shù)Tab.6 Fully connected layer neural network model parameters
COVID-19 輔助診斷模型的訓(xùn)練和診斷效果驗(yàn)證在Intel(R) Core(TM) i7-6700HQ CPU@2.6 GHz 2.59 GHz,8 GB 內(nèi)存的Windows 10 系統(tǒng)上進(jìn)行[24]。COVID-19影像學(xué)測(cè)試集樣本為105個(gè),早期、進(jìn)展期和重癥期的樣本個(gè)數(shù)分別為30、39、36個(gè)。影像學(xué)測(cè)試集中不同CT影像表現(xiàn)的樣本(圖10~12)。
圖10 COVID-19 早期CT影像表現(xiàn)Fig.10 Early CT imaging performance of COVID-19.
圖11 COVID-19 發(fā)展期CT影像表現(xiàn)Fig.11 COVID-19 CT imaging performance during development.
圖12 不同病變分期患者胸部CT影像Fig.12 Chest CT images of patients with different pathological stages.
訓(xùn)練好的COVID-19輔助診斷模型在測(cè)試集上的測(cè)試結(jié)果以混淆矩陣顯示(表7),表現(xiàn)為早期(真實(shí)類別為0)的樣本診斷為0類別樣本數(shù)為29,錯(cuò)誤診斷為1類別樣本數(shù)為1;而表現(xiàn)為進(jìn)展期樣本全部診斷正確;表現(xiàn)為重癥期(真實(shí)類別為2)的樣本診斷為2類別樣本數(shù)為35,診斷為1類別樣本數(shù)為1?;煜仃嚉w一化后(圖13)。
表7 三分類混淆矩陣Tab.7 Three-class confusion matrix(n)
圖13 歸一化的三分類混淆矩陣Fig.13 Normalized three-class confusion matrix.
根據(jù)三分類混淆矩陣中的數(shù)值,計(jì)算不同CT表現(xiàn)的敏感度、精確度、F1-Score,得到評(píng)估模型的指標(biāo)值(表8),輔助診斷COVID-19的模型在CT表現(xiàn)為早期、進(jìn)展期和重癥期的敏感度分別為0.97、1.00、0.97,精確率分別為1.0、0.95、1.0,F(xiàn)1-score分別為0.98、0.97、0.99。
表8 評(píng)估模型的指標(biāo)Tab.8 Methods for evaluating models
輔助診斷COVID-19的模型在測(cè)試集上的準(zhǔn)確率達(dá)到98.10%,高于文獻(xiàn)[19-20]所述大型公司或國家級(jí)研究團(tuán)隊(duì)設(shè)計(jì)的輔助診斷COVID-19模型準(zhǔn)確率,105個(gè)樣本的診斷時(shí)間為28.06 s。3個(gè)類別的敏感度分別為0.97、1.00、0.97,精確率分別為1.0、0.95、1.0,F(xiàn)1-score分別為0.98、0.97、0.99。這些模型評(píng)估指標(biāo)如準(zhǔn)確率、敏感度、精確率和F1-Score上都較既往研究中設(shè)計(jì)的基于遷移學(xué)習(xí)技術(shù)的COVID-19診斷模型[24]有所提高,具有一定的應(yīng)用價(jià)值和研究?jī)r(jià)值。
診斷模型在測(cè)試集上的結(jié)果表明,本文設(shè)計(jì)的輔助診斷COVID-19的模型可靠性高以及診斷速度較快。雖施打疫苗的人數(shù)不斷增多,但未接種疫苗的人數(shù)還很多,Delta變異病毒株傳染力顯著增強(qiáng),且正在未接種疫苗的人群中迅速傳播,確診人數(shù)創(chuàng)新高,現(xiàn)階段需篩查、復(fù)檢的人較多,引入輔助診斷COVID-19的智能系統(tǒng)可自動(dòng)、快速為醫(yī)生提供參考意見,提高臨床診斷效率。
綜上所述,本文基于小樣本影像學(xué)數(shù)據(jù)集,采用遷移學(xué)習(xí)技術(shù),引入多參數(shù)融合優(yōu)化設(shè)計(jì)COVID-19診斷模型。首先對(duì)COVID-19影像學(xué)數(shù)據(jù)集進(jìn)行劃分和預(yù)先處理,然后引入基于VGG-16的遷移學(xué)習(xí)技術(shù)搭建全連接層構(gòu)成一個(gè)初始的基于遷移學(xué)習(xí)的COVID-19智能診斷模型,通過對(duì)全連接層網(wǎng)絡(luò)結(jié)構(gòu)、激活函數(shù)、損失函數(shù)、優(yōu)化算法、學(xué)習(xí)率和樣本批次大小的多參數(shù)融合逐步優(yōu)化,最后訓(xùn)練出一個(gè)COVID-19輔助診斷模型。結(jié)合流行病學(xué)史,依據(jù)CT圖像診斷患者處于早期、進(jìn)展期還是重癥期,但診斷模型是基于小樣本數(shù)據(jù)集訓(xùn)練出來的,故數(shù)據(jù)集預(yù)處理、診斷模型有待進(jìn)一步優(yōu)化,對(duì)COVID-19的病灶數(shù)量、體積、病灶占比等定量化的研究,更高效、客觀和準(zhǔn)確地進(jìn)行COVID-19嚴(yán)重程度的量化評(píng)估,有助于臨床分診及療效評(píng)估,更為精確為醫(yī)生提供參考意見。也為進(jìn)一步研究深度學(xué)習(xí)技術(shù)在不同病毒性肺炎的鑒別診斷打下基礎(chǔ)。