摘 要:隨著醫(yī)學(xué)圖像的快速發(fā)展和大量產(chǎn)生,如何快速、準(zhǔn)確地提取對學(xué)習(xí)有用的特征成為醫(yī)學(xué)圖像處理和診斷中的重要問題。甚于深度神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像特征學(xué)習(xí)正是為了解決這一問題而被提出和廣泛應(yīng)用,旨在通過自動學(xué)習(xí)高層次的特征表示,提高醫(yī)學(xué)圖像分類和診斷的準(zhǔn)確性、降低人力成本、改善普適性、推動自動化和智能化發(fā)展。文章首先分析基于深度神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像特征學(xué)習(xí)的研究意義,其次闡述醫(yī)學(xué)圖像多元特征提取方法,最后探究基于多層級特征融合的醫(yī)學(xué)圖像分析方法,以推動深度袖經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)領(lǐng)域中的應(yīng)用深度。
關(guān)鍵詞:深度神經(jīng)網(wǎng)絡(luò);醫(yī)學(xué)圖像;特征學(xué)習(xí)
中圖法分類號:TP391文獻(xiàn)標(biāo)識碼:A
1 研究意義
基于深度神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像特征學(xué)習(xí)研究意義重大,它可以為醫(yī)學(xué)圖像處理和診斷帶來以下好處。(1)提高醫(yī)學(xué)圖像的準(zhǔn)確性。深度學(xué)習(xí)在醫(yī)學(xué)圖像處理領(lǐng)域的應(yīng)用非常廣泛,其中一個原因就是它能夠自動學(xué)習(xí)到高層次的特征表示。相對于傳統(tǒng)的手工特征提取方式,基于深度學(xué)習(xí)的特征提取更加準(zhǔn)確和魯棒,可以提高醫(yī)學(xué)圖像分類和診斷的準(zhǔn)確性。(2)降低醫(yī)學(xué)圖像處理和分析的人力成本。傳統(tǒng)的醫(yī)學(xué)圖像處理和分析方法需要經(jīng)驗豐富的醫(yī)學(xué)專家進(jìn)行設(shè)計和選擇特征,需要大量的時間和人力成本。而基于深度神經(jīng)網(wǎng)絡(luò)的特征學(xué)習(xí)方法可以自動學(xué)習(xí)到高層次的特征表示,減少了手工設(shè)計的需求,從而降低了醫(yī)學(xué)圖像處理和分析的人力成本。(3)改善醫(yī)學(xué)圖像處理和分析的普適性。傳統(tǒng)的醫(yī)學(xué)圖像處理和分析方法通常只能處理特定的圖像類型或應(yīng)用場景,缺乏普適性。而基于深度神經(jīng)網(wǎng)絡(luò)的特征學(xué)習(xí)方法可以通過大規(guī)模的訓(xùn)練數(shù)據(jù)學(xué)習(xí)到通用的特征表示,從而提高處理不同類型和應(yīng)用場景的醫(yī)學(xué)圖像的能力。(4)促進(jìn)醫(yī)學(xué)圖像處理和分析的智能化。隨著深度學(xué)習(xí)的發(fā)展,基于深度神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像特征學(xué)習(xí)也在不斷完善和拓展。它可以使醫(yī)學(xué)圖像處理和分析更加智能化,讓計算機(jī)能夠自動識別和提取醫(yī)學(xué)圖像中的特征,為醫(yī)生提供更好的輔助診斷和治療決策。
2 醫(yī)學(xué)圖像多元特征提取方法研究
2.1 圖卷積神經(jīng)網(wǎng)絡(luò)
隨著醫(yī)學(xué)圖像數(shù)據(jù)量的不斷增加,多元特征提取方法的研究已成為醫(yī)學(xué)圖像處理領(lǐng)域的一個熱點。
在傳統(tǒng)的深度學(xué)習(xí)模型中,如卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN),多元特征的提取主要依靠卷積核或循環(huán)單元的復(fù)合運算,這種方式雖然效果不錯,但卻無法充分利用醫(yī)學(xué)圖像的空間拓?fù)浣Y(jié)構(gòu)信息。而圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)則可以在這方面做到更好。圖卷積神經(jīng)網(wǎng)絡(luò)是一種基于圖結(jié)構(gòu)的深度學(xué)習(xí)模型。在醫(yī)學(xué)圖像處理中,圖結(jié)構(gòu)通常是通過建立圖像中的像素點之間的連接來描述的。
具體而言,對于一張醫(yī)學(xué)圖像,可以將其視為一個圖結(jié)構(gòu),其中每個像素點表示一個節(jié)點,每個像素點之間的距離和像素值等屬性可以表示為邊上的權(quán)重。通過構(gòu)建這樣一個圖結(jié)構(gòu),圖卷積神經(jīng)網(wǎng)絡(luò)可以利用節(jié)點之間的拓?fù)浣Y(jié)構(gòu)信息,提高醫(yī)學(xué)圖像的多元特征提取能力和識別準(zhǔn)確性。與傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)不同,圖卷積神經(jīng)網(wǎng)絡(luò)的卷積操作是在圖結(jié)構(gòu)上進(jìn)行的。圖卷積神經(jīng)網(wǎng)絡(luò)通過定義一種新的卷積核,可以在節(jié)點之間傳遞信息,從而實現(xiàn)多元特征的提取。例如,對于醫(yī)學(xué)圖像中的腫瘤檢測任務(wù),圖卷積神經(jīng)網(wǎng)絡(luò)可以通過利用腫瘤細(xì)胞之間的拓?fù)浣Y(jié)構(gòu)信息,來學(xué)習(xí)腫瘤細(xì)胞之間的關(guān)系,并根據(jù)這些關(guān)系進(jìn)行腫瘤的檢測和診斷[1] 。
圖卷積神經(jīng)網(wǎng)絡(luò)具有以下幾個優(yōu)點。(1)可以處理不規(guī)則數(shù)據(jù)結(jié)構(gòu)。醫(yī)學(xué)圖像通常具有不規(guī)則的形狀和結(jié)構(gòu),傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)難以處理這種不規(guī)則數(shù)據(jù)結(jié)構(gòu),而圖卷積神經(jīng)網(wǎng)絡(luò)可以通過定義不同的鄰接矩陣,靈活地處理各種不規(guī)則的數(shù)據(jù)結(jié)構(gòu)。(2)能夠利用空間拓?fù)浣Y(jié)構(gòu)信息。在醫(yī)學(xué)圖像處理中,很多疾病的診斷和治療都與空間拓?fù)浣Y(jié)構(gòu)密切相關(guān)。
2.2 醫(yī)學(xué)圖像異常檢測
醫(yī)學(xué)圖像多元特征提取是一種利用計算機(jī)視覺技術(shù)自動從醫(yī)學(xué)圖像中提取多種特征的方法,其中包括顏色、形狀、紋理、亮度、梯度等多個方面。醫(yī)學(xué)圖像異常檢測是利用這些特征來自動檢測醫(yī)學(xué)圖像中異常區(qū)域的技術(shù),可以應(yīng)用于醫(yī)學(xué)各個領(lǐng)域,如肺部結(jié)節(jié)、乳腺癌、糖尿病、視網(wǎng)膜病變等。醫(yī)學(xué)圖像多元特征提取方法主要有以下幾種。
(1)基于深度學(xué)習(xí)的特征提取方法。利用深度神經(jīng)網(wǎng)絡(luò)(DNN)從醫(yī)學(xué)圖像中自動提取特征。這種方法不需要手工設(shè)計特征,具有很好的泛化能力和魯棒性。常見的DNN 包括卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)等。(2)基于形狀描述符的特征提取方法。通過對醫(yī)學(xué)圖像的形狀(如輪廓、曲線等)進(jìn)行描述來提取特征。這種方法對于形狀變化較大的異常區(qū)域檢測有一定優(yōu)勢。(3)基于紋理描述符的特征提取方法。通過對醫(yī)學(xué)圖像中的紋理(如灰度共生矩陣(GLCM)、局部二值模式(LBP)等)進(jìn)行描述來提取特征。這種方法對于紋理變化較大的異常區(qū)域檢測有一定優(yōu)勢。(4)基于濾波器的特征提取方法。通過利用不同的濾波器對醫(yī)學(xué)圖像進(jìn)行濾波,如高斯濾波、拉普拉斯濾波等,以提取特征。這種方法對于不同頻率的特征有很好的提取效果[2] 。
3 基于多層級特征融合的醫(yī)學(xué)圖像分析方法研究
3.1 圖像預(yù)處理方法及標(biāo)注工具
醫(yī)學(xué)圖像分析是醫(yī)學(xué)影像診斷的重要組成部分。傳統(tǒng)的醫(yī)學(xué)圖像分析方法通常依賴于手工設(shè)計的特征和單一模態(tài)的圖像信息,無法完全挖掘醫(yī)學(xué)圖像中的信息。近年來,基于多層級特征融合的醫(yī)學(xué)圖像分析方法得到廣泛關(guān)注。該方法將不同層級的特征進(jìn)行融合,從而提高醫(yī)學(xué)圖像分析的準(zhǔn)確性和魯棒性。其中,圖像預(yù)處理和標(biāo)注工具是該方法的重要組成部分。
圖像預(yù)處理是指對醫(yī)學(xué)圖像進(jìn)行預(yù)處理,以消除圖像噪聲、增強(qiáng)圖像對比度等?;诙鄬蛹壧卣魅诤系尼t(yī)學(xué)圖像分析方法通常采用多種預(yù)處理方法對醫(yī)學(xué)圖像進(jìn)行處理,如濾波器、灰度變換、直方圖均衡化等。這些預(yù)處理方法可以有效去除圖像中的噪聲,提高圖像對比度,從而為后續(xù)的特征提取和分類任務(wù)提供更好的數(shù)據(jù)基礎(chǔ)[3] 。
醫(yī)學(xué)圖像標(biāo)注工具是指用于標(biāo)注醫(yī)學(xué)圖像中感興趣區(qū)域(ROI)的工具?;诙鄬蛹壧卣魅诤系尼t(yī)學(xué)圖像分析方法通常需要使用標(biāo)注工具標(biāo)注醫(yī)學(xué)圖像中的ROI,以便進(jìn)行后續(xù)的特征提取和分類任務(wù)?,F(xiàn)有的醫(yī)學(xué)圖像標(biāo)注工具有很多, 如ITK?SNAP,3DSlicer,MIPAV 等。這些標(biāo)注工具支持多種標(biāo)注方式,如手動標(biāo)注、自動分割等。其中,自動分割是一種較為先進(jìn)的標(biāo)注方式,可以通過機(jī)器學(xué)習(xí)等方法實現(xiàn)自動標(biāo)注。在基于多層級特征融合的醫(yī)學(xué)圖像分析方法中,特征提取是關(guān)鍵步驟。通常采用多種特征提取方法,如卷積神經(jīng)網(wǎng)絡(luò)(CNN)、圖像紋理特征、形態(tài)學(xué)特征等,從不同層級的特征中提取有用的信息。其中,CNN 是目前最常用的特征提取方法之一,通過多層卷積和池化操作,可以自動從醫(yī)學(xué)圖像中提取高級別的特征。特征融合是基于多層級特征融合的醫(yī)學(xué)圖像分析方法的核心。該方法將不同層級的特征進(jìn)行融合,以提高醫(yī)學(xué)圖像分析的準(zhǔn)確性和魯棒性[4] 。
3.2 多層級卷積神經(jīng)網(wǎng)絡(luò)方法
基于多層級特征融合的醫(yī)學(xué)圖像分析方法逐漸成為醫(yī)學(xué)圖像分析領(lǐng)域的研究熱點。在這些方法中,多層級卷積神經(jīng)網(wǎng)絡(luò)(CNN)方法被廣泛應(yīng)用,能夠有效挖掘醫(yī)學(xué)圖像中的信息,提高醫(yī)學(xué)圖像分析的準(zhǔn)確性和魯棒性。多層級CNN 方法將CNN 應(yīng)用于醫(yī)學(xué)圖像的分析中,將多個卷積層、池化層和全連接層等組成多層的網(wǎng)絡(luò)結(jié)構(gòu),以提取不同層級的特征。通過將這些層級的特征進(jìn)行融合,可以挖掘更多的圖像信息,提高圖像分析的準(zhǔn)確性。多層級CNN 方法在醫(yī)學(xué)圖像分析中的應(yīng)用主要包括2 個方面:分類和分割。在分類方面,該方法可以將醫(yī)學(xué)圖像分為不同的類別,如腫瘤和非腫瘤等。在分割方面,該方法可以將醫(yī)學(xué)圖像中的感興趣區(qū)域(ROI)進(jìn)行分割,如腫瘤和正常組織等。多層級CNN 方法的特點是可以自動提取高級別的特征,并且可以從大規(guī)模的醫(yī)學(xué)圖像數(shù)據(jù)中學(xué)習(xí)到更加準(zhǔn)確的特征,從而提高圖像分析的準(zhǔn)確性[5] 。此外,該方法還可以通過增加或減少網(wǎng)絡(luò)層數(shù)、改變卷積核大小等方式進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化,從而提高網(wǎng)絡(luò)的性能。
3.3 基于教師、學(xué)生網(wǎng)絡(luò)的知識蒸餾方法
在基于多層級特征融合的醫(yī)學(xué)圖像分析方法中,知識蒸餾方法是一種重要的技術(shù)手段。該方法通過將復(fù)雜的教師網(wǎng)絡(luò)中的知識傳遞給輕量級的學(xué)生網(wǎng)絡(luò),提高學(xué)生網(wǎng)絡(luò)的泛化能力和魯棒性,從而提高醫(yī)學(xué)圖像分析的準(zhǔn)確性。
教師網(wǎng)絡(luò)和學(xué)生網(wǎng)絡(luò)都是深度卷積神經(jīng)網(wǎng)絡(luò),它們的網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)設(shè)置相似,但教師網(wǎng)絡(luò)通常比學(xué)生網(wǎng)絡(luò)更深、更寬,具有更強(qiáng)的特征提取能力。在知識蒸餾方法中,教師網(wǎng)絡(luò)首先通過大量的醫(yī)學(xué)圖像數(shù)據(jù)進(jìn)行訓(xùn)練,學(xué)習(xí)到豐富的特征表示。然后,學(xué)生網(wǎng)絡(luò)通過學(xué)習(xí)教師網(wǎng)絡(luò)的輸出和特征表示,提高學(xué)生網(wǎng)絡(luò)的泛化能力和魯棒性。知識蒸餾方法的核心是如何將教師網(wǎng)絡(luò)中的知識傳遞給學(xué)生網(wǎng)絡(luò)。目前有多種知識蒸餾方法,其中比較常用的是軟標(biāo)簽方法、特征重構(gòu)方法和網(wǎng)絡(luò)剪枝方法[6] 。軟標(biāo)簽方法是一種基于概率分布的知識蒸餾方法。在該方法中,教師網(wǎng)絡(luò)將每個樣本的預(yù)測概率輸出轉(zhuǎn)化為一個軟標(biāo)簽,即一個概率分布。學(xué)生網(wǎng)絡(luò)的目標(biāo)是將其與教師網(wǎng)絡(luò)輸出的軟標(biāo)簽之間的KL 散度最小化。這種方法可以使學(xué)生網(wǎng)絡(luò)更加關(guān)注于數(shù)據(jù)的細(xì)節(jié),提高預(yù)測的準(zhǔn)確性。特征重構(gòu)方法是一種基于特征的知識蒸餾方法。在該方法中,對教師網(wǎng)絡(luò)和學(xué)生網(wǎng)絡(luò)在不同層級上提取的特征進(jìn)行比較,學(xué)生網(wǎng)絡(luò)的目標(biāo)是將其與教師網(wǎng)絡(luò)相應(yīng)層級特征之間的距離最小化。這種方法可以使學(xué)生網(wǎng)絡(luò)更好地學(xué)習(xí)到教師網(wǎng)絡(luò)的特征表示。網(wǎng)絡(luò)剪枝方法是一種基于網(wǎng)絡(luò)結(jié)構(gòu)的知識蒸餾方法。在該方法中,教師網(wǎng)絡(luò)通過刪除不必要的連接和節(jié)點來精簡網(wǎng)絡(luò)結(jié)構(gòu),學(xué)生網(wǎng)絡(luò)通過復(fù)制教師網(wǎng)絡(luò)的剪枝模型進(jìn)行學(xué)習(xí)。這種方法可以減少學(xué)生網(wǎng)絡(luò)的計算量,提高網(wǎng)絡(luò)的速度和效率。
3.4 基于梯度加權(quán)類激活的特征可視化方法
在基于多層級特征融合的醫(yī)學(xué)圖像分析方法中,特征可視化是一種重要的技術(shù)手段。該方法通過對深度卷積神經(jīng)網(wǎng)絡(luò)中的特征進(jìn)行可視化,幫助醫(yī)學(xué)專家理解神經(jīng)網(wǎng)絡(luò)的特征提取能力,提高醫(yī)學(xué)圖像分析的可解釋性和可信度?;谔荻燃訖?quán)類激活的特征可視化方法是一種比較常用的特征可視化方法。在該方法中,通過計算網(wǎng)絡(luò)中某一層級的神經(jīng)元對最終預(yù)測結(jié)果的貢獻(xiàn),生成一個權(quán)重矩陣。然后,將該權(quán)重矩陣與該層級神經(jīng)元的輸出值進(jìn)行加權(quán)平均,得到該層級神經(jīng)元的重要性權(quán)重。最后,將該權(quán)重矩陣進(jìn)行反卷積操作,可視化輸出該層級的特征圖。該方法的優(yōu)點是可解釋性強(qiáng),可以幫助醫(yī)學(xué)專家理解深度卷積神經(jīng)網(wǎng)絡(luò)中的特征提取能力,提高醫(yī)學(xué)圖像分析的可解釋性和可信度。
4 結(jié)束語
本文主要介紹了基于深度神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像特征學(xué)習(xí)研究,探討了該領(lǐng)域的研究現(xiàn)狀、挑戰(zhàn)以及未來發(fā)展方向。深度神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)圖像分類、檢測、分割等方面具有較好的表現(xiàn),并能夠提取出更具有區(qū)分度和可解釋性的特征。同時,多層級特征融合、知識蒸餾、特征可視化等技術(shù)手段的應(yīng)用,進(jìn)一步提高了深度神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)圖像分析中的應(yīng)用價值。
參考文獻(xiàn):
[1] 趙爽,魏國輝,趙文華,等.基于級聯(lián)特征正交融合網(wǎng)絡(luò)的小兒肺炎分類[J].生物醫(yī)學(xué)工程研究,2022,41(3):248?253.
[2] 林正春,李思遠(yuǎn),姜允志,等.基于誤差反饋的多尺度特征網(wǎng)絡(luò)的CT 圖像超分辨率重建[J].廣東技術(shù)師范大學(xué)學(xué)報,2022,43(3):22?30.
[3] 孫昌胤.基于深度學(xué)習(xí)的肺結(jié)節(jié)圖像分割算法研究[D].南昌:南昌大學(xué),2022.
[4] 張道奧.基于深度學(xué)習(xí)的口腔醫(yī)學(xué)圖像識別技術(shù)研究[D].西安:西安工業(yè)大學(xué),2022.
[5] 梁爽.基于深度神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)圖像特征學(xué)習(xí)與分析[D].北京:北京科技大學(xué),2022.
[6] 陳建明.基于注意力機(jī)制的肺結(jié)節(jié)良惡性分類方法研究[D].天津:天津師范大學(xué),2022.
作者簡介:
周雨薇(1994—),助教,研究方向:深度學(xué)習(xí)在醫(yī)學(xué)圖像分割中應(yīng)用。