黃煒嘉,張正言+,楊 魏,李垣江,李效龍,王澤輝
(1.江蘇科技大學(xué) 電子信息學(xué)院,江蘇 鎮(zhèn)江 212100;2.江蘇省人民醫(yī)院 介入科,江蘇 南京 210029)
近年來,研究者們根據(jù)醫(yī)學(xué)圖像特征值的統(tǒng)計(jì)特性和強(qiáng)度差異,分析正常和異常肝組織之間的差異,通過診斷患者肝臟是否病變來間接評(píng)估肝功能[1]。Duan[2]通過提取CT圖像的能量、慣性、熵、相關(guān)性等參數(shù),分析肝硬化和正常肝組織之間的統(tǒng)計(jì)學(xué)意義。Li等[3]采用灰度共生矩陣、Gabor小波變換等特征對(duì)MRI圖像進(jìn)行分析,探討其在肝血管瘤、肝轉(zhuǎn)移瘤和肝細(xì)胞癌分類中的可行性。劉曉虹等[4]針對(duì)CT圖像提出了一種改進(jìn)的多尺度LBP算法,提高了肝臟病變檢測的準(zhǔn)確率。這些研究顯示出醫(yī)學(xué)影像與肝功能之間具有一定的相關(guān)性。然而,利用肝臟醫(yī)學(xué)圖像自身的強(qiáng)度、方向等紋理信息進(jìn)行肝功能分級(jí)的研究鮮有報(bào)道。因此,研究肝臟CT圖像的特點(diǎn),實(shí)現(xiàn)基于CT圖像的肝功能分級(jí)是一個(gè)亟需解決的問題。
本文提出一種基于肝臟CT圖像的多尺度方向數(shù)值模式(multi-scale directional number pattern,MSDNP)的肝功能分級(jí)方法,利用Gabor濾波器提取肝臟CT圖像的多尺度紋理特征,通過支持向量機(jī)(support vector machine,SVM)建立肝功能分級(jí)模型,對(duì)肝功能進(jìn)行分級(jí)評(píng)估。
基于MSDNP的肝功能分級(jí)方法的基本流程如圖1所示。首先,對(duì)患者的臨床檢查數(shù)據(jù)進(jìn)行預(yù)處理,包括肝臟感興趣區(qū)域(region of interest,ROI)的提取以及數(shù)據(jù)標(biāo)簽的計(jì)算,構(gòu)建肝功能分級(jí)數(shù)據(jù)集;然后,對(duì)肝臟ROI進(jìn)行MSDNP編碼,并分塊統(tǒng)計(jì)直方圖信息,獲得多尺度特征向量;并利用SVM分類器優(yōu)化訓(xùn)練,建立肝功能分級(jí)模型,最后,對(duì)患者的肝功能進(jìn)行分級(jí)。
圖1 基于MSDNP的肝功能分級(jí)方法的基本流程
本文的實(shí)驗(yàn)數(shù)據(jù)采集自江蘇省人民醫(yī)院2017年~2019年期間的38位肝病患者的臨床檢查數(shù)據(jù),包括患者的1~3次肝臟CT檢查影像以及同期的血液學(xué)指標(biāo)等。其中,肝臟CT圖像格式為DICOM,大小為512×512像素,患者的血液學(xué)檢查數(shù)據(jù)包括生化全套、凝血五項(xiàng)組合及病因指標(biāo)。
首先,根據(jù)患者的血液學(xué)指標(biāo)等數(shù)據(jù)按式(1)計(jì)算終末期肝病模型[5](model for end-stage liver disease,MELD)評(píng)分,即
R=3.8×ln[膽紅素(mg/dl)]+11.2×ln(INR)+ 9.6×ln[肌酐(mg/dl)]+6.4×(病因)
(1)
式中:“病因”選項(xiàng)中,膽汁性或酒精性為0,其它為1;INR為凝血酶原時(shí)間國際標(biāo)準(zhǔn)化比值。
通過對(duì)比患者的肝臟CT圖像發(fā)現(xiàn),相同肝功能等級(jí)所對(duì)應(yīng)的CT圖像,由于不同患者的血管、腫瘤等存在明顯差異,導(dǎo)致同一肝功能等級(jí)之間的圖像差異較大;而不同肝功能等級(jí)所對(duì)應(yīng)的CT圖像之間的紋理相似、細(xì)節(jié)不豐富,導(dǎo)致不同肝功能等級(jí)之間的圖像差異較小。這種類內(nèi)差異大,類間差異小的特點(diǎn),給基于肝臟CT圖像的肝功能分級(jí)帶來了困難。為了減小相同肝功能等級(jí)之間的差異,由醫(yī)生或具有專業(yè)知識(shí)的從業(yè)人員對(duì)患者的臨床CT圖像提取不包含血管和腫瘤的肝臟ROI圖像,大小為38×38像素,如圖2所示。從圖中可以看出,不同肝功能等級(jí)的肝臟ROI圖像的紋理結(jié)構(gòu)相似,肉眼難以分辨。
圖2 不同肝功能等級(jí)的CT圖像及其肝臟ROI
然后,根據(jù)MELD評(píng)分標(biāo)準(zhǔn),將肝功能劃分為3個(gè)等級(jí):“低?!?R<15)、“中?!?15≤R≤18)、“高?!?R>18),并將其作為相應(yīng)ROI圖像的標(biāo)簽,建立肝功能分級(jí)數(shù)據(jù)集,如表1所示。其中,“低?!钡燃?jí)樣本697個(gè)、“中?!钡燃?jí)樣本93個(gè)、“高?!钡燃?jí)樣本92個(gè),共有樣本882個(gè)。大部分患者的肝功能屬于“低?!钡燃?jí),較少患者屬于“中?!?、“高?!钡燃?jí)。
表1 肝功能分級(jí)數(shù)據(jù)集統(tǒng)計(jì)結(jié)果
1.2.1 Gabor濾波
考慮到不同肝功能等級(jí)的ROI圖像紋理結(jié)構(gòu)相似、紋理細(xì)節(jié)不豐富,首先借助于Gabor濾波器的頻率選擇性和方向選擇性的特性,提取圖像更豐富的多尺度紋理特征。
已知二維Gabor函數(shù)Ψ(x,y) 定義為[6]
(2)
式中: (x0,y0) 為空間域的中心, (u0,v0) 為頻域的最優(yōu)空間頻率。σx和σy分別是在X和Y軸上的標(biāo)準(zhǔn)差。
假設(shè)I(x,y) 為肝臟ROI圖像,則有
Fu,v(x,y)=I(x,y)*Ψu,v(x,y)=Au,v(x,y)ejθu,v(x,y)
(3)
式中:Fu,v(x,y) 表示濾波圖像,“*”表示卷積運(yùn)算。Au,v(x,y) 和θu,v(x,y) 分別表示第v個(gè)尺度、第u個(gè)方向上的幅頻和相頻響應(yīng)。
圖3為采用5個(gè)尺度,8個(gè)方向的Gabor濾波器對(duì)不同肝功能等級(jí)的肝臟ROI圖像進(jìn)行濾波后的幅頻響應(yīng)。其中,圖3(a)和圖3(b)分別是“低危”和“高?!钡燃?jí)肝臟ROI圖像對(duì)應(yīng)的幅頻響應(yīng)。從圖中可以看出,經(jīng)過Gabor濾波后,不同肝功能等級(jí)的幅頻響應(yīng)在前3個(gè)尺度在不同方向上的紋理呈現(xiàn)出較為明顯的視覺差異。
圖3 對(duì)不同肝功能等級(jí)的肝臟ROI圖像Gabor濾波后的幅頻響應(yīng)
1.2.2 多尺度方向數(shù)值編碼
為了提取更為豐富的細(xì)節(jié)特征,進(jìn)一步增大不同肝功能等級(jí)之間的差異,克服Gabor濾波造成的維度過高的問題,在各個(gè)尺度上計(jì)算每個(gè)像素點(diǎn)的主要方向[7]
(4)
(5)
其中,D1,v(x,y) 和D2,v(x,y) 分別表示像素點(diǎn) (x,y) 在第v個(gè)尺度上最大和最小的幅頻響應(yīng)所對(duì)應(yīng)的方向數(shù)值。
然后,對(duì)像素點(diǎn) (x,y) 的方向數(shù)值按式(6)進(jìn)行編碼,即有
MSDNPv(x,y)=8D1,v(x,y)+D2,v(x,y)
(6)
式中: MSDNPv(x,y) 表示像素點(diǎn) (x,y) 在第v個(gè)尺度上對(duì)應(yīng)的編碼值,編碼過程如圖4所示。
圖4 編碼過程
從圖4中可以看出,MSDNP編碼方式僅使用6位二進(jìn)制編碼,維數(shù)為56,相對(duì)于8位二進(jìn)制編碼,維數(shù)為256的局部二值模式[8](local binary pattern,LBP)、局部方向模式[9](local direction pattern,LDP)更為緊湊,特征維數(shù)更低,數(shù)據(jù)存儲(chǔ)量更小。
對(duì)圖3中的各個(gè)尺度進(jìn)行方向信息編碼,結(jié)果如圖5所示。從圖中可以清晰看出,經(jīng)過編碼之后,兩種不同等級(jí)的圖像有了較為明顯的差異,說明方向信息編碼能夠進(jìn)一步增大類間差異,提高特征的可辨別力。
圖5 對(duì)不同肝功能等級(jí)圖像進(jìn)行局部方向編碼的結(jié)果
1.2.3 多尺度特征向量
將每個(gè)尺度的編碼圖像分成K個(gè)子塊 {R1,R2,…,RK}, 并對(duì)每個(gè)子塊統(tǒng)計(jì)直方圖
(7)
然后,將所有尺度的直方圖進(jìn)行級(jí)聯(lián),得到特征向量Η,即
(8)
SVM屬于監(jiān)督學(xué)習(xí)模型,基于訓(xùn)練數(shù)據(jù)構(gòu)建模型來產(chǎn)生預(yù)測目標(biāo)值,從而將數(shù)據(jù)分配到對(duì)應(yīng)的類別中,其優(yōu)化的目標(biāo)為[10]
(9)
式中:w為法向量,C為懲罰因子,b為位移量,ξi為松弛變量。
SVM利用非線性映射函數(shù)將低維樣本空間內(nèi)的向量映射到高維空間,使之線性可分,同時(shí)在該高維空間內(nèi)建立一個(gè)最優(yōu)超平面,以實(shí)現(xiàn)更好的分類。這種非線性映射通常使用核函數(shù)來完成,常用的核函數(shù)有多項(xiàng)式、S形函數(shù)和徑向基函數(shù)[11]。
實(shí)驗(yàn)環(huán)境為Windows10系統(tǒng),實(shí)驗(yàn)平臺(tái)為MATLAB 2019b,使用SVM分類器進(jìn)行優(yōu)化訓(xùn)練,建立肝功能分級(jí)模型,實(shí)現(xiàn)肝功能分級(jí)。為了降低數(shù)據(jù)分布不均衡的影響,本文采用10折交叉驗(yàn)證策略,對(duì)以下兩種情形分別進(jìn)行實(shí)驗(yàn):
(1)考慮到肝功能“低?!痹u(píng)分為1~14分,分值間隔大,“中?!痹u(píng)分15~18分,分值間隔小,且相對(duì)接近“高?!痹u(píng)分(大于18分)的臨界值。因此,將“中?!迸c“高危”兩個(gè)等級(jí)合并,進(jìn)行“低?!迸c“中高?!眱蓚€(gè)等級(jí)的分級(jí)實(shí)驗(yàn)。實(shí)驗(yàn)隨機(jī)選取數(shù)據(jù)集中“低?!眻D像200張與“中高?!眻D像185張,共計(jì)385張圖像進(jìn)行實(shí)驗(yàn)。
(2)對(duì)“低危”、“中?!?、“高?!?個(gè)等級(jí)進(jìn)行分級(jí)實(shí)驗(yàn),隨機(jī)選取數(shù)據(jù)集中“低?!眻D像100張、“中?!眻D像93張、“高?!眻D像92張,共計(jì)285張圖像進(jìn)行實(shí)驗(yàn)。
2.2.1 不同尺度數(shù)量下的實(shí)驗(yàn)結(jié)果
為了分析尺度數(shù)量對(duì)肝功能分級(jí)準(zhǔn)確度的影響,圖6給出了不同尺度下的實(shí)驗(yàn)結(jié)果。從圖中可以看出,在尺度較少的情況下,分級(jí)準(zhǔn)確率相對(duì)較低,隨著尺度數(shù)量的增加,分級(jí)準(zhǔn)確率有了明顯的提高,說明了多尺度有利于提取到肝臟CT圖像中豐富的細(xì)節(jié)特征。在5個(gè)尺度時(shí),分級(jí)準(zhǔn)確率達(dá)到最高,隨著尺度數(shù)量的繼續(xù)增加,準(zhǔn)確率又有所下降。可能的原因是尺度數(shù)量的持續(xù)增加導(dǎo)致了特征維數(shù)的增大,造成特征信息的冗余,進(jìn)而影響分級(jí)的準(zhǔn)確率。同時(shí),過多尺度也會(huì)導(dǎo)致計(jì)算量和計(jì)算時(shí)間的增加,因此,本文選擇5個(gè)尺度進(jìn)行后續(xù)實(shí)驗(yàn)。
圖6 不同尺度下的分級(jí)準(zhǔn)確率
2.2.2 不同分塊直方圖統(tǒng)計(jì)下的實(shí)驗(yàn)結(jié)果
為了驗(yàn)證基于CT圖像進(jìn)行肝功能分級(jí)的可行性以及本文方法的有效性,表2給出了若干典型的圖像描述子在不同分塊大小下進(jìn)行直方圖統(tǒng)計(jì)的對(duì)比實(shí)驗(yàn)結(jié)果。其中,LBP[8]利用中心像素與領(lǐng)域中其它像素的差異進(jìn)行編碼,LDP[9]通過對(duì)中心像素的k個(gè)局部方向進(jìn)行編碼,改進(jìn)的韋伯二值編碼[12](improved weber binary coding,IWBC)使用局部異或模式和LBP分別對(duì)改進(jìn)的韋伯幅度和方向信息進(jìn)行編碼,中值魯棒擴(kuò)展局部二值模式[13](median robust extended local binary pattern,MRELBP)通過比較局部圖像的中值來提取圖像紋理特征,捕捉圖像的宏觀與微觀信息。這些方法都在單一尺度上利用圖像自身的強(qiáng)度、方向信息等提取特征,總體分級(jí)準(zhǔn)確率偏低,而局部Gabor二值模式直方圖序列[14](local Gabor binary pattern histogram sequence,LGBPHS)和MSDNP通過提取不同尺度的紋理特征,提高了分級(jí)準(zhǔn)確率。
從表2中可以看出,各個(gè)描述子的準(zhǔn)確率都高于50%,說明了醫(yī)學(xué)影像與肝功能之間存在著密切的相關(guān)性,驗(yàn)證了基于醫(yī)學(xué)圖像的局部描述子對(duì)肝功能進(jìn)行分級(jí)是切實(shí)可行的。另一方面,多尺度特性能夠使得特征更具表征力和辨別力,獲得較高的分級(jí)準(zhǔn)確率。本文方法在最佳分塊情況下,分級(jí)準(zhǔn)確率最高可達(dá)74.48%,進(jìn)一步驗(yàn)證了本文方法的有效性。
2.2.3 多尺度特征維數(shù)的對(duì)比
為了分析特征維數(shù)對(duì)分級(jí)準(zhǔn)確率的影響,針對(duì)采用多尺度特性的描述子LGBPHS和MSDNP在5個(gè)尺度、8個(gè)方向、11×11分塊條件下進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果見表3。其中,LGBPHS在5個(gè)尺度下對(duì)每個(gè)方向的Gabor幅頻響應(yīng)單獨(dú)提取LBP特征,即使采用59維的等價(jià)二值模式編碼,特征向量的維數(shù)依然較高,計(jì)算時(shí)間較長,內(nèi)存占用較大。
表2 不同圖像描述子的肝功能“低?!?、“中高危”分級(jí)準(zhǔn)確率/%
MSDNP在每個(gè)尺度上對(duì)主要的方向信息進(jìn)行緊湊編碼,每個(gè)尺度生成一張編碼圖像,這樣使得最終的特征向量保持較低的維數(shù)。從表中可以看出,MSDNP方法的分級(jí)準(zhǔn)確率高出LGBPHS方法約4%,同時(shí),特征向量的維數(shù)比LGBPHS減少了大約9倍。
表3 LGBPHS和MSDNP在相同條件下的對(duì)比結(jié)果
從表3可以看出,經(jīng)過分塊直方圖統(tǒng)計(jì),特征向量的維數(shù)會(huì)隨著分塊大小的增大而增多,對(duì)特征進(jìn)行有效的降維,不僅可以數(shù)據(jù)量減小,還能夠提高分類器的優(yōu)化訓(xùn)練的效率。為此,利用主成分分析[15](principal component analysis,PCA)對(duì)LGBPHS和MSDNP的特征進(jìn)行降維,圖7為特征維度為5維到100維的分級(jí)準(zhǔn)確率。從圖中可以看出,MSDNP方法在特征降維后,準(zhǔn)確率保持在72%以上,均高于LGBPHS的準(zhǔn)確率,因此,本文的方法在特征降維后仍然有效。
圖7 不同維度下“低?!?、“中高?!钡姆旨?jí)準(zhǔn)確率
2.2.4 最佳分塊下的模型的性能指標(biāo)
為了更為全面地對(duì)模型進(jìn)行評(píng)估及優(yōu)化,表4給出了最佳分塊下的查準(zhǔn)率、查全率、特異性、F1值、AUC等相關(guān)性能指標(biāo)。從表4可見,本文提出的方法相對(duì)于其它描述子獲得了更佳的性能,其中,本文方法的查準(zhǔn)率、查全率、特異性、F1值相對(duì)于LGBPHS來說,分別提高了大約4%、3%、6%和3%,AUC也提升大約1%。
表4 不同圖像描述子在最佳分塊下的性能指標(biāo)
為了全面地驗(yàn)證本文方法的有效性和適用性,表5列出了不同圖像描述子在不同分塊下進(jìn)行肝功能“低?!?、“中?!焙汀案呶!?個(gè)等級(jí)的分級(jí)準(zhǔn)確率。從表5可以看出,在當(dāng)前最佳分塊下,各個(gè)描述子的分級(jí)準(zhǔn)確率均高于40%;同時(shí),MSDNP的準(zhǔn)確率高出LGBPHS的準(zhǔn)確率5%左右。
對(duì)比表2與表5的結(jié)果可以看出,盡管3個(gè)等級(jí)圖像之間的類間差異更小,分級(jí)的難度更大,準(zhǔn)確率有所下降,但是,本文的方法取得了64.27%的分級(jí)準(zhǔn)確率,在一定程度上辨別出了不同等級(jí)圖像之間的差異,進(jìn)一步驗(yàn)證了本文方法的可行性和有效性。
表5 不同圖像描述子的肝功能“低?!薄ⅰ爸形!焙汀案呶!狈旨?jí)準(zhǔn)確率/%
針對(duì)不同肝功能等級(jí)的CT圖像存在類間差異小,類內(nèi)差異大的特點(diǎn),本文提出了一種基于肝臟CT圖像MSDNP的肝功能分級(jí)方法,借助于Gabor濾波器,通過對(duì)CT圖像多個(gè)尺度的主要方向信息進(jìn)行緊湊編碼,有效地提取出肝臟CT圖像的特征。臨床數(shù)據(jù)的實(shí)驗(yàn)結(jié)果表明,本文提出的方法有效且可行,為醫(yī)生對(duì)患者肝硬化程度評(píng)分、是否適合肝切除手術(shù)治療以及術(shù)后死亡率的估計(jì)提供了基于影像學(xué)的輔助診斷,具有非侵入性、高效性和可重復(fù)性。
隨著機(jī)器學(xué)習(xí)方法的不斷提高,實(shí)驗(yàn)數(shù)據(jù)量的增加,基于CT影像的肝功能分級(jí)的準(zhǔn)確性將會(huì)進(jìn)一步提高。在今后的工作中,將逐步建立更為完善的肝臟CT圖像數(shù)據(jù)集;進(jìn)一步研究肝臟CT圖像的紋理特點(diǎn),提取出更具表征力和辨別力的特征;結(jié)合不同的肝功能評(píng)分標(biāo)準(zhǔn),深入研究肝功能綜合分級(jí)等方向。