鄭宇,郭子義
(錦州醫(yī)科大學(xué)附屬第一醫(yī)院,遼寧 錦州 121000)
肝癌包括原發(fā)肝癌和肝轉(zhuǎn)移癌是癌癥患者的主要死亡原因之一[1]。以腫瘤射頻消融或微波消融為代表的局部毀損性治療(local ablative treatment,LAT)已經(jīng)得到腫瘤治療指南推薦[2]。然而,腫瘤消融術(shù)后局部復(fù)發(fā)是影響患者長期生存的關(guān)鍵問題之一[3-4]。CT紋理分析(CT texture analysis,CTTA)是一種利用像素屬性表征特定感興趣區(qū)域(region of interesting,ROI)內(nèi)病變的異質(zhì)性進(jìn)而獲得定量紋理參數(shù)的方法。已有研究表明CTTA能夠預(yù)測腫瘤患者預(yù)后,總體生存率及評估腫瘤治療反應(yīng)[5]。
本研究擬通過對肝癌患者隨訪中,以機(jī)器學(xué)習(xí)(ML)分類模型方法為基礎(chǔ),分析肝癌門靜脈期增強(qiáng)CT的CTTA所獲得參數(shù)特征來預(yù)測肝癌消融術(shù)后復(fù)發(fā)與否。
本研究中的所有臨床數(shù)據(jù)和影像學(xué)數(shù)據(jù)均來自錦州醫(yī)科大學(xué)附屬第一醫(yī)院,CT圖像以DICOM格式保存。所有實(shí)驗(yàn)方案均已獲得錦州醫(yī)科大學(xué)機(jī)構(gòu)審查委員會的批準(zhǔn)。
回顧性的收集2016—2021年肝腫瘤微波消融術(shù)治療病例,共146例,3~6個月后隨訪發(fā)現(xiàn)局部復(fù)發(fā)者45例。本研究中僅包括那些在肝腫瘤消融術(shù)后3個月以上,且行對比增強(qiáng)CT(contrast enhancement CT,CECT)檢查并且保存有原始DICOM圖像數(shù)據(jù)的患者。所有這些圖像為最大管電壓為120 kV的腹部增強(qiáng)CT,切片厚度5 mm,僅收集門靜脈期增強(qiáng)CT圖像。
CECT圖像質(zhì)量差的患者,如明顯的圖像噪聲、偽影或圖像存在其他質(zhì)量問題被排除在研究之外。
每位患者3~5個連續(xù)層面的樣本,將數(shù)據(jù)擴(kuò)充到總共528個標(biāo)記樣本(225個無局部復(fù)發(fā)的樣本和303個局部復(fù)發(fā)樣本)。圖像選在感興趣病灶的最大直徑中心切片位置和上、下1~2層,因此在3~5個不同且連續(xù)的切片中進(jìn)行采樣。
在代表腫瘤最大橫截面積的軸向圖像切片上,使用3D Slicer軟件(版本4.8.1)手動進(jìn)行腫瘤分割[6],然后在相鄰的連續(xù)上層和下層切片上執(zhí)行其他分割。每個病灶最多可獲取5次分割(連續(xù)5層),且距病變輪廓約2 mm的邊緣縮進(jìn)。全部針對DICOM圖像格式進(jìn)行提取數(shù)據(jù),并進(jìn)行歸一化和標(biāo)準(zhǔn)化處理。
使用開源軟件包提取紋理特征(Pyradiomics,版本2.2.0)[7],提取過程按軟件說明書進(jìn)行。所提取的紋理特征包括一階特征,灰度相關(guān)矩陣,灰度共現(xiàn)矩陣,灰度游程矩陣,灰度大小帶矩陣,相鄰灰度差矩陣和基于小波分析的紋理特征。每個病變提取的特征總數(shù)為828。這些特征的詳細(xì)描述和數(shù)學(xué)公式已在其他文獻(xiàn)進(jìn)行了描述[8]。
使用統(tǒng)計(jì)軟件SPSS 18.0中運(yùn)行內(nèi)相關(guān)系數(shù)(internal correlation coefficient,ICC)為每個紋理特征計(jì)算類內(nèi)相關(guān)系數(shù)值[9]。在特征選擇步驟中,僅包含類ICC > 0.9的特征(表明具有高度可重復(fù)性)。
基于ML的分類模型的統(tǒng)計(jì)使用Pycaret軟件(2.1.2版)[10]。使用10倍交叉驗(yàn)證,共制作了18個分類模型。主要根據(jù)AUC值對分類模型的性能進(jìn)行了評估和比較。主要使用AUC值測算不同分類模型的性能,顯著性檢查水平P<0.05。
本研究所納入病例的一般特征:平均年齡(59.74 ± 27.5)歲;男性101例,女性45例;原發(fā)肝癌48例,肝轉(zhuǎn)移癌98例;出現(xiàn)微波消融術(shù)后復(fù)發(fā)者原發(fā)肝癌10例,肝轉(zhuǎn)移癌35例。在門靜脈增強(qiáng)CT增強(qiáng)圖像上的測定病變最大直徑如下:(1)伴有局部復(fù)發(fā)腫瘤直徑為直徑:(2.95±1.38) cm;中位數(shù):3.57 cm;IQR:2.88~4.40 cm;(2)無局部復(fù)發(fā)的肝腫瘤為(2.02±1.45) cm;中位數(shù):2.95 cm;IQR:2.06~3.36 cm。每個含有腫瘤的ROI中的體素?cái)?shù)量如下:(1)伴有局部復(fù)發(fā)腫瘤者4893± 4698;中位數(shù):5875;IQR:2860~5578;(2)無局部復(fù)發(fā)腫瘤者3574 ± 5658;中位數(shù):4984;IQR:1761~4430。肝腫瘤微波消融術(shù)后局部復(fù)發(fā)在門靜脈期增強(qiáng)CT影像表現(xiàn),見圖1。
目標(biāo)變量是消融術(shù)后局部復(fù)發(fā)狀態(tài)(是=1,否=0)。在828個紋理特征中,759個具有高度可重復(fù)性(ICC ≥ 0.9),因此以下分析中總共包括759特征和528個樣本。訓(xùn)練集∶測試集∶驗(yàn)證集的樣本比例為70∶20∶10。使用交叉驗(yàn)證對總共18個模型進(jìn)行了訓(xùn)練和評估。
在訓(xùn)練集上對所有18個分類模型進(jìn)行了訓(xùn)練,并使用分層交叉驗(yàn)證對它們進(jìn)行了評分,分別用AUC、準(zhǔn)確率、精確率、Kappa值表示分類模型的優(yōu)劣。最終將得分最高的3種分類模型Extra Trees、cat Boost和Gradient Boosting用作判定局部復(fù)發(fā)與否,3種分類模型在腫瘤局部復(fù)發(fā)與否預(yù)測的準(zhǔn)確率、精確率、Kappa值和AUC值之間的比較,見表1。
星號所示A:最大徑約為1.8 cm;B:行CT引導(dǎo)下微波消融術(shù)后3個月時(shí)復(fù)查CT提示可疑結(jié)節(jié),未行進(jìn)一步治療;C:微波消融術(shù)后6個月復(fù)查增強(qiáng)提示病灶局部復(fù)發(fā)
表1 不同分類模型對有/無局部復(fù)發(fā)分類
在測試集上Extra Trees、cat Boost和Gradient Boosting這3種分類模型的預(yù)測準(zhǔn)確率均超過80%,精確率超過80%,Kappa值約60%,特別是AUC值均超過85%(P<0.05),提示所選擇的3種分類模型在預(yù)測效能和穩(wěn)定性上具有顯著優(yōu)勢。為了驗(yàn)證數(shù)據(jù)的預(yù)測模型功能,在從原始數(shù)據(jù)集中保留了53個樣本記錄(占10%),用于最終驗(yàn)證所用分類模型的AUC的性能,見圖2。
在測試樣本(test data為20%,105個樣本)上判定經(jīng)過訓(xùn)練集獲得的3種模型的分類結(jié)果。圖2顯示了來自Extra trees分類模型,Cat Boost分類模型和Gradient Boosting模型的ROC曲線圖,3種分類模型的分類準(zhǔn)確性均超過85%。進(jìn)一步對預(yù)測的精確率進(jìn)行判定,見圖3。Extra Trees、CatBoost、Gradient Boosting這3種分類模型方法,從肝癌的門靜脈期增強(qiáng)CT的CTTA獲得的所選10個特征預(yù)測AUC值分別為:0.85、0.88、0.89(P<0.05);預(yù)測精確度分別為90%、91%和92%(P<0.05)。
A:使用Extra Trees分類模型獲得的AUC為0.85;B:使用Cat Boost分類模型獲得的AUC值為0.88;C:使用Gradient Boosting分類模型獲得的AUC分別為0.89。顯著性檢驗(yàn)水平設(shè)定為P<0.05
為了預(yù)測驗(yàn)證集并查看評估指標(biāo),最終模型功能將模型擬合到完整的數(shù)據(jù)集驗(yàn)證集樣本(validation data 為10%,53個樣本)。在測試集和驗(yàn)證集上,3種性能良好的模型分別是Extra Trees、Cat Boost和Gradient Boosting,模型之間預(yù)測準(zhǔn)確性結(jié)果的比較如下,如圖3所示:(1)測試樣本(105個樣本)上Extra Trees分類模型的準(zhǔn)確性為0.85,驗(yàn)證集數(shù)據(jù)(53個樣本)進(jìn)行預(yù)測的準(zhǔn)確性為0.9;(2)Cat Boost在測試集(105個樣本)上的準(zhǔn)確度為0.88,驗(yàn)證集數(shù)據(jù)(53個樣本)的預(yù)測準(zhǔn)確度為0.9;(3)Gradient Boosting在測試集(105個樣本)上的準(zhǔn)確度為0.86,驗(yàn)證集數(shù)據(jù)(53個樣本)的預(yù)測準(zhǔn)確度為0.9。
A:使用Extra Trees分類模型有效區(qū)分有/無局部復(fù)發(fā)分類的精確度為0.90;B:使用Cat Boost分類模型有效區(qū)分有/無局部復(fù)發(fā)分類的精確度為0.91;C:使用Gradient Boosting分類模型有效區(qū)分有/無局部復(fù)發(fā)分類的精確度為0.92。 3種分類模型(Extra Trees,Cat Boost和Gradient Boosting)判定復(fù)發(fā)與否的精確度均超過90%,顯著性檢驗(yàn)水平設(shè)定為P<0.05
本文使用ML分類模型對肝腫瘤消融治療后CTTA所獲特征數(shù)據(jù)進(jìn)行分析,來預(yù)測腫瘤消融局部復(fù)發(fā)與否。本研究結(jié)果表明,使用3種不同ML分類模型(如 Extra Trees、Cat Boost和Gradient Boosting分類模型)對CTTA分析均可能對預(yù)測肝腫瘤局部復(fù)發(fā)有用,預(yù)測的準(zhǔn)確率可以達(dá)到90%以上。本研究結(jié)果與其他通過使用CTTA的作為腫瘤復(fù)發(fā)的生物標(biāo)志物研究結(jié)論一致,判斷正確率約88%~93%[11]。
本研究中僅通過分析肝癌門靜脈期增強(qiáng)CT進(jìn)行CTTA研究,而且使用120 kV的管電壓完成肝增強(qiáng)CT檢查,使得應(yīng)用于本研究所需的CT檢查放射劑量低于常規(guī)多期肝增強(qiáng)CT(平掃-動脈期-門靜脈期-延遲期),有效的降低了CT放射劑量。特別是對于肝癌患者而言,需要反復(fù)多次進(jìn)行CT為代表的放射線檢查,能夠行之有效地降低醫(yī)療相關(guān)輻射劑量。
基于CTTA的ML分類模型已用于預(yù)測轉(zhuǎn)移性結(jié)直腸癌患者的生存[12],CTTA還成功用于預(yù)測單個HER2擴(kuò)增的結(jié)直腸癌肝轉(zhuǎn)移的化療后反應(yīng)[13]。從CTTA得出的特征參數(shù)可能會提供潛在的預(yù)后標(biāo)記來預(yù)測腫瘤治療后局部復(fù)發(fā),我們可以預(yù)計(jì)通過進(jìn)一步研究可能會開發(fā)出新的基于影像數(shù)據(jù)的預(yù)后標(biāo)記物和模型,其中可能涉及更大的數(shù)據(jù)集和不同的特征選擇算法以及支持ML分類模型。由于CTTA可以揭示成像特征與腫瘤治療預(yù)后之間的關(guān)系,我們目前的研究可能具有重要的臨床意義。
該研究尚存在一些局限有待解決:(1)作為一項(xiàng)回顧性研究設(shè)計(jì),該研究提供了一些較低水平的證據(jù);(2)基于ML的分類模型可能會因患者人數(shù)少且失衡而導(dǎo)致過擬合的風(fēng)險(xiǎn),我們努力通過應(yīng)用數(shù)據(jù)增強(qiáng)技術(shù)來增加標(biāo)記樣本的數(shù)量,以減少這種預(yù)期過擬合的問題,這是一種有效的方法,可以克服基于ML的分類模型中的過擬合;(3)盡管3D分割可以更有效地表示放射線影像學(xué)信息,但是我們僅將最大的2D切片及其相鄰的連續(xù)上下切片用于CTTA,因?yàn)槎鄶?shù)既往對肝癌的臨床研究都是基于單個層面的分割或少數(shù)幾個分割層面[14];(4)本文未分析非對比增強(qiáng)CT或動脈期增強(qiáng)CT的CTTA,因?yàn)榉菍Ρ仍鰪?qiáng)CT在診斷肝腫瘤復(fù)發(fā)缺乏組織對比度,因難于早期發(fā)現(xiàn),易出現(xiàn)漏診;肝動脈期增強(qiáng)CT可因腫瘤消融術(shù)后所致肝實(shí)質(zhì)“異常灌注”,可能造成誤診,故本文僅選擇門靜脈期CT圖像進(jìn)行CTTA分析;(5)本文僅評估了腫瘤局部復(fù)發(fā)與否,對復(fù)發(fā)程度和范圍未進(jìn)行劃分。
綜上所述,基于ML分類模型的CTTA被證明是預(yù)測肝癌患者腫瘤消融治療后復(fù)發(fā)與否的可行且可能成功的方法。由于本研究僅使用門靜脈期增強(qiáng)CT即可實(shí)現(xiàn)對腫瘤消融術(shù)后復(fù)發(fā)的有效預(yù)測,并能夠行之有效的降低CT檢查放射劑量,而且可以將該方法用作大型和前瞻性臨床試驗(yàn)中的臨床決策支持工具之一。