崔金濤,許建生
(張家口市第一醫(yī)院 放射科,河北 張家口 075000)
肝血管瘤是一種肝臟良性腫瘤,瘤旁肝組織呈受壓改變,肝竇擴(kuò)張,病灶大小不一,肉眼呈紫紅色,腫瘤質(zhì)地較軟,其內(nèi)血供豐富[1]。目前,外科手術(shù)仍是肝血管瘤的主要治療措施,但由于肝血管瘤患者臨床特征不明顯,故對(duì)其精確診斷具有一定難度,導(dǎo)致臨床治療效果及預(yù)后均較差。隨著我國醫(yī)療影像技術(shù)的發(fā)展,臨床診斷小肝癌的技術(shù)較多,其中準(zhǔn)確性較高的檢查方式之一是MRI。釓塞酸二鈉(Gd-EOB-DTPA)是一種新型的肝膽MRI特異性對(duì)比劑,可進(jìn)入肝細(xì)胞內(nèi),再排泄入膽系[2]。由于在肝膽特異期肝血管瘤不吸收對(duì)比劑,呈低信號(hào)影,而肝臟背景吸收對(duì)比劑,呈高信號(hào),可使肝血管瘤病灶分割更加準(zhǔn)確[3]。影像組學(xué)主要是利用相關(guān)軟件對(duì)影像學(xué)圖像進(jìn)行更進(jìn)一步挖掘,將肉眼不可見的圖像信息轉(zhuǎn)換為可見的計(jì)算機(jī)信息,并結(jié)合診斷醫(yī)師的主觀診斷,進(jìn)行高通量運(yùn)算,從而獲得更精確的影像學(xué)信息[4]。已有研究報(bào)道,Gd-EOB-DTPA增強(qiáng)MRI可較好顯示肝血管瘤,對(duì)肝血管瘤診斷具有優(yōu)越性[5]。但MRI增強(qiáng)是否可以用于預(yù)測(cè)肝血管瘤患者術(shù)后療效尚未確定。在本研究中,我們旨在評(píng)估基于Gd-EOB-DTPA增強(qiáng)MRI的影像組學(xué)技術(shù),獲取MRI圖像的高通量特征,并結(jié)合臨床資料,通過構(gòu)建機(jī)器學(xué)習(xí)模型,探討Gd-EOB-DTPA增強(qiáng)MRI影像組學(xué)對(duì)肝血管瘤術(shù)后療效的預(yù)測(cè)價(jià)值。
選取2018年2月至2020年10月在張家口市第一醫(yī)院行腹腔鏡肝切除術(shù)治療的肝血管瘤患者131 例作為研究對(duì)象。納入標(biāo)準(zhǔn):(1)無其他惡性腫瘤病史;(2)術(shù)后病理可明確診斷肝血管瘤;(3)術(shù)前10 d內(nèi)接受Gd-EOB-DTPA增強(qiáng)MRI檢查;(4)年齡≥18歲。排除標(biāo)準(zhǔn):(1)近期服用過肝毒性藥物;(2)合并其他系統(tǒng)惡性腫瘤;(3)合并高血糖、高血壓、高血脂;(4)精神病患者。本研究經(jīng)我院倫理委員會(huì)審核,入選患者及家屬均知情并簽署知情同意書。
收集患者年齡、性別、體質(zhì)量指數(shù)(body mass index,BMI)、伴發(fā)慢性疾?。ǜ斡不?、慢性乙型肝炎)、血管瘤發(fā)生部位、類型、數(shù)目、血管瘤最大徑、瘤供血?jiǎng)用}支數(shù),以及肝切除大小、術(shù)中出血量、手術(shù)時(shí)間。
使用德國Siemens Magnetom Skyra 3.0 T MRI成像系統(tǒng)和16通道腹部線圈。檢查前空腹6 h以上,受檢者仰臥位以便行上腹部掃描。MRI掃描參數(shù)如下:(1)T1WI,重復(fù)時(shí)間(time of repeatation,TR)為 4.11 ms,回波時(shí)間(time of echo,TE)為1.24 ms,層厚3.6 mm,視野(field of vision,F(xiàn)OV)為260 mm× 320 mm;(2)脂肪抑制T2WI,F(xiàn)OV為310 mm× 330 mm,TE為75.40 ms,TR為5 000 ms,層厚6 mm;(3)DWI,F(xiàn)OV為260 mm×320 mm,TE為55 ms,TR為1 600 ms,矩陣為256×170;(4)T1WI增強(qiáng)掃描,使用3D VIBE T1WI序列,F(xiàn)OV為310 mm×330 mm,TR為4.26 ms,TE為1.85 ms。增強(qiáng)掃描前,使用高壓注射器經(jīng)肘靜脈注射對(duì)比劑Gd-EOB-DTPA(德國拜耳醫(yī)藥保健有限公司),注射流率為1 mL/s,注射劑量為0.025 mmoL/kg。分別于注射對(duì)比劑后18~21 s采集動(dòng)脈期圖像、60 s采集門靜脈期圖像、180 s采集平衡期圖像、20 min采集肝膽期圖像。見圖1。
圖1 患者女性,53歲,肝血管瘤,Gd-EOB-DTPA增強(qiáng)MRI影像學(xué)表現(xiàn)
(1)本研究使用圖像處理軟件(ITK-SNAP Version 3.4.0,http://www.itksnap.org/)對(duì)肝膽期圖像進(jìn)行圖像分割。先以隨機(jī)數(shù)字法提取20 例肝血管瘤患者,由分別有6、7年上腹部影像學(xué)診斷臨床經(jīng)驗(yàn)的2名放射科醫(yī)師(本文第一作者A、本文第二作者B)分別進(jìn)行圖像分割,1 周后醫(yī)師A再次勾畫該20例患者,并完成剩余病例。(2)紋理特征提?。菏褂肞yRadiomics軟件提取肝膽期MRI圖像定量特征,包括領(lǐng)域灰度差矩陣、灰度區(qū)域大小矩陣、灰度共生矩陣、灰度依賴矩陣、灰度游程長度矩陣、形狀特征、一階特征。分別提取小波變換圖像、高斯拉普拉斯過濾圖像和原始圖像的特征。(3)特征篩選:使用最小絕對(duì)收縮和選擇算子(the least absolute shrinkage and selection operator,LASSO)回歸5折交叉驗(yàn)證方法篩選納入的影像組學(xué)特征和臨床特征,選擇調(diào)優(yōu)參數(shù)lambda.1se時(shí)對(duì)應(yīng)的特征,獲取最優(yōu)特征子集,繪制相關(guān)性熱圖。
研究采用機(jī)器學(xué)習(xí)算法,利用提取的最優(yōu)特征子集進(jìn)行學(xué)習(xí),建立和訓(xùn)練一個(gè)預(yù)測(cè)模型。將131例肝血管瘤患者采用計(jì)算機(jī)產(chǎn)生隨機(jī)數(shù)法以7:3的比例分為訓(xùn)練集(92例)和驗(yàn)證集(39例),分別用于構(gòu)建和驗(yàn)證預(yù)測(cè)模型效能。
Logistic回歸屬于概率型非線性回歸,多用于鑒別診斷、評(píng)價(jià)治療措施以及分析疾病的預(yù)后因素,是處理二分類反應(yīng)數(shù)據(jù)的標(biāo)準(zhǔn)方法[6]。
XGBoost是將損失函數(shù)通過二階泰勒擴(kuò)展推導(dǎo),為避免模型擬合過度,在目標(biāo)函數(shù)中加入控制模型復(fù)雜度的正規(guī)化項(xiàng),具有與決策樹相同的決策規(guī)則,支持回歸和分類[7]。
CatBoost采用對(duì)稱樹的方式,通過特殊的方式處理類別特征編碼,從而避免過度擬合,提升模型的泛化能力和魯棒性[8]。
LightGBM是基于決策樹算法的梯度提升算法框架,利用弱分類器迭代訓(xùn)練得到最優(yōu)模型,并采用梯度提升算法減少結(jié)構(gòu)分?jǐn)?shù)的計(jì)算量,可以準(zhǔn)確提高計(jì)算能力[9]。
患者手術(shù)當(dāng)天為隨訪開始日期,截止時(shí)間2021年9月,術(shù)后每2~3個(gè)月進(jìn)行1次隨訪和復(fù)查,隨訪方式為上門或電話隨訪。根據(jù)患者術(shù)后是否出現(xiàn)并發(fā)癥分為預(yù)后不良組和預(yù)后良好組。訓(xùn)練集中預(yù)后良好64例,預(yù)后不良28例;驗(yàn)證集中預(yù)后良好25例,預(yù)后不良14例。
訓(xùn)練集和驗(yàn)證集患者的一般臨床資料、病變相關(guān)因素、操作相關(guān)因素等比較,差異均無統(tǒng)計(jì)學(xué)意義(P>0.05),具有可比性。見表1。
表1 訓(xùn)練集和驗(yàn)證集患者的臨床資料比較(例)
訓(xùn)練集中預(yù)后不良的患者有28例,其中感染19例(19/92,20.65%),膽漏5例(5/92,5.43%),腹腔積液4例(4/92,4.35%)。比較訓(xùn)練集肝血管瘤患者預(yù)后不良組和預(yù)后良好組間的臨床特征,結(jié)果發(fā)現(xiàn),兩組在慢性疾病、血管瘤最大徑、血管瘤數(shù)目、血管瘤供血?jiǎng)用}支數(shù)、肝切除大小、術(shù)中出血量方面,差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。兩組在年齡、性別、BMI、血管瘤發(fā)生部位、血管瘤類型、手術(shù)時(shí)間方面無統(tǒng)計(jì)學(xué)差異(P>0.05)。見表2。
表2 訓(xùn)練集臨床資料比較(例)
A醫(yī)師與B醫(yī)師第1次圖像分割結(jié)果進(jìn)行比較發(fā)現(xiàn),組間ICC值為0.862~0.934;對(duì)A醫(yī)師2次圖像分割結(jié)果進(jìn)行比較發(fā)現(xiàn),組內(nèi)ICC值為0.839~0.922。圖像分割組內(nèi)和組間比較均具有較好的一致性。
基于訓(xùn)練集肝膽期MRI圖像共提取1 068個(gè)影像組學(xué)特征,再利用LASSO回歸,通過5 折交叉驗(yàn)證確定LASSO回歸中的最佳λ取值,基于最佳λ值從12個(gè)臨床特征和1 068 個(gè)影像組學(xué)特征中篩選出14 個(gè)非零系數(shù)特征,構(gòu)成最優(yōu)特征子集,其中包括12個(gè)影像組學(xué)特征和2個(gè)臨床特征(見圖2、表3)。
表3 肝血管瘤影像組學(xué)和臨床特征及回歸系數(shù)
圖2 影像組學(xué)紋理特征篩選
繪制最優(yōu)特征子集的相關(guān)性熱圖,14個(gè)最優(yōu)特征的相關(guān)性較弱,相對(duì)獨(dú)立,可全部納入機(jī)器學(xué)習(xí)模型。見圖3。
圖3 最優(yōu)特征子集的相關(guān)性熱圖
基于最優(yōu)特征子集建立預(yù)測(cè)肝血管瘤術(shù)后療效的Logistic回歸模型、CatBoost模型、XGBoost模型、LightGBM模型,然后利用驗(yàn)證集病例對(duì)訓(xùn)練集建立的模型進(jìn)行驗(yàn)證,使用ROC曲線比較4 種模型的預(yù)測(cè)價(jià)值。
在訓(xùn)練集中,Logistic回歸模型、XGBoost模型、CatBoost模型、LightGBM模型的ROC曲線下面積(AUC)分別為0.820(95%CI0.746~0.881)、0.784(95%CI0.729~0.864)、0.722(95%CI0.651~0.803)、0.693(95%CI0.618~0.752),Logistic回歸模型的敏感性和特異性均高于其他3 種模型。在驗(yàn)證集中,Logistic回歸模型、XGBoost模型、CatBoost模型、LightGBM模型的AUC分別為0.814(95%CI0.732~0.861)、0.785(95%CI0.735~0.850)、0.706(95%CI0.619~0.769)、0.684(95%CI0.607~0.763),Logistic回歸模型的敏感性和特異性均高于其他3種模型。見表4。
表4 ROC曲線評(píng)價(jià)4種模型的預(yù)測(cè)價(jià)值
根據(jù)訓(xùn)練集和驗(yàn)證集結(jié)果,4種機(jī)器學(xué)習(xí)算法的預(yù)測(cè)效果良好,其中Logistic回歸的預(yù)測(cè)效果優(yōu)于其他3種,預(yù)測(cè)更加準(zhǔn)確。見圖4。
圖4 ROC曲線評(píng)估訓(xùn)練集(A圖)和驗(yàn)證集(B圖)中4種模型對(duì)術(shù)后療效的預(yù)測(cè)價(jià)值
肝血管瘤是一種良性腫瘤,腹腔鏡肝切除術(shù)是治療肝血管瘤的常用術(shù)式,術(shù)后瘤體殘留和復(fù)發(fā)率極低,因此本研究以患者術(shù)后發(fā)生并發(fā)癥為預(yù)后不良。本研究發(fā)現(xiàn),訓(xùn)練集中預(yù)后不良患者有28 例,其中感染19 例,膽漏5 例,腹腔積液4 例,比例分別為20.65%、5.43%、4.35%。以往研究顯示,肝血管瘤經(jīng)腹腔鏡肝切除術(shù)治療術(shù)后感染率約為19%~33%[10],與本研究結(jié)果相符。本研究進(jìn)一步比較預(yù)后良好組和預(yù)后不良組臨床資料發(fā)現(xiàn),預(yù)后不良組患者中,血管瘤供血?jiǎng)用}多支、血管瘤數(shù)目>1個(gè)、合并慢性疾病、血管瘤最大徑≥10 cm、肝切除≥35%,術(shù)中出血量≥400 mL者占比均明顯較大,提示上述因素可能與預(yù)后不良有關(guān)。本研究又利用LASSO回歸篩選最優(yōu)特征發(fā)現(xiàn),血管瘤最大徑和血管瘤數(shù)這兩個(gè)臨床特征被納入最優(yōu)特征子集,提示二者與肝血管瘤術(shù)后療效相關(guān)。已有研究發(fā)現(xiàn),血管瘤數(shù)目>1 個(gè)是肝血管瘤預(yù)后不良的危險(xiǎn)因素之一,原因可能是由于瘤體數(shù)量越多,分布越廣,術(shù)中需切除的肝臟也越大,從而擴(kuò)大手術(shù)切口,增加手術(shù)風(fēng)險(xiǎn)[11]。而血管瘤最大徑≥10 cm也會(huì)增加手術(shù)預(yù)后不良風(fēng)險(xiǎn),這是由于腫瘤直徑越大,術(shù)中所需切除的體積越大,受損組織越多。
影像組學(xué)通過自動(dòng)化數(shù)據(jù)的特征化算法,從感興趣區(qū)提取大量特征數(shù)據(jù),進(jìn)行篩選,獲取定量特征,有助于對(duì)腫瘤異質(zhì)性進(jìn)行分析[12]。Gd-EOB-DTPA是一種新型肝膽磁共振對(duì)比劑,經(jīng)靜脈注射后,約50%能夠被正常肝細(xì)胞膜上的有機(jī)陰離子轉(zhuǎn)運(yùn)多肽攝取,并可完整通過膽道排泄,而不會(huì)被肝細(xì)胞代謝,剩余的50%會(huì)被腎臟代謝[13]。在正常肝臟組織中,Gd-EOB-DTPA在肝膽特異期呈等信號(hào)或高信號(hào)表現(xiàn),而在肝臟惡性腫瘤中,Gd-EOB-DTPA在肝膽特異期呈低信號(hào)表現(xiàn)[14]。李亮杰等[15]和Takao等[16]分別報(bào)道了Gd-EOB-DTPA增強(qiáng)MRI在肝硬化和慢性肝炎患者中,肝膽特異期影像學(xué)的變化與患者肝功能損害具有相關(guān)性。報(bào)道Gd-EOB-DTPA增強(qiáng)MRI預(yù)測(cè)肝血管瘤術(shù)后療效較少。已有研究報(bào)道,包含影像組學(xué)和臨床參數(shù)的回歸模型的評(píng)估能力明顯優(yōu)于單獨(dú)的臨床參數(shù)模型[17]。也有研究證實(shí),提取肝癌患者術(shù)前MRI影像組學(xué)特征后建立的模型可準(zhǔn)確預(yù)測(cè)術(shù)后腫瘤變化[18]。本研究基于肝血管瘤患者術(shù)前肝膽期MRI圖像共提取1 068個(gè)影像組學(xué)特征,再利用LASSO回歸,通過5折交叉驗(yàn)證確定LASSO回歸中的最佳λ取值,基于最佳λ值從12個(gè)臨床特征和1 068個(gè)影像組學(xué)特征中篩選出14個(gè)非零系數(shù)特征,構(gòu)成最優(yōu)特征子集,其中包括12個(gè)影像組學(xué)特征和2個(gè)臨床特征。
機(jī)器學(xué)習(xí)算法在人工智能領(lǐng)域?qū)儆谝环N比較新穎的方法,其可以通過龐大的電子醫(yī)療記錄獲得從實(shí)踐中得出的數(shù)據(jù)集,通過自動(dòng)改進(jìn)的計(jì)算機(jī)算法對(duì)數(shù)據(jù)進(jìn)行整合分析,為患者臨床的精準(zhǔn)預(yù)測(cè)提供新的思路和方法[19]。既往關(guān)于肝血管瘤術(shù)后療效的預(yù)測(cè)研究主要根據(jù)傳統(tǒng)的Logistic回歸進(jìn)行危險(xiǎn)因素分析,鮮有結(jié)合影像組學(xué)數(shù)據(jù)進(jìn)行預(yù)測(cè)。本研究將基于LASSO回歸和5 折交叉驗(yàn)證篩選出的2 個(gè)臨床特征和12 個(gè)影像組學(xué)特征納入Logistic回歸、CatBoost、XGBoost和LightGBM 4種機(jī)器學(xué)習(xí)算法中,通過對(duì)訓(xùn)練集進(jìn)行數(shù)據(jù)分析,驗(yàn)證集進(jìn)行預(yù)測(cè)驗(yàn)證,其最高AUC可達(dá)0.8 以上,規(guī)避了傳統(tǒng)方法數(shù)據(jù)處理量大、人工操作繁雜、指標(biāo)納入局限性等問題,此研究方法可供醫(yī)師臨床診斷和術(shù)后療效預(yù)測(cè)提供理論支持。另外,本研究比較了4 種機(jī)器學(xué)習(xí)算法在預(yù)測(cè)模型上的預(yù)測(cè)效能,發(fā)現(xiàn)Logistic回歸和XGBoost的AUC均大于0.75,說明預(yù)測(cè)效果具有很大的潛力;而CatBoost和LightGBM的AUC均在0.60~0.75,就本實(shí)驗(yàn)而言預(yù)測(cè)效果欠佳。整體看來,Logistic回歸算法優(yōu)于另外3種。
綜上所述,血管瘤最大徑和血管瘤數(shù)結(jié)合釓塞酸二鈉增強(qiáng)MRI肝膽期圖像的影像組學(xué)特征構(gòu)建的機(jī)器學(xué)習(xí)模型可用于對(duì)肝血管瘤術(shù)后療效進(jìn)行預(yù)測(cè),其中Logistic回歸算法構(gòu)建的模型更加精準(zhǔn),可為肝血管瘤患者的個(gè)體化預(yù)測(cè)提供理論依據(jù)。