崔達華 ,趙 瑩,劉愛連,武敬君,郭 妍,李 昕,吳艇帆,崔景景,左盼莉
(1.大連醫(yī)科大學附屬第一醫(yī)院放射科,遼寧 大連 116011;2.通用電氣藥業(yè)(上海)有限公司,上海 200000;3.慧影醫(yī)療科技(北京)有限公司,北京 100080)
肝細胞癌(Hepatocellular carcinoma,HCC)的主要治療方式有手術切除、肝移植、消融術、經(jīng)肝動脈化療栓塞、化學藥物全身治療等[1]。肝切除術是HCC的重要治療手段,但根治術后5 年內腫瘤復發(fā)率高達70%[2]。HCC 患者的預后預測由于腫瘤病灶內部異質性而具有很大難度[3]。傳統(tǒng)的影像手段僅能夠憑借醫(yī)師個人經(jīng)驗獲取常規(guī)影像特征,忽略了更多肉眼無法分辨的有價值的影像特征,因此難以全面客觀地對HCC 的預后進行術前預測。影像組學是近年來研究較為廣泛的一種影像定量評估手段,能夠將圖像轉化為多維度定量參數(shù),更全面客觀地反映腫瘤內部特征。影像組學特征能反映腫瘤的生物學特性,與腫瘤的預后密切相關[2]。最近研究指出,CT影像組學預測模型具有術前預測HCC 患者3 年生存期的價值[4],但動態(tài)增強MRI 影像組學對HCC 術后3 年復發(fā)的預測價值尚未見報道。本研究擬探討動態(tài)增強MRI 影像組學列線圖預測HCC 切除術后3 年復發(fā)的價值。
回顧性納入2007 年1 月—2016 年9 月我院符合以下標準的HCC 患者(圖1)。納入標準包括:①接受部分肝切除術并通過術后病理確診為HCC;②術前2 周內行腹部1.5T MRI 平掃及L 肝臟快速容積采集(Liver acceleration volume acquisition,LAVA)動態(tài)增強掃描。排除標準包括:①在MRI 檢查前接受任何抗癌治療(包括放療、化療、生物治療及介入治療);②圖像質量差,信噪比低或運動偽影嚴重;③臨床資料不完整;④術后3 年內失訪。最后80例患者(90 個病灶)納入研究,男66 例,女14 例,年齡36~81 歲,平均(57.9±10.0)歲。90 個HCC 病灶以5∶2 隨機分為訓練集和測試集,最終,64 個納入訓練集,26 個納入測試集。
收集患者相關臨床資料,包括性別、年齡、乙型肝炎病史、肝硬化病史、甲胎蛋白(AFP)(正常水平:<5.8 ng/mL)、癌胚抗原(CEA)(正常水平:<5 ng/mL)、丙氨酸氨基轉移酶(ALT)(正常范圍:9~50 U/L)、天冬氨酸氨基轉移酶(AST)(正常范圍:15~40 U/L)、γ-谷氨酰轉肽酶(GGT)(正常范圍:10~60 U/L)、白蛋白(ALB)(正常范圍:40~55 g/L)、總膽紅素(TBIL)(正常范圍:5.1~19.0 μmol/L)和Child-Pugh 等級(A 或B)。
圖1 HCC 患者招募流程。Figure 1.Recruitment process of patients with hepatocellular carcinoma.
所有HCC 患者在切除術后至少隨訪3 年,通過增強CT 或MRI 掃描定期監(jiān)測復發(fā)情況,隨訪截止日期為2019 年9 月。復發(fā)標準:本院CT 或MRI 檢查或病理學檢查確定為HCC 肝內復發(fā)或遠處轉移。HCC 病灶中復發(fā)49 個(訓練集35 個,測試集14個),未復發(fā)41 個(訓練集29 個,測試集12 個)。
本研究采用1.5T MR 掃描儀(Signa,HDxt,美國GE 公司),患者仰臥位,采用8 通道腹部線圈,行上腹部MRI 平掃和動態(tài)增強掃描。所有患者在掃描前禁食4~6 h。掃描參數(shù)如下:①T1WI:TR/TE=400 ms/8.0 ms,F(xiàn)OV=320 mm×320 mm,矩陣=320×192,NEX=2.0,層厚=5.0 mm;②T2WI:TR/TE=5 000~7 000 ms/125 ms,F(xiàn)OV=320 mm×320 mm,矩陣=320×192,NEX=4.0,層厚=5.0 mm;③LAVA 動態(tài)增強掃描:經(jīng)肘靜脈高壓注射器團注對比劑Gd-DTPA(釓噴酸葡胺注射液,德國Bayer Schering Pharma AG),0.1 mmol/kg 體質量,速率2.5 mL/s,分別于注藥后40 s、70 s 及90 s 后掃描,獲得動脈期、門靜脈期及延遲期圖像。
首先,由具備2 年MRI 讀片經(jīng)驗的觀察者1 使用ITK-SNAP 軟件,于增強3 期MR 圖像的各個層面逐層手動勾勒HCC 病灶邊緣,隨后由具備10 年MRI 讀片經(jīng)驗的觀察者2 檢查修訂,并保存三維感興趣區(qū)(Volume of intertest,VOI)(圖2)。再將DICOM 格式的增強MR 圖像和保存的VOI 傳輸至Radcloud 平 臺(Huiying Medical Technology Co.,Ltd,北京,中國)。
圖2 女,60 歲,肝右葉HCC。圖2a~2c 分別為軸位、矢狀位和冠狀位動脈期圖像,在軸位圖像上逐層手動勾勒HCC 病灶邊緣;圖2d 為病灶融合后的三維示意圖。Figure 2.A 60-year-old female confirmed with HCC in the right lobe of the liver.Figure 2a~2c:The axial,sagittal and coronary images on the arterial phase,respectively.The lesion was manually delineated around the edge in axial image on each slice.Figure 2d:Three-dimensional diagram of the lesion after fusion.
基于Radcloud 平臺對病灶提取增強3 期各1 029個影像組學特征,包括一階特征(描繪多個體素值的空間分布)、形狀特征(描繪形狀和大?。?、紋理特征(灰度共生矩陣(GLCM)、灰度運行長度矩陣(GLRLM)、灰度級區(qū)域大小矩陣(GLSZM))以及高階特征(經(jīng)指數(shù)、平方、平方根、對數(shù)和小波變換)。
采用最大相關最小冗余(Maximal relevance and minimal redundancy,mRMR)算法、最小絕對收縮和選擇算子(Least absolute shrinkage and selection operator,LASSO)方法進行特征降維,采用逐步回歸方法將篩選得到的影像組學特征代入多變量Logistic 回歸分析,得到有意義特征的各自回歸系數(shù)進行加權,分別構建基于動脈期、門靜脈期以及延遲期的影像組學評分(Radscore),并利用十折交叉驗證方法對結果進行驗證。對預后相關臨床因素進行多變量Logistic 回歸,采用自動向后剔除方法,逐步回歸迭代得到有意義的臨床因素(包括性別、腫瘤大小、病理分級),構建臨床評分模型。然后聯(lián)合上述得到的預測效能最佳的期相的Radscore,繪制列線圖,并通過決策曲線分析(Decision curve analysis,DCA)評估其臨床應用價值。
Kolmogorov-Smirnov 檢驗計量資料是否符合正態(tài)分布,符合正態(tài)分布的計量資料用均數(shù)±標準差()表示,不符合正態(tài)分布的計量資料用中位數(shù)(P25,P75)表示。計數(shù)資料采用χ2檢驗進行比較,計量資料采用獨立樣本t 檢驗或Mann-Whitney U 檢驗進行比較。P<0.05 為差異有統(tǒng)計學意義。通過ROC 曲線評估構建的動脈期、門靜脈期以及延遲期的Radscore 的預測效能,基于Delong 檢驗得到3 個不同期相下效能最佳的Radscore。通過ROC 曲線評估列線圖的預測效能。
所有統(tǒng)計分析均通過R studio(Version 1.0.143-C 2009-2016 R studio)軟件包進行處理。
男66 例,女14 例,年齡36~81 歲,平均(57.9±10.0)歲。69 例單發(fā),21 例多發(fā),共90 個HCC 病灶,腫瘤大小0.70~11.64 cm,平均(3.59±1.99)cm。訓練集中復發(fā)和未復發(fā)組間的AFP 水平、病理分化程度差異有統(tǒng)計學意義(P<0.05),其余特征差異無統(tǒng)計學意義(P>0.05);測試集中復發(fā)和未復發(fā)組間的總膽紅素差異有統(tǒng)計學意義(P<0.05),其余特征差異無統(tǒng)計學意義(P>0.05)。
經(jīng)mRMR 算法和LASSO 方法降維后,分別構建基于3 個期相的組學評分模型,通過Delong 檢驗,經(jīng)動脈期篩選出9個最有預測價值的影像組學特征構建的影像組學評分模型最優(yōu)(表1,圖3),Radscore=0.196+0.243×特征7-0.141×特征8-0.172×特征3-0.090×特征4-0.298×特征5-0.240×特征6-0.076×特征2-0.077×特征1+0.356×特征9(表2),相應的影像組學評分效能見圖4,表3。
納入分析的臨床因素包括性別、年齡、乙型肝炎病史、肝硬化病史、AFP、CEA、ALT、AST、GGT、ALB、T-BIL水平以及Child-Pugh 等級(A 或B)。12 個臨床因素經(jīng)逐步回歸迭代得到3 個與預后相關的臨床危險因素,分別為性別、腫瘤大小和病理分化程度,建立相應的臨床評分模型(表4),臨床評分模型效能見圖4,表3。
訓練集中基于動脈期構建的影像組學評分的預測效能最優(yōu),聯(lián)合動脈期影像組學評分和臨床評分來構建列線圖(表5,圖5),列線圖的效能見圖4,表3。列線圖的診斷效能顯著優(yōu)于臨床評分模型的診斷效能(P=0.019),但并未顯著優(yōu)于影像組學評分(P=0.799)。決策曲線分析表明,加入影像組學評分之后的列線圖模型比未加入影像組學評分的臨床評分模型的臨床應用價值高(圖6)。
表1 基于3 個期相建立的影像組學評分模型的預測效能
表2 基于動脈期圖像篩選的影像組學特征
表3 影像組學評分、臨床評分模型及列線圖的預測效能
圖3 LASSO 模型選擇的影像組學特征。圖3a:LASSO 模型中調節(jié)參數(shù)(λ)的選擇。頂端數(shù)值表示相應的特征數(shù),本研究取左邊第1 條垂線對應的最佳λ 取值,選擇得到了具有非零系數(shù)的9 個特征。圖3b:隨著調節(jié)參數(shù)(λ 值)變化,不同影像組學特征LASSO 系數(shù)的變化情況。Figure 3.Selection of radiomics features by the LASSO regression model.Figure 3a:Tuning parameter (λ) selection in the LASSO regression model.The value on the top represented the number of radiomics features.We chose the optimal values of the LASSO tuning parameter(λ) indicated by the first vertical lines on the left,and selected nine nonzero coefficients.Figure 3b:The LASSO coefficients of different radiomics features varied with the log(λ).
表4 臨床危險因素
表5 列線圖的構建因素
圖4 訓練集(圖4a)和測試集(圖4b)的影像組學評分、臨床評分模型及列線圖的ROC 曲線分析。Figure 4.The ROC curves of the radscore,clinical score and nomogram in the training(Figure 4a) and testing set(Figure 4b).
圖5 預測HCC 切除術后3 年復發(fā)可能性的列線圖。每個變量對應的預測點在列線圖最頂端的比例尺上。將所有變量的預測點相加,投影在列線圖底部刻度上的總點數(shù)代表術后3 年復發(fā)的可能性。Figure 5.The nomogram predicted the recurrence of HCC within three years after hepatectomy.Each variable corresponded to a predicting point on the scale at the top of the nomogram.After adding up all the points,the total points projected on the scale at the bottom of the nomogram represented the probability of the recurrence of HCC within three years after hepatectomy.
圖6 基于動脈期的影像組學評分、臨床評分模型和列線圖的決策曲線分析。Figure 6.The decision curve analysis for the radsore based on the arterial phase,clinical score and nomogram.
HCC 是世界第三大癌癥致死原因,手術切除是肝臟儲備功能良好的Ⅰa、Ⅰb 和Ⅱa 期HCC 的首選治療方式,但HCC 患者預后較差,其術后5 年的復發(fā)和轉移率可達40%~70%[1,5],嚴重阻礙患者生存期延長和預后改善。影像學檢查和血清腫瘤標志物檢查是監(jiān)測HCC 術后復發(fā)的主要方式。MRI 具有較高的軟組織分辨率,能夠實現(xiàn)多序列、多參數(shù)成像,在HCC 的診斷及鑒別診斷方面展現(xiàn)出更多優(yōu)勢。傳統(tǒng)影像學圖像特征,如邊緣強化、瘤周實質成分強化、衛(wèi)星灶和腫瘤大小等,雖然對HCC 術后復發(fā)的風險具有一定的預估價值,但是忽略了病灶內部很多潛在特征[6]。影像組學將醫(yī)學圖像轉化為高通量的定量數(shù)據(jù),全面挖掘病灶內部微觀信息,定量描述腫瘤內部異質性特征[7],為術前預測HCC 術后復發(fā)提供定量信息,以達到精準、個體化診療的目的。影像組學特征具有預測HCC 的總生存期、復發(fā)和治療反應的潛在價值[8]。劉璐璐等[4]及Zhou 等[9]研究表明,CT影像組學在術前預測HCC 術后復發(fā)及1 年、3 年生存期方面具有一定的價值。列線圖可結合多個臨床因素,將復發(fā)風險預測模型的復雜公式簡化,為個體化的臨床治療決策提供可視化的參考依據(jù)[10]。列線圖已經(jīng)應用于肝內膽管癌、胃癌、乳腺癌和肺癌等多種癌癥的預后預測[11-14]。最近研究表明,基于增強MR 聯(lián)合臨床危險因素和影像學特征的列線圖可在術前預測HCC 術后早期復發(fā)[8]。
本研究基于動脈期構建的影像組學評分的診斷效能最優(yōu),最終選擇聯(lián)合動脈期影像組學評分和與臨床評分來構建列線圖。劉璐璐等[4]應用影像組學模型預測原發(fā)性肝癌3 年生存期的研究也表明,基于CT 動脈期測試集模型的曲線下面積(AUC)(0.861)高于門靜脈期的AUC(0.750),動脈期預測模型的泛化能力高于門靜脈期。
測試集中,列線圖模型與影像組學評分對HCC切除術后3 年復發(fā)的預測效能相近(AUC 分別為0.830 和0.820),經(jīng)Delong 檢驗,二者AUC 無顯著統(tǒng)計學差異(P=0.799),提示影像組學評分與列線圖模型預測效能相當。加入臨床因素在一定程度上提升了列線圖的診斷效能,但并無統(tǒng)計學意義,考慮這可能與本研究中樣本量較少有關,同時筆者認為常規(guī)臨床危險因素仍然具有一定的參考價值,故保留在最終的列線圖模型中。本研究中有統(tǒng)計學差異的臨床危險因素在訓練集和測試集不一致,可能是導致臨床評分模型在測試集中效能不高的原因,但是,即使是在訓練集中有統(tǒng)計學差異的臨床危險因素,也未能顯著提升列線圖模型在訓練集中的預測效能,可見臨床因素對列線圖模型沒有太大貢獻。該結果與Zhou 等[9]研究結果類似,在基于CT 影像組學模型術前預測HCC 術后早期復發(fā)的研究中,影像組學模型的預測效能(AUC=0.817)與聯(lián)合臨床因素的預測模型的預測效能(AUC=0.836)差異無統(tǒng)計學意義(P=0.164),Zhou 等經(jīng)共線性分析指出,納入研究中的臨床因素與影像組學特征的相關性不高,臨床因素在聯(lián)合模型中相關性低可能是因為臨床因素對聯(lián)合模型的貢獻遠小于影像組學特征。本研究中,臨床評分模型與列線圖模型的AUC 有統(tǒng)計學差異(P=0.019),表明在單純臨床危險因素中加入影像組學評分可顯著提高術前預測HCC 切除術后3 年復發(fā)的效能。DCA 表明,加入影像組學評分后的列線圖模型比單獨臨床評分模型的臨床應用價值高,可輔助臨床醫(yī)生術前預測HCC 晚期復發(fā)的可能性,優(yōu)化患者術前的治療決策。
本研究屬于回顧性單中心研究,樣本量較少,預測效能有限,有待進行更大樣本量的研究;其次,本研究尚未將HCC 患者術后3 年內的進一步抗腫瘤治療納入預測模型;再次,多參數(shù)MRI 和多模態(tài)影像數(shù)據(jù)會涵蓋HCC 病灶的更多信息,故基于多參數(shù)MRI 和多模態(tài)影像數(shù)據(jù)的影像組學研究將會為腫瘤的預后提供更高價值,值得進一步深入研究。
綜上所述,基于術前動脈期MRI 的影像組學列線圖可以用于預測HCC 切除術后3 年復發(fā),影像組學評分的預測效能與列線圖模型的預測效能相當。