蔣明巧 楊彬* 韓福剛 張艷麗 陳馨
作者單位: 646099 西南醫(yī)科大學附屬中醫(yī)醫(yī)院(蔣明巧 楊彬 張艷麗 陳馨)
646099 西南醫(yī)科大學附屬醫(yī)院(韓福剛)
胃腸道間質瘤(gastrointestinal stromal tumors,GIST)是胃腸道最常見的間葉來源腫瘤。GIST 的發(fā)病率<2/10 萬,但初診病例中危險度分級為高度危險性的比例約15%~30%[1]。文獻報道一例直徑約1.0 cm 的發(fā)生在胃的GIST,表現為快速進展及早期遠處轉移,經手術及靶向治療后仍預后較差[2]。鑒于GIST 的惡性潛能和復雜的生物學行為,根據改良的2008年美國國立衛(wèi)生研究院(NIH)分類標準,GIST 被分為極低、低、中和高危組。針對突變基因的靶向治療,明顯改善GIST患者的預后,但目前治療仍以手術治療為主,約60%的患者可以通過手術達到治愈[1]。影像組學是從放射圖像中提取無法通過人眼識別的定量數據,將圖像轉換為高維數據,并挖掘這些數據以幫助和支持決策,量化病變的異質性,是相對客觀且參數更為豐富的研究方法。本文綜述不同影像檢查技術的影像組學方法在GIST 中的研究進展。
超聲內鏡(EUS)是常見的評估胃黏膜下腫瘤檢查方法之一,但僅使用超聲內鏡圖像仍難以區(qū)分GIST 與部分非GIST腫瘤,比如神經源性腫瘤、平滑肌瘤等,對破壞黏膜層的腫瘤,部分影像表現可能和黏膜起源的惡性腫瘤重疊。而GIST的治療方式有別于平滑肌瘤等良性黏膜下腫瘤及胃癌等惡性腫瘤,正確的術前的診斷可以幫助臨床選擇治療方式。
早在2010 年NGUYEN 等收集46 例胃黏膜下腫瘤的超聲內鏡圖像,通過神經網絡學習,診斷脂肪瘤、類癌和GIST的AUC 值分別達0.92、 0.86、0.89[3]。KIM 等和MINODA 等研究均發(fā)現超聲內鏡圖像的紋理特征能很好鑒別GIST 與非GIST[4-5],并且人工智能4.5 s 的診斷速度遠超過超聲內鏡醫(yī)師的診斷速度[4]。且KIM 等研究建立的AI 模型診斷效能高于內鏡醫(yī)師的診斷效能,其中EUS-AI 對直徑>20 mm 黏膜下腫瘤的診斷效能(0.965)高于EUS 醫(yī)師的診斷效能(0.684)[5],該研究還發(fā)現較大的黏膜下腫瘤的EUS-AI 的診斷準確率比較小的黏膜下腫瘤高。在YANG 等[6]多中心前瞻性研究中,使用752例患者的10,439張EUS圖像開發(fā)的AI系統(tǒng)能有效鑒別GIST 和其他黏膜下腫瘤;通過聯(lián)合AI 系統(tǒng),超聲內鏡醫(yī)師在診斷132 例病理確診(36 例GIST、44 例平滑肌瘤和52例其他常見的黏膜下腫瘤)入組病例中的總準確性從69.7%(95%CI:61.4~76.9)上升到78.8%(95%CI:71~84.9),診斷80 例GIST 或非GIST 的準確性從73.8%(95%CI:63.1~82.2)提高88.8%(95%CI:63.1~82.2);該研究中還發(fā)現人工智能診斷直徑<20 mm 和≥20 mm 腫瘤診斷準確性基本相當,與KIM 等[5]研究結果相反。SEVEN 等[7-8]研究發(fā)現GIST的超聲內鏡圖像特征與其惡性潛能或有絲分裂計數無相關(P>0.05),但是以卷積神經網絡構建的深度學習模型對GIST 進行危險度評估時發(fā)現深度學習算法可以高精度預測GIST 的惡性潛能。
綜上,影像組學在GIST 的超聲內鏡圖像研究中表現出巨大潛力,但文獻也提出經EUS 圖像建立的模型對罕見疾病的圖像學習難度較大,主要原因是胃腸道神經鞘瘤等少見病的發(fā)病率低,收集病例數目較少機器學習困難而仍然難以診斷[6,9],需要進一步多中心大樣本研究。應用EUS 成像進行AI 診斷對EUS 探頭的依賴大[6],臨床應用還需要更規(guī)范化的研究。目前超聲內鏡在GIST 危險度預測、療效評估、預后分析和突變基因預測等方面的研究較少。
2.1 診斷及鑒別診斷 BA-SSALAMAH 等[10]發(fā)現基于增強CT 動脈期掃描圖像的紋理特征分析能較好區(qū)分胃癌和胃淋巴瘤、胃癌和胃間質瘤,但不能完全將3 種腫瘤分開。SUN等[11]發(fā)現結合主觀CT 征象和影像組學診斷模型可以提高胃腫瘤的診斷準確性。LU 等[12]在研究壺腹部腫瘤的鑒別診斷時發(fā)現,動脈期增強CT 圖像的一階特征第90 百分位特征值在鑒別十二指腸腺癌與GIST、胰腺癌與GIST 時的AUC 值分別達0.809、0.96312。STARMANS 等[13]構建的影像組學模型能夠將GIST 與非GIST 區(qū)分開來,對觀察者的依賴性較小。
2.2 危險度預測 大量研究證實影像組學的紋理特征與GIST 的危險度分級相關,目前大多數研究以2008 年改良版的NIH 標準[14]為分類依據。研究顯示低危險度的GIST 熵值高[15],也有研究顯示熵值在高危組和低危組GIST 中差異無統(tǒng)計學意義或預測效能低[16-17],紋理參數可以預測GIST 危險度分級,但紋理特征所代表的意義有待進一步研究。目前對于增強圖像的影像組學研究較多是在門靜脈期,可能原因是該期腫瘤邊界顯示較清楚,受掃描者影響相對較小,圖像更穩(wěn)定。REN 等[18]融合GIST 的CT 征象(包括大小、囊變)和門靜脈期紋理參數(meanValue)構建危險度預測諾謨圖,在訓練集和驗證集都表現出較高的診斷效能,AUC 值分別為0.935、0.933。YAN 等[19]研究顯示結合臨床、主觀影像特征和門靜脈期增強CT 圖像的紋理特征構建的胃腸道預測模型的AUC 為0.943??梢钥闯鯣IST 門靜脈期圖像能預測其危險度,結合臨床或主觀影像特征可提高診斷效能,動脈期的紋理參數與GIST 的危險度也具有相關性[20]。聯(lián)合動脈期、靜脈期、延遲期的影像組學特征構建術前預測GIST 危險度的模型也表現出較好的預測性能[21]。ZHANG 等[22]在多中心研究中,根據腫瘤大小和平掃圖像的影像組學特征建立的GIST危險度預測模型,在訓練集、內部驗證集及外部驗證集中均具有較高的AUC 值(分別為0.965、0.967、0.941),該研究還發(fā)現,基于CT 平掃圖像的影像組學預測模型優(yōu)于基于增強圖像的預測模型,差異有統(tǒng)計學意義。如未來更多的研究證實平掃圖像預測危險度的效能和增強基本相當甚至高于增強圖像,將給患者帶來更多的益處,文中未具體分析診斷效能提高的原因,但CT 平掃圖像病變和周圍軟組織對比差,GIST病灶的發(fā)現、診斷、腫瘤的血供評估不如增強CT,可能導致勾畫ROI 時存在偏差,對影像組學分析結果的一致性和客觀性存在影響。WU 等[23]研究發(fā)現GIST 瘤周的紋理特征對其危險度分級也具有預測價值,但腫瘤周圍的定義和人工智能方法會影響其預測效果,目前該方面研究較少。
2.3 直徑較小GIST 的危險度預測 JIA 等[24]基于EUS 和CT的1~2 cm GIST 的研究發(fā)現,形態(tài)學高危特征(包括鈣化、壞死、瘤內不均勻、邊界不規(guī)則或表面潰瘍)在極低和中危間差異無統(tǒng)計學意義(P>0.05),但影像組學模型對1~2 cm 高危險性的GIST 鑒別表現良好,可以應用于1~2 cm GIST 的術前風險分層。SUN 等[25]研究直徑在2~5 cm GIST 時發(fā)現影像組學模型的預測效能高于主觀影像特征模型,臨床工作中對直徑2~5 cm GIST 的危險度預測常較困難,對臨床治療方式的選擇也有重要影響,但該研究中陽性預測值較低,需要進一步研究。
2.4 預后及Ki67 表達水平評估 EKERT 等[26]對進展期的GIST 研究中發(fā)現4 個紋理參數(Gclm Id 、Gclm Idn、Glrlm normalized、Ngtdm coarseness)與疾病進展呈顯著正相關,與無進展生存期呈負相關。WANG 等[27]研究發(fā)現影像組學特征是中/高危GIST 患者經伊馬替尼化療的獨立預后因素,結合影像組學特征和臨床風險指標構建的預測GIST 預后的諾謨圖,預測精度高于之前基于臨床、影像或病理構建的預測模型[18,28]。CHEN 等[29]提出一種基于深度學習的諾謨圖(基于殘差神經網絡)預測局限性原發(fā)性GIST 切除術后無復發(fā)生存,在和改良的NIH 標準、AFIP 標準、臨床和病理學構建的模型相比時,深度學習模型的諾謨圖評估3 年無復發(fā)率AUC值最高(0.947),甚至是高于經典的NIH 標準,更重要的是該諾謨圖中,影像組學模型所占的權重大于有絲分裂計數和腫瘤大小,減少了人為誤差。研究證實腫瘤的影像組學特征能預測Ki67 抗原表達水平[30]。Ki-67 表達水平與GIST 的惡性潛能和預后相關,Ki-67 高表達與總體生存率差和腫瘤復發(fā)率顯著相關31,32。ZHANG 等[30]多中心研究顯示,由6 個增強CT 影像組學特征組成的預測模型能提高Ki67 表達水平預測的準確性,由影像組學特征和腫瘤大小組成的諾謨圖預測Ki67 抗原表達水平最準確(AUC 為0.801),FENG 等[31]研究也得出類似結論,表明CT 影像組學特征與GIST 的Ki67 表達相關,能為GIST的術前評估提供決策支持。
2.5 基因突變狀態(tài)評估 不同基因突變狀態(tài)的GIST 對分子治療反應不一,GIST kit-11 突變亞型(約75%)的患者對伊馬替尼治療反應更好,kit-9 突變、PDGFRA 突變(最顯著的是18 D842V 外顯子突變)及野生型GIST,對伊馬替尼治療反應差[33],因此,確定有無kit 外顯子11 突變尤為重要。研究顯示,與kit-11 突變組相比,kit-9 突變組腫瘤大小常>10 cm,腫瘤更易壞死,強化程度也較高,表現為更強的侵襲性[34]。增強CT 圖像的紋理分析可能有助于鑒別GIST 是否有kit 外顯子11 突變,結合紋理特征、解剖位置和CD34-stain 水平的模型預測GIST 突變基因型的AUC 為0.864-0.904,且紋理特征是GIST 有無kit 外顯子11 突變的獨立預測因子[33]。LIU等[35]研究顯示,聯(lián)合臨床特征、主觀影像特征及影像組學特征能較好預測GIST 的突變狀態(tài),影像組學特征比臨床特征能更好地反映GIST 分子水平的變化,影像組學在區(qū)分GIST kit-11 突變有巨大潛力。STARMANS 等[13]構建影像組學模型區(qū)分c-kit 突變的AUC 為0.52,c-kit 外顯子11 突變的AUC 為0.56,PDGFRA、BRAF 和其他c-kit 突變的數量太少,無法進行分類,該研究模型無法預測任何遺傳或分子特征。由于突變基因的測序方法還在研究進展中,技術未普及到大多數醫(yī)院,以及費用等問題,目前在GIST 基因突變狀態(tài)方向的研究還比較少,研究所納入的病例均較少。
YANG 等[36]研究發(fā)現基于T2WI、DWI、增強動脈期、靜脈期、延遲期的圖像紋理特征預測GIST 核分裂計數的效能較高,AUC=0.906,聯(lián)合紋理特征、腫瘤最大徑和位置建立的預測諾謨圖,在訓練集中(AUC 為0.878)和驗證集中(AUC 值為0.903)中均可較好的預測GIST 危險度分級。MAO等[37]研究顯示T1WI、T2WI、ADC 及三個序列聯(lián)合均可以對GIST 的不同風險進行了正確分類。預后評估方面,FU 等[38]研究51 例接受伊馬替尼靶向治療的轉移性GIST 患者,發(fā)現GIST 患者的總生存率與DWI 和ADC 圖的紋理參數顯著相關。關于MRI 圖像的研究較少,目前的研究提取了不同序列及不同期相的圖像特征,特征數量多,更大挖掘了可能有用的特征,但是由于樣本量均較少,存在泛化能力較差的問題,由于MRI 層厚較厚,可能對直徑較小腫瘤顯示差,存在一定的選擇偏倚。
目前關于GIST 的影像組學研究也存在較多問題:(1)大多數研究均為回顧性研究。(2)大多數研究均為單中心研究,且亞洲人群居多,存在得出的結論泛化能力差的問題;目前研究大部分均為手動勾畫ROI,以后研究可進一步探討深度學習構架模型,并完全自動檢出及定位腫瘤位置,完成危險度分級等相關預測。(3)既往研究發(fā)現,各個部位的GIST 影像表現、預后、基因突變類型是存在差異的[39-40],可能是因不同部位GIST 發(fā)病率不同,較少研究專門針對某一部位GIST的研究,特別是直腸、食道等少見部位,未來期待多中心的研究,提高模型的評估效能。(4)MRI、PETCT、能譜CT 等反映更多腫瘤內部信息的檢查方法在影像組學方面的研究較少,僅一項研究探討瘤周圖像信息與GIST 的相關性,有待進一步的研究。(5)目前醫(yī)學圖像配準技術正迅速發(fā)展,今后研究是可在平掃圖像達到或接近增強圖像的預測效果,或結合平掃及強化圖像配準達到更優(yōu)的預測效果。
綜上,影像組學在GIST 方面的研究雖然存在較多問題,但其在定量評估方面潛力巨大,有望為GIST 的精準化治療提供更客觀的證據支持,但應用于臨床實踐中還需要更多的研究。期待人工智能與影像組學、基因組學、病理學、臨床數據的結合,建立更加精準的預測模型,定能給患者帶來更大的獲益。