肖園園 景德龍 韓忠杰 婁晶
結(jié)直腸癌(colorectal cancer,CRC)是最為常見的消化系統(tǒng)惡性腫瘤之一,其發(fā)病率及死亡率在國內(nèi)癌癥中逐年增高,分別位于第三位和第二位[1]。目前診斷CRC 最有效的方式依然是腸鏡下活體組織檢查,存在出血、穿孔等風(fēng)險,影像學(xué)檢查能夠直觀、全面地顯示CRC 的部位、形態(tài)、大小、周圍侵犯及遠處轉(zhuǎn)移等情況,是臨床診療過程中的重要一環(huán),傳統(tǒng)術(shù)前影像檢查方法包括CT、MRI 和PETCT 等,但是這些檢查對CRC 異質(zhì)性描述效果不甚理想。近年來,影像組學(xué)作為一項非侵入新興技術(shù)在腫瘤學(xué)領(lǐng)域備受關(guān)注,多項研究表明,影像組學(xué)可以應(yīng)用于各種腫瘤的TNM 分期、組織學(xué)分級、療效評價和預(yù)后評估[2-3],其在CRC 診療過程中也廣泛應(yīng)用,本文就近年來影像組學(xué)技術(shù)在CRC 診療中的研究進行總結(jié)及探討。
影像組學(xué)是一個新興的轉(zhuǎn)化研究領(lǐng)域,旨在通過從傳統(tǒng)的醫(yī)學(xué)影像(如CT、MRI 和PET-CT 等)中高通量地提取大量醫(yī)學(xué)影像特征,將這些影像特征轉(zhuǎn)化為高維數(shù)據(jù),運用專門的計算機軟件篩選出定量的、可挖掘的影像特征用以評價腫瘤時間上、空間上的各種異質(zhì)性,從而為指導(dǎo)臨床決策提供數(shù)據(jù)支持[4]。
影像組學(xué)工作流程主要包括:(1)數(shù)據(jù)采集。包括醫(yī)學(xué)圖像、臨床數(shù)據(jù)及分子數(shù)據(jù),獲取圖像后,應(yīng)對圖像進行預(yù)處理,以提高圖像質(zhì)量[5]。(2)圖像分割。通常包括手動、半自動、自動三種方式,以獲取病灶感興趣區(qū)域(region of interest,ROI)。(3)特征提取及降維,即從分割的ROI 中提取影像組學(xué)特征,包括形狀特征、直方圖特征、紋理特征及基于過濾器的特征(如小波特征、Gabor 特征等),為防止過擬合,需采用聚類分析法、主成分分析法(principal component analysis,PCA)等機器學(xué)習(xí)方法降維[6],去除冗余、不穩(wěn)定的特征,選取高性能的特征。(4)模型構(gòu)建、分類及驗證,建立預(yù)測/分類模型常用方法有邏輯回歸分析、K 近鄰算法(k-nearest neighbour,KNN)、支持向量機(support vector machine,SVM)、深度學(xué)習(xí)等[7-8],構(gòu)建的預(yù)測模型需要進行訓(xùn)練和驗證。
近年來,影像組學(xué)技術(shù)在CRC 診療中的應(yīng)用主要集中在以下幾方面:(1)評估術(shù)前TNM 分期;(2)預(yù)測CRC 的Kirsten 大鼠肉瘤病毒癌(Kirsten rat sarcoma viral oncogene,KRAS)基因突變;(3)預(yù)測患者復(fù)發(fā)、轉(zhuǎn)移及生存;(4)預(yù)測局部晚期直腸癌(locally advanced rectal cancer,LARC)在新輔助放化療(neoadjuvant chemoradiotherapy,nCRT)后的病理完全緩解(pathologic complete response,pCR)情況。
對于早期(T1、T2期)CRC,可直接選擇手術(shù)切除;而對于局部進展期(T3、T4期)病變,多先行nCRT 降期之后再行全系膜切除術(shù)(total mesorect excision,TME)。因此,CRC 患者術(shù)前精準(zhǔn)評估TNM 分期對治療方案的選擇參考意義重大。Liang等[9]對494 例CRC 患者的CT 圖像進行紋理分析,提取了16 個紋理特征作為腫瘤T 分期的獨立預(yù)測因子,結(jié)果顯示訓(xùn)練集和驗證集的ROC 曲線下的面積(area under curve,AUC)分別為0.792 和0.708。Meng 等[10]對345 例行多參數(shù)磁共振成像(MP-MRI)檢查的CRC 患者進行腫瘤分化程度評估,結(jié)果顯示,采用最大相關(guān)最小冗余(maximum relevance and minimum redundancy,MRMR)算法和最小絕對收縮和選擇(least absolute shrinkage and selection operator,LASSO)算法構(gòu)建的影像組學(xué)特征可用于評估腫瘤分化程度,其AUC 為0.720[95%CI(0.621,0.819)],從而證明了基于MP-MRI 的影像組學(xué)特征具有無創(chuàng)性評估直腸癌組織病理學(xué)的潛力。張?zhí)炱娴萚11]回顧性分析了83 例CRC 患者的高分辨T2WI 和磁共振體素不相干(IVIM)功能圖像,提取1 427 個影像組學(xué)特征,通過LASSO 算法進行降維后得到32 個對病理分期最有價值的組學(xué)特征,采用邏輯回歸模型建立單序列及聯(lián)合序列Rad 評分,經(jīng)驗證表明,聯(lián)合序列Rad 評分的診斷效能最佳,AUC 為0.929[95%CI(0.78,1.00)],敏感度、特異度分別為0.81、0.75。上述研究均表明,通過篩選獨立的預(yù)測因子,建立合適的影像組學(xué)模型,可用于CRC 術(shù)前預(yù)測TNM 分期,為臨床決策提供理論支持,而目前相關(guān)研究多為回顧性單中心研究,圖像來源單一,構(gòu)建的影像組學(xué)模型泛化性差,紋理特征篩選及模型建立,仍需進一步多中心研究支持。
近年來,基因檢測技術(shù)不斷發(fā)展,精準(zhǔn)醫(yī)學(xué)體系逐漸成熟,將腫瘤的醫(yī)學(xué)圖像和基因表達相匹配是精準(zhǔn)腫瘤學(xué)發(fā)展的重要研究方向。目前,對于CRC 研究較多的是KRAS 基因突變。大約40% CRC患者存在KRAS 基因突變,且對于西妥昔、帕尼單抗等抗表皮生長因子抗體(epidermal growth factor receptor,EGFR)靶向藥物具低反應(yīng)性的特點[12]。有研究表明,抗EGFR 靶向治療的預(yù)后預(yù)測與特異性KRAS 基因相關(guān),KRAS 基因突變提示抗EGFR靶向治療存在不良反應(yīng),如果采用抗EGFR 治療,不僅會產(chǎn)生較差的治療效果,而且會導(dǎo)致生存期縮短[13]。因此,CRC 患者如果進行分子靶向藥物治療,進行KRAS 基因檢測非常有必要。樊芮娜等[14]基于MR T2WI 影像組學(xué)特征構(gòu)建影像組學(xué)模型、臨床模型及影像組學(xué)-臨床聯(lián)合模型,評價各模型預(yù)測CRC 患者KRAS 基因亞型的效能,結(jié)果聯(lián)合模型預(yù)測KRAS 基因亞型的AUC 顯著高于臨床模型(P<0.05)。此外,KRAS 基因突變與CRC 肝轉(zhuǎn)移患者的特定復(fù)發(fā)模式密切相關(guān)[15],將影像參數(shù)與KRAS 狀態(tài)相關(guān)聯(lián),比定性影像評估具有顯著優(yōu)勢,可以更好地指導(dǎo)癌癥治療,預(yù)測治療反應(yīng)。Granata等[16]首次采用CE-MRI 成像評估了大鼠肉瘤(rat sarcoma,RAS)基因突變與肝轉(zhuǎn)移患者影像組學(xué)數(shù)據(jù)的相關(guān)性,該研究聯(lián)合了T1WI 和T2WI 多序列圖像,基于病變形態(tài)學(xué)的紋理特征和參數(shù),對每例患者進行單因素和多因素分析,結(jié)果,使用單因素分析,獲得的準(zhǔn)確率并不令人滿意,而采用多因素分析和分類方法,僅以紋理特征作為預(yù)測因子的KNN算法就達到了最優(yōu)結(jié)果(AUC=0.84),值得注意的是,該研究影像數(shù)據(jù)來自兩臺不同型號的MR,可能存在采集參數(shù)間的差異,缺少影像組學(xué)特征與除病變形態(tài)學(xué)之外的其他臨床預(yù)后因素的相結(jié)合。
CRC 患者術(shù)后局部轉(zhuǎn)移是影響臨床治療是否獲益的重要因素,其中淋巴結(jié)轉(zhuǎn)移(lymph node metastasis,LNM)是CRC 的主要轉(zhuǎn)移部位,也是導(dǎo)致術(shù)后復(fù)發(fā)和死亡的重要原因,因此術(shù)前準(zhǔn)確預(yù)測淋巴結(jié)轉(zhuǎn)移至關(guān)重要[17]。李夢蕾等[18]在767 例CRC 患者中,基于增強CT 門靜脈期圖像的影像組學(xué)特征和臨床危險因素進行CRC 淋巴結(jié)轉(zhuǎn)移的個體化術(shù)前預(yù)測,單獨提取了周圍淋巴結(jié)的影像組學(xué)特征,構(gòu)建了6 個預(yù)測模型進行比較,結(jié)果表明臨床-原發(fā)灶-周圍淋巴結(jié)聯(lián)合模型為最佳模型,使AUC 從0.697 0 增加到0.730 5,依據(jù)此最優(yōu)模型生成列線圖可實現(xiàn)預(yù)測模型可視化,從而實現(xiàn)臨床醫(yī)生術(shù)前對CRC 的淋巴結(jié)轉(zhuǎn)移風(fēng)險進行個體化預(yù)測。Inchingolo 等[19]提及一項研究中前瞻性地將CRC 轉(zhuǎn)移淋巴結(jié)病理和MRI 圖像進行了節(jié)點到節(jié)點的匹配和標(biāo)記,成功開發(fā)了一個新的預(yù)測模型能夠準(zhǔn)確識別LNM,該模型在訓(xùn)練集和測試集中的AUC 值分別為0.846 和0.733,此外該模型還可以進一步區(qū)分轉(zhuǎn)移性淋巴結(jié)和腫瘤沉積物,表明影像組學(xué)可以對CRC 患者區(qū)域LNM 早期識別提供可靠的證據(jù),為進一步的前瞻性研究提供了新的研究思路及方法。結(jié)直腸癌肝轉(zhuǎn)移(colorectal cancer liver metastases,CRLM)在約25% 的CRC 患者中發(fā)生,更為常見的是同步性轉(zhuǎn)移(14%~17%)而不是異時性轉(zhuǎn)移(8%~15%)[20]。Lee 等[21]利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)分析Ⅰ~Ⅲ期2 019 例CRC 患者的肝臟CT 影像學(xué)特征,預(yù)測CRLM 的5 年異時性轉(zhuǎn)移(5-year metachronous liver metastasis,5YLM),使用VGG16 卷積神經(jīng)網(wǎng)絡(luò)模型提取肝臟影像特征并進行預(yù)處理,PCA 降維后并將第1 主成分(PC1)至第10 主成分(PC10)等新特征集作為預(yù)測模型的成像特征,將具有PC1 和臨床特征(年齡、性別、T 分期、N 分期)的模型進行關(guān)聯(lián)性研究,結(jié)果臨床-影像組合模型預(yù)測CRLM 5 年異時性轉(zhuǎn)移的性能最高(平均AUC 為0.747),但是該模型中,肝臟影像學(xué)特征缺乏對5 年死亡率額外的預(yù)測能力(平均AUC 為0.690),而且缺少同時包含腹部CT 圖像和臨床信息的開放性數(shù)據(jù)庫,導(dǎo)致模型泛化能力差。
影像組學(xué)技術(shù)也被用來預(yù)測CRC 患者的生存預(yù)期,進而幫助臨床進行治療選擇和患者分層。諸多學(xué)者發(fā)現(xiàn)一些影像組學(xué)特征與無進展生存期(progression free survival,PFS)和總生存期(overall survival,OS)相關(guān)[22-23]。最近的一項研究中,Lv等[22]回顧性分析196 例經(jīng)病理證實的CRC 患者(Ⅰ~Ⅳ期)的18F-FDG PET-CT 影像資料,術(shù)前臨床因素、血清腫瘤標(biāo)志物和PET-CT 影像特征被納入PFS 分析,研究中構(gòu)建了一個預(yù)測各期CRC 患者預(yù)后的原始模型(M1),通過基因18F-FDG PETCT 影像組學(xué)模型(M2)對Ⅲ期CRC 患者的PFS 進行單獨評估,結(jié)果臨床-生物學(xué)-影像學(xué)綜合模型M1 預(yù)測PFS 效果最佳[C 指數(shù)0.780,95%CI(0.634,0.877)],腫瘤標(biāo)志物糖類抗原19-9(carbohydrate antigen 19-9,CA19-9)對M1 模型的預(yù)后預(yù)測貢獻最大,而影像組學(xué)特征對M2 模型的預(yù)后影響更大,因此利用術(shù)前18F-FDG PET/CT 影像組學(xué)可以準(zhǔn)確預(yù)測CRC 預(yù)后,對協(xié)助CRC 個體化精準(zhǔn)治療的管理和決策具有潛在價值,期待嘗試進行前瞻性研究,以進一步驗證該模型,并研究分階段(如ⅢA、ⅢB、ⅢC)患者的預(yù)后。
目前,nCRT 降期之后行TME 是LARC 的標(biāo)準(zhǔn)治療方案,10%~25%的患者在放化療后實現(xiàn)pCR,這些對放化療反應(yīng)良好的患者,可實施仔細定期監(jiān)測的觀望策略[24],因此,術(shù)前預(yù)測準(zhǔn)確的nCRT 效果,對于制訂個體化診療方案至關(guān)重要。預(yù)測和評估nCRT 治療效果的首選影像檢查是MRI,MRI 影像組學(xué)技術(shù)已經(jīng)在無創(chuàng)預(yù)測LARC 患者nCRT 后病理完全緩解方面得到了普及,目前相關(guān)研究中多存在一定的局限性,比如用于驗證的患者數(shù)量不足,或者缺乏與放射科醫(yī)生MRI 判讀的比較等。一項對114 例LARC 患者的研究表明,基于T2WI 的影像組學(xué)模型在預(yù)測pCR 方面的診斷效果優(yōu)于T2WI 和彌散加權(quán)成像(diffusion weighted image,DWI)的定性評估[25]。為了測試影像組學(xué)技術(shù)在CRC 患者中的穩(wěn)定性,Shahzadi 等[26]表明,只有一項研究可以用于外部驗證,提示該研究總體上缺乏可重復(fù)性,需要進一步標(biāo)準(zhǔn)化,才可作為一種有用的臨床工具。Shin 等[27]回顧性分析898 例LARC 患者,評價基于MRI 數(shù)據(jù)的影像組學(xué)模型預(yù)測LARC 患者nCRT 后pCR 的效果,并將其與放射科醫(yī)生的視覺評估進行比較,該研究主要采用了T2WI、表觀彌散系數(shù)(apparent diffusion coefficient,ADC)序列,同時進行了大規(guī)模驗證來評估上述模型,結(jié)果顯示T2WI 模型、ADC 模型和兩者聯(lián)合模型的AUC 分別為0.82、0.79 和0.82,T2WI 和聯(lián)合模型之間沒有差異,而ADC 模型的表現(xiàn)不如聯(lián)合模型,T2WI 模型對腫瘤回縮分級的分類性能優(yōu)于放射科醫(yī)生分類性能,其敏感度(80.0%)較高,特異度(68.4%)較低。以上研究均表明基于MRI 數(shù)據(jù)建立的影像組學(xué)模型可用于評估LARC 患者對nCRT 的pCR,為選擇器官保留策略的患者提供有價值的信息,但未來應(yīng)該集中在標(biāo)準(zhǔn)化MR 協(xié)議的多中心研究上,以驗證和測試影像組學(xué)模型的可行性及其在日常臨床實踐中的潛在用途。
影像組學(xué)在CRC 術(shù)前分期、基因突變預(yù)測、預(yù)后預(yù)測及新輔助治療效果評估方面已取得階段性研究成果,然而,對復(fù)發(fā)風(fēng)險高的患者進行整體輔助放化療的獲益評估是臨床的一大挑戰(zhàn)[28],CRC Ⅲ期患者是全球公認的可以從放化療中獲益的患者,而對于具有其他臨床危險因素的Ⅱ期患者,放化療的優(yōu)勢仍存在爭議,下一步研究的主要領(lǐng)域應(yīng)是側(cè)重評估影像組學(xué)在對可能受益于輔助放化療的非轉(zhuǎn)移性CRC 高?;颊哌M行分層方面的表現(xiàn)。盡管目前影像組學(xué)技術(shù)在CRC 診療中具有良好價值,但應(yīng)該注意的是,影像組學(xué)技術(shù)在常規(guī)實施之前,仍面臨諸多挑戰(zhàn):醫(yī)學(xué)影像數(shù)據(jù)缺乏標(biāo)準(zhǔn)化和驗證,預(yù)測模型泛化能力不足,缺乏前瞻性多中心研究等。因此,亟需制定并嚴格遵守標(biāo)準(zhǔn)化的圖像采集和重建方案,引入新理論,如FAIR 數(shù)據(jù)管理準(zhǔn)則[29],構(gòu)建標(biāo)準(zhǔn)化醫(yī)學(xué)影像數(shù)據(jù)庫,同時通過增加數(shù)據(jù)樣本量和數(shù)據(jù)多樣性以提升模型的泛化性,因此未來的發(fā)展方向是多中心研究,即通過聯(lián)合多中心數(shù)據(jù)可解決樣本量和多樣性的問題[30]。筆者認為,通過國內(nèi)外學(xué)者的共同努力,隨著人工智能技術(shù)的不斷發(fā)展,影像組學(xué)技術(shù)可以在CRC 診療中實現(xiàn)從臨床研究轉(zhuǎn)化為臨床常規(guī)實踐,從而促進CRC 的個性化精準(zhǔn)治療。