袁恩雨, 宋彬
肝細(xì)胞癌(hepatocellular carcinoma,HCC)是最常見的原發(fā)性肝腫瘤,其在全球的發(fā)病率不斷上升[1]。影像學(xué)檢查是HCC無創(chuàng)檢查的重要手段,由于其能提供對病灶結(jié)構(gòu)和功能多參數(shù)、多維度、多模態(tài)的評估信息,因此在HCC的檢出、鑒別診斷、生物學(xué)行為預(yù)測、療效預(yù)測和預(yù)后評估等方面發(fā)揮重要作用。定性、半定量分析主要使用傳統(tǒng)影像征象,具有直觀、易評估的特點,而也存在觀察者間主觀差異、圖像信息利用較少的缺點。影像組學(xué)是定量分析的代表方法,通過計算感興趣區(qū)(region of interest,ROI)的高通量直方圖、形態(tài)及紋理特征,將圖像矩陣數(shù)據(jù)轉(zhuǎn)化為定量數(shù)據(jù),更加客觀地描述ROI的影像特征,成為醫(yī)學(xué)影像領(lǐng)域研究的熱點。近年來,不斷有研究探索影像組學(xué)在HCC診療中的應(yīng)用價值,拓展了影像學(xué)在HCC臨床實踐中的指導(dǎo)價值。本文主要對影像組學(xué)在HCC診斷、治療及預(yù)后評估中的研究進展進行綜述。
“影像組學(xué)”的概念在2010年由Gillies等[2]首次提出,Lambin等[3]對其概念進行了完善,并提出了影像組學(xué)研究的基本步驟,包括圖像獲取、病灶標(biāo)注、特征提取與篩選、特征分析。影像組學(xué)的基本假設(shè)是基因組學(xué)和蛋白質(zhì)組學(xué)等的信息可以傳遞到宏觀圖像中,通過對醫(yī)學(xué)圖像數(shù)據(jù)的定量分析,可以推斷表型、基因-蛋白生物標(biāo)志物甚至預(yù)后信息。
圖像獲取指根據(jù)研究目的收集用于提取影像組學(xué)特征的圖像。在HCC相關(guān)的研究中,圖像數(shù)據(jù)多為單中心的回顧性CT或MRI數(shù)據(jù)。先前研究表明,影像組學(xué)特征對圖像采集和重建參數(shù)變化十分敏感[4,5],不同機型和不同參數(shù)采集的圖像的影像組學(xué)特征存在較大差異。因此需要在特征提取前對圖像進行預(yù)處理(如重采樣、像素歸一化)或特征提取后對特征進行預(yù)處理(特征歸一化)來減小不同來源圖像的影響。同時在特征分析時,有條件時應(yīng)以不同來源的圖像分為亞組,驗證結(jié)果在不同亞組中的推廣性。
病灶標(biāo)注指通過標(biāo)注軟件或標(biāo)注算法生成ROI的掩膜。在特征提取時,算法僅考慮掩膜內(nèi)的像素值,從而計算得到ROI的影像組學(xué)特征。從標(biāo)注方法上,手動標(biāo)注最為簡單易行,但受到標(biāo)注者主觀影響,因此不同標(biāo)注者間或同一標(biāo)注者的多次標(biāo)注間都存在差異。目前的研究中主要通過計算多次標(biāo)注ROI間的空間重合程度(如Dice相似系數(shù)、Jaccard相似系數(shù))或多次標(biāo)注ROI提取的多套影像組學(xué)特征間的一致性(如組內(nèi)相關(guān)系數(shù))來評價手動分割的重復(fù)性和穩(wěn)定性[6]。另一種方法為半自動或自動標(biāo)注,是指通過閾值分割、區(qū)域生長、深度卷積神經(jīng)網(wǎng)絡(luò)等方法,實現(xiàn)端對端的標(biāo)注,不需要或僅需要少量的人工校正。相對于人工標(biāo)注,這類標(biāo)注方法更快、更穩(wěn)定,也因此越來越受到研究人員的關(guān)注[7,8]。
特征提取是指按照預(yù)先定義的計算機算法從圖像ROI中自動提取出大量的定量化影像特征。目前研究中使用的影像組學(xué)特征多為標(biāo)準(zhǔn)特征[9],主要分為:①直方圖特征,反映ROI像素值的分布特點;②形態(tài)特征,反映ROI的幾何形態(tài)特征;③紋理特征,同時考慮像素值和像素的空間分布,反映ROI對應(yīng)的各種紋理矩陣的特征(如灰階共生矩陣特征、灰階游程矩陣特征等)。此外,在特征提取前,還可以使用各種濾波函數(shù)對圖像進行變換,增強圖像的某種特性。如高斯-拉普拉斯變換可以增強物體的邊緣信息[10],平方根變換使像素間的差異變小。由于濾波函數(shù)的應(yīng)用,病例的影像組學(xué)特征向量的維度往往非常高。特征篩選是從高維影像組學(xué)特征中篩選出穩(wěn)定、高區(qū)分度的特征,常用方法包括最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸模型、主成分分析等。
特征分析在目前研究中主要分為有監(jiān)督學(xué)習(xí)的分類模型構(gòu)建和無監(jiān)督學(xué)習(xí)的聚類分析。在有監(jiān)督學(xué)習(xí)中,特征與結(jié)局事件同時輸入分類模型,用于擬合特征與結(jié)局事件間的關(guān)系,最終評估分類模型的區(qū)分度、校準(zhǔn)度和臨床實用性等性能[11,12]。在無監(jiān)督學(xué)習(xí)中,算法通過特征值的相似性將樣本分為多個簇,通過比較簇間結(jié)局事件的發(fā)生情況及影像組學(xué)特征的表達情況,最終間接分析影像組學(xué)特征與結(jié)局間的關(guān)系。
1.HCC的診斷與鑒別診斷
肝臟局灶性病變的診斷主要依靠影像檢查。一些肝臟良性病變?nèi)缪芰觥⒛夷[等往往只需要隨訪,而惡性病變則需要積極的臨床干預(yù),并且HCC與非HCC惡性病變的診療策略也不同。盡管多數(shù)病變在影像上有較為典型的表現(xiàn),但部分不典型的良、惡性病變?nèi)砸着cHCC混淆,加大診斷的難度。
影像組學(xué)在HCC與其他肝臟良惡性病變的鑒別診斷中有重要價值。Zhao等[13]基于平掃CT圖像上病灶區(qū)域的信息建立影像組學(xué)預(yù)測模型,用于診斷6種肝局灶性病變,包括肝血管瘤、肝囊腫、肝腺瘤、肝臟局灶性結(jié)節(jié)增生(focal nodular hyperplasia,FNH)、HCC和肝轉(zhuǎn)移癌。他們發(fā)現(xiàn)對于6種病變的診斷,影像組學(xué)模型的受試者操作特征(receiver operating characteristic,ROC)曲線的曲線下面積(area under curve,AUC)均可達0.89以上,并且在鑒別良性病變與惡性病變的任務(wù)中AUC值也很高(0.899)。利用平掃影像組學(xué)模型,能有效鑒別診斷常見肝局灶性病變,從而幫助克服因?qū)Ρ葎┻^敏而產(chǎn)生的不良反應(yīng)。
多項研究表明基于CT或MRI的影像組學(xué)模型能很好地鑒別診斷肝硬化背景下的HCC。Ding等[14]探究了增強MRI影像組學(xué)特征對鑒別診斷肝硬化背景下的HCC與FNH的效能,發(fā)現(xiàn)通過臨床危險因素建立的臨床預(yù)測模型在融合了影像組學(xué)特征后,診斷效能明顯提高。類似的,Nie等[15]基于增強CT圖像建立影像組學(xué)預(yù)測模型,能有效區(qū)分肝硬化背景下的HCC與FNH,并且影像組學(xué)標(biāo)志物能顯著提高臨床模型的預(yù)測準(zhǔn)確性。
影像組學(xué)模型也能夠很好地區(qū)分HCC與非HCC的惡性病變。Wang等[16]使用MRI影像組學(xué)模型鑒別診斷HCC、肝內(nèi)膽管細(xì)胞癌與混合型肝細(xì)胞癌-膽管細(xì)胞癌,發(fā)現(xiàn)基于延遲期特征的模型在區(qū)分病變上有更好的AUC值(0.91),且使用高階影像組學(xué)特征的模型相對于僅使用低階特征的模型能提高約10%的診斷效能。Huang等[17]也發(fā)現(xiàn)基于T2*WI序列的影像組學(xué)特征能很好地區(qū)分HCC與肝內(nèi)膽管細(xì)胞癌。
2.HCC病理特征的術(shù)前預(yù)測
HCC的多種病理特征與其預(yù)后緊密相關(guān),是HCC風(fēng)險分層的重要參考標(biāo)準(zhǔn),而準(zhǔn)確的風(fēng)險分層是合理制定治療方案的關(guān)鍵。由于HCC的診斷不依賴于組織病理檢查,因此在術(shù)前往往難以獲得病灶的病理信息。影像組學(xué)提供了一種無創(chuàng)、安全、可重復(fù)的檢測方法,并且已經(jīng)在多項研究中展現(xiàn)出對HCC病理特征的術(shù)前精準(zhǔn)預(yù)測能力。
影像組學(xué)可用于術(shù)前識別HCC的特殊組織學(xué)亞型。在Feng等[18]的研究中,使用術(shù)前增強CT圖像建立的影像組學(xué)模型能夠在內(nèi)、外部驗證集中較好地預(yù)測粗梁-團塊型肝細(xì)胞癌亞型。通過分析批量和單細(xì)胞RNA測序數(shù)據(jù),作者發(fā)現(xiàn)該影像組學(xué)標(biāo)志物與B細(xì)胞浸潤的體液免疫功能失調(diào)相關(guān)。Wu等[19]分別使用增強MRI動脈期、靜脈期影像組學(xué)特征以及他們的組合構(gòu)建雙表型HCC的預(yù)測模型,結(jié)果表明基于靜脈期特征的模型(AUC=0.879)與動、靜脈期混合模型(AUC=0.908)的區(qū)分度顯著優(yōu)于臨床預(yù)測模型(AUC=0.658)。
影像組學(xué)還可以用于預(yù)測HCC的組織病理學(xué)特征。Mao等[20]分析了297例HCC患者增強CT動脈期和靜脈期病灶的影像組學(xué)特征,發(fā)現(xiàn)結(jié)合了臨床特征、動脈期特征和靜脈期特征的預(yù)測模型在預(yù)測Edmondson-Steiner分級上有最高的診斷效能(AUC=0.8014),且動脈期特征的預(yù)測效能優(yōu)于靜脈期特征。Meng等[21,22]發(fā)現(xiàn)無論CT或MRI,影像組學(xué)特征在預(yù)測HCC微血管侵犯上沒有顯著差別,并且基于臨床特征、影像特征和影像組學(xué)特征建立的預(yù)測模型,在內(nèi)、外部驗證中能很好地預(yù)測微血管侵犯(AUC=0.835~0.864)。Yu等[23]探究了增強MRI圖像上HCC腫瘤內(nèi)部和腫瘤周圍影像組學(xué)特征對于預(yù)測腫瘤包繞型血管的價值,結(jié)果發(fā)現(xiàn)瘤周1 mm區(qū)域的影像組學(xué)特征較瘤內(nèi)特征有更好的預(yù)測效能,且該模型的預(yù)測結(jié)果是早期復(fù)發(fā)和無進展生存的獨立預(yù)測因子。
影像組學(xué)還可以對免疫組化標(biāo)記物進行預(yù)測,實現(xiàn)術(shù)前分子分型,幫助更好地理解腫瘤生物學(xué)行為和優(yōu)化治療方案。Wu等[24]分析了172例HCC患者的術(shù)前增強CT圖像,發(fā)現(xiàn)結(jié)合血清甲胎蛋白水平、Edmondson-Steiner分級和影像組學(xué)標(biāo)志物的模型能很好地預(yù)測腫瘤Ki-67的表達水平。Wang等[25]基于臨床危險因素和增強MRI影像組學(xué)特征建立不同的模型預(yù)測HCC腫瘤CK-19表達情況,發(fā)現(xiàn)聯(lián)合動脈期和肝膽期的MRI影像組學(xué)模型預(yù)測效能優(yōu)于任何單一序列模型及單純臨床模型,而同時聯(lián)合臨床危險因素能提高MRI影像組學(xué)模型的預(yù)測效能。Gu等[26]基于腫瘤延遲期MRI圖像和臨床危險因素構(gòu)建影像組學(xué)模型,其預(yù)測HCC腫瘤GPC-3表達情況的AUC為0.914。
3.HCC的療效預(yù)測和預(yù)后評估
影像組學(xué)的模型預(yù)測結(jié)果還可以整合到診療方式的選擇中。Chen等[27]分析了術(shù)前平掃和動脈期CT圖像中病灶及病灶周圍區(qū)域的影像組學(xué)特征,發(fā)現(xiàn)腫瘤+瘤周10 mm影像組學(xué)模型對預(yù)測中期HCC患者初次肝動脈灌注化療栓塞術(shù)(transcatheter arterial chemoembolization,TACE)后的客觀緩解準(zhǔn)確性最高,并且結(jié)合臨床、傳統(tǒng)影像危險因素后,該模型能進一步提高診斷準(zhǔn)確性,在內(nèi)、外部驗證集中AUC分別達到0.94和0.90。該研究結(jié)果有助于術(shù)前選擇出可能從TACE治療中獲益的患者。Jin等[28]通過分析三中心TACE患者隊列,發(fā)現(xiàn)基于術(shù)前增強CT圖像的影像組學(xué)模型有助于預(yù)測初次TACE后肝外播散和血管侵犯,從而幫助發(fā)現(xiàn)不適合TACE治療的初治患者。
早期HCC的首選治療方法是手術(shù)切除,然而術(shù)后復(fù)發(fā)仍舊是造成不良預(yù)后的重要因素,因此高復(fù)發(fā)風(fēng)險的患者可能需要額外的輔助治療[29,30]。Li等[31]分析了行手術(shù)切除治療的329例HCC患者的隨訪數(shù)據(jù),發(fā)現(xiàn)基于增強CT圖像的影像組學(xué)模型可以對患者的復(fù)發(fā)風(fēng)險進行分層,模型預(yù)測高風(fēng)險組與低風(fēng)險組的復(fù)發(fā)概率差異有統(tǒng)計學(xué)意義。結(jié)合影像組學(xué)預(yù)測風(fēng)險和術(shù)后病理腫瘤微血管侵犯情況建立的預(yù)測模型,可以進一步提高對早期復(fù)發(fā)與晚期復(fù)發(fā)的預(yù)測準(zhǔn)確性(C-index=0.727)。Gao等[32]使用增強MRI圖像和患者早期復(fù)發(fā)情況(≤2年)訓(xùn)練深度卷積神經(jīng)網(wǎng)絡(luò),并將網(wǎng)絡(luò)的全連接層輸出作為深度學(xué)習(xí)特征,與影像組學(xué)特征結(jié)合,建立融合預(yù)測模型。該模型在預(yù)測HCC早期復(fù)發(fā)的任務(wù)中AUC能達到0.840,優(yōu)于單用影像組學(xué)模型(AUC=0.780)和單用深度學(xué)習(xí)模型(AUC=0.813)。
盡管影像組學(xué)在HCC診斷、治療與預(yù)后方面突顯出重要價值,但其臨床應(yīng)用仍存在諸多問題。
一方面,目前的影像組學(xué)研究多關(guān)注模型的性能好壞,而忽視了對研究設(shè)計及結(jié)果分析的質(zhì)量控制,導(dǎo)致大多數(shù)已發(fā)表的研究可能存在系統(tǒng)誤差,或未提供足夠的信息供讀者評價其研究的發(fā)現(xiàn)[33-36]。例如,目前的研究中特征提取的參數(shù)設(shè)置缺乏詳細(xì)報道,導(dǎo)致他人無法復(fù)現(xiàn)特征提取過程[37];研究多采用隨機拆分驗證,且同時缺乏樣本量計算,因此難以保證模型驗證的可靠性。系統(tǒng)誤差可能導(dǎo)致模型的性能膨脹,即虛假性的高性能。
另一方面,目前的研究缺乏對影像組學(xué)特征和影像組學(xué)模型的生物學(xué)可解釋性分析。盡管已有部分研究使用了如夏普利值等算法分析輸入影像組學(xué)特征與輸出間的數(shù)學(xué)可解釋性[38],而影像組學(xué)特征與傳統(tǒng)肉眼影像征象、組織病理特征與分子基因表達等的生物學(xué)可解釋性仍較差[39]。缺乏潛在的生物學(xué)可解釋性,“組學(xué)”這類黑盒模型難以廣泛應(yīng)用。
其次,以犧牲生物學(xué)可解釋性換取的性能提升,缺乏多中心或前瞻性的外部驗證,難以保證模型的泛化性。在應(yīng)用了濾波函數(shù)后,影像組學(xué)特征的維度可達上千,屬于高維數(shù)據(jù)。一項模擬研究表明,即使是隨機生成的影像組學(xué)特征也可以產(chǎn)生“重要”的預(yù)后價值[34]。因此,高維度的影像組學(xué)數(shù)據(jù)極有可能產(chǎn)生與結(jié)局事件的虛假相關(guān)性。多中心空間外部驗證或前瞻性時間外部驗證能夠很好地評估模型在真實環(huán)境中使用時的性能,而目前多數(shù)研究缺乏這樣的可靠性和魯棒性的驗證。
最后,隨著近年來算法的進步,以卷積神經(jīng)網(wǎng)絡(luò)系列模型和Transformer系列模型為代表的深度學(xué)習(xí)算法在上述臨床應(yīng)用中表現(xiàn)出相似甚至更好的性能。如Xu等[40]使用基于Swin-Transformer的深度學(xué)習(xí)模型評估肝臟病灶的肝臟成像報告和數(shù)據(jù)系統(tǒng)(liver imaging reporting and data system,LI-RADS)評分以及判斷病灶是否為HCC。該模型在內(nèi)部驗證和外部驗證中的LI-RADS評分和HCC診斷任務(wù)中都表現(xiàn)出較好的性能。Gao和Wang的團隊發(fā)現(xiàn)預(yù)測肝癌早期復(fù)發(fā)的問題中,使用多層卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法的性能顯著優(yōu)于影像組學(xué)方法,同時通過結(jié)合深度學(xué)習(xí)模型的全連接層特征和影像組學(xué)特征建立的混合模型,表現(xiàn)出比兩者單獨使用更好的預(yù)測性能[41]。此外,深度學(xué)習(xí)不受建模任務(wù)的限制,可以應(yīng)用于病灶檢測、病灶分割和病灶配準(zhǔn)等影像組學(xué)無法完成的任務(wù)中[42-44],也可以利用海量無標(biāo)注數(shù)據(jù)進行自監(jiān)督表征學(xué)習(xí),提高下游監(jiān)督學(xué)習(xí)任務(wù)的性能[45]。因此,影像組學(xué)如何與深度學(xué)習(xí)有機結(jié)合,更好為臨床個體化服務(wù),是需要思考的問題。
在HCC的診斷、鑒別診斷、病理特征預(yù)測、療效預(yù)測及預(yù)后評估中,加入了影像組學(xué)特征的預(yù)測模型可以獲得更好的預(yù)測性能,但現(xiàn)有研究的局限性限制了影像組學(xué)在臨床實踐中的廣泛應(yīng)用。為了推進其臨床應(yīng)用,后續(xù)研究需要注意研究設(shè)計及統(tǒng)計分析的質(zhì)量控制,提高影像組學(xué)特征和模型的生物學(xué)可解釋性,并探索成熟的影像組學(xué)模型在真實臨床診療中的價值。多中心、前瞻性的臨床驗證是最終應(yīng)用前的關(guān)鍵步驟。