張洪博 張宇澤 黃飚
膠質(zhì)瘤是成人最常見的惡性原發(fā)性腦腫瘤,其中彌漫性膠質(zhì)瘤發(fā)病率最高[1]。2013年,Killela等[2]提出編碼端粒酶逆轉(zhuǎn)錄酶(telomerase reverse transcriptase,TERT)啟動(dòng)子是多種常見腫瘤的關(guān)鍵驅(qū)動(dòng)因素。在WHO中樞神經(jīng)系統(tǒng)腫瘤分類第5版(the fifth edition of the WHO Classification of Tumors of the Central Nervous System,WHO CNS 5)中提出,異檸檬酸脫氫酶(isocitrate dehydrogenase,IDH)野生型彌漫性膠質(zhì)瘤TERT啟動(dòng)子突變能夠提高膠質(zhì)瘤的組織學(xué)分級[3]。近年來,人工智能(artificial intelligence,AI)被用于醫(yī)學(xué)影像的工作流程和研究中,主要體現(xiàn)在腦腫瘤分級、分子信息和病人預(yù)后預(yù)測等方面[4]。本文就AI在彌漫性膠質(zhì)瘤TERT啟動(dòng)子突變預(yù)測中的研究進(jìn)展進(jìn)行綜述。
AI作為計(jì)算機(jī)科學(xué)的一個(gè)分支,能夠模擬、延伸和擴(kuò)展人的智能[5]。AI涵蓋的范圍非常廣泛,它由不同的技術(shù)組成,例如機(jī)器學(xué)習(xí)(machine learning,ML)、計(jì)算機(jī)視覺、生物識別技術(shù),其中ML與醫(yī)學(xué)影像聯(lián)系最為緊密。ML通過使用不同的算法指導(dǎo)計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí),然后根據(jù)學(xué)習(xí)經(jīng)驗(yàn)來提高自身的性能。在醫(yī)學(xué)研究中常見的ML算法包括線性回歸、支持向量機(jī)、邏輯回歸算法、決策樹、隨機(jī)森林和樸素貝葉斯算法等[5]。影像組學(xué)是從醫(yī)學(xué)成像(CT、MRI、PET等)的興趣區(qū)中高通量地提取影像特征,采用ML方法從其中獲取關(guān)鍵信息,進(jìn)而用于疾病的診斷、分級或預(yù)后判斷等。但當(dāng)面對一些復(fù)雜的臨床問題時(shí),傳統(tǒng)ML的整體算法分析、學(xué)習(xí)流程應(yīng)用時(shí)顯得較為繁瑣,而預(yù)測效果也欠佳。深度學(xué)習(xí)(deep learning,DL)作為ML的子領(lǐng)域,相對于ML,它的性能更為強(qiáng)大。DL本質(zhì)上是構(gòu)建含有多個(gè)隱含層的ML架構(gòu)模型,通過大規(guī)模數(shù)據(jù)進(jìn)行訓(xùn)練,得到大量更具代表性的特征信息,從而對樣本進(jìn)行分類和預(yù)測,提高分類和預(yù)測的精度[6]。其中卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)是DL的代表算法之一。CNN可以通過輸入定量數(shù)據(jù)、像素或體素信息等多維數(shù)據(jù),進(jìn)而解決圖像的分類問題。因此,DL作為一種使用CNN架構(gòu)的ML形式,在醫(yī)學(xué)成像應(yīng)用中展示出巨大的前景[6]。
TERT基因位于5號染色體短臂末端(5p15.33),是編碼端粒酶復(fù)合體的重要基因之一[7-8]。由于TERT啟動(dòng)子的轉(zhuǎn)錄抑制作用,在大部分的人類細(xì)胞中端粒酶活性是缺失的[9]。但通過端粒酶表達(dá)重新激活端粒維持機(jī)制可以促使細(xì)胞無限增殖,從而使正常細(xì)胞發(fā)展成癌細(xì)胞。大約90%的癌癥中,細(xì)胞永生是通過重新激活端粒酶實(shí)現(xiàn)的,其中包括重新激活TERT基因表達(dá)。在膠質(zhì)瘤的發(fā)生中,TERT啟動(dòng)子突變重新激活TERT基因發(fā)揮著關(guān)鍵作用[10-11]。TERT突變常發(fā)生在啟動(dòng)子區(qū)域的C228T和C250T,其中C228T突變發(fā)生率較高[12]。
有文獻(xiàn)[13]報(bào)道,TERT啟動(dòng)子突變對膠質(zhì)瘤亞型具有高度特異性。在膠質(zhì)母細(xì)胞瘤(glioblastoma,GBM)中TERT啟動(dòng)子突變型占70%~80%,遠(yuǎn)高于WHO 2和3級的彌漫性膠質(zhì)瘤[14-15]。TERT啟動(dòng)子突變型的GBM相較TERT啟動(dòng)子野生型表現(xiàn)為侵襲性更強(qiáng)、易復(fù)發(fā),并且病人的生存期更短(分別為14個(gè)月和27個(gè)月)[16]。此外,Li等[17]通過原位注射表達(dá)空腸彎曲菌腺嘌呤堿基編輯器的腺相關(guān)病毒可抑制TERT啟動(dòng)子突變的膠質(zhì)瘤生長,證明TERT啟動(dòng)子是治療膠質(zhì)瘤的潛在靶點(diǎn)。
較低級別膠質(zhì)瘤(WHO 2和3級)重要的臨床相關(guān)分子標(biāo)志物包括IDH、1號染色體短臂及19號染色體長臂缺失狀態(tài)(1p/19q)、TERT啟動(dòng)子及α地中海貧血伴智力低下綜合征x連鎖基因(alpha thalassemia/mental retardation syndrome x-linked gene,ATRX),其中IDH和TERT啟動(dòng)子的突變對于診斷較低級別膠質(zhì)瘤和判斷病人預(yù)后方面至關(guān)重要[18-19]。
Shboul等[20]使用影像組學(xué)方法預(yù)測WHO 2和3級彌漫性膠質(zhì)瘤分子標(biāo)志物(IDH突變、1p/19q共缺失、TERT啟動(dòng)子突變和ATRX突變),從多參數(shù)MRI中提取了680個(gè)影像組學(xué)特征,經(jīng)過特征篩選,使用極端梯度提升算法進(jìn)行建模并進(jìn)行了5折交叉驗(yàn)證,最終在測試集中發(fā)現(xiàn)TERT啟動(dòng)子突變預(yù)測模型的預(yù)測效能良好,平均受試者操作特征曲線下面積(AUC)為0.82。Jiang等[21]使用基于常規(guī)MRI的影像組學(xué)特征預(yù)測WHO 2和3級膠質(zhì)瘤中的TERT啟動(dòng)子突變狀態(tài),提取腫瘤實(shí)質(zhì)、腫瘤周圍水腫和整體腫瘤的影像組學(xué)特征,應(yīng)用支持向量機(jī)、隨機(jī)森林和自適應(yīng)增強(qiáng)算法進(jìn)行建模,結(jié)果發(fā)現(xiàn)使用腫瘤實(shí)質(zhì)的影像組學(xué)特征并采用隨機(jī)森林算法建立的模型分類效果最好,AUC為0.827。Fang等[22]基于常規(guī)MRI影像組學(xué)特征建立線性支持向量機(jī)模型來預(yù)測WHO 2級膠質(zhì)瘤的TERT啟動(dòng)子突變狀態(tài),經(jīng)過10折交叉驗(yàn)證,最終模型的AUC為0.844 6。Yan等[23]分別從T1WI、T2WI、T2-液體衰減反轉(zhuǎn)恢復(fù)(FLAIR)、增強(qiáng)T1WI和擴(kuò)散加權(quán)成像中提取影像組學(xué)特征并構(gòu)建多模態(tài)MRI特征融合模型,在預(yù)測TERT啟動(dòng)子突變狀態(tài)方面,基于增強(qiáng)T1WI和表觀擴(kuò)散系數(shù)(ADC)的特征融合模型取得了最佳的預(yù)測效果,AUC為0.669,準(zhǔn)確度為0.655;年齡是TERT啟動(dòng)子突變狀態(tài)唯一的臨床預(yù)測因素,然而加入年齡的融合模型的預(yù)測效能并沒有提高。Lu等[24]從176例較低級別膠質(zhì)瘤病人術(shù)前增強(qiáng)T1WI中提取了851個(gè)影像組學(xué)特征,使用最小絕對值收斂和選擇算子(least absolute shrinkage and selection operator,LASSO)進(jìn)行特征降維,最終選擇了7個(gè)影像組學(xué)特征并計(jì)算影像組學(xué)評分,使用多因素邏輯回歸構(gòu)建包含病人年齡、性別和影像組學(xué)評分的影像組學(xué)列線圖模型,列線圖模型對TERT啟動(dòng)子突變狀態(tài)預(yù)測的AUC為0.873。Fukuma等[25]納入164例WHO 2和3級彌漫性膠質(zhì)瘤病人,基于術(shù)前MRI通過影像組學(xué)和DL方法提取特征,預(yù)測膠質(zhì)瘤IDH和TERT啟動(dòng)子突變,分別以病人年齡、影像組學(xué)特征、CNN特征以及三者聯(lián)合共建立了4個(gè)模型,結(jié)果表明,利用CNN提取的高階特征對膠質(zhì)瘤的3種分子亞型(IDH野生型、IDH和TERT啟動(dòng)子突變型、IDH突變型和TERT啟動(dòng)子野生型)分類效果最好,準(zhǔn)確度可達(dá)到63.1%;在IDH突變的WHO 2和3級彌漫性膠質(zhì)瘤中,對TERT啟動(dòng)子突變狀態(tài)分類效果同樣使用CNN特征建立的模型準(zhǔn)確度最高,可達(dá)84.0%。綜上所述,AI有助于預(yù)測較低級別膠質(zhì)瘤TERT啟動(dòng)子突變狀態(tài)。利用基于深度特征和集成學(xué)習(xí)算法所構(gòu)建的模型可以獲得較好的預(yù)測效能。值得注意的是,多模態(tài)MRI特征融合方法的應(yīng)用為預(yù)測彌漫性膠質(zhì)瘤TERT啟動(dòng)子突變狀態(tài)的研究提供了新的思路,但上述研究使用此方法的預(yù)測效果欠佳。目前基于DL方法預(yù)測彌漫性膠質(zhì)瘤TERT啟動(dòng)子突變狀態(tài)的研究較少,且總體樣本量仍有待擴(kuò)大。因此,基于多序列、多尺度影像特征融合的影像組學(xué)或DL方法應(yīng)用于預(yù)測彌漫性膠質(zhì)瘤TERT啟動(dòng)子突變有待進(jìn)一步研究。
高級別膠質(zhì)瘤(high-grade gliomas,HGG)具有細(xì)胞生長更旺盛,腫瘤新生血管更多,腫瘤異質(zhì)性更高的特點(diǎn),尤其是膠質(zhì)瘤中最高級別的GBM[26]。TERT啟動(dòng)子突變狀態(tài)對于HGG病人的總生存期的判斷十分重要[16]。
Tian等[27]研究提示,年齡、膽堿/肌酸比值、乳酸峰值、腫瘤壞死體積(core necrosis volume,CNV)和影像組學(xué)特征是HGG中TERT啟動(dòng)子突變預(yù)測的重要指標(biāo)。該研究納入126例HGG病人,使用影像組學(xué)方法預(yù)測TERT啟動(dòng)子突變狀態(tài),基于T1WI、T2WI、T2-FLAIR、增強(qiáng)T1WI和MR波譜影像提取了1 230個(gè)影像組學(xué)特征,并采用LASSO算法進(jìn)行降維,最終篩選出6個(gè)影像組學(xué)特征并建立了4種模型。模型A由年齡、膽堿/肌酸比值、乳酸峰值、CNV和影像組學(xué)特征組成;模型B在模型A的基礎(chǔ)上減少了CNV;模型C僅由影像組學(xué)特征建模;模型D僅通過CNV值建模,結(jié)果顯示模型A預(yù)測效能最佳(AUC為0.889)。此外,CNV可作為TERT啟動(dòng)子突變的獨(dú)立預(yù)測因素,如Yamashita等[28]對GBM病人進(jìn)行TERT啟動(dòng)子突變狀態(tài)的預(yù)測研究,納入2個(gè)臨床指標(biāo)(年齡和性別)和9個(gè)MRI特征采用支持向量機(jī)算法建模,模型預(yù)測能力較高,AUC為0.776;多因素分析顯示,TERT啟動(dòng)子野生型病人的年齡和壞死體積百分比顯著高于TERT啟動(dòng)子突變型。另一研究團(tuán)隊(duì)對159例IDH野生型HGG病人利用動(dòng)態(tài)O-(2-18F-氟代乙酯)-L-酪氨酸PET預(yù)測TERT啟動(dòng)子突變狀態(tài),使用峰值時(shí)間圖像提取了9個(gè)影像組學(xué)特征,據(jù)此建立的邏輯回歸模型獲得了最佳預(yù)測性能,其AUC為0.82[29]。綜上所述,AI同樣有助于預(yù)測HGG病人TERT啟動(dòng)子突變狀態(tài),并且基于多序列和多參數(shù)的聯(lián)合模型能夠進(jìn)一步提高模型的預(yù)測能力。但上述研究均僅關(guān)注了TERT啟動(dòng)子的預(yù)測因子,然而預(yù)后也是HGG病人重要的信息,因此應(yīng)進(jìn)一步對構(gòu)建彌漫性膠質(zhì)瘤TERT啟動(dòng)子突變狀態(tài)及預(yù)后預(yù)測的多任務(wù)模型進(jìn)行研究。
綜上所述,TERT啟動(dòng)子是彌漫性膠質(zhì)瘤診斷及判斷預(yù)后的重要分子標(biāo)志物。AI是預(yù)測TERT啟動(dòng)子突變狀態(tài)行之有效的方法。但目前AI在預(yù)測彌漫性膠質(zhì)瘤TERT啟動(dòng)子突變方面仍局限于學(xué)術(shù)研究,且大部分研究以小樣本量和單中心為主。因此,今后預(yù)測彌漫性膠質(zhì)瘤TERT啟動(dòng)子突變的研究可以從以下幾方面開展:①根據(jù)WHO CNS 5劃分膠質(zhì)瘤類別進(jìn)行研究;②基于功能成像和擴(kuò)散加權(quán)成像構(gòu)建多序列、多參數(shù)影像組學(xué)或DL模型進(jìn)行研究;③構(gòu)建彌漫性膠質(zhì)瘤TERT啟動(dòng)子突變狀態(tài)及預(yù)后預(yù)測的多任務(wù)模型;④進(jìn)行多中心、前瞻性研究。