周小焙 周海軍
南華大學(xué)附屬郴州第一人民醫(yī)院放射科,湖南省郴州市 423000
膠質(zhì)母細胞瘤(Glioblastoma, GBM)是星形細胞瘤中最常見、惡性程度最高的腫瘤[1],組織病理學(xué)中明顯的壞死和內(nèi)皮增生是最顯著的特征,根據(jù)WHO(2016)CNS腫瘤(Central nervous system tumors)[2]分類,將其分為Ⅳ級。GBM侵襲性強,治療效果差,手術(shù)切除后極易復(fù)發(fā),需進行輔助放化療。目前MRI仍是GBM診斷和監(jiān)測地首選成像方式[3],但由于不同醫(yī)生對于圖像的主觀評價有所差異,最終的臨床評估結(jié)果存在潛在偏差。
影像組學(xué)是2012年荷蘭學(xué)者Lambin[4]提出的新興概念,可以深度挖掘醫(yī)學(xué)影像中人眼無法識別的影像特征,并通過統(tǒng)計學(xué)或者深度學(xué)習(xí)的方法來剔除冗余特征,使用相關(guān)特征來分析相關(guān)臨床信息。近年來,隨著個體化治療及精準(zhǔn)醫(yī)學(xué)的推進,影像組學(xué)得到了全面的發(fā)展,廣泛應(yīng)用多種成像技術(shù),如PET、CT、MR圖像、超聲[5]等。影像學(xué)檢查對于膠質(zhì)母細胞瘤的鑒別診斷、預(yù)后、生存期預(yù)測都具有重要的參考價值。
通過影像組學(xué)分析的研究內(nèi)容主要包括以下4個關(guān)鍵步驟:圖像采集、圖像分割、特征提取和篩選、建立數(shù)據(jù)庫對信息分析建模。
1.1 圖像采集 足量病例的標(biāo)準(zhǔn)化采集是保證后續(xù)分析的基礎(chǔ)。為了保證分析質(zhì)量, 除了對病人進行篩選及在采集過程嚴(yán)格標(biāo)準(zhǔn)化掃描外,也應(yīng)注意幾個方面: (1) 盡可能使用高分辨率圖像; (2) 按標(biāo)準(zhǔn)化流程采集數(shù)據(jù); (3) 盡可能擴大樣本量。目前不同機構(gòu)之間的檢查,并無共識及指南,后續(xù)提取特征必然存在差異,所以難以共用。
1.2 圖像分割 圖像的感興趣區(qū)(Region of interest,ROI)的分割,根據(jù)提取的方法的不同,大致有以下幾種常見方法:(1)手工分割方法。(2)閾值分割方法。(3)水平分割方法。(4)區(qū)域生長法。(5)人工神經(jīng)網(wǎng)絡(luò)等。各種方法各有優(yōu)劣,如手工分割腫瘤的精度高,但操作時間長,且可重復(fù)性差。
1.3 特征提取 提取可靠、穩(wěn)定并且全面的特征十分重要,目前可以通過Python、Matlab等軟件,或通過放射組云平臺、飛利浦星云工作站等云平臺提取。目前一般特征包括如下:(1)一階特征:一階統(tǒng)計數(shù)據(jù)描述圖像區(qū)域內(nèi)體素強度的分布,包括熵、平均值、中位數(shù)、標(biāo)準(zhǔn)差、偏度等。(2)形狀特征(2D、3D):描述ROI的三維或二維大小和形狀的特征,如腫瘤的體素體積、表面積、表面積與體積比等。(3)紋理特征:常用灰度共生矩陣(Gray level co-occurrence matrix,GLCM):描述兩個位置的像素的聯(lián)合概率密度;灰度大小區(qū)域矩陣(Gray level size zone matrix,GLSZM):量化圖像中的具有相同灰度強度的連接體素的數(shù)目;灰度游程矩陣(Gray level run length matrix,GLRLM):表示具有相同灰度值的連續(xù)像素的長度;鄰近灰度差矩陣(Neighbouring gray tone difference matrix,NGTDM):表示一定距離內(nèi)的灰度值與其鄰域的平均灰度值之間的差值;特征灰度依賴矩陣(Gray level dependence matrix,GLDM):量化圖像中距離內(nèi)的連接體素數(shù)。包括基于過濾器的特征:如經(jīng)拉普拉斯高斯濾波、平方值、平方根、小波特征等。最后并非所有提取出的特征對預(yù)測結(jié)果有所幫助,為了消除冗余特征并減小數(shù)據(jù)過擬合對模型的泛化能力造成的影響。還需對提取出的特征值進行篩選,目前常用篩選特征值的方法,如最小絕對收斂和選擇算子(Least absolute shrinkage and selection operator,LASSO)、方差分析、最小冗余最大相關(guān)等。
1.4 建立模型 模型構(gòu)建各種不同的算法包括:支持向量機(Support vector machine,SVM),如Lin CJ等[6]建立的LIBSVM、邏輯回歸(Logistic regression,LR)、隨機森林(Random forest, RF)、K鄰近(K-nearest neighbor, KNN)、決策樹(Decision tree,DT)、貝斯葉算法、深度學(xué)習(xí)(Deep learning,DL)等,最終需根據(jù)研究目的將臨床數(shù)據(jù)、基因、蛋白等特征納入模型。
2.1 鑒別診斷 GBM、原發(fā)性中樞神經(jīng)系統(tǒng)淋巴瘤(Primary central nervous system lymphoma ,PCNSL)、轉(zhuǎn)移瘤作為顱內(nèi)常見的惡性腫瘤[7],其表現(xiàn)不盡相同,現(xiàn)有不少研究就通過影像組學(xué)獲得更多診斷信息。Suh HB等[8]通過54例PCNSL患者和23例非壞死性不典型GBM患者。從多參數(shù)和多區(qū)域圖像中提取了6 366個放射學(xué)特征,包括形狀、體積、一階、紋理和小波變換特征。通過交叉驗證,對這些特征進行遞歸特征消除和RF分析。采用ROC分析評價基于影像組學(xué)的機器學(xué)習(xí)分類器、ADC值和使用三種基于常規(guī)MR序列的三位放射科醫(yī)師對腫瘤的診斷能力。最終基于影像組學(xué)的機器學(xué)習(xí)算法在鑒別PCNSL和非典型GBM分類結(jié)果的AUC值(0.921),高于腫瘤ADC值的AUC值(0.684)和三位放射科醫(yī)師的AUC值(分別為0.707、0.759、0.695)。Wu G等[9]提出了一種基于稀疏表示的PCNSL和GBM自動分類系統(tǒng),回顧27例PCNSL患者及28例GBM患者的TIWI圖像,利用十折法對數(shù)據(jù)集進行交叉驗證,鑒別診斷結(jié)果的準(zhǔn)確率為96.36%,敏感度為96.30%,特異性為96.43%,以上研究均表明影像組學(xué)在鑒別PCNSL和GBM取得了不錯的結(jié)果。Artzi M[10]等通過212例GBM患者和227例腦轉(zhuǎn)移患者(乳腺、肺等)用1.5T和3.0T MR獲T1WI圖像,通過多種臨床信息、腫瘤部位、圖像中的一階特征、形態(tài)特征、小波特征。在降維后,采用各種機器學(xué)習(xí)算法進行分類,包括SVM、KNN、DT和集成分類器,最終SVM分類器對GBM和腦轉(zhuǎn)移瘤進行鑒別的AUC達到0.96,可以看出影像組學(xué)對GBM和腦轉(zhuǎn)移瘤有較大的診斷價值。以上研究表明影像組學(xué)作為一種反應(yīng)腫瘤異質(zhì)性的技術(shù),可以對鑒別GBM有較好的診斷效能。
2.2 基因表達 2016年WHO發(fā)布的《中樞神經(jīng)系統(tǒng)腫瘤分類》是基于2007年版本的修訂版,其中納入了用分子學(xué)特點定義的一些新的分類,使得影像組學(xué)未來研究方向朝著基因及分子特點上的預(yù)測發(fā)展。近期的研究已經(jīng)對異檸檬酸脫氫酶(Isocitrate dehydrogenase 1,IDH1)突變[11]、O6-甲基鳥嘌呤DNA甲基轉(zhuǎn)移酶[O(6)-methylguanine-DNA methyltransferase,MGMT]甲基化[12]和地中海貧血/智力低下綜合征基因(X-linked alpha thalassemia mental retardation syndrome,ATRX)突變[13]的影像組學(xué)特征進行探索。Chang P等[14]回顧259例LGG或者HGG的MRI,并使用主成分分析法提取組學(xué)特征,其中發(fā)現(xiàn)突變型IDH1較野生型IDH1腫瘤相對呈弱強化。而Yamashita K等[15]對55例野生型IDH1和11例突變型IDH1的GBM進行回顧性研究,分析其血流量及壞死程度,證實腫瘤血管與突變型IDH1狀態(tài)之間可能存在相關(guān)性。Li ZC等[16]回顧133例GBM患者,從多參數(shù)MRI中自動提取了1 705個多區(qū)域放射學(xué)特征,使用R語言中Boruta包篩選相關(guān)特征并構(gòu)建模型,結(jié)果使用6個相關(guān)特征的影像組學(xué)模型對獨立的60例驗證組GBM中MGMT甲基化狀態(tài)預(yù)測,AUC可達0.88,準(zhǔn)確度可達0.80,證實影像組學(xué)特征有助于診斷和預(yù)測GBM基因突變狀態(tài)。而魏煒等[17]回顧137例GBM患者術(shù)前MR圖像并人工勾畫ROI,隨后在T1WI增強序列上提取620個高維3D影像組學(xué)特征,并采用Pearson相關(guān)和LASSO回歸進行特征的選擇,最后用Logistic回歸建立對MGMT甲基化狀態(tài)分類的預(yù)測模型,AUC可達0.974,符合率達0.912。該研究也表明影像組學(xué)是可以作為預(yù)測GBM中MGMT甲基化的一種潛在的、非侵入性的影像生物標(biāo)志物。
2.3 預(yù)后研究 近年來,GBM患者的3年生存率從過去1999—2000年的約4%上升到2009—2010年的10%[18],如何更加準(zhǔn)確地預(yù)測患者預(yù)后情況及早期復(fù)發(fā)和轉(zhuǎn)移可能性,以及時調(diào)整每一位患者個性化治療方法仍是一個考驗。不正確的腫瘤進展診斷可能導(dǎo)致錯誤的治療方案,并對生存率產(chǎn)生負面影響,并會導(dǎo)致不適當(dāng)?shù)幕颊弑患{入臨床試驗。而影像組學(xué)的理念認為影響疾病的各種預(yù)后因素是能通過圖像特征表現(xiàn)出來。Zhang X等[19]收集105例的GBM患者(57例為長期存活組,48例為短期存活組,以12個月的總生存期分組)的多參數(shù)MRI圖像,共提取了4 000個影像組學(xué)特征。運用LASSO方法篩選出25個特征,結(jié)合臨床危險因素,構(gòu)建出基于LR模型的影像組學(xué)列線圖。通過校準(zhǔn)度、區(qū)分度和臨床實用性來評估該影像組學(xué)列線圖的效能。結(jié)果在生存分層中比臨床危險因素(如年齡、Karnofsky功能狀態(tài)評分和治療策略)表現(xiàn)更好。當(dāng)影像組學(xué)和臨床危險因素相結(jié)合時,其影像組學(xué)列線圖在訓(xùn)練集(C指數(shù),0.971)和驗證集(C指數(shù),0.974)中顯示出良好的區(qū)分度。表明影像組學(xué)列線圖作為無創(chuàng)性預(yù)測工具表現(xiàn)出良好的預(yù)測準(zhǔn)確性,并可提供GBM病人生存分層的個體化概率。
在預(yù)測GBM復(fù)發(fā)方面。Kim JY等[20]回顧性分析83例膠質(zhì)母細胞瘤患者術(shù)前磁共振成像(MRI)表現(xiàn),從中提取6 472個放射特征。用AUC檢驗6個月進展的診斷模型,并與FA和CBV的單個參數(shù)進行了比較。采用Harrell C指數(shù)進行生存模型的檢驗,并與年齡、性別、Karnofsky表現(xiàn)評分、手術(shù)切除程度等臨床模型進行比較。最終聯(lián)合應(yīng)用FA和CBV放射組學(xué)對局部進展(AUC 0.79;95%CI 0.67~0.90)的預(yù)測價值優(yōu)于單影像學(xué)放射組學(xué)(AUC 0.70~0.76)和單項影像學(xué)參數(shù)(AUC 0.51~0.54),結(jié)果表明影像組學(xué)對于假性進展具有一定的診斷效能,有助于為患者調(diào)整和改進下一步的治療計劃。
影像組學(xué)有很大的臨床應(yīng)用潛力,能夠充分挖掘和分析肉眼無法觀察的影像特征,提供臨床提供量化的非侵入性工具,幫助腫瘤的精確診斷、分型及靶向基因檢測,實現(xiàn)臨床的提前干預(yù)、提高患者的生存質(zhì)量。目前,影像組學(xué)內(nèi)許多步驟仍處于發(fā)展階段,未來將多種信息整合到一個人工智能模型中將是推進個體化醫(yī)療的重要方向。隨著計算機水平及影像學(xué)的發(fā)展,影像組學(xué)必將使影像學(xué)和臨床產(chǎn)生巨大革新。