劉振 任晶晶 洪旋科 劉獻(xiàn)志 △
鄭州大學(xué)第一附屬醫(yī)院 1)神經(jīng)外科;2)臨床大數(shù)據(jù)中心 鄭州 450052
彌漫性膠質(zhì)瘤是成人原發(fā)性腦腫瘤中最常見(jiàn)的類型之一,高度惡性且病死率高[1]。即使經(jīng)過(guò)手術(shù)治療及術(shù)后放化療,患者的5 a生存率依然極低[2-3]。2021年世界衛(wèi)生組織(WHO)對(duì)中樞神經(jīng)系統(tǒng)(central nervous system, CNS)腫瘤的分類中,依據(jù)異檸檬酸脫氫酶(isocitrate dehydrogenase,IDH)、1號(hào)染色體短臂和19號(hào)染色體長(zhǎng)臂(1p/19q)的狀態(tài),將成人型彌漫性膠質(zhì)瘤分為IDH野生型、IDH突變型和1p/19q非共缺失型、IDH突變和1p/19q共缺失型3個(gè)分子亞型[4]。目前已有多項(xiàng)研究表明,IDH突變型的膠質(zhì)瘤患者比野生型擁有更長(zhǎng)的總生存期[5-6]。然而,確定彌漫性膠質(zhì)瘤生物分子標(biāo)志物的狀態(tài)多需要進(jìn)行侵入性手術(shù)或組織活檢[7-8]。為了便于術(shù)前風(fēng)險(xiǎn)評(píng)估及術(shù)后選取最佳的治療方案,需要一種術(shù)前能夠判斷彌漫性膠質(zhì)瘤生物分子標(biāo)志物狀態(tài)的無(wú)創(chuàng)方法。動(dòng)態(tài)敏感性對(duì)比劑灌注加權(quán)成像(dynamic susceptibility contrast perfusion-weighted imaging,DSC-PWI)是一種較為先進(jìn)的且不斷發(fā)展的成像方法,通過(guò)監(jiān)測(cè)血管中造影劑信號(hào)的強(qiáng)弱變化來(lái)描述腫瘤的微尺度血流和血流動(dòng)力學(xué)[9]。有報(bào)道稱,灌注參數(shù)是膠質(zhì)瘤分子生物標(biāo)志物的潛在預(yù)測(cè)指標(biāo)之一[10-13]。本研究通過(guò)DSC-PWI導(dǎo)出灌注參數(shù)偽彩圖,提取影像組學(xué)特征,結(jié)合機(jī)器學(xué)習(xí)算法,開發(fā)并驗(yàn)證了一個(gè)預(yù)測(cè)模型,旨在通過(guò)簡(jiǎn)單的方法提高預(yù)測(cè)成人型彌漫性膠質(zhì)瘤分子亞型的能力,從而進(jìn)行早期干預(yù)、改善預(yù)后。
1.1一般資料本研究經(jīng)鄭州大學(xué)第一附屬醫(yī)院倫理委員會(huì)批準(zhǔn)(No. 2019-KY-176)。收集2013-01—2020-01我院神經(jīng)外科手術(shù)切除后經(jīng)組織病理結(jié)果證實(shí)的274例成人型彌漫性腦膠質(zhì)瘤患者的臨床及影像資料。納入標(biāo)準(zhǔn):(1)年齡≥18歲。(2)明確的IDH和1p/19q狀態(tài)。(3)可用的液體衰減反轉(zhuǎn)恢復(fù)序列(fluid attenuated inversion recovery,F(xiàn)LAIR)圖像和DSC-PWI圖像,經(jīng)1名資深神經(jīng)外科醫(yī)生和1名資深神經(jīng)影像科醫(yī)生確認(rèn),任何一幅圖像都沒(méi)有強(qiáng)烈的和不可修復(fù)的運(yùn)動(dòng)偽影。(4)術(shù)前未進(jìn)行藥物治療、化療及放療。
1.2MR成像采集所有圖像均采集于術(shù)中3.0 T磁共振掃描儀(Siemens Healthcare, Germany),12通道線圈。掃描參數(shù),F(xiàn)LAIR:重復(fù)時(shí)間(time of repetition,TR)6 000 ms,回波時(shí)間(time of echo,TE) 94 ms,掃描野220 mm×193 mm,層厚5 mm。在患者進(jìn)行5次無(wú)增強(qiáng)掃描后,通過(guò)手背靜脈以4 mL/s的速度注射0.1 mmol/kg順磁造影劑(Bayer Healthcare,Germany)。采用T2*加權(quán)梯度回波平面成像獲得DSC-PWI:TR 1 500 ms,TE 30 ms,掃描野230 mm×230 mm,層厚4 mm。
1.3圖像預(yù)處理采用后處理工作臺(tái)灌注軟件(Siemens Healthcare,Germany)對(duì)DSC-PWI圖像進(jìn)行預(yù)處理,生成相應(yīng)的腦血容量(cerebral blood volume,CBV)、腦血流量(cerebral blood flow,CBF)、達(dá)峰時(shí)間(time to peak,TTP)及平均通過(guò)時(shí)間(mean transit time,MTT)灌注圖。為了減少位置、層數(shù)和其他參數(shù)的誤差,在N4ITK程序(美國(guó)國(guó)立衛(wèi)生研究院的Insight工具包內(nèi)獲取)上對(duì)所有影像圖像的形狀、體素及強(qiáng)度進(jìn)行標(biāo)準(zhǔn)化處理。圖像標(biāo)準(zhǔn)化之后,以軸向FLAIR圖像為基準(zhǔn),采用互信息相似性度量對(duì)CBV、CBF、MTT和TTP圖像進(jìn)行剛性配準(zhǔn),得到配準(zhǔn)圖像rFLAIR、rCBV、rCBF、rMTT和rTTP。定義整個(gè)腫瘤區(qū)域內(nèi)所有增強(qiáng)、未增強(qiáng)和壞死區(qū)域?yàn)楦信d趣體積(volume of interest,VOI)區(qū)域。一位研究生在采用盲法的情況下,利用ITK-SNAP軟件(3.4.0版本),在軸向rFLAIR圖像逐層地描繪腫瘤感興趣區(qū)(region of interest, ROI),得到腫瘤VOIs。隨后,另一位神經(jīng)外科主任醫(yī)生單獨(dú)復(fù)查了腫瘤ROIs。對(duì)有爭(zhēng)議的ROI,主任醫(yī)師與一位影像科主任醫(yī)師探討后確定標(biāo)準(zhǔn)區(qū)域。
1.4影像組學(xué)特征提取所有特征使用Pycharm軟件(2020.2.3版本)PyRadiomics工具包(能夠從醫(yī)學(xué)影像圖中提取組學(xué)特征的工具包,3.0.1版本)提取。將ROIs與對(duì)應(yīng)灌注圖像相結(jié)合,提取影像組學(xué)特征。
1.5特征選擇特征選擇的過(guò)程大致可分兩部分:(1)去除冗余和不相關(guān)的特征。(2)最優(yōu)特征集的選擇。分別使用R軟件的Caret工具包(6.0-89版本)和Boruta工具包(7.0.0版本)。首先對(duì)特征集進(jìn)行標(biāo)準(zhǔn)化和歸一化處理;標(biāo)準(zhǔn)化的特征在Caret包中進(jìn)行去冗余,對(duì)于相關(guān)系數(shù)>0.75的特征,保留單變量預(yù)測(cè)能力較強(qiáng)的特征(較大的曼-惠特尼U檢驗(yàn)P值)。然后利用Boruta算法對(duì)剩余的非冗余特征的重要性進(jìn)行比較,逐一刪除相關(guān)性差的特征,重復(fù)這個(gè)過(guò)程,直到剔除完所有預(yù)測(cè)能力弱的特征。在評(píng)估所有的特征后,選擇預(yù)測(cè)能力最強(qiáng)的特征集進(jìn)入預(yù)測(cè)模型。
1.6機(jī)器學(xué)習(xí)與預(yù)測(cè)模型根據(jù)選定的影像組學(xué)特征集,利用機(jī)器學(xué)習(xí)開發(fā)了一個(gè)預(yù)測(cè)模型,使用隨機(jī)森林算法[14]預(yù)測(cè)成人型彌漫性膠質(zhì)瘤的分子亞型。在該算法中,設(shè)置隨機(jī)森林算法中的樹數(shù)目為500,同時(shí)將基尼指數(shù)(Gini index)作為描述各組學(xué)特征對(duì)分子亞型重要性的指標(biāo)?;嶂笖?shù)數(shù)值越小,說(shuō)明該特征對(duì)該分型的重要性越小。影像組學(xué)預(yù)測(cè)模型的獨(dú)特邏輯回歸基于R軟件的Utiml工具包(0.1.7版本)和randomForest工具包(4.6-14版本)。
1.7統(tǒng)計(jì)分析入組病例按6∶4的比例隨機(jī)分為訓(xùn)練集和驗(yàn)證集。為驗(yàn)證臨床信息分布的均衡性,采用χ2檢驗(yàn)評(píng)估隊(duì)列中性別、WHO分級(jí)及分子分型的差異,采用Wilcoxon檢驗(yàn)評(píng)估年齡分布的差異,統(tǒng)計(jì)分析均采用R軟件(R-4.0.5版本)。描述訓(xùn)練集和驗(yàn)證集的性能為曲線下面積(area under curve,AUC)、準(zhǔn)確性、敏感性和特異性。
2.1患者臨床特征文章的設(shè)計(jì)流程如圖1所示。在本研究中,根據(jù)納入標(biāo)準(zhǔn)共入組274例患者(訓(xùn)練集168例和驗(yàn)證集106例)。訓(xùn)練集與驗(yàn)證集患者之間的臨床信息分布無(wú)差異性,如表1所示:性別(P=0.3647)、年齡(P=0.5739)、WHO分級(jí)(P=0.7782)、分子亞型(P=0.9739)。
表1 入組患者臨床資料的比較
圖1 研究設(shè)計(jì)流程圖
2.2特征選擇經(jīng)特征提取后,共從4張灌注圖中獲得影像組學(xué)特征4 787個(gè)(形狀特征55個(gè),強(qiáng)度特征936個(gè),紋理特征3 796個(gè))。其中537個(gè)特征為非冗余特征。經(jīng)過(guò)特征去冗余和特征選擇后,最終納入了13個(gè)與預(yù)測(cè)模型高度擬合的組學(xué)特征:7個(gè)紋理特征和6個(gè)強(qiáng)度特征,見(jiàn)表2。并且每個(gè)選中的特征與分子亞型的單變量關(guān)聯(lián)是顯著的(偽發(fā)現(xiàn)調(diào)整率P<0.01)。
表2 預(yù)測(cè)成人型彌漫膠質(zhì)瘤分子分型的13個(gè)影像組學(xué)特征
2.3分類性能基于影像學(xué)的預(yù)測(cè)模型的受試者工作特征曲線(receiver operating characteristic curve,ROC)見(jiàn)圖2。預(yù)測(cè)模型在驗(yàn)證集中的AUC值分別為:IDH野生型,0.748;IDH突變型和1p/19q非共缺失型,0.707;IDH突變和1p/19q共缺失型,0.759。其他反映訓(xùn)練集和驗(yàn)證集的性能的指標(biāo),包括敏感性、準(zhǔn)確性和特異性,見(jiàn)表3。
圖2 訓(xùn)練集(A)和驗(yàn)證集(B)的ROC曲線
表3 影像組學(xué)模型的預(yù)測(cè)性能總結(jié)
2.4特征性能圖3顯示了13個(gè)特征對(duì)各分子分型的重要性。基尼指數(shù)作為每個(gè)特征對(duì)各個(gè)分子分型的預(yù)測(cè)貢獻(xiàn)測(cè)量指標(biāo),基尼系數(shù)越高,說(shuō)明該特征預(yù)測(cè)該分子分型的能力越強(qiáng)。為了描述所選中的13個(gè)影像組學(xué)特征與分子亞型的關(guān)聯(lián)性,圖4展示了3種分子分型的典型圖像和與之相對(duì)應(yīng)的同源特征圖。
圖3 選定的13個(gè)特征與彌漫性膠質(zhì)瘤分子分型之間重要性的熱圖
圖4 選定特征的紋理及強(qiáng)度圖形
DSC-PWI及相應(yīng)的同源特征圖用于區(qū)別IDH野生型、IDH突變和1p/19q非共缺失型、IDH突變和1p/19q共缺失型彌漫性膠質(zhì)瘤。腫瘤內(nèi)部圖像模式的變化可以在特征圖中清楚地顯示,同時(shí)揭示了影像組學(xué)特征和分子亞型之間的相關(guān)性。
本研究開發(fā)并驗(yàn)證了一個(gè)依托于DSC-PWI影像組學(xué)模型,根據(jù)2021年WHO分類系統(tǒng),能夠有效地預(yù)測(cè)成人型彌漫性膠質(zhì)瘤的分子亞型。與以往使用常規(guī)核磁影像的研究相比[15-16],其主要優(yōu)勢(shì)有:(1)將灌注參數(shù)中反映腫瘤微血管生理特性的CBV、CBF、MTT和TTP 4種灌注圖全部納入放射組學(xué)模型,首次較為完整地納入全部灌注參數(shù)信息,可以更準(zhǔn)確地預(yù)測(cè)膠質(zhì)瘤的分子亞型。(2)依托機(jī)器學(xué)習(xí),從4種灌注圖中提取大量影像組學(xué)特征而非局限于原始圖像本身或相對(duì)腦血流量數(shù)值,進(jìn)而提高了我們研究結(jié)果的可信度。
以往的文獻(xiàn)表明,利用影像組學(xué)模型預(yù)測(cè)膠質(zhì)瘤分子分型具有一定的意義。例如Lu等[17]使用多參數(shù)核磁圖像影像組學(xué)對(duì)456例膠質(zhì)瘤的亞型進(jìn)行分類,獲得了80%~91.7%的準(zhǔn)確率。與常規(guī)核磁圖像相比,灌注加權(quán)成像在檢查腫瘤與腦組織血管網(wǎng)絡(luò)的關(guān)系上存在著明顯的優(yōu)勢(shì)。
大量研究表明,彌漫性膠質(zhì)瘤在不同分子亞型中表現(xiàn)出不同的血管系統(tǒng)和代謝模式[18-19]。IDH野生型膠質(zhì)瘤患者的相對(duì)腦血容量(CBV)較突變型顯著升高[10,20];而在IDH突變型膠質(zhì)瘤中,1p/19q非共缺失型膠質(zhì)瘤患者的腦血容量較共缺失型則降低[21]。而彌漫性膠質(zhì)瘤在腫瘤初生長(zhǎng)時(shí)就開始聚集大量微血管網(wǎng)絡(luò),更進(jìn)一步說(shuō)明血流灌注與彌漫性膠質(zhì)瘤密切相關(guān)。由上不難發(fā)現(xiàn),灌注參數(shù)在預(yù)測(cè)膠質(zhì)瘤分子生物標(biāo)志物中擁有巨大潛力[10,12,20-22]。以往的研究主要是通過(guò)CBV的半定量分析或直方圖分析進(jìn)行單個(gè)基因的預(yù)測(cè),無(wú)法納入完整的灌注圖像信息。本研究根據(jù)2021年WHO的分類,通過(guò)整合4個(gè)灌注參數(shù)圖,利用機(jī)器學(xué)習(xí)提取特征后開發(fā)并驗(yàn)證了1個(gè)影像組學(xué)模型來(lái)預(yù)測(cè)成人型彌漫性膠質(zhì)瘤的分子分型,并取得了預(yù)期的效果。
本研究模型對(duì)IDH野生型膠質(zhì)瘤的預(yù)測(cè)結(jié)果準(zhǔn)確性較高,其原因?yàn)镮DH野生型膠質(zhì)瘤的血管系統(tǒng)與突變型在分子上有所區(qū)別,導(dǎo)致了IDH野生型膠質(zhì)瘤具有不同的血管生成譜[18]。值得注意的是,表2顯示大多數(shù)特征都是CBV派生的,圖3中對(duì)應(yīng)的Gini指數(shù)值也偏高。這一結(jié)果可能與CBV間接反映了腫瘤內(nèi)血管新生程度有關(guān)[19]。同時(shí),提取自CBF、MTT和TTP的特征也有助于影像組學(xué)模型的預(yù)測(cè)。圖3中可見(jiàn)CBF衍生的f1紋理特征在區(qū)別IDH野生型膠質(zhì)瘤和IDH突變型方面具有優(yōu)越的意義。Yamashita等[13]的研究表明,與突變型患者比較,IDH野生型患者的CBF顯著增加。盡管如此,生物學(xué)原理仍需進(jìn)一步研究闡明,以支持我們的發(fā)現(xiàn)。之前的一項(xiàng)研究發(fā)現(xiàn),量化局部圖像模式和全腫瘤體積內(nèi)信號(hào)強(qiáng)度不均勻性的紋理特征是預(yù)測(cè)IDH和1p/19q狀態(tài)最有用的生物標(biāo)志物[17]。已驗(yàn)證了我們模型的發(fā)現(xiàn),13個(gè)放射組學(xué)特征中有7個(gè)是紋理特征。
本研究仍存在一定的局限性:(1)是回顧性的單機(jī)構(gòu)研究設(shè)計(jì),需要更多的多中心數(shù)據(jù)集來(lái)進(jìn)一步獨(dú)立檢驗(yàn)?zāi)P汀?2)對(duì)于標(biāo)準(zhǔn)化圖像,在提取特征之前,雖然我們對(duì)圖像各向同性體素進(jìn)行了歸一化,但大量提取的特征之間仍可能存在細(xì)微差異。(3)應(yīng)利用多組學(xué)數(shù)據(jù)闡述預(yù)測(cè)膠質(zhì)瘤分子亞型的影像組學(xué)特征的生物學(xué)基礎(chǔ),將預(yù)測(cè)模型轉(zhuǎn)化為臨床應(yīng)用。
綜上所述,依托DSC-PWI的先進(jìn)影像組學(xué)模型能夠根據(jù)2021年WHO分類預(yù)測(cè)成人型彌漫性膠質(zhì)瘤的分子亞型,可基于此進(jìn)行早期臨床干預(yù),以提高膠質(zhì)瘤的治療水平。