許廣智 張佳樂 伊西才 魏禮洲 劉衛(wèi)平
【摘要】 目的 建立異檸檬酸脫氫酶(IDH)野生型膠質(zhì)母細(xì)胞瘤生存概率的列線圖模型及隨機(jī)生存森林模型。方法 回顧性分析2017年1月—2020年12月在空軍軍醫(yī)大學(xué)附屬西京醫(yī)院手術(shù)治療的127例IDH野生型膠質(zhì)母細(xì)胞瘤患者臨床資料,進(jìn)行預(yù)后因素分析并建立列線圖模型及隨機(jī)生存森林模型,通過C指數(shù),校準(zhǔn)曲線,決策曲線評(píng)價(jià)模型的區(qū)分度,校準(zhǔn)度以及臨床凈獲益率。結(jié)果 使用Cox比例風(fēng)險(xiǎn)模型進(jìn)行多因素分析發(fā)現(xiàn),患者術(shù)前卡氏功能狀態(tài)評(píng)分(KPS)、是否接受同步放化療、年齡、O6-甲基鳥嘌呤甲基轉(zhuǎn)移酶(MGMT)蛋白表達(dá),是獨(dú)立的預(yù)后因素(P<0.05)。通過Cox回歸模型建立列線圖預(yù)測(cè)模型;通過R軟件建立隨機(jī)生存森林模型,兩個(gè)模型均具有良好的區(qū)分度和校準(zhǔn)度,隨機(jī)生存森林模型的臨床凈獲益優(yōu)于列線圖模型。結(jié)論 建立的列線圖模型及隨機(jī)生存森林模型有助于臨床醫(yī)生判斷患者特定時(shí)間點(diǎn)的生存概率。
【關(guān)鍵詞】 IDH野生型膠質(zhì)母細(xì)胞瘤;列線圖;隨機(jī)生存森林;預(yù)測(cè)模型;MGMT蛋白
【中圖分類號(hào)】 R739.41? 【文獻(xiàn)標(biāo)志碼】 A? 【文章編號(hào)】 1672-7770(2024)03-0280-07
機(jī)器學(xué)習(xí)是近年來的熱點(diǎn)領(lǐng)域,被廣泛應(yīng)用于生存分析中。最早的機(jī)器學(xué)習(xí)方法為生存樹的概念,類似于決策樹,生存樹也是通過樹節(jié)點(diǎn)選擇最佳分割,最大化兩個(gè)節(jié)點(diǎn)的生存差異,通常使用Log-rank檢驗(yàn)作為分裂標(biāo)準(zhǔn)。隨著預(yù)測(cè)模型研究的進(jìn)展,越來越多的預(yù)測(cè)模型被研發(fā)出來,在生存分析中最常用的預(yù)測(cè)模型是列線圖和隨機(jī)生存森林模型[1]。列線圖運(yùn)用于生存分析中,原理是將Cox多因素分析建立的模型進(jìn)行可視化繪制,通過對(duì)各因素分值的結(jié)合,確定個(gè)體發(fā)生某個(gè)臨床事件的概率。其優(yōu)點(diǎn)為可以將連續(xù)變量以及其他影響因素進(jìn)行整合,并可視化地呈現(xiàn)在列線圖中,便于臨床應(yīng)用[2]。列線圖可以分析多種結(jié)局事件,如腫瘤的轉(zhuǎn)移、復(fù)發(fā)、死亡等,應(yīng)用于生存分析中主要預(yù)測(cè)復(fù)發(fā)概率、生存概率等。列線圖雖然簡(jiǎn)單實(shí)用,但由于其必須滿足比例風(fēng)險(xiǎn)假定,即假設(shè)某個(gè)事件發(fā)生率不隨時(shí)間變化而變化,并且由于技術(shù)的進(jìn)步以及實(shí)際情況,部分事件發(fā)生率會(huì)隨著時(shí)間改變,會(huì)影響列線圖的準(zhǔn)確性,因此基于Cox回歸分析的列線圖預(yù)測(cè)模型應(yīng)用有一定限制[3]。隨機(jī)生存森林(random survival forest,RSF)是2008年首次提出的機(jī)器學(xué)習(xí)方法,是生存樹與隨機(jī)森林的結(jié)合。其特點(diǎn)為不要求數(shù)據(jù)滿足對(duì)數(shù)線性假定以及比例風(fēng)險(xiǎn)假定,并且其預(yù)測(cè)準(zhǔn)確度不低于Cox比例風(fēng)險(xiǎn)模型,可用于高維數(shù)據(jù)的數(shù)據(jù)篩選。本研究通過納入2017年1月—2020年12月在空軍軍醫(yī)大學(xué)附屬西京醫(yī)院神經(jīng)外科手術(shù)治療的127例異檸檬酸脫氫酶(isocitric dehydrogenase,IDH)野生型膠質(zhì)母細(xì)胞瘤患者,構(gòu)建生存概率的列線圖以及隨機(jī)生存森林模型,預(yù)測(cè)患者不同時(shí)間點(diǎn)的生存概率,并通過區(qū)分度、校準(zhǔn)度、決策曲線評(píng)價(jià)兩種方法的適用性。
1 資料與方法
1.1 一般資料 共納入127例WHO Ⅳ級(jí)IDH野生型膠質(zhì)母細(xì)胞瘤患者,其中男74例,女53例;年齡20~79歲,中位年齡55歲(四分位數(shù)間距為17);術(shù)前卡氏功能狀態(tài)評(píng)分(Karnofsky performance scale,KPS)評(píng)分≥70分的95例(74.8%)。納入標(biāo)準(zhǔn):(1)所有患者首次入院,且由病理科專家診斷為WHO Ⅳ級(jí)IDH野生型膠質(zhì)母細(xì)胞瘤;(2)術(shù)前無嚴(yán)重的心肝腎等系統(tǒng)異常;(3)所有患者知情同意,并簽署知情同意書;(4)所有患者均行腫瘤切除術(shù)。排除標(biāo)準(zhǔn):(1)復(fù)發(fā)型或曾經(jīng)確診為低級(jí)別膠質(zhì)瘤的繼發(fā)性膠質(zhì)瘤;(2)臨床資料不完整或病理資料不全;(3)妊娠或者哺乳期女性;(4)腫瘤病理標(biāo)本不符合檢測(cè)要求,隨訪(聯(lián)系人)資料不全的患者;(5)術(shù)后有嚴(yán)重的手術(shù)并發(fā)癥或者嚴(yán)重的不良反應(yīng)。本研究已通過西京醫(yī)院倫理委員會(huì)批準(zhǔn)(批準(zhǔn)號(hào):XJLL-KY20222013)。
1.2 切除程度評(píng)價(jià)及隨訪方法 通過手術(shù)記錄,術(shù)后影像學(xué)資料來判定切除程度。通過電話隨訪的方式對(duì)患者進(jìn)行出院后隨訪。總生存期定義為手術(shù)日至患者因IDH野生型膠質(zhì)母細(xì)胞瘤死亡或隨訪截止時(shí)間。平均隨訪時(shí)間為18.2個(gè)月。
1.3 統(tǒng)計(jì)學(xué)方法 使用R4.2.1軟件及SPSS 23.0軟件對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。使用R軟件的survival包建立Cox比例風(fēng)險(xiǎn)模型,多因素Cox比例風(fēng)險(xiǎn)模型采用單因素Cox分析中有意義的變量(P<0.05),并對(duì)多因素Cox比例風(fēng)險(xiǎn)模型進(jìn)行比例風(fēng)險(xiǎn)(proportional hazards,PH)假定的檢驗(yàn),檢驗(yàn)方法為使用R的Cox.zph函數(shù),對(duì)Cox回歸模型的有效性進(jìn)行Schoenfeld殘差的趨勢(shì)檢驗(yàn),檢驗(yàn)納入的變量是否P>0.05并繪制可視化曲線。計(jì)算風(fēng)險(xiǎn)比(hazard ratio,HR)及其相應(yīng)的95%置信區(qū)間(95% confidence interval,95%CI)。以P<0.05認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。
1.3.1 隨機(jī)生存森林的構(gòu)建 使用R4.2.1進(jìn)行統(tǒng)計(jì)分析。利用randomForestSRC包,以200棵樹為基礎(chǔ)構(gòu)建隨機(jī)生存森林模型?;谑鼓P头€(wěn)定的ntree納入Cox單因素分析有意義的變量。使用網(wǎng)格搜索法(grid search)計(jì)算各種組合的袋外錯(cuò)誤率,將能夠達(dá)到最低袋外錯(cuò)誤率的mtry和nodesize篩選出來,并構(gòu)建隨機(jī)生存森林模型。再計(jì)算各變量的最小深度以及預(yù)測(cè)其重要性。
1.3.2 列線圖預(yù)測(cè)模型的構(gòu)建 使用R4.2.1軟件的survival和rms包,利用內(nèi)容二中構(gòu)建的Cox多因素模型的β系數(shù)絕對(duì)值進(jìn)行排序,然后將所有變量按照各自的β系數(shù)絕對(duì)值與β系數(shù)最大的系數(shù)絕對(duì)值相比,換算成相應(yīng)分值,用rms包將各變量以其分值以平行線的形式繪制在同一個(gè)坐標(biāo)系中,制作列線圖。在列線圖下方制作不同時(shí)間節(jié)點(diǎn)的總刻度所對(duì)應(yīng)的預(yù)測(cè)生存率,可以從一定程度上預(yù)測(cè)個(gè)體在IDH野生型膠質(zhì)母細(xì)胞瘤術(shù)后的生存概率。
1.3.3 預(yù)測(cè)模型的評(píng)價(jià) 使用1 000次Bootstrap重抽樣法,即自舉法進(jìn)行內(nèi)部驗(yàn)證。通過一致性指數(shù)(concordance index,C-index)評(píng)價(jià)區(qū)分度,即將不同的患者區(qū)分開的能力,利用pec包中的cindex函數(shù)計(jì)算6個(gè)月、12個(gè)月、24個(gè)月的C指數(shù)(一致性指數(shù))及校正C指數(shù)。rms包中的calibrate函數(shù)繪制校準(zhǔn)曲線來評(píng)定模型的校準(zhǔn)度。利用stdca.R程序繪制6個(gè)月、12個(gè)月、24個(gè)月的臨床決策曲線(decision curve analysis,DCA),其可以預(yù)測(cè)模型的臨床有效性,凈收益高,認(rèn)為臨床效用更好,預(yù)測(cè)模型越遠(yuǎn)離兩條極端線,其人群凈獲益更高。
2 結(jié) 果
2.1 臨床特征 腫瘤相關(guān)指標(biāo)顯示,術(shù)中完全切除腫瘤有60例(47.21%),腫瘤未全切有67例(52.89%),術(shù)后接受同步放化療有72例(56.7%)、僅接受化療為9例(7.09%)、僅接受放療為3例(2.36%)、接受放化療治療但并未同步進(jìn)行2例(1.57%)、沒有接受放化療41例(32.28%)。ATRX陽性患者共104例,占全部患者的81.9%;Ki-67陽性患者共118例,占全部患者的82.7%;O6-甲基鳥嘌呤甲基轉(zhuǎn)移酶(O6-methylguanine-DNA methyltransferase,MGMT)陽性患者共41例,占全部患者的32.3%;P53陽性患者共28例,占全部患者的22.0%。見表1。截至2022年8月5日因膠質(zhì)瘤而死亡的為107例(84.3%),平均生存期為19.57個(gè)月,中位生存期為14.5(95%CI=12.7~16.3)個(gè)月。
2.2 IDH野生型膠質(zhì)母細(xì)胞瘤Cox比例風(fēng)險(xiǎn)模型分析結(jié)果 單因素Cox回歸分析顯示年齡越低、KPS指數(shù)≥70、MGMT表達(dá)陰性、接受同步放化療為總生存期(overall survival,OS)的保護(hù)因素(P<0.05)。通過R的cox.zph函數(shù),對(duì)Cox比例風(fēng)險(xiǎn)模型進(jìn)行Schoenfeld殘差趨勢(shì)檢驗(yàn)。對(duì)上述Cox單因素模型有意義的變量,通過ggcoxzph函數(shù)進(jìn)行可視化處理??芍挲g、KPS評(píng)分、MGMT蛋白表達(dá)、是否接受放化療這四個(gè)因素不因?yàn)闀r(shí)間的改變而改變發(fā)生率,因此符合PH假定可以納入Cox多因素分析中。
將上述單因素Cox分析中有意義的因素納入Cox多因素分析中。使用R語言的coxph函數(shù),通過逐步回歸法,以死亡為結(jié)局變量、OS為時(shí)間變量進(jìn)行分析。結(jié)果顯示患者年齡、術(shù)前KPS評(píng)分、是否接受同步放化療、MGMT蛋白表達(dá),是總生存期的獨(dú)立影響因素(P<0.05)。見表2。
2.2.1 建立隨機(jī)生存森林預(yù)測(cè)模型 將年齡、是否接受同步放化療、KPS指數(shù)以及MGMT蛋白表達(dá)作為自變量,死亡作為結(jié)局事件,當(dāng)ntree取200時(shí),模型表現(xiàn)趨于穩(wěn)定,計(jì)算時(shí)間適中。當(dāng)mtry取2、nodesize取15時(shí),袋外錯(cuò)誤率達(dá)到最低。各變量對(duì)IDH野生型膠質(zhì)母細(xì)胞瘤的重要性依次為是否接受放化療、年齡、KPS指數(shù)以及MGMT蛋白表達(dá)(圖1)。
2.2.2 隨機(jī)生存森林模型預(yù)測(cè)的前10個(gè)體的生存曲線 使用R語言的matplot函數(shù),繪制數(shù)據(jù)中前10個(gè)體的生存曲線。隨機(jī)生存森林為不可視化的預(yù)測(cè)模型,對(duì)于個(gè)體患者的預(yù)測(cè)是通過將個(gè)體患者的年齡、KPS指數(shù)、是否接受放化療、MGMT蛋白表達(dá)輸入R中進(jìn)行個(gè)體患者的生存曲線繪制(圖2)。
2.2.3 隨機(jī)生存森林模型評(píng)價(jià) 隨機(jī)生存森林在模型構(gòu)建過程中可以形成帶外錯(cuò)誤率,即對(duì)患者預(yù)后的錯(cuò)分率,本模型袋外錯(cuò)誤率為37.45%。隨機(jī)生存森林模型在6個(gè)月、12個(gè)月、24個(gè)月的 Bootstrap校正C指數(shù)分別為0.724、0.696、0.700。繪制隨機(jī)生存森林模型的Bootstrap法重抽樣1 000次驗(yàn)證校準(zhǔn)曲線,表明預(yù)測(cè)模型的校準(zhǔn)度較好,即預(yù)測(cè)生存率和實(shí)際生存率接近(圖3)。
2.3 建立列線圖預(yù)測(cè)模型 根據(jù)Cox多因素回歸分析中的獨(dú)立預(yù)后因素年齡、KPS評(píng)分、是否接受放化療、MGMT蛋白表達(dá)構(gòu)建列線圖。用這四個(gè)變量在Cox多因素回歸方程中的β系數(shù),使用R語言的rms包構(gòu)建列線圖(圖4)。例如1例48歲患者、接受了放化療、入院KPS評(píng)分小于70分、MGMT蛋白表達(dá)陽性,則對(duì)該患者的各項(xiàng)評(píng)分相加,47+65+70+48=230,則預(yù)測(cè)該患者6個(gè)月生存概率為73%、12個(gè)月生存概率為30%、24個(gè)月生存概率小于10%。
2.4 列線圖的內(nèi)部驗(yàn)證 通過Bootstrap重抽樣1 000次計(jì)算出三個(gè)點(diǎn)的置信區(qū)間作為三條豎線,繪制得到校準(zhǔn)曲線。模型經(jīng)過1 000次重抽樣內(nèi)部驗(yàn)證校準(zhǔn)后,其校準(zhǔn)曲線接近45°角,表明預(yù)測(cè)模型的校準(zhǔn)度較好,即預(yù)測(cè)生存率和實(shí)際生存率接近(圖5)。列線圖模型在6個(gè)月、12個(gè)月、24個(gè)月的Bootstrap重抽樣校正C指數(shù)分別為0.701、0.647、0.653,表明模型具有良好的區(qū)分能力。
2.5 決策曲線 繪制6個(gè)月、12個(gè)月、24個(gè)月的隨機(jī)生存森林模型與列線圖模型的決策曲線用以評(píng)估兩個(gè)模型的臨床凈獲益。在三個(gè)時(shí)間節(jié)點(diǎn)中,隨機(jī)生存森林模型與列線圖模型的曲線與兩條極端曲線較遠(yuǎn),因此使用兩種預(yù)測(cè)模型的臨床凈獲益率較高(圖6)。在12個(gè)月、24個(gè)月的DCA曲線中,隨機(jī)生存森林的曲線相對(duì)列線圖模型,距離兩條極端曲線更遠(yuǎn),因此在這兩個(gè)時(shí)間節(jié)點(diǎn),隨機(jī)生存森林模型的臨床凈獲益優(yōu)于列線圖模型。
3 討 論
IDH突變的WHO Ⅳ級(jí)成人彌漫性膠質(zhì)瘤中位生存期為39.4個(gè)月,遠(yuǎn)高于既往報(bào)道的WHO Ⅳ級(jí)成人彌漫性膠質(zhì)瘤的平均生存時(shí)間14.6個(gè)月[4]。因此2021年新版的中樞神經(jīng)系統(tǒng)分類將成人彌漫性膠質(zhì)瘤分成IDH突變型以及IDH野生型兩類,本研究著重分析IDH野生型膠質(zhì)母細(xì)胞瘤[5]。IDH野生型膠質(zhì)母細(xì)胞瘤作為一種新的分類方式,其患者人口學(xué)特征、臨床特征以及免疫組化標(biāo)志物的情況尚待總結(jié)分析[6]。
單因素及多因素預(yù)后分析表明,在IDH野生型膠質(zhì)母細(xì)胞瘤中,術(shù)前KPS評(píng)分、年齡、是否接受同步放化療均為獨(dú)立影響因素,而MGMT蛋白表達(dá),是分子標(biāo)志物中的獨(dú)立影響因素(P<0.05)。這個(gè)結(jié)果與WHO Ⅳ級(jí)成人彌漫性膠質(zhì)瘤的Cox回歸分析結(jié)果相似[7]。年齡是IDH野生型膠質(zhì)母細(xì)胞瘤的一個(gè)很重要的預(yù)后因素。由于老年患者伴隨的循環(huán)系統(tǒng)疾病、衰老的內(nèi)臟功能以及能量?jī)?chǔ)備等原因,導(dǎo)致老年患者并非標(biāo)準(zhǔn)治療方案的最佳適用者,因此部分老年患者無法接受手術(shù)或者放化療治療,這也與老年患者預(yù)后差有關(guān)。是否接受了同步放化療治療是IDH野生型膠質(zhì)母細(xì)胞瘤一個(gè)重要預(yù)后因素。有研究表明,在年齡大于65歲的高齡人群中,聯(lián)合放化療相對(duì)于單獨(dú)放療生存收益更高[8]。手術(shù)切除程度也是一個(gè)很重要的預(yù)后指標(biāo),可以減輕占位效應(yīng)、獲得病理標(biāo)本,并且可以很好地減少體內(nèi)腫瘤細(xì)胞數(shù)量。在WHO Ⅳ級(jí)成人彌漫性膠質(zhì)瘤中,單純的腫瘤切除術(shù)可以使生存期增加約6個(gè)月[9]。KPS評(píng)分是一個(gè)與預(yù)后關(guān)系密切的指標(biāo),其評(píng)分越高,患者健康情況越好、對(duì)治療的耐受性更高、更能接受完整的標(biāo)準(zhǔn)化治療。MGMT蛋白是一種修復(fù)蛋白,當(dāng)MGMT蛋白不足時(shí)會(huì)導(dǎo)致DNA修復(fù)過程受到影響,導(dǎo)致未修復(fù)的DNA受到損傷。既往研究表明,MGMT蛋白的低表達(dá)是WHO Ⅳ級(jí)成人彌漫性膠質(zhì)瘤的獨(dú)立保護(hù)因素[1012],同時(shí),本研究結(jié)果證實(shí)MGMT蛋白低表達(dá)在WHO Ⅳ級(jí)IDH野生型膠質(zhì)母細(xì)胞瘤中仍然是獨(dú)立的保護(hù)因素。
機(jī)器學(xué)習(xí)作為一種新興的熱門學(xué)科,在醫(yī)學(xué)統(tǒng)計(jì)領(lǐng)域發(fā)揮了重要的作用,可以使用不同的算法提高模型的預(yù)測(cè)能力。在傳統(tǒng)的生存分析研究中,Kaplan-Meier法以及Cox比例風(fēng)險(xiǎn)模型是最常見的方法。隨著對(duì)預(yù)測(cè)模型的研究深入,將預(yù)測(cè)模型以及生存分析相結(jié)合,提出了各種不同的預(yù)測(cè)模型,包括支持向量機(jī)、決策樹、神經(jīng)網(wǎng)絡(luò)等。其中列線圖與隨機(jī)生存森林是最常見的兩種方法。
列線圖可以將多種預(yù)后相關(guān)因素整合,很便捷地將研究結(jié)果可視化,在膠質(zhì)瘤預(yù)后分析中有很重要的作用[13]。其通過構(gòu)建Cox多因素比例風(fēng)險(xiǎn)模型,根據(jù)各個(gè)因素的回歸系數(shù)大小來評(píng)價(jià)其對(duì)結(jié)局的貢獻(xiàn)程度,通過對(duì)各個(gè)因素賦值,再計(jì)算其相加的總和,來計(jì)算出結(jié)局事件的發(fā)生概率,即生存概率[6]。列線圖在預(yù)測(cè)得到的生存概率與實(shí)際生存概率之間有一定的差異,但其在可視化個(gè)體預(yù)測(cè)上具有很重要的意義,因此常被用于臨床實(shí)踐中。在WHO Ⅳ級(jí)成人彌漫性膠質(zhì)瘤的預(yù)測(cè)模型研究中,確定與預(yù)后相關(guān)的變量是非常重要的過程[14];通常要考慮變量的臨床與統(tǒng)計(jì)意義,其中最常見的臨床特征包括年齡、KPS評(píng)分、接受的治療、手術(shù)切除程度等,而其中最常見的分子標(biāo)志物為IDH突變狀態(tài)以及MGMT啟動(dòng)子甲基化狀態(tài)。IDH野生型膠質(zhì)母細(xì)胞瘤作為一種預(yù)后很差的腫瘤,對(duì)于新診斷的患者及其家屬而言,了解其預(yù)后不同時(shí)間點(diǎn)的生存概率,有助于患者家屬及醫(yī)生共同選擇更合適的治療方案。列線圖由于其便捷性,可以簡(jiǎn)單計(jì)算出6個(gè)月、12個(gè)月、24個(gè)月的生存概率,對(duì)患者及家屬直觀了解預(yù)后有很大幫助。對(duì)于患者而言,了解生存概率有助于緩解對(duì)于疾病的恐懼,也有助于制定相應(yīng)的應(yīng)對(duì)策略。
隨機(jī)森林是于2001年提出的基于決策樹的有監(jiān)督學(xué)習(xí)方法[15], 隨機(jī)生存森林于2008年被提出,是基于隨機(jī)森林的算法[16]。隨機(jī)生存森林是隨機(jī)森林的擴(kuò)展,是完全非參數(shù)模型,能評(píng)價(jià)變量間的復(fù)雜影響,無需要限制性假設(shè),并能計(jì)算出變量的重要性。多數(shù)情況下隨機(jī)生存森林與經(jīng)典Cox比例風(fēng)險(xiǎn)模型相比性能更優(yōu)良。隨機(jī)生存森林是傳統(tǒng)的二元決策樹的拓展。隨機(jī)生存森林通過自舉法(Bootstrap)對(duì)樣本和變量進(jìn)行抽樣生成大量的決策樹。對(duì)每個(gè)樣本(觀測(cè)對(duì)象)來說,所有決策樹依次對(duì)其進(jìn)行預(yù)測(cè)。隨機(jī)生存森林可以處理大量輸入變量,并且可以評(píng)估變量的重要性。其造模時(shí)使用無偏估計(jì),模型泛化能力強(qiáng),當(dāng)數(shù)據(jù)缺失較多時(shí),仍可以維持一定的精度[17]。
傳統(tǒng)的區(qū)分能力和校準(zhǔn)能力不能判斷使用一個(gè)模型做臨床決策是否有益,或者不同模型之間哪一個(gè)會(huì)更有臨床意義,尤其是一個(gè)模型區(qū)分度高,一個(gè)模型準(zhǔn)確度高的情況下[18]。決策曲線可以判斷一個(gè)模型是否值得使用,當(dāng)遇到假陽性或者假陰性的情況時(shí),既然兩種情況都不能避免,那應(yīng)該找出一個(gè)得到凈收益的方法,通過計(jì)算風(fēng)險(xiǎn)閾值的真陽性減去假陽性得出不同風(fēng)險(xiǎn)閾值概率的凈收益[19]。DCA可以預(yù)測(cè)模型的臨床有效性,凈收益高,被認(rèn)為其臨床效用更好[20]。
本研究通過Cox比例風(fēng)險(xiǎn)模型的基礎(chǔ)上繪制列線圖,用來判斷具有不同年齡、KPS評(píng)分、接受放化療方式以及MGMT蛋白表達(dá)的患者,其6個(gè)月、12個(gè)月、24個(gè)月的生存概率;同時(shí),通過R軟件構(gòu)建隨機(jī)生存森林模型,用來判斷不同時(shí)間點(diǎn)患者的生存概率。通過Bootstrap法重抽樣1 000次驗(yàn)證預(yù)測(cè)模型的區(qū)分度與校準(zhǔn)度。隨機(jī)生存森林模型與列線圖預(yù)測(cè)模型相比,具有更好的臨床凈獲益率,并且隨機(jī)生存森林還具有因素篩選及因素重要性排序的功能。但列線圖具有操作簡(jiǎn)便、不需要將變量輸入軟件的特點(diǎn),因此也有很高的實(shí)用性。
與其他IDH野生型膠質(zhì)母細(xì)胞瘤的預(yù)測(cè)模型研究相比,本研究主要納入指標(biāo)為預(yù)后相關(guān)臨床因素及免疫組化檢測(cè)的蛋白表達(dá)結(jié)果。本研究發(fā)現(xiàn)ATRX蛋白表達(dá)、Ki-67蛋白表達(dá)、P53蛋白表達(dá)這3個(gè)在成人彌漫性膠質(zhì)瘤中常用的分子標(biāo)志物,在IDH野生型膠質(zhì)母細(xì)胞瘤中與預(yù)后不相關(guān)。本研究還證實(shí)了MGMT蛋白是IDH野生型膠質(zhì)母細(xì)胞瘤的獨(dú)立預(yù)后因素,并將其納入預(yù)測(cè)模型中。MGMT蛋白表達(dá)檢測(cè)迅速并且價(jià)格低廉,因此在臨床運(yùn)用中價(jià)值很高,包含MGMT蛋白表達(dá)的預(yù)測(cè)模型更切合實(shí)際臨床工作。
本研究的局限性為單中心研究,并且IDH野生型膠質(zhì)母細(xì)胞瘤是一種發(fā)病率較低的惡性腫瘤[21],因此樣本量有一定局限,這與兩個(gè)模型的C指數(shù)較低,隨機(jī)生存森林模型袋外錯(cuò)誤率較高有關(guān),并且本研究沒有探究MGMT蛋白表達(dá)與MGMT啟動(dòng)子甲基化的關(guān)系,后續(xù)研究會(huì)考慮納入更多因素,納入臨床多中心相關(guān)數(shù)據(jù)使模型更加完善。本研究納入的臨床特征是常見與預(yù)后相關(guān)的特征,后續(xù)研究會(huì)納入更多臨床特征,以研究臨床特征與蛋白表達(dá)之間相關(guān)性。
利益沖突:所有作者均聲明不存在利益沖突。
[參 ?考 ??文 ??獻(xiàn)]
[1] Mijderwijk HJ,Nieboer D,Incekara F,et al.Development and external validation of a clinical prediction model for survival in patients with IDH wild-type glioblastoma[J].J Neurosurg,2022:110.
[2] 羅治文,陳曉,張業(yè)繁,等.機(jī)器學(xué)習(xí)算法和Cox列線圖在肝細(xì)胞癌術(shù)后生存預(yù)測(cè)中的應(yīng)用價(jià)值[J].中華消化外科雜志,2020,19(2):166178.
Luo ZW,Chen X,Zhang YF,et al.Application value of machine learning algorithms and Cox nomogram in the survival prediction of hepatocellular carcinoma after resection[J].Chin J Dig Surg,2020,19(2):166178.
[3] 陳金鳳.生存分析在隨訪研究中的應(yīng)用[J].實(shí)用老年醫(yī)學(xué),2021,35(9):896899.
Chen JF.Application of survival analysis in follow-up study[J].Pract Geriatr,2021,35(9):896899.
[4] Wong QH,Li KK,Wang WW,et al.Molecular landscape of IDH-mutant primary astrocytoma Grade IV/glioblastomas[J].Mod Pathol,2021,34(7):12451260.
[5] Louis DN,Perry A,Wesseling P,et al.The 2021 WHO classification of tumors of the central nervous system:a summary[J].Neuro Oncol,2021,23(8):12311251.
[6] Alzial G,Renoult O,Paris F,et al.Wild-type isocitrate dehydrogenase under the spotlight in glioblastoma[J].Oncogene,2022,41(5):613621.
[7] Gülten G,Yaln N,Baltalarl B,et al.The importance of IDH1,ATRX and WT-1 mutations in glioblastoma[J].Pol J Pathol,2020,71(2):127137.
[8] Perry JR,Laperriere N,OCallaghan CJ,et al.Short-course radiation plus temozolomide in elderly patients with glioblastoma[J].N Engl J Med,2017,376(11):10271037.
[9] Rammeloo E,Schouten JW,Krikour K,et al.Preoperative assessment of eloquence in neurosurgery:a systematic review[J].J Neurooncol,2023,165(3):413430.
[10]Butler M,Pongor L,Su YT,et al.MGMT status as a clinical biomarker in glioblastoma[J].Trends Cancer,2020,6(5):380391.
[11]許廣智,張佳樂,伊西才,等.IDH野生型膠質(zhì)母細(xì)胞瘤患者預(yù)后影響因素分析[J].臨床神經(jīng)外科雜志,2022,19(2):130134.
Xu GZ,Zhang JL,Yi XC,et al.Prognostic factors of IDH wild-type glioblastoma patients[J].J Clin Neurosurg,2022,19(2):130134.
[12]Castresana JS,Meléndez B.Glioblastoma biology,genetics and possible therapies[J].Cells,2023,12(16):2063.
[13]Jekel L,Brim WR,von Reppert M,et al.Machine learning applications for differentiation of glioma from brain metastasis-a systematic review[J].Cancers,2022,14(6):1369.
[14]Zheng H,Yan TN,Han YS,et al.Nomograms for prognostic risk assessment in glioblastoma multiforme:Applications and limitations[J].Clin Genet,2022,102(5):359368.
[15]Sylman JL,Mitrugno A,Atallah M,et al.The predictive value of inflammation-related peripheral blood measurements in cancer staging and prognosis[J].Front Oncol,2018,8:78.
[16]Kim TG,Park W,Kim H,et al.Baseline neutrophil-lymphocyte ratio and platelet-lymphocyte ratio in rectal cancer patients following neoadjuvant chemoradiotherapy[J].Tumori,2019,105(5):434440.
[17]李淼.隨機(jī)生存森林在不同維度肺癌患者預(yù)后預(yù)測(cè)中的應(yīng)用[D].太原:山西醫(yī)科大學(xué),2021.
Li M.Application ofrandom survival forest in prognosisprediction of lung cancer patients with different dimensions[D].Tai Yuan:SHANXI MEDICAL UNIVERSITY,2021.
[18]Zhang Z,Jin ZP,Liu DY,et al.A nomogram predicts individual prognosis in patients with newly diagnosed glioblastoma by integrating the extent of resection of non-enhancing tumors[J].Front Oncol,2020,10:598965.
[19]Van Calster B,Wynants L,Verbeek JFM,et al.Reporting and interpreting decision curve analysis:a guide for investigators[J].Eur Urol,2018,74(6):796804.
[20]Vickers AJ,van Calster B,Steyerberg EW.A simple,step-by-step guide to interpreting decision curve analysis[J].Diagn Progn Res,2019,3:18.
[21]Ostrom QT,Cioffi G,Gittleman H,et al.CBTRUS statistical report:primary brain and other central nervous system tumors diagnosed in the United States in 2012—2016[J].Neuro Oncol,2019,21(Suppl 5):v1v100.