沈陽 秦建曄 孫博文
摘 要 目的:以免疫相關(guān)基因的生物信息學(xué)分析為基礎(chǔ),構(gòu)建頭頸部鱗癌預(yù)后模型。方法:從癌癥基因組圖譜(the cancer genome atlas,TCGA)下載頭頸部鱗癌患者的基因表達(dá)數(shù)據(jù)和臨床數(shù)據(jù),從ImmPort數(shù)據(jù)庫下載免疫相關(guān)基因,通過單因素Cox回歸分析、LASSO回歸分析和多因素Cox回歸分析得到相應(yīng)預(yù)后基因并構(gòu)建預(yù)后模型。運(yùn)用KaplanMeier生存分析、受試者工作特征曲線(receiver operating characteristic curve,ROC)進(jìn)行模型的內(nèi)、外部評價(jià)。采用多因素Cox回歸鑒定模型能否作為獨(dú)立預(yù)后因子。通過諾莫圖和決策曲線評價(jià)模型的精確度和有效性。結(jié)果:單因素Cox回歸分析初步得到162個與預(yù)后相關(guān)的免疫基因,LASSO回歸進(jìn)一步縮減到24個基因,多因素Cox回歸分析最終確認(rèn)11個,構(gòu)建預(yù)后模型。通過Kaplan-Meier生存分析發(fā)現(xiàn)在訓(xùn)練集與測試集中,低風(fēng)險(xiǎn)組生存時(shí)間遠(yuǎn)大于高風(fēng)險(xiǎn)組(P<0.001)。且預(yù)后模型的1、2、3年的ROC曲線下面積AUC較大。多因素Cox回歸分析發(fā)現(xiàn)模型的風(fēng)險(xiǎn)比(HR)=1.3、95% CI=1.289~1.508、P<0.001。經(jīng)決策曲線驗(yàn)證預(yù)后模型與分級、分期、年齡、性別一起聯(lián)用時(shí),患者凈收益最大。校正曲線得知3、5年的C指數(shù)均為0.705。結(jié)論:成功建立了11個免疫相關(guān)基因的頭頸部鱗癌預(yù)后模型,該模型能較好的預(yù)測患者的預(yù)后情況。
關(guān)鍵詞 頭頸部鱗癌;隨機(jī)生存森林;預(yù)后模型;免疫治療;腫瘤微環(huán)境
中圖分類號:R73 文獻(xiàn)標(biāo)志碼:A 文章編號:1006-1533(2021)24-0023-05
Construction of a prognostic mode for head and neck squamous cell carcinoma based on bioinformatic analysis of immune-related genes
SHEN Yang1, QIN Jianye2, SUN Bowen2,3(1.Graduate School of Shanghai University of Traditional Chinese Medicine, Shanghai 201203, China; 2. Shanghai Health and Medical
College, Shanghai 200120, China; 3. Shanghai University of Traditional Chinese Medicine, Shanghai 201203, China)
ABSTRACT Objective: To construct a prognosis mode for head and neck squamous cell carcinoma based on the bioinformatics analysis of immune-related genes. Methods: Gene expression data and clinical data of patients with head and neck squamous cell carcinoma were downloaded from the cancer genome atlas(TCGA), and the immune-related genes were downloaded from the ImmPort database, by univariate Cox regression analysis, Lasso regression analysis and multivariate Cox regression analysis, the corresponding prognostic genes were obtained and the prognostic mode was constructed. Kaplan Meier survival analysis and receiver operating characteristic curve(ROC) were used for internal and external evaluation of the mode. Multivariate Cox regression was used to identify whether the mode could be used as an independent prognostic factor. The accuracy and effectiveness of the mode were evaluated through the Nomo diagram and the decision curve. Results: Univariate Cox regression analysis initially obtained 162 immune genes related to prognosis, LASSO regression further reduced to 24 genes, and multivariate Cox regression analysis finally confirmed 11 immune genes to construct the prognostic mode. Kaplan-Meier survival analysis found that in the training set and test set, the survival time of the low-risk group was significantly longer than that of the high-risk group(P<0.001). Moreover, the area AUC under the ROC curve of 1, 2 and 3 years in the prognosis mode was large. Multivariate Cox regression analysis showed that the risk ratio(HR)=1.3, 95% CI=1.289~1.508, P<0.001. The decision curve verified that when the prognostic mode was combined with classification, staging, age, and gender, the patient’s net benefit was the largest. The correction curve showed that the C index in 3 and 5 years was 0.705. Conclusion: The prognosis mode for head and neck squamous cell carcinoma with 11 immune related genes is successfully established, which can better predict the prognosis of patients.
KEY WORDS head and neck squamous cell carcinoma; random survival forest; prognostic mode; immunotherapy; tumor microenvironment
頭頸部鱗癌是全世界范圍內(nèi)常見的惡性腫瘤之一,通常其生存時(shí)間的中位值在10~13個月之間,5年總體生存率在50%左右,預(yù)后較差[1]。當(dāng)今,頭頸部鱗癌治療的核心問題之一是對頭頸部鱗癌患者預(yù)后情況的預(yù)測,因此有必要開發(fā)出一種準(zhǔn)確的預(yù)測模型來指導(dǎo)治療。
腫瘤微環(huán)境中的免疫反應(yīng)不僅決定了腫瘤的生長行為,還影響著腫瘤患者的預(yù)后情況。其中,免疫逃逸已經(jīng)有大量的文獻(xiàn)報(bào)道,特別是關(guān)于PD-1/PD-L1的研究[2-3]。2016年FDA批準(zhǔn)PD-1單抗用于鉑類治療失敗的復(fù)發(fā)和(或)轉(zhuǎn)移性頭頸部鱗癌的治療[4]。預(yù)測腫瘤患者預(yù)后情況通常有兩種方法:(1)單分子的標(biāo)志物如人乳頭瘤病毒(HPV)來預(yù)測頭頸部鱗癌患者的預(yù)后;(2)利用與患者相關(guān)的預(yù)后基因構(gòu)建的模型來預(yù)測患者預(yù)后[5-6]。基于此,通過分析癌癥基因組圖譜(the cancer genome atlas,TCGA)的頭頸部鱗癌的基因表達(dá)數(shù)據(jù),構(gòu)建并驗(yàn)證免疫相關(guān)基因的預(yù)后模型,從而預(yù)測患者預(yù)后情況,解決相同臨床分期但結(jié)局不同的問題。
1.1 數(shù)據(jù)收集與處理
從TCGA中下載頭頸部鱗癌的基因表達(dá)數(shù)據(jù)以及臨床信息。以TCGA數(shù)據(jù)為訓(xùn)練集構(gòu)建預(yù)后模型。同時(shí)從ImmPort下載免疫相關(guān)基因,并從基因表達(dá)數(shù)據(jù)庫(Gene Expression Omnibus,GEO)下載頭頸部鱗癌的數(shù)據(jù)集GSE65858作為模型測試集,以驗(yàn)證模型的預(yù)測能力。提取免疫相關(guān)基因,進(jìn)行單因素Cox回歸分析,設(shè)定P≤0.01,篩選獲得相應(yīng)免疫相關(guān)基因,再進(jìn)行LASSO回歸以及交叉驗(yàn)證獲得最優(yōu)基因集。
1.2 預(yù)后基因模型構(gòu)建
將最優(yōu)基因集進(jìn)行多因素Cox回歸,同時(shí)基于赤池信息量準(zhǔn)則,采用逐步回歸法精簡獲得相應(yīng)免疫相關(guān)基因。采用另一種獨(dú)立方法即隨機(jī)生存森林評估免疫相關(guān)基因的重要性。
1.3 預(yù)后基因模型驗(yàn)證
1.4 決策曲線和諾莫圖構(gòu)建
采用決策曲線分析評估模型的臨床有效性,其曲線下所形成面積越大,患者的凈收益越大。同時(shí)構(gòu)建風(fēng)險(xiǎn)值及其他指標(biāo)的諾莫圖。通過校準(zhǔn)曲線評價(jià)訓(xùn)練集實(shí)際生存狀態(tài)和預(yù)測生存狀態(tài)的一致性。
2.1 免疫相關(guān)基因提取
從TCGA中下載的頭頸部鱗癌數(shù)據(jù)集有546例樣品信息,其中包括502例癌癥患者樣品信息和44例正常樣品信息。臨床數(shù)據(jù)包括528例患者信息,刪除缺失生存狀態(tài)和生存時(shí)間的臨床信息1例,共計(jì)527例臨床信息。從ImmPort下載到的免疫相關(guān)基因有2013個基因,GSE65858中包含了270例頭頸部鱗癌患者的基因表達(dá)數(shù)據(jù)及相應(yīng)臨床信息。利用單變量Cox回歸分析后得到162個免疫相關(guān)基因與患者預(yù)后有關(guān)。LASSO回歸可得到不同基因集下的正則化參數(shù)值(圖1A),交叉驗(yàn)證得到最小誤差下的最優(yōu)正則化參數(shù),從而得到最適合的基因集。當(dāng)正則化參數(shù)為-3.55時(shí),誤差最小,即基因集中含24個基因,模型表現(xiàn)最佳(圖1B)。
2.2 預(yù)后基因模型構(gòu)建
通過多變量Cox回歸分析,同時(shí)兼顧模型的復(fù)雜度和簡潔性,利用逐步回歸法,最終得到11個免疫相關(guān)基因(圖2)和相應(yīng)回歸系數(shù)(表1)。用隨機(jī)生存森林進(jìn)一步評估11個免疫相關(guān)基因?qū)颊呱鏍顟B(tài)的重要程度,發(fā)現(xiàn)分類樹在2000顆左右時(shí),錯誤率趨于平穩(wěn)(圖3A),而此時(shí)的變量重要性均為非負(fù)值(圖3B),提示了這些基因?qū)颊哳A(yù)后具有一定的影響。因此,最終采用這11個免疫基因作為模型構(gòu)建基因。
2.3 模型驗(yàn)證
11個基因代入風(fēng)險(xiǎn)公式后得到:riskScore=-0.255741*CTSG+0.167647*PTX3+0.336622*MA P2K1+0.115274*OLR1+- 0.298285*SEMA5A+ 0.131288*CHGB+0.192869*PDGFA+0.614438*AI MP1+-0.283802*TNFRSF25+-0.219474*TNFRSF4+-0.258105*IKBKB。風(fēng)險(xiǎn)值越高,患者的生存率越低。根據(jù)風(fēng)險(xiǎn)值的中位值(1.014)在訓(xùn)練集即TCGA中頭頸部鱗癌患者的數(shù)據(jù)中劃分成高、低風(fēng)險(xiǎn)組(圖4A)。高風(fēng)險(xiǎn)組的死亡人數(shù)遠(yuǎn)大于低風(fēng)險(xiǎn)組,且生存時(shí)間低于低風(fēng)險(xiǎn)組(圖4B)。通過Kaplan-Meier生存分析得到高風(fēng)險(xiǎn)組的中位生存期為1.82年,3、5年的生存概率分別為37.8%、28.7%。低風(fēng)險(xiǎn)組中位生存期為7.41年,3、5年的生存概率分別為76.0%、63.9%。低風(fēng)險(xiǎn)組較高風(fēng)險(xiǎn)組生存期長、總生存率高(P<0.05)(圖5A)。同時(shí),1、2、3年的總體生存率ROC曲線下面積AUC分別為0.716、0.747、0.757(圖5B)。上述結(jié)果提示模型在訓(xùn)練集中表現(xiàn)良好,具有一定的準(zhǔn)確性和良好的預(yù)測能力。為進(jìn)一步驗(yàn)證模型的預(yù)測能力,通過評估模型在測試集GSE65858的表現(xiàn)情況。同樣在測試集中劃分成高、低風(fēng)險(xiǎn)兩組。利用Kaplan-Meier生存分析得到高風(fēng)險(xiǎn)組的中位生存期為3.15年,3、5年生存率分別是53.1%、35.65%。低風(fēng)險(xiǎn)組的中位生存期為5.38年,3、5年生存率分別是76.5%、60.2%。發(fā)現(xiàn)在測試集中,低風(fēng)險(xiǎn)組依然較高風(fēng)險(xiǎn)組生存期長,總生存率高(P<0.05)(圖5C)。同時(shí)測試集中1、2、3年的總體生存率的ROC曲線下面積AUC分別為0.611、0.633、0.623(圖5D),進(jìn)一步提示模型在測試集上具有良好的預(yù)測能力。為驗(yàn)證模型能否作為獨(dú)立預(yù)后因子,利用多因素Cox回歸方法,發(fā)現(xiàn)模型HR=1.3,95% CI=1.289~1.508,P<0.001,可作為一個獨(dú)立的預(yù)測因子(圖6)。
2.4 決策曲線和諾莫圖
為了解模型的臨床有效性,通過決策曲線得知,預(yù)后模型單獨(dú)與傳統(tǒng)的分級、分期、年齡、性別相比,患者單獨(dú)使用預(yù)后模型的凈收益比上述其他指標(biāo)所得的凈收益較大。而預(yù)后模型與分級、分期、年齡、性別一起聯(lián)用時(shí),患者凈收益最大(圖7)。諾莫圖可以通過整合多個風(fēng)險(xiǎn)因素來量化某個單獨(dú)的風(fēng)險(xiǎn)因子(圖8A)。通過校準(zhǔn)曲線來比較患者3年、5年真實(shí)生存率與預(yù)測生存率得知3、5年的C指數(shù)均為0.705(圖8B、C),進(jìn)一步提示模型具有良好的預(yù)測能力。
在頭頸部鱗癌治療中,除了常規(guī)的化療、放療外,免疫治療也在近些年來興起[7]。而免疫治療中PD-1抑制劑納武利尤單抗已經(jīng)在頭頸部鱗癌中取得一定的效果?,F(xiàn)有資料表明,納武利尤單抗組與標(biāo)準(zhǔn)治療組的2年生存率分別為16.9%和6.0%,兩組中位總體生存期分別為7.7個月和5.1個月,死亡風(fēng)險(xiǎn)降低32%,極大地顯示出免疫治療的優(yōu)越性[8]。而預(yù)后情況的預(yù)測,能有效地掌握疾病的發(fā)展趨勢,對臨床用藥具有一定的指導(dǎo)作用。因此,本研究通過構(gòu)建免疫相關(guān)基因的預(yù)后模型來預(yù)測頭頸部鱗癌患者的預(yù)后情況。
本研究通過對TCGA頭頸部鱗癌患者基因表達(dá)數(shù)據(jù)的分析得到了一個由免疫相關(guān)基因構(gòu)建的預(yù)后模型。本研究所構(gòu)建的模型經(jīng)訓(xùn)練集和測試集驗(yàn)證,發(fā)現(xiàn)在預(yù)測患者1、2、3年的生存率時(shí)具有相對較高的AUC值,證實(shí)了本模型具有良好的預(yù)測能力。同時(shí),多因素Cox回歸分析也證實(shí)本模型可作為一個獨(dú)立預(yù)測因子。校準(zhǔn)曲線比較了3、5年的預(yù)測生存率和實(shí)際生存率,發(fā)現(xiàn)兩者之間具有較高的一致性,進(jìn)一步說明本模型能較好地反應(yīng)患者實(shí)際生存情況。決策曲線也驗(yàn)證了模型的臨床有效性。Zhao等[9]所構(gòu)建的頭頸部鱗癌預(yù)后模型AUC值僅0.6,wang等[5]構(gòu)建的預(yù)后模型在相同測試集中1、3年的AUC值為0.59、0.55。而本模型的AUC值比上述模型的AUC值均大,進(jìn)一步提示本模型相比其他模型具有良好的預(yù)測能力。
在一項(xiàng)頭頸部鱗癌治療臨床實(shí)驗(yàn)中發(fā)現(xiàn),手術(shù)前使用TNFRSF4激動劑抗體能有效地預(yù)防手術(shù)切除后的復(fù)發(fā)[10]。TNFRSF4是免疫檢查點(diǎn)分子之一,其功能主要是促進(jìn)淋巴細(xì)胞的存活以及可增殖記憶性T細(xì)胞。TNFRSF4激動劑抗體可通過增強(qiáng)腫瘤微環(huán)境中的CD8+和CD4+T細(xì)胞的繁殖和存活能力,促進(jìn)細(xì)胞因子生成,從而增強(qiáng)T細(xì)胞抗腫瘤的能力。因此,TNFRSF4被認(rèn)為是腫瘤免疫治療藥物研發(fā)的新靶點(diǎn)[10-11]。OLR1為多核型髓源抑制性細(xì)胞的標(biāo)志物,該細(xì)胞可抑制免疫反應(yīng),從而使腫瘤對化療、免疫治療產(chǎn)生抗性[12]。PTX3是固有免疫中體液免疫的重要組成成分之一。PTX3缺失,導(dǎo)致補(bǔ)體激活,促CCL2合成,增加腫瘤巨噬細(xì)胞招募,從而增加間皮質(zhì)細(xì)胞和上皮細(xì)胞癌的發(fā)生[13]。本模型中包含以上幾種基因,驗(yàn)證了本模型具有其臨床意義。
本研究通過多種生物信息學(xué)方法和技術(shù),最終構(gòu)建了免疫相關(guān)基因預(yù)后模型,發(fā)現(xiàn)對頭頸部鱗癌患者的預(yù)后情況有較好的預(yù)測能力,并具有一定的準(zhǔn)確性和特異性。同時(shí),還解決了不同患者具有相同分級分期等相同臨床指標(biāo),但其臨床結(jié)局不同的問題。
參考文獻(xiàn)
[1] Global Burden of Disease Cancer Collaboration, Fitzmaurice C, Abate D, et al. Global, regional, and national cancer incidence, mortality, years of life lost, years lived with disability, and disability-adjusted life-years for 29 cancer groups, 1990 to 2017: A systematic analysis for the global burden of disease study[J]. JAMA Oncol, 2019, 5(12): 1749-1768.
[2] 楊文婷, 余英豪. PD-1及其配體在實(shí)體腫瘤中的應(yīng)用[J].臨床與實(shí)驗(yàn)病理學(xué)雜志, 2015, 31(7): 791-793.
[3] 黃育剛, 王莉, 湯顯斌. PD-1/PD-L1免疫抑制劑在肺癌臨床治療和病理檢測中的研究進(jìn)展[J]. 臨床與實(shí)驗(yàn)病理學(xué)雜志, 2020, 36(6): 688-692.
[4] Seiwert TY, Burtness B, Mehra R, et al. Safety and clinical activity of pembrolizumab for treatment of recurrent or metastatic squamous cell carcinoma of the head and neck(KEYNOTE-012): an open-label, multicentre, phase 1b trial[J]. Lancet Oncol, 2016, 17(7): 956-965.
[5] Wang J, Chen X, Tian Y, et al. Six-gene signature for predicting survival in patients with head and neck squamous cell carcinoma[J]. Aging(Albany NY), 2020, 12(1): 767-783.
[6] Arantes LMRB, De Carvalho AC, Melendez ME, et al. Serum, plasma and saliva biomarkers for head and neck cancer[J]. Expert Rev Mol Diagn, 2018, 18(1): 85-112.
[7] Ferris RL. Immunology and immunotherapy of head and neck cancer[J]. J Clin Oncol, 2015, 33(29): 3293-3304.
[8] Ferris RL, Blumenschein G Jr, Fayette J, et al. Nivolumab vs investigator’s choice in recurrent or metastatic squamous cell carcinoma of the head and neck: 2-year long-term survival update of CheckMate 141 with analyses by tumor PD-L1 expression[J]. Oral Oncol, 2018, 81: 45-51.
[9] Zhao X, Sun S, Zeng X, et al. Expression profiles analysis identifies a novel three-mRNA signature to predict overall survival in oral squamous cell carcinoma[J]. Am J Cancer Res, 2018, 8(3): 450-461.
[10] Aspeslagh S, Postel-Vinay S, Rusakiewicz S, et al. Rationale for anti-OX40 cancer immunotherapy[J]. Eur J Cancer, 2016, 52: 50-66.
[11] 姜鑫, 杜國強(qiáng), 李志勇, 等. OX40免疫檢查點(diǎn)在頭頸部鱗狀細(xì)胞癌中的作用機(jī)制及臨床應(yīng)用的研究進(jìn)展[J]. 中國醫(yī)科大學(xué)學(xué)報(bào), 2020, 49(6): 570-573.
[12] Condamine T, Dominguez GA, Youn JI, et al. Lectin-type oxidized LDL receptor-1 distinguishes population of human polymorphonuclear myeloid-derived suppressor cells in cancer patients[J]. Sci Immunol, 2016, 1(2): aaf8943.
[13] Garlanda C, Bottazzi B, Magrini E, et al. PTX3, a humoral pattern recognition molecule, in innate immunity, tissue repair, and cancer[J]. Physiol Rev, 2018, 98(2): 623-639.