韓文凱,許曉燕,李丹霞,車鎧,焦偉,牛海濤
(1 青島大學醫(yī)學部,山東 青島 266071; 2 青島大學附屬醫(yī)院泌尿外科)
膀胱癌是泌尿系統(tǒng)中最常見的腫瘤之一,也是我國老年人群中高致死率的癌癥[1-2]。膀胱癌最常見的病理類型是尿路上皮癌,其具有耐藥性強、轉(zhuǎn)移率高、復發(fā)率高、預后差等特點[3-4]。雖然手術(shù)、放療和輔助化療的應用大大改善了膀胱癌病人的預后,但膀胱癌致死率仍居高不下[5]。因此,需要尋找新的方法來提高膀胱癌病人的診斷和預后。近年來,分子標志物已經(jīng)被證實有助于膀胱癌的診斷和治療[6]。已有研究表明,膀胱癌病人的晚期無進展生存與某些分子標志物高表達相關(guān)[7-8]。然而,由于研究缺乏更大的臨床研究隊列,這些潛在生物標志物的功能以及臨床意義無法得到充分驗證。自噬在細胞的代謝過程中具有平衡作用,正常情況下自噬可以清除功能受損的細胞器以及表達錯誤的蛋白質(zhì)[9]。人類發(fā)展過程中的多種疾病與自噬相關(guān),并且自噬與腫瘤的發(fā)生也存在密切關(guān)系[10]。自噬對于腫瘤是一把雙刃劍,早期可以抑制腫瘤的形成,晚期可以促進腫瘤的生長和轉(zhuǎn)移[11]。近年來有研究表明,自噬基因可以通過信號通路誘導膀胱癌浸潤和轉(zhuǎn)移[12-13]。因此,自噬基因可能作為膀胱癌診斷以及預后的分子標志物。本研究從腫瘤基因組圖譜(TCGA)數(shù)據(jù)庫中獲取膀胱癌轉(zhuǎn)錄組數(shù)據(jù)進行分析,并且構(gòu)建自噬相關(guān)基因(DEARGs)的預后模型,評估該模型的預后預測能力。
從TCGA數(shù)據(jù)庫中獲取了430例樣本的轉(zhuǎn)錄組數(shù)據(jù)(HTSeq-FPKM),其中癌旁組織19例,膀胱癌組織411例。GSE31684數(shù)據(jù)集從基因表達綜合數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE31684)中下載獲得[14-15]。DEARGs來源于人類自噬數(shù)據(jù)庫(HADb,http://www.autophagy.lu/),從該數(shù)據(jù)庫中獲得了232個自噬基因,其中194個基因在TCGA數(shù)據(jù)庫中表達。
對瘤旁組織和膀胱癌組織的轉(zhuǎn)錄組數(shù)據(jù)進行分析,篩選差異表達的DEARGs。在R語言(版本3.6.2)環(huán)境下進行操作,首先使用“l(fā)imma”包對數(shù)據(jù)進行校正歸一化處理,篩選標準為|logFC|>1(實驗組/對照組>2),錯誤發(fā)現(xiàn)率(FDR)<0.05。采用Wilcoxon檢驗進行差異分析,最后使用“pheatmap”和“ggpubr”包對DEARGs進行可視化處理。
對DEARGs進行基因本體(GO)及京都基因與基因組百科全書(KEGG)信號通路富集分析。在R語言環(huán)境下,使用“colorspace”“stringi”“ggplot2”“DOSE”“clusterProfiler”和“enrichplot”等軟件包對數(shù)據(jù)進行可視化處理(P<0.05,Q<0.05,Q值為校正后的P值)。
首先,在R語言環(huán)境下使用“survival”軟件包對DEARGs進行單因素Cox回歸分析,篩選與預后生存相關(guān)的自噬基因,以P<0.05為差異有顯著意義。隨后,將以上篩選到的與生存相關(guān)的自噬基因進行多因素Cox回歸分析。最后,構(gòu)建自噬基因的風險預測模型,根據(jù)風險模型計算每一樣本的風險評分,以風險評分中位值為界將樣本分為高風險組和低風險組,觀察兩組病人生存狀態(tài)。風險評分=expRNA1×βRNA1+expRNA2×βRNA2+…+expRNAn×βRNAn,其中exp是差異表達基因的表達量,RNA1~RNAn代表每一基因的名稱,β是Cox回歸模型的多元回歸系數(shù)。
在R語言環(huán)境下使用“survival”包對高低風險組的病人進行預后分析,利用Kaplan-Meier(K-M)檢驗方法和log-rank檢驗評估高低風險組病人的生存預后。使用“survival ROC”包繪制受試者工作特征(ROC)曲線評估該模型的準確性。
使用GSE31684數(shù)據(jù)集驗證風險模型的預測性能,根據(jù)模型風險評分的中位值將樣本分為高風險組和低風險組,觀察兩組病人總體生存狀態(tài),繪制ROC曲線評估結(jié)果準確性。
將樣本的風險評分和臨床指標進行單因素和多因素Cox回歸分析,綜合評估風險評分與膀胱癌病人預后的關(guān)系。以P<0.05為差異有統(tǒng)計學意義。
根據(jù)篩選標準(|logFC|>1、FDR<0.05)獲得DEARGs 37個,其中19個基因表達下調(diào),18個基因表達上調(diào)(圖1A)。依據(jù)|logFC|排序,表達上調(diào)的前10個基因為:CDKN2A、SERPINA1、BIRC5、TP73、ATG9B、EIF4EBP1、SPHK1、ERBB2、BID和ITGA3;表達下調(diào)的前10個基因為:FOS、CCL2、HSPB8、PRKN、ITPR1、TP53INP2、NRG2、MYC、DLC1和BCL2。
GO富集分析的結(jié)果顯示,生物過程(BP)主要包含內(nèi)在凋亡信號通路、神經(jīng)元死亡、內(nèi)質(zhì)網(wǎng)應激反應、自噬和自噬信號通路等,細胞組成(CC)主要包含自噬體、內(nèi)質(zhì)網(wǎng)腔體、外膜、線粒體外膜和細胞器外膜等,分子功能(MF)主要涉及泛素蛋白連接酶的結(jié)合、磷酸酶結(jié)合、死亡結(jié)構(gòu)域結(jié)合、BH結(jié)構(gòu)域結(jié)合及蛋白酶結(jié)合等。見圖1B。KEGG分析的結(jié)果則顯示,DEARGs主要與肌萎縮性側(cè)索硬化癥(ALS)、細胞凋亡、凋亡-多物種、膀胱癌、慢性骨髓性白血病、EGFR酪氨酸激酶抑制劑抗性、內(nèi)分泌的阻力、ErbB信號通路、p53信號通路、PI3K-Akt信號通路和鉑耐藥等通路相關(guān)(圖1C)。
A為DEARGs火山圖:圖中每一點代表一個自噬基因,其中黑色點代表無差異表達基因,紅色點代表表達上調(diào)基因,綠色點則代表表達下調(diào)基因。B為GO富集分析:圖中形狀的大小代表富集基因的數(shù)量,形狀越大代表富集的基因越多;顏色代表P值的大小,P值越小顏色越紅,反之越藍(P<0.05)。C為KEGG通路富集分析:圖中每行代表一個生物功能通路,其中方格代表富集于該通路的基因,顏色則代表基因表達差異的倍數(shù),顏色越紅代表表達差異倍數(shù)越大。
對37個DEARGs進行單因素Cox回歸分析,結(jié)果發(fā)現(xiàn)共有7個基因(SPNS1、APOL1、P4HB、DIRAS3、ITGA3、MYC、SPHK1)與膀胱癌病人的預后顯著相關(guān)(P<0.05)。將其納入多因素Cox回歸分析,最終得到了包含6個自噬基因(SPNS1、APOL1、P4HB、DIRAS3、ITGA3、MYC)的風險模型。熱圖分析結(jié)果顯示,與低風險組比較,高風險組DIRAS3、MYC、P4HB基因表達上調(diào),APOL1、ITGA3則表達下調(diào),而SPNS1的表達在兩組中并無明顯差異(圖2A)。低風險組的總體生存優(yōu)于高風險組(圖2B、C)。根據(jù)風險模型計算了每例膀胱癌病人的風險評分,高風險組201例,低風險組202例。K-M分析結(jié)果顯示,高風險組3年生存率為41.4%(95%CI=0.334~0.513),低風險組為57.7%(95%CI=0.490~0.679),高風險組的預后生存率低于低風險組(圖3A)。ROC曲線分析結(jié)果顯示,膀胱癌病人3年生存期的AUC為0.789(圖3B)。
A:模型中6個風險基因的差異表達圖;B:樣本中風險模型評分分布圖;C:風險模型評分與膀胱癌病人生存狀態(tài)分布圖。
A:風險模型對于高風險組和低風險組的生存預后分析;B:ROC曲線對風險模型預測準確性的分析結(jié)果;C:風險模型對于GEO數(shù)據(jù)集中高低風險組的生存預后分析;D:風險模型對于GEO數(shù)據(jù)集分析結(jié)果準確性分析。
使用GEO數(shù)據(jù)集中的GSE31684數(shù)據(jù)集對模型的預測能力進行驗證,根據(jù)風險模型的風險評分,將病人分為高風險組(46例)、低風險組(47例)。K-M生存分析結(jié)果顯示,高風險組的預后差于低風險組,高風險組的3年生存率為31.6%(95%CI=0.3167~0.499),低風險組3年生存率為64.6%(95%CI=0.436~0.665)。ROC曲線分析結(jié)果顯示,膀胱癌病人3年生存期的AUC為0.652(圖3C、D)。
單因素Cox回歸分析結(jié)果顯示,病人腫瘤分期(HR=1.763,95%CI=1.236~2.515,P<0.01)、腫瘤浸潤深度(HR=1.695,95%CI=1.152~2.495,P<0.01)、淋巴結(jié)轉(zhuǎn)移(HR=1.531,95%CI=1.165~2.013,P<0.01)和模型風險評分(HR=1.828,95%CI=1.438~2.324,P<0.001)與膀胱癌病人預后相關(guān)。多因素Cox回歸分析結(jié)果顯示,風險評分(HR=1.933,95%CI=1.457~2.563,P<0.001)可以作為膀胱癌病人預后的獨立影響因素。見圖4。
圖4 Cox回歸分析評估風險模型評分及臨床特征對于膀胱癌病人的預后價值
一般情況下,體內(nèi)的自噬水平一直處于相對平衡的生理狀態(tài),自噬在腫瘤的發(fā)生、形成和轉(zhuǎn)移的過程中具有重要作用[16]。在腫瘤形成的初期,自噬可以抑制腫瘤的形成。但是在腫瘤形成后,自噬則會促進腫瘤生長和侵襲,此時的自噬就會成為腫瘤的促進因素[17]。目前,對膀胱癌自噬研究比較局限、單一。本文研究篩選膀胱癌癌旁組織和膀胱癌組織中DEARGs,并探討其生物學功能。GO富集分析結(jié)果顯示,DEARGs主要與BP(主要包含內(nèi)在凋亡信號通路、神經(jīng)元死亡、內(nèi)質(zhì)網(wǎng)應激反應、自噬和自噬信號通路)、CC(主要包含自噬體、內(nèi)質(zhì)網(wǎng)腔體、外膜、線粒體外膜和細胞器外膜)和MF(主要涉及泛素蛋白連接酶的結(jié)合、磷酸酶結(jié)合、死亡結(jié)構(gòu)域結(jié)合、BH結(jié)構(gòu)域結(jié)合及蛋白酶結(jié)合)相關(guān);KEGG分析結(jié)果顯示,DEARGs主要與ALS、細胞凋亡、凋亡-多物種、膀胱癌、慢性骨髓性白血病、EGFR酪氨酸激酶抑制劑抗性、內(nèi)分泌的阻力、ErbB信號通路、P53信號通路、PI3K-Akt信號通路和鉑耐藥等通路相關(guān),這說明膀胱癌DEARGs與癌癥相關(guān)通路及腫瘤耐藥相關(guān)。目前研究認為,PI3K-Akt信號通路和鉑耐藥通路相關(guān),RrbB2可以誘導血管生長并促進膀胱癌的轉(zhuǎn)移[18];在膀胱癌中,3-BrPA可以通過抑制P53通路從而有效抑制膀胱癌的發(fā)生和轉(zhuǎn)移[19];PI3K-Akt信號通路可以調(diào)節(jié)上皮間質(zhì)化和侵襲,在浸潤性膀胱癌中已發(fā)現(xiàn)了類似的FGFR3突變[20];DEARGs還與鉑類藥物耐藥相關(guān),有些膀胱癌病人應用此類藥物治療效果不佳,可能與膀胱癌的耐藥機制相關(guān)[7]。其機制是否與DEARGs相關(guān),有待進一步研究。
本文研究構(gòu)建了含有6個自噬基因(SPNS1、APOL1、P4HB、DIRAS3、ITGA3、MYC)的風險模型,其中DIRAS3和ITGA3可以作為膀胱癌預后的生物標志物[7-8],MYC可以通過各種機制促進膀胱癌的轉(zhuǎn)移和浸潤[21]。關(guān)于SPNS1、APOL1和P4HB基因在膀胱癌中的作用尚不明確,需進一步的研究和探索。但已有研究顯示,SPNS1與P53信號通路相關(guān)[22]。APOL1可以作為胰腺癌的腫瘤標志物[23]。在腎透明細胞癌中P4HB可以作為預后不良的腫瘤標志物[24]。本研究建立的模型可以有效劃分高、低風險的病人,預測結(jié)果也準確有效,并且該結(jié)果在外部數(shù)據(jù)集中也得到了驗證。該模型的風險評分也可作為預測膀胱癌病人預后的獨立因素。因此,本文構(gòu)建的自噬基因相關(guān)模型可以篩查高風險的膀胱癌病人,提前干預、治療從而改善病人的預后。
綜上所述,本文篩選并構(gòu)建了含有以下6個基因SPNS1、APOL1、P4HB、DIRAS3、ITGA3和MYC的風險模型,該模型可以很好地篩選高風險的膀胱癌病人,其風險評分還可以作為預測膀胱癌病人預后的一個獨立因素。本研究結(jié)果為后期膀胱癌的早期診斷及前期干預治療,改善病人預后提供了可靠的理論基礎依據(jù)。