張元,曹慶飛,佟明
(錦州醫(yī)科大學附屬第一醫(yī)院,遼寧 錦州 121000)
腎細胞癌(renal cell carcinoma,RCC)是世界上最常見的泌尿系腫瘤之一,約占所有成人惡性腫瘤的3%。美國癌癥協(xié)會估計,2020年美國將出現(xiàn)新增腎癌和腎盂癌病例73 750例,死亡14 830例[1]。腎透明細胞癌(clear cell renal carcinoma,ccRCC)是腎癌最常見的亞型,在腎癌所有的組織學類型中約占75%[2],也是腎癌死亡的主要原因[3]。早期局限性腎透明細胞癌經(jīng)治療后預后良好,5年生存率大于90%[4],可一旦發(fā)生遠處轉(zhuǎn)移,生存期大幅縮短,發(fā)生骨轉(zhuǎn)移后平均生存時間為12~28個月[5]。由于30%~50%的腎透明細胞癌患者早期缺乏臨床癥狀,約有20%~30%的患者在初次診斷時就發(fā)現(xiàn)存在遠處轉(zhuǎn)移[6-7],因此早期準確診斷對腎透明細胞癌患者至關(guān)重要。隨著高通量測序技術(shù)的發(fā)展,越來越多的新的生物標志物被發(fā)現(xiàn)與癌癥患者的生存預后相關(guān),尋找新的可靠的生物標志物有助于腎透明細胞癌早期診斷、估計預后及指導治療。
VI型膠原是一種主要的細胞外基質(zhì)(extracellular matrix,ECM)蛋白,它與其他細胞外基質(zhì)分子相互作用,形成微絲網(wǎng)狀,為細胞提供結(jié)構(gòu)支撐[8]。既往研究表明膠原蛋白VI可以通過觸發(fā)信號通路調(diào)節(jié)細胞凋亡[9]、炎癥[10],甚至促進腫瘤進展[11]。膠原蛋白VI由不同基因編碼的3條主要多肽鏈(分別為α1、α2和α3)組成。COL6A1基因編碼的是α1多肽鏈,通常參與腫瘤轉(zhuǎn)移。有研究顯示下調(diào)COL6A1表達能夠抑制肺癌細胞轉(zhuǎn)移,而過表達COL6A1則能促進肺癌細胞轉(zhuǎn)移[12]。一項全球分泌蛋白質(zhì)組分析結(jié)果顯示,高表達COL6A1可以促進體內(nèi)腫瘤細胞骨轉(zhuǎn)移[13]。 然而,在腎透明細胞癌中COL6A1的臨床意義和預后價值仍然未知。
本研究旨在通過對癌癥基因組圖譜(the cancer genome atlas,TCGA)數(shù)據(jù)庫中腎透明細胞癌樣本數(shù)據(jù)進行生物信息學分析,探討COL6A1表達在腎透明細胞癌中的預后價值。同時,我們利用基因集富集分析(gene set enrichment analysis,GSEA)探索了COL6A1 高表達表型和低表達表型中關(guān)鍵信號通路的差異。
從TCGA數(shù)據(jù)庫(https://portal.gdc.cancer.gov/repository)下載腎透明細胞癌基因表達數(shù)據(jù)(共611例樣本;539例腎透明細胞癌組織樣本和72例正常的癌旁非癌組織樣本;工作流類型:HTSeq-FPKM)以及相關(guān)的臨床資料。相關(guān)的臨床資料包括年齡、性別、病理分級、TNM分期和臨床分期。部分臨床資料缺失的樣本不納入統(tǒng)計。
利用R語言的生存包建立包含年齡、病理分級、臨床分期、TNM分期、COL6A1表達的預后模型來預測腎透明細胞癌患者3年和5年的生存率。采用一致性指數(shù)(c-index)、校準曲線和ROC曲線評價模型性能。
將KEGG基因集數(shù)據(jù)和表型標簽文件(COL6A1-high和COL6A1-low)上傳至GSEA軟件。我們對每個分析進行1000次基因集排列,將正常P< 0.05和FDR< 0.25的基因集定義為顯著差異表達的基因集。
所有數(shù)據(jù)均使用R軟件(V3.6.0; https://www.r-project.org/)進行分析。采用Wilcoxon秩和檢驗分析COL6A1 在腎透明細胞癌組和正常組中的表達差異。使用Wilcoxon符號秩檢驗分析腎透明細胞癌及配對鄰近組織中COL6A1的表達差異。使用Wilcoxon秩和檢驗、Kruskal-Wallis檢驗評估臨床及病理因素和COL6A1表達之間的關(guān)系。采用Kaplan-Meier法分析COL6A1 表達和患者總生存時間之間的關(guān)系。采用Cox回歸分析COL6A1表達及其他臨床特征與總生存時間的關(guān)系。
分析比較539例腎透明細胞癌組織和72例癌旁非癌組織中COL6A1的表達,發(fā)現(xiàn)COL6A1在腫瘤組織中的表達顯著高于正常組織(P<0.001),見圖1A。同時,我們分析了COL6A1在72對配對腎透明細胞癌組織及癌旁非癌組織中的表達,COL6A1在腎透明細胞癌組織中表達顯著高于癌旁非癌組織(P<0.001),見圖1B。
圖1 COL6A1在腫瘤組織中的表達顯著高于癌旁正常組織
TCGA數(shù)據(jù)庫中收集并整理患者的臨床及病理資料,見表1。包括年齡、性別、病理分級、TNM分期和臨床分期。采用Wilcoxon秩和檢驗、Kruskal-Wallis檢驗分析COL6A1表達量與臨床病理特征之間的關(guān)系,結(jié)果顯示COL6A1表達量與患者性別、M分期無關(guān),與年齡、病理分級、T分期、N分期、臨床分期顯著相關(guān),見圖2~3。
表1 從TCGA獲取的腎透明細胞癌患者的臨床信息
圖2 COL6A1表達量與腎透明細胞癌患者年齡、性別、病理分級、臨床分期之間的關(guān)系
Kaplan-Meier生存分析結(jié)果顯示,COL6A1高表達與患者不良預后相關(guān)(P=0.007),見圖4,即COL6A1高表達患者的總生存時間較低表達患者短。COL6A1高表達組的中位生存時間為66個月,而低表達組直到隨訪時間截止,死亡人數(shù)都沒有超過總?cè)藬?shù)的50%。為了進一步分析COL6A1以及其他臨床病理因素對總生存時間的影響,我們進行了Cox回歸分析。單因素Cox回歸分析結(jié)果顯示,COL6A1表達量、年齡、病理分級、臨床分期、TNM分期與總生存時間顯著相關(guān)(P<0.05),隨后,將這些因素作為自變量進行多因素Cox回歸分析,結(jié)果顯示年齡、M分期、COL6A1表達量仍然與總生存時間密切相關(guān)(P<0.001),見圖5。說明COL6A1高表達、年齡、M分期是腎透明細胞癌患者不良預后的獨立危險因素。
圖4 Kaplan-Meier生存分析結(jié)果顯示COL6A1高表達患者的總生存時間較低表達患者短
圖5 多因素Cox回歸分析結(jié)果顯示COL6A1高表達、年齡、M分期是影響腎透明細胞癌患者總生存時間的獨立危險因素
為了預測腎透明細胞癌患者的3年和5年生存率,我們制作了一個包含年齡、病理分級、臨床分期、T分期、N分期、M分期和COL6A1 表達量的預后模型,見圖6。在這個預后模型中,每個因素都按其對生存率的風險貢獻比例被分配了分數(shù),總分越高,總生存率越低。該預后模型的一致性指數(shù)(C指數(shù))為0.768。為了進一步評價該預后模型的準確性,我們繪制了預測校準曲線和受試者工作特性(ROC)曲線。結(jié)果顯示,預測校準曲線貼近標準曲線,見圖7。3年和5年生存率的ROC曲線下面積(AUC)分別為0.827和0.802,見圖8。說明該預后模型預測的3年和5年生存率與實際基本相符。
圖6 腎透明細胞癌患者總生存期的預后模型
圖7 預測模型的校準曲線
圖8 預測模型的ROC曲線
為了探究腎透明細胞癌中與COL6A1高表達相關(guān)的信號通路,我們將從TCGA數(shù)據(jù)庫中收集到的樣本根據(jù)COL6A1表達量分為COL6A1高表達組和COL6A1低表達組進行基因集富集分析。結(jié)果顯示,ECM受體相互作用、JAK STAT信號通路、MAPK 信號通路、NOTCH信號通路、p53信號通路、VEGF信號通路、WNT信號通路中基因集被富集到COL6A1高表達表型,見圖9。
細胞外基質(zhì)為調(diào)節(jié)細胞生長和凋亡提供了必要的信號,同時它還可以通過調(diào)節(jié)化療的途徑和形成促進耐藥性的物理屏障來影響腫瘤對抗癌藥物的反應[14]。膠原蛋白是細胞外基質(zhì)的主要蛋白之一,其中膠原蛋白VI在細胞信號轉(zhuǎn)導和細胞遷移中發(fā)揮重要作用[13,15-16]1339-1355,并與一系列ECM組分相互作用[17]。COL6A1是脊椎動物中的保守基因/蛋白,存在于所有結(jié)締組織中[18],主要編碼膠原蛋白VI的α1鏈,被發(fā)現(xiàn)在星形細胞瘤中差異表達[19]。根據(jù)全球分泌蛋白質(zhì)組分析,Blanco等[13,20]1339-1355研究發(fā)現(xiàn)COL6A1是一種新型的骨轉(zhuǎn)移介質(zhì)。但是,沒有研究報道COL6A1在腎透明細胞癌中的表達與臨床預后之間的關(guān)系。
在本研究中,我們利用生物信息學的方法分析了從TCGA數(shù)據(jù)庫中獲得的高通量RNA測序數(shù)據(jù)。結(jié)果顯示COL6A1在腎透明細胞癌中高表達與晚期臨床病理特征(高病理分級、高T分期、淋巴結(jié)轉(zhuǎn)移、高臨床分期)相關(guān)。Kaplan-Meier曲線顯示,COL6A1高表達患者總生存時間明顯少于低表達患者。多因素Cox回歸分析顯示,年齡、M分期以及COL6A1高表達是腎透明細胞癌患者預后不良的獨立風險因素。
隨著高通量測序技術(shù)的應用,越來越多的研究發(fā)現(xiàn)分子的異質(zhì)性與腎透明細胞癌患者的預后與生存相關(guān)[21-22],所以只利用臨床病理特征這些傳統(tǒng)的指標預測腎透明細胞癌患者的生存率是不夠充分的。因此我們建立了一個包含患者臨床病理特征(年齡、病理分級、臨床分期、TNM分期)和COL6A1表達量的預測模型來預測腎透明細胞癌患者3年和5年生存率,為臨床醫(yī)生提供了一個更加精確的定量工具來估計腎透明細胞癌患者的生存率。且C指數(shù)、預測校準曲線及ROC曲線均證明該預測模型與實際基本相符。
為了進一步探究COL6A1在腎透明細胞癌中潛在的分子生物學機制,我們通過基因集富集分析(GSEA)發(fā)現(xiàn)ECM受體相互作用、JAK STAT信號通路、MAPK 信號通路、NOTCH信號通路、p53信號通路、VEGF信號通路、WNT信號通路中基因集被富集到COL6A1高表達表型。我們推測這些信號通路與COL6A1相互作用,參與了腎透明細胞癌發(fā)生發(fā)展的過程,但是需要進一步實驗驗證。
雖然本研究證實了COL6A1高表達與腎透明細胞癌患者預后之間的關(guān)系,但是本文仍有一些不足之處。第一,本文的數(shù)據(jù)是從TCGA數(shù)據(jù)庫得到的mRNA表達量,Guo等人[23]發(fā)現(xiàn)用mRNA的表達代表蛋白的表達是不夠完美的,本文并沒有討論COL6A1 mRNA表達與COL6A1蛋白表達的相關(guān)性。第二,本研究數(shù)據(jù)從單一腫瘤數(shù)據(jù)庫中獲得,存在選擇偏倚。第三,本文并沒有探討更深層的分子機制。
綜上所述,我們利用生物信息學進行數(shù)據(jù)挖掘分析發(fā)現(xiàn)COL6A1高表達是腎透明細胞癌不良預后的獨立危險因素,并且在腎透明細胞癌中ECM受體相互作用、JAK STAT信號通路、MAPK 信號通路、NOTCH信號通路、p53信號通路、VEGF信號通路、wnt信號通路可能與COL6A1相互作用促進腎透明細胞癌的發(fā)生發(fā)展。