王道篤,趙其炯,周志標,何永越
原發(fā)性肝癌是全球第七大最常見的惡性腫瘤,肝細胞癌是原發(fā)性肝癌主要類型(75%~85%),具有預后差、復發(fā)率高的特點[1]。肝細胞癌在患者之間、腫瘤間以及腫瘤內,都具有高度的異質性[2-4]。在全球范圍內,肝細胞癌患者的總體生存率差異顯著。由于復雜的病因以及高度的異質性,使得對于該疾病的預后研究具有高度的挑戰(zhàn)性。由于目前肝細胞癌治療手段有限,急需開發(fā)新的預后模型。
鐵死亡是最近發(fā)現的一種鐵依賴性的細胞程序性死亡的形式,不同于細胞壞死、細胞凋亡、細胞自噬,鐵死亡是由脂質過氧化的積累驅動的[5,6]。近年來,誘導腫瘤細胞鐵死亡已經成為了一種有前景的治療方式,尤其是針對傳統(tǒng)治療方法無效的惡性腫瘤[7,8]。最近的研究表明,除鐵死亡誘導基因外,許多其他的基因也被確定為鐵死亡的調節(jié)因子或標志物。目前,這些鐵死亡相關基因與肝細胞癌患者的預后的關系尚未明確。
本研究從癌癥基因圖譜(TCGA)數據庫以及國際癌癥基因組聯(lián)盟(ICGC)數據庫下載了肝細胞癌患者的基因表達譜及相應的臨床病理數據。然后,我們在TCGA隊列中構建了鐵死亡相關基因預后模型,并在ICGC隊列中驗證了此模型。此外,我們進行了功能富集分析,以探討其潛在機制。
從TCGA(https://portal.gdc.cancer.gov/)數據庫及ICGC(https://dcc.icgc.org)數據庫中下載肝細胞癌患者的基因表達譜及相應的臨床病理數據,最終在TCGA數據庫中納入了370名肝細胞癌患者作為訓練隊列,在ICGC數據庫中納入了231名肝細胞癌患者作為驗證隊列。TCGA和ICGC的數據都是公開的。因此,本研究不需要地方倫理委員會的批準。本研究遵循TCGA和ICGC的數據訪問政策和出版準則。
鐵死亡相關基因從鐵死亡數據庫(FerrDb)(http://www.zhounan.org/ferrdb/)中下載,并與TCGA和ICGC數據庫中的基因表達譜取交集,最終納入了227個鐵死亡相關基因進行研究。
首先,在TCGA隊列中,提取227個鐵死亡相關基因的表達數據,對總生存期(OS)進行單因素COX回歸分析,用以篩選與預后相關的鐵死亡相關基因。為了減少過擬合風險,結合R包“glmnet”,使用LASSO COX回歸分析建立預后模型?;貧w分析的自變量為與預后相關的鐵死亡相關基因的表達量,因變量為TCGA隊列中肝細胞癌患者的總生存期和生存狀態(tài)。最終我們構建了一個基于鐵死亡相關基因的預后模型。該模型根據各基因的FPKM標準化表達水平及其相應的回歸系數計算患者的風險評分。風險評分計算公式如下:
其中,xi為每個基因的FPKM標準化表達水平,Coefi為相應基因的系數。計算隊列中所有患者的風險評分,并根據中位值將隊列中所有患者分為高風險組與低風險組。使用R包“survivalROC”繪制生存曲線?;谀P椭谢虮磉_情況,使用R包“l(fā)imma”[9]進行主成分分析(PCA),使用R包“scatterplot3d”對結果進行可視化。
首先,使用R包“l(fā)imma”對高低風險組做基因差異表達分析,將|log2FC|≥1,FDR<0.05的基因作為高低風險組差異表達基因。進一步進行基因本體(GO)和京都基因組基因百科全書(KEGG)分析。使用R包“GSVA”進行單樣本基因富集分析(ssGSEA)來計算28種免疫細胞的浸潤評分。
采用log-rank檢驗和Kaplan-Meier曲線比較高低風險組之間的總體生存期。使用單因素和多因素Cox回歸分析來評估該模型對肝細胞癌患者總體生存期的獨立預后價值。所有統(tǒng)計分析均采用R(Version 4.0.2)或SPSS(Version 25.0)進行。如果未特別注明,P值小于0.05被認為具有統(tǒng)計學意義。
本研究最終納入了TCGA數據庫中370名肝細胞癌患者與ICGC數據庫中231名肝細胞癌患者。
首先,在TCGA隊列中,提取227個鐵死亡相關基因的表達數據,對總生存期(OS)進行單因素COX回歸分析,得到了16個顯著與總生存期相關的鐵死亡相關基因(P<0.0001),將得到的16個預后相關的鐵死亡相關基因進行LASSO COX回歸分析以構建預后模型。根據最優(yōu)的λ值確定了一個10基因的預后模型(圖1A-B)。這10個基因相對應的相關系數如圖1C。
圖1 A~C:LASSO回歸及模型中每個基因的系數
計算所有患者的風險評分,并根據中位風險評分將TCGA隊列中所有患者分為高風險組(185例)和低風險組(185例)。Kaplan-Meier生存曲線顯示,高風險組肝細胞癌患者生存率較低,生存時間較短(圖2A)。風險評分和生存狀態(tài)分布如圖2B-C所示。此外,接受者操作特性曲線(ROC)顯示,該模型對肝細胞癌患者的總體生存期具有良好的預測能力,ROC曲線下面積(AUC)值分別為:0.797(1年)、0.706(3年)、0.688(5年)(圖2D)。PCA分析顯示,在TCGA隊列中,低風險組患者和高風險組患者的分布有顯著差異(圖2E)。
圖2 TCGA隊列中患者的風險評分A:Kaplan-Meier生存曲線,TCGA隊列中高風險組與低風險組患者的生存率;B:TCGA隊列中患者風險評分的分布以及中位值;C:TCGA隊列中患者的OS狀態(tài)、風險評分的分布;D:TCGA隊列中模型的ROC曲線及AUC值;E:TCGA隊列中主成分分析結果
為了檢驗在TCGA隊列構建的預后模型的準確性,使用相同的計算公式計算ICGC隊列中每個肝細胞癌患者的風險評分,同樣根據中位值將ICGC隊列中所有肝細胞癌患者分為高風險組和低風險組。與在TCGA隊列中得到的結果一致,高風險組的肝細胞癌患者生存率較低,生存時間較短(圖3A)。ICGC隊列的風險評分和生存狀態(tài)分布如圖3B~C所示。PCA分析顯示,在ICGC隊列中,低風險組患者和高風險組患者的分布有差異(圖3D)。此外,ROC曲線顯示,該模型在ICGC隊列中對肝細胞癌患者的總體生存期同樣具有良好的預測能力,AUC值分別為:0.696(1年)、0.723(2年)、0.752(3年)(圖3E)。
圖3 ICGC隊列中患者的風險評分A:Kaplan-Meier生存曲線,ICGC隊列中高風險組與低風險組患者的生存率;B:ICGC隊列中患者風險評分的分布以及中位值;C:ICGC隊列中患者的OS狀態(tài)、風險評分的分布;D:ICGC隊列中主成分分析結果;E:ICGC隊列中模型的ROC曲線及AUC值
使用單因素及多因素COX回歸分析來評估該預后模型是否為肝細胞癌患者的獨立預后因素。在TCGA隊列中,單因素COX回歸分析顯示,風險評分(riskScore)與肝細胞癌患者的總體生存期顯著相關[風險比(HR)=3.042;95%置信區(qū)間(CI)=2.315~3.996;P<0.001](圖4A)。多因素COX回歸進一步顯示風險評分是總體生存期的獨立預后因素[HR=2.785;95%CI:2.068~3.751;P<0.001](圖4B)。該結論在ICGC隊列中同樣可以得到驗證[單因素COX回歸分析:(HR=2.288;95%CI:1.554~3.368;P<0.001)(圖4C);多因素COX回歸分析:(HR=2.021;95%CI:1.343~3.040;P<0.001)](圖4D)。上述結果表明,我們所構建的預后模型可以作為一個獨立預后因素。
為了研究高低風險組之間的分子異質性和潛在的生物學過程與途徑,我們在TCGA隊列中發(fā)現了201個差異表達基因[|log2(fold change)|>1,P<0.05]。KEGG和GO分析顯示,這些差異表達基因主要富集在以下幾個方面:細胞色素P450的代謝、碳代謝、糖酵解/糖異生、類固醇代謝、酒精代謝、有機酸合成等生物學過程(圖5A~B)。
為了進一步探討風險評分與免疫之間的關系,我們采用ssGSEA對不同的免疫細胞的浸潤程度進行量化。結果顯示,在TCGA隊列中,低風險組和高風險組的活化CD4+T細胞、中央型記憶CD4+T細胞、中央型記憶CD8+T細胞、效應記憶CD4+T細胞、調節(jié)性T細胞、II型輔助性T細胞、活化樹突狀細胞、嗜酸性粒細胞、髓系抑制性細胞的浸潤有顯著差異(圖6)。
本研究首先研究了227個鐵死亡相關基因在肝細胞癌患者腫瘤組織中的表達及其與肝細胞癌患者總體生存期的關系,我們在TCGA隊列中構建了一個包含10個鐵死亡相關基因的預后模型,并在ICGC隊列中進行了驗證。此外,本研究還進行了一些功能性分析,結果顯示,許多能量代謝及免疫相關通路被富集。
本研究中所構建的預后模型由如下10個鐵死亡相關基因組成:EIF2S1、PCBP2、PRDX1、RRM2、SLC1A5、SLC2A1、SLC7A11、SRXN1、STMN1、ZFP69B。研究表明,PRDX1調節(jié)多種細胞功能[10]。最初,PRDX1被認為是一種抗過氧化物酶,而進一步的研究表明,PRDX1還可以作為分子伴侶、腫瘤抑制因子調節(jié)細胞功能[11]。SLC1A5是一種細胞表面轉運體,介導包括谷氨酰胺在內的中性氨基酸的攝?。?2],谷氨酰胺的轉運和代謝可以促進脂質過氧化,進而導致細胞鐵死亡[13]。SLC7A11在人類腫瘤中高表達,在異種移植模型中,它的過表達抑制了活性氧(ROS)誘導的鐵死亡[14]。在本研究中,這些基因的高表達均與不良的預后相關。但是上述基因是否通過影響腫瘤細胞鐵死亡過程來影響肝細胞癌患者的預后尚未明確。
盡管在過去的幾年里,腫瘤細胞鐵死亡的機制一直是研究的熱點,但腫瘤免疫和鐵死亡之間的潛在調節(jié)機制仍然是未知的。我們對TCGA隊列中所有肝細胞癌患者進行單樣本基因富集分析(ssGSEA)來計算每個患者28種免疫細胞的浸潤評分。結果顯示,高風險組患者的髓系抑制性細胞(MDSC)浸潤程度顯著高于低風險組,MDSC在肝細胞癌中能夠促進免疫逃逸,減弱抗腫瘤T細胞的表達[15]。與之相反的是,嗜酸性粒細胞在低風險組的浸潤程度顯著高于高風險組,目前的研究表明,嗜酸性粒細胞在肝細胞癌中具有抗腫瘤活性[16]。此外,本研究顯示調節(jié)性T細胞(Tregs)在高風險組中的浸潤程度要顯著高于低風險組,而目前已證明Treg在肝細胞癌中富集,并抑制γ干擾素的分泌和CD8+T細胞的細胞毒性[17]。
本研究還存在一些局限性,首先,我們利用TCGA數據集構建模型,并使用ICGC數據集驗證該模型,但仍需要更多的獨立外部數據集對該模型做出驗證。此外,本研究還對腫瘤細胞鐵死亡與免疫之間的關系進行了初步的探討,但兩者之間的相互作用機制并未闡述,需要更多的基礎研究來明確。