劉雅峰,魯繼斌
(中國醫(yī)科大學附屬盛京醫(yī)院胸外科,沈陽 110004)
肺癌是全球癌癥死亡的最主要原因。在我國,其發(fā)病率和死亡率亦位于惡性腫瘤之首[1]。肺腺癌屬于非小細胞肺癌,是肺癌最常見的病理類型,約占肺癌整體的40%[2]。分子靶向治療和免疫治療已經(jīng)成為肺腺癌的常規(guī)治療手段,使其預后有所改善,但我國肺癌患者總體5年生存率仍小于20%。因此,尋找預測肺癌預后的生物標志物十分必要。
銅是生物體必需的微量元素。但當細胞內(nèi)的銅離子濃度超過穩(wěn)態(tài)閾值時,會表現(xiàn)出細胞毒性。銅死亡是一種新型細胞程序性死亡,其原理為過量的銅離子直接與三羧酸循環(huán)中的脂?;煞纸Y(jié)合,誘導脂酰化蛋白質(zhì)聚集和鐵硫簇蛋白質(zhì)丟失,激發(fā)蛋白質(zhì)毒性應激,從而導致細胞死亡[3]。已有研究[4]表明,銅離子與腫瘤的生長、增殖和抗血管生成等密切相關。
長鏈非編碼RNA (long noncoding RNA,lncRNA)是一種長度超過200個核苷酸的非編碼RNA。許多研究[5-6]證實,lncRNA可以調(diào)控肺腺癌的生物學行為,還可以作為預測肺腺癌預后等的潛在生物標志物。本研究旨在開發(fā)新型銅死亡相關配對lncRNA的預后標志物,以期提高預測肺腺癌患者預后的準確性以及評估其藥物敏感性。
由癌癥基因組圖譜 (The Cancer Genome Atlas,TCGA) 數(shù)據(jù)庫獲取肺腺癌患者轉(zhuǎn)錄組數(shù)據(jù)、基因突變信息和對應的臨床信息。使用Ensembl數(shù)據(jù)庫來源的注釋文件,注釋其中的lncRNA。從已有文獻中獲取共10個銅死亡相關基因,包括FDX1、LIAS、LIPT1、DLD、DLAT、PDHA1、PDHB、MTF1、GLS和CDKN2A。以相關系數(shù)|r|>0.4且P< 0.000 1為標準進行Pearson相關性分析,得到銅死亡相關lncRNA (cuproptosisrelated lncRNA,crlncRNA)。使用R語言limma包,設定閾值為|log2FC|>1且P< 0.05進行差異分析,獲得DEcrlncRNA。
對DEcrlncRNA進行兩兩循環(huán)配對分析。根據(jù)lncRNA的相對表達水平,若lncRNA1與 lncRNA2的表達水平之比>1,標記該配對lncRNA為1,反之記錄為0,從而構(gòu)造出包含1或0的表達矩陣。僅保留0或1在所有樣本中比率在0.2~0.8之間的配對lncRNA。
使用單因素Cox回歸分析確定與患者總生存時間 (overall survival,OS) 相關的配對DEcrlncRNA。為了防止模型過度擬合,應用LASSO回歸分析進行進一步收斂。然后采用多因素Cox回歸分析,構(gòu)建風險模型并計算風險評分。根據(jù)風險評分的中位數(shù),將肺腺癌患者分為高風險組和低風險組。使用Kaplan-Meier生存分析驗證高風險組和低風險組間患者的生存差異。此外,通過繪制受試者操作特征(receiver operating characteristic,ROC) 曲線,以曲線下面積 (area under curve,AUC) 為標準,評估風險評分預測1 年、3 年和 5 年生存情況的準確性。繪制風險評分與臨床參數(shù)的ROC曲線,以對比預測效能。最后,對風險評分和常見的臨床參數(shù)進行單因素和多因素Cox回歸分析,以驗證構(gòu)建的風險模型是否可以獨立于性別、年齡和腫瘤分期等臨床參數(shù),有效預測肺腺癌患者的預后。
應用R語言clusterProfiler包,并基于基因本體(gene ontology,GO) 以及京都基因和基因組數(shù)據(jù)庫(Kyoto Encyclopedia of Genes and Genomes,KEGG),探索影響銅死亡風險評分高低的生物學功能機制,分析潛在通路。
為了進一步分析不同銅死亡相關風險分組的基因突變圖景,使用R語言maftools包處理由TCGA數(shù)據(jù)庫獲取的肺腺癌患者基因突變信息,分別分析并展示高風險組和低風險組基因突變的頻率和特點。
為了更好的評估風險模型對肺腺癌患者的臨床應用價值,使用癌癥基因組計劃數(shù)據(jù)庫來源的藥物處理信息,應用R語言pRRophetic包評估常見肺腺癌化療藥物的半數(shù)抑制濃度 (half maximal inhibitory concentration,IC50)。比較高風險組和低風險組間IC50的差異。
采用R語言4.1.0版本進行統(tǒng)計學分析。采用Pearson相關性分析評估相關系數(shù)。采用t檢驗確定組間差異。采用Kaplan-Meier法進行生存分析,采用對數(shù)秩檢驗確定差異顯著性。P< 0.05為差異有統(tǒng)計學意義。
2.1.1 DEcrlncRNA的篩選:納入TCGA數(shù)據(jù)庫中臨床信息完整的481個肺腺癌樣本和59個癌旁組織樣本的轉(zhuǎn)錄組數(shù)據(jù)。提取其中的lncRNA數(shù)據(jù),與銅死亡相關基因進行相關性分析后,共得到267個crlncRNA。crlncRNA經(jīng)差異分析后共篩選出145個DEcrlncRNA,其中上調(diào)lncRNA 74個,下調(diào)lncRNA 71個。
2.1.2 配對DEcrlncRNA的確定:對145個DEcrlncRNA循環(huán)配對并計算0/1矩陣,再次篩選后得到有效配對DEcrlncRNA,共3 647對。
2.2.1 預后模型的構(gòu)建:采用單因素Cox回歸分析篩選出OS相關配對DEcrlncRNA共178個,行LASSO回歸分析。之后使用逐步回歸法,得到用于構(gòu)建風險模型的6個配對DEcrlncRNA (表1)?;谝陨吓鋵EcrlncRNA,通過多因素Cox回歸分析計算風險評分。
表1 配對DEcrlncRNA的單因素和多因素Cox回歸分析Tab.1 Univariate or multivariate Cox regression analysis of DEcrlncRNA pairs
2.2.2 預后模型的評估:Kaplan-Meier生存分析曲線提示,高風險組預后更差,進一步證實了預后模型的有效性 (圖1A)。預后模型1年、3年和5年生存率ROC曲線的AUC范圍為0.69~0.76 (圖1B)。此外,比較預后模型與常見臨床相關因素對3年生存率的預測能力,發(fā)現(xiàn)風險評分具有最大AUC (圖1C),這些結(jié)果充分說明了預后風險模型的優(yōu)異性。對風險評分與常見臨床因素進行單因素和多因素Cox回歸分析,結(jié)果顯示,僅風險評分和臨床分期為肺腺癌患者的獨立預后因素 (圖1D、1E),可見風險評分具有良好的預后預測價值。
圖1 預后模型的評估Fig.1 Validation of the prognostic signature
為深入探究不同風險組間潛在的生物學機制,進行了基于高風險組和低風險組間差異基因的GO和KEGG分析。GO分析結(jié)果 (圖2A) 顯示,風險評分差異基因主要作用于生長因子的結(jié)合、細胞外基質(zhì)構(gòu)成和分泌顆粒等生物學過程。KEGG通路分析結(jié)果 (圖2B) 提示,差異基因主要集中于p53信號通路、腫瘤的轉(zhuǎn)錄調(diào)控通路和白細胞介素-17信號通路等。
使用基因突變?nèi)胺治觯瑢斫饣蛲蛔儗用娴母唢L險組和低風險組的差別意義重大。高風險組患者基因突變頻率更高,TP53與TTN為2組患者最常見的突變基因 (圖3)。此外,多數(shù)的2組間共有基因,在低風險組中突變頻率顯著降低。COL1A1等基因突變頻率較高,僅發(fā)生于高風險組,這可能與高風險組更差的預后相關。
圖3 基因突變瀑布圖Fig.3 The waterfall plot of gene mutation
鑒于高風險組和低風險組間生存差異顯著,對肺腺癌患者常用的化療藥物進行篩選、分析,以期進一步指導臨床決策。比較高風險組與低風險組化療藥物的IC50,發(fā)現(xiàn)在高風險組的患者中,順鉑、紫杉醇、吉他西濱、多西他賽、長春瑞濱和依托泊苷的IC50均相對較低 (圖4)。這些結(jié)果表明,更高的風險評分與化療藥物敏感性的增加相關,證實風險模型是指導臨床個體化治療的優(yōu)秀指標。
圖4 藥物敏感性分析Fig.4 Drug sensitivity analysis
肺腺癌是肺癌的最常見亞型。近年來,應用低劑量CT進行肺癌篩查逐漸普及,顯著降低了肺腺癌的死亡率。分子靶向藥物和免疫治療不斷進步,明顯改善了肺腺癌患者的預后。然而,肺腺癌具有異質(zhì)性,不同人群對治療的反應程度及其生存時間有很大的差異性。此外,肺癌的總體預后仍然較差。由此可見,目前仍迫切需要開發(fā)肺腺癌相關的預后模型,發(fā)現(xiàn)新的肺腺癌治療靶點,并探索其潛在的生物學機制。
細胞程序性死亡是最具潛力的抗腫瘤機制之一。最近,QU等[6]提出了銅死亡的概念,它是一種不同于細胞凋亡、鐵死亡和焦亡等的全新的銅依賴性細胞程序性死亡。銅死亡的發(fā)現(xiàn),進一步豐富了抗腫瘤的潛在機制。目前已有研究[7-8]證實,銅死亡相關的特征模型對肺腺癌患者預后具有預測價值或免疫治療相關性,其中部分研究[8]建立了基于lncRNA的模型。考慮到測序平臺、檢測時間和標準化處理等的差異帶來的批次效應,可能影響基于表達量進行預后預測的準確性。受既往研究[9]啟發(fā),本研究采用一種新算法,即根據(jù)lncRNA相對表達量而非具體的表達量,來構(gòu)建預后模型。這種模型既削弱了批次效應,還可以利用如免疫組織化學、PCR、轉(zhuǎn)錄組數(shù)據(jù)和基因芯片等各種來源的lncRNA表達量數(shù)據(jù),具有較高的臨床應用價值。
本研究中,預后風險模型共包含10個lncRNA(基于6個配對DEcrlncRNA),其中5個lncRNA已被證實與肺腺癌或其他腫瘤的發(fā)生、發(fā)展和預后密切相關。研究[10]證實,OGFRP1通過干擾miR-124-3p進而上調(diào)LYPD3表達來促進非小細胞肺癌進展。LIU等[11]發(fā)現(xiàn),OGFRP1還可通過miR-4640-5p/eIF5A 軸在肺腺癌中發(fā)揮癌基因作用。CARD8-AS1表達量降低與肺腺癌較差的預后相關,其機制可能是CARD8-AS1下調(diào)后,通過靶向miR-650進而下調(diào)Bax表達實現(xiàn)[12]。JIAO等[13]證明,TDRKH-AS1還可通過激活Wnt/β-catenin信號通路促進結(jié)直腸癌細胞的增殖和侵襲,且其與結(jié)直腸癌預后呈負相關。LINC02518和AC026401.3被證實與肝細胞癌預后呈負相關[14-15],其中AC026401.3通過與OCT1相互作用來增加E2F2的轉(zhuǎn)錄,以此增強肝細胞癌對索拉非尼和侖伐替尼的耐藥性。以上研究為構(gòu)建的模型提供了理論支持。
本研究存在一定的局限性。首先,本研究為回顧性研究,未來需要多中心前瞻性的真實世界臨床數(shù)據(jù)來進一步證實結(jié)論。其次,本研究僅采用來自于TCGA數(shù)據(jù)庫的轉(zhuǎn)錄組數(shù)據(jù),需要更多的實驗數(shù)據(jù)來探究以上lncRNA 調(diào)節(jié)銅死亡和影響銅死亡等方面的潛在機制,以進一步支持這些結(jié)論。最后,受臨床數(shù)據(jù)和藥物數(shù)據(jù)庫所限,本研究僅能分析部分肺腺癌常用化療藥物 (如順鉑、紫杉醇和依托泊苷等) 的IC50,缺乏對靶向藥和免疫治療藥物敏感性的分析數(shù)據(jù)。
綜上所述,本研究確立了一種由配對DEcrlncRNA構(gòu)建的新模型,它可以有效預測肺腺癌患者的預后情況,不受lncRNA精確表達量和數(shù)據(jù)來源的限制,并且有助于預測治療敏感性,這可能有利于篩選出相應的潛在受益人群。