陳松鶴 潘丹陽 張科峰 陳亞棟
[摘要] 目的 基于癌癥基因組圖譜數(shù)據(jù)庫(The Cancer Genome Atlas,TCGA)構(gòu)建結(jié)腸腺癌壞死性凋亡相關(guān)長鏈非編碼RNA(long non-coding RNA,LncRNA)臨床預(yù)測模型與驗證。方法 從TCGA 下載結(jié)腸腺癌轉(zhuǎn)錄組和臨床數(shù)據(jù),從基因集富集分析(gene set enrichment analysis,GSEA)、京都基因與基因組百科全書(Kyoto Encyclopedia of Genes andGenomes,KEGG)數(shù)據(jù)庫及檢索文獻(xiàn)得到壞死性凋亡相關(guān)基因。運用R 軟件通過共表達(dá)篩選出差異壞死性凋亡相關(guān)LncRNA,采用單因素分析篩選出預(yù)后相關(guān)壞死性凋亡LncRNA,運用Lasso 回歸分析和多因素分析構(gòu)建預(yù)后風(fēng)險模型。通過差異分析、Kaplan-Meier 生存分析、風(fēng)險分析、受試者工作特征曲線(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC)、臨床分組模型驗證以評價該模型的可行性和準(zhǔn)確性。采用多因素進(jìn)行模型的獨立預(yù)后分析,同時繪制Nomogram 圖預(yù)測患者1 年、3 年和5 年的生存率,憑借校準(zhǔn)曲線評價其準(zhǔn)確性和預(yù)測能力。結(jié)果 壞死性凋亡LncRNA 共1039 個,預(yù)后相關(guān)的壞死性凋亡LncRNA 共46 個。Lasso 回歸分析以AP005264.1、ALMS1-IT1、AL354993.2、LINC00513、AC145423.2、AC008764.8 構(gòu)建預(yù)后風(fēng)險模型,模型評價顯示可區(qū)分高低風(fēng)險組的患者,高風(fēng)險的患者較低風(fēng)險預(yù)后較差(P<0.05);AUC 顯示模型具有較高的準(zhǔn)確性;多因素分析顯示風(fēng)險評分可作為結(jié)腸腺癌的獨立預(yù)后因子;臨床分組的模型驗證顯示模型同時適用于不同年齡、性別、Stage、N、T 等臨床癥狀;Nomgarm 分析內(nèi)部驗證中顯示校準(zhǔn)曲線顯示具有良好的擬合度,提示該列線圖預(yù)測模型具有良好預(yù)測能力。GSEA 富集分析結(jié)果顯示在高風(fēng)險組中活躍的功能或通路有缺口信號通路、磷脂酰肌醇信號系統(tǒng)、癌癥的途徑、JAK STAT 信號通路等,在低風(fēng)險組中活躍的功能或通路有阿爾茨海默病、檸檬酸循環(huán)、亨廷頓病、氧化磷酸化等。結(jié)論 本研究建立了6 個壞死性凋亡LncRNA的預(yù)后風(fēng)險模型,并進(jìn)行了初步的功能或通路的分析,對結(jié)腸腺癌患者預(yù)后的預(yù)測和分子機(jī)制的探討提供了參考。
[關(guān)鍵詞] TCGA 數(shù)據(jù)庫;壞死性凋亡;長鏈非編碼RNA;結(jié)腸腺癌;臨床預(yù)測模型
[中圖分類號] R589? ?[文獻(xiàn)標(biāo)識碼] A? ?[DOI] 10.3969/j.issn.1673-9701.2023.12.004
結(jié)直腸癌(colorectal cancer,CRC)是消化道常見的惡性腫瘤之一,好發(fā)于中老年人,具有惡性程度高、預(yù)后差的特點,常見的病理類型是結(jié)腸腺癌(colon adenocarcinoma,COAD)[1-2]。COAD 患者初期不具備典型的臨床癥狀,僅少部分患者出現(xiàn)易忽視的輕微癥狀,因此COAD 患者被發(fā)現(xiàn)時多數(shù)已達(dá)晚期,甚至出現(xiàn)肝、肺等遠(yuǎn)端轉(zhuǎn)移。對COAD 患者初期進(jìn)行有效的特異性篩查,提高早期檢出率,尋找和探討可靠的生物標(biāo)志物和精準(zhǔn)的治療靶點,對COAD 的預(yù)后具有至關(guān)重要意義。細(xì)胞凋亡是一種基因介導(dǎo)的自主有序的程序性死亡,壞死性凋亡作為一種不同于凋亡的新型程序性壞死細(xì)胞死亡形式,在癌癥中發(fā)揮著關(guān)鍵的作用[3-4]。本研究通過癌癥基因組圖譜數(shù)據(jù)庫(The Cancer Genome Atlas,TCGA)收錄的COAD 的轉(zhuǎn)錄組和臨床數(shù)據(jù)進(jìn)行分析,構(gòu)建臨床預(yù)測模型并驗證,為COAD 治療靶點和生物標(biāo)志物的篩選提供新的思路與參考。
1 資料與方法
1.1 數(shù)據(jù)資料
從TCGA(https://portal.gdc.cancer.gov/)下載COAD 的基因轉(zhuǎn)錄組數(shù)據(jù)和臨床資料,得到473 例結(jié)腸腺癌組織標(biāo)本和41 例正常結(jié)腸組織標(biāo)本基因表達(dá)數(shù)據(jù),臨床數(shù)據(jù)包含452 例結(jié)腸腺癌患者生存時間、生存狀態(tài)、年齡、性別、腫瘤分期等。從基因集富集分析(gene set enrichment analysis,GSEA)、京都基因與基因組百科全書(Kyoto Encyclopedia ofGenes and Genomes,KEGG)數(shù)據(jù)庫及檢索文獻(xiàn)得到壞死性凋亡相關(guān)基因67 個[5]。
1.2 差異表達(dá)的壞死性凋亡LncRNA 的篩選
運用R 軟件的“Limma 和igraph”包以“相關(guān)系數(shù)>0.6、P<0.001”為篩選條件進(jìn)行共表達(dá)分析尋找壞死性凋亡LncRNA,得到共表達(dá)網(wǎng)絡(luò)。運用R 軟件篩選腫瘤組和正常組的差異LncRNA,以“|log2FC|>1 和錯誤發(fā)現(xiàn)率<0.05”為閾值,進(jìn)行聚類得到熱圖和火山圖。
1.3 預(yù)后風(fēng)險模型的構(gòu)建與評價
將壞死性凋亡LncRNA 與生存數(shù)據(jù)合并,為減少統(tǒng)計學(xué)誤差,剔除生存時間低于30d 的患者。運用R 軟件“survival”包進(jìn)行單因素分析,計算95%CI,P<0.05 為差異有統(tǒng)計學(xué)意義,得到預(yù)后相關(guān)壞死性凋亡LncRNA,繪制森林圖。通過Lasso 回歸進(jìn)一步分析,以7∶3 為比例隨機(jī)分為訓(xùn)練組(n=291)和驗證組(n=123),建立多因素預(yù)后風(fēng)險模型,計算風(fēng)險評分。依據(jù)風(fēng)險評分中位數(shù)將兩組患者區(qū)分為高風(fēng)險組和低風(fēng)險組。通過“ggplot2、ggalluvial”包進(jìn)行預(yù)后相關(guān)LncRNA與基因正負(fù)調(diào)控的關(guān)系分析,繪制?;鶊D。運用Kaplan-Meier 法進(jìn)行生存分析,繪制生存曲線;通過“pheatmap”包進(jìn)行風(fēng)險分析,觀察患者風(fēng)險與風(fēng)險得分、生存狀態(tài)、基因的關(guān)系。
1.4 獨立預(yù)后分析
運用風(fēng)險得分和臨床資料,通過R 軟件進(jìn)行單因素分析來判斷影響COAD 生存期的危險因素,進(jìn)一步采用多因素進(jìn)行獨立預(yù)后分析,觀察模型風(fēng)險評分是否可以獨立于其他臨床性狀作為獨立預(yù)后因子。運用風(fēng)險得分與臨床資料,通過R 軟件__進(jìn)行年齡、性別、分期等不同臨床分組的模型驗證,觀察模型是否同時適用于不同臨床分組。運用風(fēng)險得分和臨床資料,通過R 軟件“rms”包進(jìn)行Nomogram 分析,并預(yù)測患者1 年、3 年、5 年的生存率。通過校準(zhǔn)曲線內(nèi)部驗證列線模型的區(qū)分度和準(zhǔn)確性,評價其預(yù)測能力。運用風(fēng)險得分與表達(dá)數(shù)據(jù),通過GSEA4.2.3 軟件進(jìn)行富集分析,并分別選取高低風(fēng)險組中活躍的前五的功能與通路,通過R 軟件構(gòu)建多GSEA 富集圖。
1.5 統(tǒng)計學(xué)方法
本研究數(shù)據(jù)均來源于TCGA 數(shù)據(jù)庫,采用R 語言(R version 4.2.0)進(jìn)行數(shù)據(jù)分析與可視化。生存分析采用Kaplan-Meier 法繪制生存曲線,采用單因素分析計算HR 和95%CI 篩選代謝相關(guān)基因。采用Lasso 回歸分析和多因素分析構(gòu)建預(yù)后風(fēng)險模型。采用多因素進(jìn)行模型獨立預(yù)后分析。通過R 軟件進(jìn)行臨床分組模型驗證和Nomogram 分析,P<0.05 為差異有統(tǒng)計學(xué)意義。
2 結(jié)果
2.1 差異表達(dá)的壞死性凋亡LncRNA 的篩選
共表達(dá)分析得到8237 個壞死性凋亡LncRNA,對473 例結(jié)腸腺癌組織標(biāo)本和41 個正常組織標(biāo)本進(jìn)行壞死性凋亡LncRNA 差異表達(dá)分析,得到差異表達(dá)的壞死性凋亡LncRNA 共1039 個,對篩選出壞死性凋亡LncRNA 進(jìn)行聚類分析,繪制熱圖和火山圖。
2.2 預(yù)后風(fēng)險模型的構(gòu)建
對1039 個差異表達(dá)的壞死性凋亡LncRNA進(jìn)行單因素分析,得到46 個參與COAD 預(yù)后顯著相關(guān)的壞死性凋亡LncRNA(P<0.05)。利用46 個預(yù)后相關(guān)的壞死性凋亡LncRNA 納入Lasso 回歸進(jìn)一步分析,建立多因素預(yù)后風(fēng)險模型,計算風(fēng)險評分。
2.3 預(yù)后風(fēng)險模型評價
預(yù)后相關(guān)LncRNA 與基因正負(fù)調(diào)控的關(guān)系分析顯示均為正相關(guān)A。生存分析顯示隨著生存時間的增加,高低風(fēng)險組的生存率下降,訓(xùn)練組和驗證組高低風(fēng)險組之間的生存比較,差異有統(tǒng)計學(xué)意義(P<0.05),提示模型可區(qū)分高低風(fēng)險組的患者。風(fēng)險分析結(jié)果顯示隨著患者風(fēng)險依次增大,風(fēng)險得分增加,依據(jù)中位值分為高和低風(fēng)險兩組。風(fēng)險模型的風(fēng)險得分與生存狀態(tài)關(guān)系結(jié)果顯示:隨著患者風(fēng)險增加,訓(xùn)練組和驗證組的死亡率也逐漸增加。風(fēng)險模型的風(fēng)險得分與壞死性凋亡LncRNA 表達(dá)關(guān)系顯示:訓(xùn)練組和驗證組隨著風(fēng)險增大,壞死性凋亡LncRNA 表達(dá)下降為均低風(fēng)險,如LINC00513;壞死性凋亡LncRNA 的表達(dá)上升為高風(fēng)險, 如AP005264.1、ALMS1-IT1、AL354993.2、AC145423.2、AC008764.8 表達(dá)量?;颊? 年、2 年、3 年生存率的ROC 曲線下面積(area under curve,AUC)分別為0.717、0.746 和0.700,顯示模型預(yù)測患者生存期具有較高準(zhǔn)確性。通過構(gòu)建的模型與年齡、性別、分期等臨床性狀聯(lián)合ROC 曲線分析顯示AUC 分別為0.717、0.566、0.487 和0.774,提示該模型具有較好的預(yù)測能力。
2.4 獨立預(yù)后分析
通過R 軟件進(jìn)行單因素和多因素分析,進(jìn)一步評價模型的預(yù)測價值,單因素分析顯示該模型風(fēng)險評分、年齡、Stage 分期、T、M 和N 期為影響COAD總生存期的危險因素。多因素分析顯示該模型風(fēng)險評分可作為COAD 獨立預(yù)后因子。
2.5 臨床分組的模型驗證
不同臨床分組的模型驗證結(jié)果顯示所構(gòu)建的模型同時適用于不同年齡、性別、Stage、N、T 等臨床性狀,但在M 期上差異無統(tǒng)計學(xué)意義。
2.6 Nomogram 分析及驗證
使用Nomgarm 時,單個患者的分值位于每個變量軸上,向上畫一條線來確定每個變量值的接收點數(shù),數(shù)字的總和位于總分?jǐn)?shù)點的數(shù)軸上,并向下繪制一條向下到生存軸的線,從而預(yù)測患者1、3 和5年生存的可能性。在模型的內(nèi)部驗證中,校準(zhǔn)曲線顯示具有良好的擬合度,說明該模型具有較好的準(zhǔn)確性和預(yù)測能力。
2.7 GSEA 富集分析
GSEA 富集分析顯示在高風(fēng)險組中活躍前五的功能或通路分別為缺口信號通路、磷脂酰肌醇信號系統(tǒng)、小細(xì)胞肺癌、癌癥的途徑、JAK STAT 信號通路;在低風(fēng)險組中活躍前五的功能或通路分別為阿爾茨海默病、檸檬酸循環(huán)、亨廷頓病、氧化磷酸化、帕金森病等。
3 討論
細(xì)胞死亡最初包含兩種經(jīng)典的模式,分別為凋亡和壞死,凋亡是具有自發(fā)性和調(diào)控性的一種特殊的細(xì)胞程序性死亡方式。長期以來,壞死被認(rèn)為是一種被動的、非程序性的、不受調(diào)節(jié)的死亡方式[6-7]。然而,隨著對細(xì)胞死亡認(rèn)識的不斷深入,人們逐漸認(rèn)識到不是所有的壞死均是被動發(fā)生的,其中最具有代表性的是Degterev 等[8]在2005 年發(fā)現(xiàn)了一種可被Necrostain-1 抑制的細(xì)胞死亡方式,其是一種受細(xì)胞有序調(diào)節(jié)的壞死途徑,稱為壞死性凋亡。壞死性凋亡同時具有凋亡及壞死的特征,表現(xiàn)為細(xì)胞膜完整性的喪失、細(xì)胞器腫脹和細(xì)胞內(nèi)成分的外溢釋放[9]。壞死性凋亡的發(fā)生需要受體相互作用蛋白激酶1、受體相互作用蛋白激酶3 和混合譜系激酶域樣蛋白的參與,其誘導(dǎo)方式主要有腫瘤壞死因子、腫瘤壞死因子相關(guān)凋亡誘導(dǎo)配體、Toll 樣受體、干擾素受體等,調(diào)控機(jī)制主要涉及泛素樣修飾、磷酸化修飾、混合譜系激酶域樣蛋白調(diào)控等[10-14]。
LncRNA 是一種長度>200 個核苷酸、不編碼蛋白的RNA 種類,LncRNA 作為一種主要的調(diào)節(jié)因子主要通過表觀遺傳調(diào)控、轉(zhuǎn)錄調(diào)控和轉(zhuǎn)錄后調(diào)控等方式調(diào)節(jié)基因的表達(dá)[15]。本研究以壞死性凋亡相關(guān)LncRNA 為切入點構(gòu)建COAD 的臨床預(yù)測模型,通過Lasso 回歸進(jìn)一步篩選后得到包括ALMS1-IT1、LINC00513、AC145423.2、AP005264.1、AL354993.2、AC008764.8 在內(nèi)的6 個壞死性凋亡相關(guān)LncRNA 參與預(yù)后風(fēng)險模型的構(gòu)建。長鏈非編碼RNA 在調(diào)節(jié)腫瘤的進(jìn)展中發(fā)揮著至關(guān)重要的作用,研究表明LncRNAALMS1-IT1 可能通過AVL9 介導(dǎo)的細(xì)胞周期蛋白依賴性激酶通路的激活促進(jìn)肺腺癌的惡性進(jìn)展[16]。Xing等[17]研究報道了ALMS1-IT1 能夠在頭頸部鱗狀細(xì)胞癌中高表達(dá),且具有較多的靶向miRNA 和蛋白質(zhì),表明ALMS1-IT1 在頭頸部鱗狀細(xì)胞癌的預(yù)后中起重要作用。除此之外,ALMS1-IT1 還能通過激活缺血性腦損傷中的NF-Kappa B 信號傳導(dǎo)促進(jìn)神經(jīng)炎癥[18]。干擾素受體是壞死性凋亡的誘導(dǎo)方式之一,研究表明,LINC00513 能夠通過調(diào)節(jié)關(guān)鍵轉(zhuǎn)錄因子STAT1 和STAT2 的磷酸化來促進(jìn)干擾素通路,表明LINC00513是Ⅰ型干擾素通路的新型正調(diào)節(jié)因子[19]。Xuan 等[20]報道利用自噬相關(guān)LncRNA 預(yù)測了透明細(xì)胞腎細(xì)胞癌的風(fēng)險特征,揭示了AC145423.2 的預(yù)測價值。AP005264.1、AL354993.2、AC008764.8 等3 個LncRNA在過往的報道中未被提及,本研究揭示了以上LncRNA 在結(jié)腸腺癌的預(yù)測價值,為將來COAD 的基礎(chǔ)實驗提供了研究方向和參考。
為了研究受6 種LncRNA 影響的生物學(xué)途徑,進(jìn)行了GSEA 分析以確定富含低風(fēng)險和高風(fēng)險組的途徑。結(jié)果顯示,高風(fēng)險組的通路主要與缺口信號通路、磷脂酰肌醇信號系統(tǒng)、癌癥的途徑、JAK STAT信號通路有關(guān),以上途徑均與癌癥密切相關(guān)。高危組與癌癥相關(guān)的豐富通路使高危組患者預(yù)后更差,死亡率更高。對于低風(fēng)險組,活躍靠前功能或通路主要與神經(jīng)系統(tǒng)疾病和代謝相關(guān)通路有關(guān),可能表明,與高風(fēng)險組相比,良好調(diào)節(jié)的神經(jīng)功能和代謝調(diào)節(jié)是有助于改善低風(fēng)險組預(yù)后和提高存活率的關(guān)鍵因素。
綜上所述,本研究中構(gòu)建并驗證了與COAD 患者預(yù)后相關(guān)的基于6 種LncRNA 構(gòu)建的風(fēng)險模型。結(jié)果顯示所構(gòu)建的風(fēng)險模型可以預(yù)測 COAD患者的生存時間和生存率,并可作為臨床環(huán)境中的預(yù)后標(biāo)志物,這些結(jié)果可用作未來COAD 患者管理的提供潛在預(yù)后和治療意義。
[參考文獻(xiàn)]
[1] HUANG L, ZHANG Y, LI Z, et al. MiR-4319 suppressescolorectal cancer progression by targeting ABTB1[J].United European Gastroenterol J, 2019, 7(4): 517–528.
[2] BRAY F, FERLAY J, SOERJOMATARAM I, et al.Global cancer statistics 2018: GLOBOCAN estimates ofincidence and mortality worldwide for 36 cancers in 185countries[J]. CA Cancer J Clin, 2018, 68(6): 394–424.
[3] YAN J, WAN P X, SWATI C, et al. Necroptosis andtumorprogression[J]. Trends Cancer, 2021, 8(1): 21–27.
[4] HUANG Y, ZOU Y, XIONG Q, et al. Development of anovel necroptosis-associated miRNA risk signature toevaluate the prognosis of colon cancer patients[J]. AnnTransl Med, 2021, 9(24): 1800.
[5] ZHAO Z R, LIU H H, ZHOU X Y, et al. NecroptosisrelatedLncRNAs: Predicting prognosis and thedistinction between the cold and hot tumors in gastriccancer[J]. J Oncol, 2021, 2021: 6718443.
[6] GROOTJANS S, VANDEN BERGHE T, VANDENABEELE P.Initiation and execution mechanisms of necroptosis: Anoverview[J]. Cell Death Differ, 2017, 24(7): 1184–1195.
[7] VANDEN BERGHE T, LINKERMANN A, JOUANLANHOUETS, et al. Regulated necrosis: The expandingnetwork of non-apoptotic cell death pathways[J]. Nat RevMol Cell Biol, 2014, 15(2): 135–147.
[8] DEGTEREV A, HUANGg Z, BOYCE M, et al. Chemicalinhibitor of nonapoptotic cell death with therapeuticpotential for ischemic brain injury[J]. Nat Chem Biol,2005, 1(2): 112–119.
[9] CAI Z, LIU Z G. Detection of MLKL oligomerizationduring programmed necrosis[J]. Methods Mol Biol,2018, 1857: 85–92.
[10] 劉加玉. GSK-3β 在壞死性凋亡中的作用[D]. 溫州:溫州大學(xué), 2021.
[11] STOLL G, MA Y, YANG H, et al. Pro-necroticmolecules impact local immunosurveillance in humanbreast cancer[J]. Oncoimmunology, 2017, 6(4): e1299302.
[12] WANG Z, GUO L M, ZHOU H K, et al. Using drugs totarget necroptosis: Dual roles in disease therapy[J].Histol Histopathol, 2018, 33(8): 773–789.
[13] SNYDER A G, HUBBARD N W, MESSMER M N, et al.Intratumoral activation of the necroptotic pathwaycomponents RIPK1 and RIPK3 potentiates antitumorimmunity[J]. Sci Immunol, 2019, 4(36): eaaw2004.
[14] WANG W, MARINIS J M, BEAL A M, et al. RIP1kinase drives macrophage-mediated adaptive immunetolerance in pancreatic cancer[J]. Cancer Cell, 2018,34(5): 757–774.
[15] LIU C Y, ZHANG Y H, LI R B, et al. LncRNA CAIFinhibits autophagy and attenuates myocardial infarctionby blocking p53-mediated myocardin transcription[J].Nat Commun, 2018, 9(1): 1–12.
[16] LUAN T, ZHANG T Y, LV Z H, et al. The LncRNAALMS1-IT1 may promote malignant progression oflung adenocarcinoma via AVL9-mediated activation ofthe cyclin-dependent kinase pathway[J]. FEBS OpenBio, 2021, 11(5): 1504–1515.
[17] XING L, ZHANG X, CHEN A. Prognostic 4-LncRNAbasedrisk model predicts survival time of patients withhead and neck squamous cell carcinoma[J]. Oncol Lett,2019, 18(3): 3304–3316.
[18] LU P, ZHANG Y, NIU H, et al. Upregulated long noncodingRNA alms1-it1 promotes neuroinflammation byactivating NF-κB signaling in ischemic cerebral injury[J].Curr Pharm Des, 2021, 27(41): 4270–4277.
[19] XUE Z, CUI C, LIAO Z, et al. Identification ofLncRNA Linc00513 containing lupus-associated geneticvariants as a novel regulator of interferon signalingpathway[J]. Front Immunol, 2018, 9: 2967.
[20] XUAN Y, CHEN W, LIU K, et al. A risk signature withautophagy-related long noncoding rnas for predicting theprognosis of clear cell renal cell carcinoma: Based onthe tcga database and bioinformatics[J]. Dis Markers,2021, 2021: 8849977.
(收稿日期:2022-08-29)
(修回日期:2023-01-15)