彭瑞 張磊 王鵬 趙麗 王曄 牟曉峰
[摘要] 目的 ?通過TCGA數(shù)據(jù)庫對肺腺癌(LUAD)病人相關(guān)測序資料進(jìn)行分析,探討與LUAD預(yù)后相關(guān)的長鏈非編碼RNA(LncRNAs)。方法 從TCGA數(shù)據(jù)庫下載LUAD的基因表達(dá)資料及臨床信息,使用edge R包進(jìn)行差異分析,Survival包行預(yù)后分析,加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA)包構(gòu)建共表達(dá)網(wǎng)絡(luò),尋找與生存顯著相關(guān)的基因模塊,ClusterProfiler包對目標(biāo)模塊的mRNA進(jìn)行基因本體論(GO)注釋和KEGG富集分析。結(jié)果 共篩選得到15 473個差異表達(dá)基因(DEGs),進(jìn)一步篩選得到187個差異表達(dá)的LncRNAs(DELncRNAs),其中80個DELncRNAs表達(dá)上調(diào),107個DELncRNAs表達(dá)下調(diào)。將DELncRNAs納入Cox危險比例回歸模型進(jìn)行分析,得到影響LUAD病人預(yù)后的15個LncRNAs。Kaplan Meier分析驗(yàn)證顯示,Cox分析結(jié)果中低風(fēng)險的LUAD病人較高風(fēng)險者擁有更長的生存期。通過WGCNA生成40個模塊,其中violet模塊與生存相關(guān)性最高(r=0.680,P<0.05);violet模塊中的LncRNAs與預(yù)后相關(guān)的DELncRNAs取交集,通過篩選得到LINC00982。對violet模塊的mRNA進(jìn)行富集分析后顯示,LINC00982在血管生成、白細(xì)胞介素-6(IL-6)、淋巴免疫等有關(guān)的生物學(xué)過程(BP)中顯著富集,在核染色體等有關(guān)的細(xì)胞成分(CC)中占比增加,與嘧菌酯域結(jié)合等有關(guān)的分子功能(MF)有關(guān),主要參與IL-17、PD-L1等相關(guān)的信號通路。Pearson分析顯示,PRDM16表達(dá)水平隨LINC00982表達(dá)上調(diào)而升高(r=0.897,P<0.001),可能為LINC00982的靶基因。結(jié)論 LINC00982可能為預(yù)測LUAD病人預(yù)后的生物學(xué)標(biāo)志物,通過靶控PRDM16參與LUAD的發(fā)生發(fā)展。
[關(guān)鍵詞] 肺腺癌;長鏈非編碼RNA;癌癥基因組圖譜;預(yù)后
[中圖分類號] R730.261
[文獻(xiàn)標(biāo)志碼] A
[文章編號] 2096-5532(2022)01-0079-06
doi:10.11712/jms.2096-5532.2022.58.016
肺癌為死亡率最高的一種惡性腫瘤,其發(fā)病率逐年上升[1]。其中非小細(xì)胞肺癌占所有肺癌病例的80%左右,錯過早期診治的病人普遍生存時間不超過18個月。尋找一種新型分子診斷靶點(diǎn)對于改善非小細(xì)胞肺癌病人的整體生存至關(guān)重要[2]。非小細(xì)胞肺癌常見亞型肺腺癌(LUAD)與肺鱗癌(LUSC)基因表達(dá)并不一致,探尋LUAD發(fā)病機(jī)制中的關(guān)鍵基因,對抑制癌細(xì)胞的增殖、遷移、侵襲具有重要意義[3]。長鏈非編碼RNA(LncRNAs)是指超過200個核苷酸的非編碼RNA,其可以調(diào)節(jié)許多生理和病理相關(guān)的細(xì)胞功能[4]。越來越多的研究結(jié)果顯示,LncRNAs異常表達(dá)與癌癥類型相關(guān),這些異常表達(dá)的LncRNAs通過調(diào)控細(xì)胞增殖、遷移、存活來影響細(xì)胞內(nèi)穩(wěn)態(tài)[5]。許多研究都將LncRNAs與非小細(xì)胞肺癌的病理特征聯(lián)系起來,認(rèn)為其可作為預(yù)測非小細(xì)胞肺癌病人整體生存的生物學(xué)標(biāo)志物[4]。癌癥基因組圖譜(TCGA)包含人類33種不同癌癥的臨床病理數(shù)據(jù)和多平臺的分子圖譜,為癌癥病理機(jī)制的研究和分子靶點(diǎn)的開發(fā)提供了有力支持[6]。本文研究基于TCGA數(shù)據(jù)庫中LUAD的LncRNAs表達(dá)譜構(gòu)建Cox危險比例回歸模型,并行生存分析,使用加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(WGCNA)構(gòu)建基因共表達(dá)網(wǎng)絡(luò),識別與病人預(yù)后相關(guān)的模塊,富集分析注釋模塊基因的功能,探尋LUAD中的關(guān)鍵基因,為揭示LUAD的發(fā)病機(jī)制提供理論基礎(chǔ)。
1 資料和方法
1.1 TCGA數(shù)據(jù)集和差異表達(dá)基因(DEGs)分析
從TCGA下載LUAD的基因表達(dá)資料,時間截止到2020年6月。該數(shù)據(jù)集包括585例測序資料,篩選出其中臨床資料完整的59例正常樣本和513例腫瘤樣本。使用 edge R包對腫瘤樣本與正常樣本中的基因的表達(dá)量進(jìn)行差異分析,篩選條件為log2 Fold Change絕對值>1,P<0.05。
1.2 生存分析
整合LUAD病人的臨床信息,通過Survival包使用log-rank檢驗(yàn)進(jìn)行Kaplan Meier分析。另構(gòu)建Cox風(fēng)險比例回歸模型,并行PH檢驗(yàn),報告風(fēng)險比(HR)和95%置信區(qū)間(95%CI),比較差異表達(dá)的LncRNAs(DELncRNAs)與LUAD病人生存之間的聯(lián)系。使用ggplot2包對風(fēng)險回歸模型和生存分析進(jìn)行數(shù)據(jù)可視化。
1.3 WGCNA構(gòu)建基因共表達(dá)網(wǎng)絡(luò)
對TCGA中LUAD樣本基因表達(dá)量的平均值進(jìn)行大小排序,挑選513例腫瘤樣本中基因表達(dá)量最高的15例樣本,使用WGCNA包構(gòu)建共表達(dá)模塊,軟閾值功率設(shè)置為30,對樣本進(jìn)行聚類分析,分析模塊與性狀之間的關(guān)系,尋找與生存顯著相關(guān)的基因模塊,分析基因顯著性。提取該模塊中的基因,將其與預(yù)后模型中得到的LncRNAs取交集,篩選出與預(yù)后相關(guān)的模塊基因。
1.4 富集分析
使用ClusterProfiler包對目標(biāo)模塊的mRNA進(jìn)行富集以了解模塊對應(yīng)的生物學(xué)功能,進(jìn)行基因本體論(GO)注釋和KEGG富集分析,使用ggplot2包繪制GO二級分類氣泡圖及KEGG氣泡圖,使用GDCRNAtools包計算mRNA與目標(biāo)LncRNAs之間的Pearson相關(guān)系數(shù)(PCC),以PCC>0.8、P<0.05作為LncRNAs靶基因的篩選條件。
2 結(jié) 果
2.1 LUAD和正常樣本中的DEGs
本文59例正常樣本和513例LUAD樣本共篩選得到15 473個DEGs,進(jìn)一步篩選得到80個上調(diào)的DELncRNAs,107個表達(dá)下調(diào)的DELncRNAs(圖1A),對相應(yīng)DELncRNAs進(jìn)行聚類分析,繪制熱圖(圖1B)。其中最顯著的前10個表達(dá)上調(diào)及下調(diào)DELncRNAs見表1、2。
2.2 與生存及預(yù)后相關(guān)的基因
基于DELncRNAs表達(dá)矩陣構(gòu)建預(yù)后相關(guān)的預(yù)測模型,并進(jìn)行多因素Cox風(fēng)險比例回歸模型分析,根據(jù)P<0.05篩選得到影響LUAD病人預(yù)后的15個LncRNAs(圖2),多因素Cox風(fēng)險比例回歸模型PH檢驗(yàn)結(jié)果見表3。對高表達(dá)及低表達(dá)的LncRNAs分別進(jìn)行Kaplan Meier分析并繪制生存曲線,其中與預(yù)后最相關(guān)的6個LncRNAs的生存曲線見圖3。由圖3可見,高表達(dá)LINC00982、COLCA1、LINC01852、PWAR6、AL365361.1的LUAD病人較其低表達(dá)病人生存期長,TMPO-AS1高表達(dá)的LUAD病人預(yù)后較差。
2.3 共表達(dá)模塊及與預(yù)后相關(guān)的模塊基因
對15個表達(dá)量最高的腫瘤樣本進(jìn)行全基因分析,通過動態(tài)剪切樹算法對樣本的全基因組初步識別并分割,將具有相似表達(dá)譜的基因聚集于同一模塊中,得到40個模塊,每個顏色代表1個模塊(圖4A),對樣本再次進(jìn)行層次聚類分析以明確是否有離群異常值(圖4B)。通過對樣本臨床信息和模塊進(jìn)行關(guān)聯(lián)分析,發(fā)現(xiàn)2個模塊與生存狀態(tài)顯著相關(guān)(圖4C),其中violet模塊相關(guān)程度最高(r=0.680,P<0.01),其生存相關(guān)基因與violet模塊核心基因之間具有較高的相關(guān)性(圖4D)。violet模塊中僅有兩個LncRNAs(LINC00982和AL161785.1)與圖2中重疊,其中LINC00982生存分析顯示差異有統(tǒng)計學(xué)意義,因此將LINC00982作為目標(biāo)基因進(jìn)行后續(xù)分析。
2.4 關(guān)鍵模塊基因的功能分析
結(jié)果表明,violet模塊中66個mRNA在血管生成、藥物反應(yīng)、細(xì)胞外基質(zhì)、白細(xì)胞介素-6(IL-6)、淋巴免疫等有關(guān)的生物學(xué)過程(BP)中顯著富集,在核染色體、高爾基體等有關(guān)的細(xì)胞成分(CC)中占比增加,與嘧菌酯域結(jié)合、二氧酶活性等有關(guān)的分子功能(MF)有關(guān),見表4和圖5。KEGG通路分析結(jié)果顯示,這些基因主要參與IL-17、PD-L1、小細(xì)胞肺癌、HIF-1等相關(guān)的信號通路。Pearson相關(guān)分析結(jié)果顯示,PRDM16表達(dá)與LINC00982表達(dá)之間相關(guān)性最高,兩者表達(dá)呈顯著正相關(guān)(r=0.897,P<0.001)。因此,將PRDM16作為LINC00982的靶基因。見圖6。
3 討 論
本文研究首先對TCGA數(shù)據(jù)庫中LUAD病人572例的測序資料進(jìn)行差異分析,共篩選出187個DELncRNAs,并根據(jù)病人的臨床信息構(gòu)建出15個LncRNAs的預(yù)測模型,進(jìn)一步分析結(jié)果顯示,這些模型DELncRNAs風(fēng)險評分較高時往往伴隨著較短的生存時間。LINC00982、COLCA1、LINC01852、PWAR6、AL365361.1低表達(dá)以及TMPO-AS1高表達(dá)是LUAD病人的獨(dú)立預(yù)后因素,有望成為評估病人預(yù)后的生物學(xué)標(biāo)志物。
在差異表達(dá)分析之外,WGCNA已經(jīng)被確立為一種獨(dú)立有效的數(shù)據(jù)挖掘方法,可以用來尋找高度相關(guān)的分子集群和模塊,并識別模塊中的樞紐基因,目前已經(jīng)被應(yīng)用于多項肺癌的研究中[7-8]。本文通過對TCGA數(shù)據(jù)庫中LUAD病人中15個表達(dá)量最高的腫瘤樣本進(jìn)行WGCNA,共獲得40個共表達(dá)模塊,其中violet模塊與生存狀態(tài)相關(guān)程度最高;進(jìn)一步將violet模塊中的基因與影響病人預(yù)后的LncRNAs取交集,通過篩選得到了LINC009822和AL161785.1,其中LINC009822具有更好的預(yù)后預(yù)測價值,因此本文研究主要探討了LINC00982在LUAD中的預(yù)后意義。
本文研究篩選出violet模塊mRNA并進(jìn)行富集分析,GO注釋結(jié)果顯示這些mRNA與血管生成的正向調(diào)節(jié)、細(xì)胞對藥物的反應(yīng)有關(guān),也在IL-6以及淋巴系統(tǒng)免疫等炎癥相關(guān)的BP中富集。OGAWA等[9]研究顯示,IL-6可能成為肺癌新的治療靶點(diǎn),聯(lián)合應(yīng)用抗IL-6抗體能夠增強(qiáng)順鉑靶向作用肺癌組織的敏感性,提高肺癌病人的生存率。此外,本文KEGG通路分析顯示,violet模塊mRNA主要參與IL-17、PD-L1、小細(xì)胞肺癌、HIF-1等相關(guān)的信號通路。另有研究結(jié)果顯示,PD-L1在多種腫瘤細(xì)胞中均有表達(dá),PD-L1介導(dǎo)T細(xì)胞對靶細(xì)胞的生物效應(yīng)[10]。阻斷PD-L1信號通路能增強(qiáng)細(xì)胞毒性T淋巴細(xì)胞的抗腫瘤活性,從而識別腫瘤特異性抗原,對多種腫瘤均有效;并且其毒副作用明顯低于其他免疫療法。目前,美國食品和藥物管理局(FDA)已經(jīng)批準(zhǔn)將抗PD-L1藥物用于非小細(xì)胞肺癌以及黑色素瘤的治療中[11-12]。而IL-17作為腫瘤免疫中雙向調(diào)節(jié)因子,一方面能夠促進(jìn)抗腫瘤細(xì)胞毒性T細(xì)胞反應(yīng),導(dǎo)致腫瘤消退;另一方面,IL-17可促進(jìn)腫瘤細(xì)胞的血管生成和轉(zhuǎn)移,導(dǎo)致腫瘤的擴(kuò)散。有研究表明,肺癌病人肺泡灌洗液中的IL-17表達(dá)與調(diào)節(jié)T細(xì)胞中的細(xì)胞毒性T淋巴細(xì)胞抗原4表達(dá)呈負(fù)相關(guān)[13]。推測LINC00982在LUAD病人中可能通過調(diào)控IL-6、IL-17或PD-L1的表達(dá),為腫瘤的抗免疫治療提供新的分子靶點(diǎn)。
本文最后應(yīng)用Pearson相關(guān)分析LINC009822與violet模塊中mRNA表達(dá)的相關(guān)性,結(jié)果顯示,PRDM16的表達(dá)與LINC00982的表達(dá)呈正相關(guān),PRDM16可能為LINC00982的靶基因。L等[14]的研究發(fā)現(xiàn),LUAD病人LINC00982和PRDM16表達(dá)和拷貝數(shù)的變異較低,而甲基化程度則較高,LINC00982和PRDM16基因低表達(dá)的LUAD病人預(yù)后不良,并且該研究在LUAD細(xì)胞株中進(jìn)一步驗(yàn)證結(jié)果顯示LINC00982和PRDM16表達(dá)下調(diào)。本文研究結(jié)果與其一致。另有研究指出,PRDM16在LUAD中表達(dá)下調(diào),其表達(dá)水平與LUAD的主要臨床病理特征和預(yù)后密切相關(guān);體內(nèi)外實(shí)驗(yàn)結(jié)果表明,PRDM16可以通過抑制LUAD上皮間充質(zhì)轉(zhuǎn)換(EMT)的調(diào)節(jié)因子MUC4的轉(zhuǎn)錄,從而抑制癌細(xì)胞的EMT。因此,PRDM16可能成為LUAD的一個轉(zhuǎn)移抑制因子和潛在的治療靶點(diǎn)[15]。
綜上所述,LINC00982低表達(dá)是LUAD病人的預(yù)后相關(guān)危險因素,LINC00982可能通過調(diào)控PRDM16參與LUAD的發(fā)生發(fā)展。LINC00982可能成為LUAD預(yù)后評估的生物學(xué)標(biāo)志物。
[參考文獻(xiàn)]
[1]SIEGEL R L, MILLER K D, JEMAL A. Cancer statistics, 2019[J]. CA: A Cancer Journal for Clinicians, 2019,69(1):7-34.
[2]石少敏,趙建軍,楊蕾. 抑制有氧糖酵解增加硼替佐米誘導(dǎo)的非小細(xì)胞肺腺癌細(xì)胞凋亡[J]. 中國實(shí)驗(yàn)診斷學(xué), 2018,22(11):1999-2001.
[3]WANG T J, ZHANG L, TIAN P, et al. Identification of differentially-expressed genes between early-stage adenocarcinoma and squamous cell carcinoma lung cancer using meta-analysis methods[J]. Oncology Letters, 2017,13(5):3314-3322.
[4]LIU B, CHEN Y F, YANG J. LncRNAs are altered in lung squamous cell carcinoma and lung adenocarcinoma[J]. Oncotarget, 2017,8(15):24275-24291.
[5]HUARTE M. The emerging role of lncRNAs in cancer[J]. Nature Medicine, 2015,21(11):1253-1261.
[6]LIU J F, LICHTENBERG T, HOADLEY K A, et al. An integrated TCGA Pan-cancer clinical data resource to drive high-quality survival outcome analytics[J]. Cell, 2018,173(2):400-416.e11.
[7]WANG X H, LI G, LUO Q S, et al. Integrated TCGA analysis implicates lncRNA CTB-193M12.5 as a prognostic factor in lung adenocarcinoma[J]. Cancer Cell International, 2018,18:27.
[8]QI G Q, KONG W, MOU X Y, et al. A new method for excavating feature lncRNA in lung adenocarcinoma based on pathway crosstalk analysis[J]. Journal of Cellular Biochemistry, 2019,120(6):9034-9046.
[9]OGAWA H, KOYANAGI-AOI M, OTANI K, et al. Interleukin-6 blockade attenuates lung cancer tissue construction integrated by cancer stem cells[J]. Scientific Reports, 2017,7(1):12317.
[10]DAVIES L C, HELDRING N, KADRI N, et al. Mesenchymal stromal cell secretion of programmed death-1 ligands regulates T cell mediated immunosuppression[J]. Stem Cells (Dayton, Ohio), 2017,35(3):766-776.
[11]IWAI Y, HAMANISHI J, CHAMOTO K, et al. Cancer immunotherapies targeting the PD-1 signaling pathway[J]. Journal of Biomedical Science, 2017,24(1):1-11.
[12]SUL J, BLUMENTHAL G M, JIANG X P, et al. FDA approval summary: pembrolizumab for the treatment of patients with metastatic non-small cell lung cancer whose tumors express programmed death-ligand 1[J]. The Oncologist, 2016,21(5):643-650.
[13]KWIECIEN I, STELMASZCZYK-EMMEL A, POLUBIEC-KOWNACKA M, et al. Elevated regulatory T cells, surface and intracellular CTLA-4 expression and interleukin-17 in the lung cancer microenvironment in humans[J]. Cancer Immunology, Immunotherapy, 2017,66(2):161-170.
[14]L W, YU X, LI W X, et al. Low expression of LINC00982 and PRDM16 is associated with altered gene expression, da-maged pathways and poor survival in lung adenocarcinoma[J]. Oncology Reports, 2018,40(5):2698-2709.
[15]FEI L R, HUANG W J, WANG Y, et al. PRDM16 functions as a suppressor of lung adenocarcinoma metastasis[J]. Journal of Experimental & Clinical Cancer Research, 2019,38(1):1-16.
(本文編輯 黃建鄉(xiāng))
3681500338288