易鳳仙 曾淑華 周 容 楊 靜 王月君 唐 青 萬鳳知
(三峽大學(xué) 第一臨床醫(yī)學(xué)院[宜昌市中心人民醫(yī)院] 婦科, 湖北 宜昌 443003)
子宮內(nèi)膜癌(endometrial carcinoma,EC)可分為雌激素依賴型(I型)和非雌激素依賴型(Ⅱ型)。I型EC絕大部分為內(nèi)膜樣癌,少部分為黏液腺癌;Ⅱ型包括漿液性癌和透明細胞癌等[1]。EC是女性生殖系統(tǒng)三大惡性腫瘤之一,占女性生殖系統(tǒng)惡性腫瘤的20%~30%[2,3]。近年來,EC的發(fā)病率在全球范圍內(nèi)有所增加[4,5]。據(jù)統(tǒng)計,全世界每年有287 000例新增EC病例和74 000例EC相關(guān)死亡病例[6]。EC不僅給患者帶來痛苦,而且增加了社會和家庭的經(jīng)濟負擔(dān)。因此,明確其發(fā)病機制,尋找有效的分子生物標(biāo)志物,對實現(xiàn)EC的早發(fā)現(xiàn)、早診斷、早治療具有重要意義。
近年來,全基因組測序和生物信息學(xué)技術(shù)的發(fā)展為癌癥研究提供了新方向,例如癌癥基因組圖譜(The Cancer Genome Atlas,TCGA)數(shù)據(jù)庫、基因表達綜合譜(Gene Expression Omnibus,GEO)和基因組富集分析(Gene Set Enrichment Analysis,GSEA)。長鏈非編碼RNA(long non-coding RNA,LncRNA)是指長度>200個核苷酸的轉(zhuǎn)錄本,根據(jù)它們所處的基因組環(huán)境大致分為反義LncRNA(antisense LncRNA)、內(nèi)含子LncRNA(intronic LncRNA)和基因間LncRNA(intergenic LncRNA,LincRNA)等,其中LincRNA是最大的LncRNA分子[7]。LincRNA在腫瘤的發(fā)生發(fā)展中起重要調(diào)控作用。本研究使用生物信息學(xué)分析報告EC中的關(guān)鍵LincRNA,擬為EC的診斷和治療提供新的標(biāo)志物。
從TCGA(https://portal.gdc.cancer.gov/)下載RNA-Seq、拷貝數(shù)變化(copy number variation,CNV)和臨床數(shù)據(jù)。RNA-Seq數(shù)據(jù)顯示為FPKM(Fragments Per Kilobase of transcript per Million fragments mapped)?;贓nsembl數(shù)據(jù)集(http://asia.ensembl.org/index.html)對基因變異類型進行分類。
使用基因富集分析軟件鑒定EC中差異性LincRNA的富集程度[8]。對于功能富集分析,根據(jù)目標(biāo)LincRNA的相關(guān)性,將mRNA排列,以Pearson相關(guān)系數(shù)R值表示相關(guān)水平。隨后,列出mRNA和相應(yīng)的R值,并通過clusterProfiler進行GO、KEGG及GSEA富集分析[9,10]。
本研究選擇了總體生存(overall survival,OS)作為預(yù)后指標(biāo),OS定義為從診斷之日至因任何原因死亡之日的時間,研究時間為5年[11]。在TCGA數(shù)據(jù)集中的漿液性癌樣品上建立雙變量回歸和多元Cox模型,驗證漿液性癌中特異性表達LincRNAs在漿液性癌中的預(yù)后預(yù)測價值。
多組間比較采用單因素方差分析,兩兩比較采用Bonferroni校正的t檢驗以評估任意兩種類型的樣品之間表達水平的差異。交集分析通過在線工具venny 2.1進行。在SPSS 25.0上執(zhí)行雙變量回歸和Cox模型。使用GraphPad Prism 8或Rv3.6.1進行其他分析和繪圖。以P<0.05為差異有統(tǒng)計學(xué)意義。
為了鑒定在EC中差異表達的LncRNA,在521個EC腫瘤樣品(包括407個內(nèi)膜樣癌組織和114個漿液性癌組織)和35個正常組織樣品中分析它們的表達。與正常組織相比,腫瘤組織中LincRNA表達更高(P<0.05);與內(nèi)膜樣癌組織相比,LincRNAs在漿液性癌組織中表達更高(P<0.05),見圖1A。與正常組織相比,腫瘤組織中反義LncRNA表達更低(P<0.05),漿液性癌組織與內(nèi)膜樣癌組織比較差異無統(tǒng)計學(xué)意義(P>0.05),見圖1B。與正常組織相比,其它類型LncRNA在內(nèi)膜樣癌組織中表達更高(P<0.05),見圖1C。篩選出只在漿液性癌中高表達的LincRNA共39個(C2orf48,LINC00839,LINC01993,AL391095.1,AL354707.1,AC109826.1,LINC00954,LINC01508,LINC01814,LINC00958,AC105219.3,MIR9-3HG,AC117498.2,LINC00239,AC012236.1,AL023284.4,LINC01572,AL512274.1,AC010422.2,AC004233.3,AL390719.2,U62317.1,AC099568.2,LINC02012,AL096828.3,AL121906.2,BLACAT1,UCA1,AL121899.1,AL391832.2,AC024230.1,AC016737.1,AL671710.1,LINC01127,AL080250.1,AC025165.4,AC010719.1,AP002360.3,AC253536.6)。未發(fā)現(xiàn)只在內(nèi)膜樣癌中高表達的LincRNA。
注:A:LincRNA在不同組織中的表達; B:反義LncRNA在不同組織中的表達; C:其它類型LncRNA在不同組織中的表達;與正常組織相比,*P<0.05;與漿液性癌組織相比,#P<0.05圖1 LncRNA在不同組織中的表達
為了鑒定這39種LincRNA在EC中的富集程度,根據(jù)它們的表達進行了GSEA分析。這39種LincRNA在EC中富集得分為0.65(P=0.006)(見圖2A),在漿液性癌中富集得分為0.66(P=0.010)(見圖2B),說明這39種LincRNA在EC和漿液性癌中顯著富集。
注:A:LincRNA在EC中的富集分析;B:LincRNA在漿液性癌中的富集分析圖2 LincRNA富集分析
密度圖顯示了每個漿液性癌特異性表達LincRNA的CNV擴增和缺失分布(見圖3)。
圖3 LincRNA的CNV譜
這39個LincRNA的CNV擴增密度峰值明顯大于缺失密度峰值,表明CNV擴增介導(dǎo)了漿液性癌中特異性表達的LincRNA的過表達。在這39種LincRNA中,膀胱癌相關(guān)轉(zhuǎn)錄本1(bladder cancer-associated transcript 1,BLACAT1)(TCGA編號ENSG00000281406)的表達差異性最大。
通過雙變量回歸(見圖4A)和Cox(見圖4B)模型進行ROC分析驗證這些LincRNA對OS的預(yù)測價值。雙變量回歸模型(AUC=0.786,P<0.000 1)和多變量Cox模型(AUC=0.704,P=0.001)顯示,這些LincRNA均為漿液性癌的預(yù)測標(biāo)志物。
圖4 漿液性癌特異性表達LincRNAs預(yù)測分析
本研究通過生物信息學(xué)方法分析公共數(shù)據(jù)庫中的EC測序數(shù)據(jù),首先確定了不同類型的LncRNA在EC不同亞型中的表達水平,接下來鑒定了漿液性癌中特異性過表達的39種LincRNA。這39種LincRNA中,LincRNA BLACAT1的表達差異性最大,且這39種LincRNA可作為漿液性癌預(yù)后預(yù)測的生物標(biāo)記物。
LncRNA是指長度>200個核苷酸的轉(zhuǎn)錄本,不含蛋白質(zhì)編碼序列[12]。盡管有多項研究報告指出,LincRNA在EC中既有腫瘤抑制作用也有腫瘤促進作用,但尚無研究報道LincRNA與漿液性癌之間的關(guān)系。據(jù)報道,某些LincRNA與腫瘤進展有關(guān)。例如,LincRNA UCA1(ensembl編號ENSG00000214049)可促進胃癌、膀胱癌和乳腺癌的發(fā)生[13,14]。本研究發(fā)現(xiàn),39種LincRNA的CNV擴增密度峰值明顯大于缺失密度峰值,表明CNV擴增介導(dǎo)了漿液性癌中特異性LincRNA的過表達,可能是LincRNA過表達的重要機制,后續(xù)研究中應(yīng)進一步實驗驗證。
本研究發(fā)現(xiàn),在這39種LincRNA中,LincRNA BLACAT1表達差異性最大,LincRNA BLACAT1可作為OS的預(yù)測指標(biāo)。據(jù)報道,LincRNA BLACAT1可促進腫瘤發(fā)生,并與小細胞肺癌和大腸癌的不良預(yù)后有關(guān)[15,16]。具體機制可能與LincRNA BLACAT1調(diào)節(jié)Wnt信號通路,促進腫瘤增殖、遷移和侵襲有關(guān)[17]。然而,本研究也存在一些不足。首先,本研究缺乏臨床標(biāo)本的收集和進一步實驗驗證;其次,沒有預(yù)測和驗證LincRNA BLACAT1的下游靶標(biāo),后續(xù)研究中將通過收集臨床標(biāo)本,結(jié)合體內(nèi)和體外實驗進行深入的機制探討。
綜上所述,在漿液性癌中差異表達的39種LincRNAs可作為漿液性癌的預(yù)后標(biāo)志物。這些LincRNA中,LincRNA BLACAT1表達差異最大,有望為EC提供新的預(yù)后標(biāo)志物和治療靶點。