孫金旗, 馬佳康, 任凱凱, 李 南, 李雨濛, 馬 軍,3
鄭州大學(xué)第二附屬醫(yī)院 1.檢驗(yàn)科; 2.腫瘤科,河南 鄭州 450014; 3.鄭州大學(xué)消化疾病研究所
肝癌是全世界高發(fā)的惡性腫瘤,其發(fā)病率也呈逐年增高的趨勢[1-2]。近年來,雖然針對肝癌的研究取得不斷進(jìn)展,但仍面臨著嚴(yán)峻的挑戰(zhàn)。隨著全基因組和轉(zhuǎn)錄組測序技術(shù)的發(fā)展,肝癌相關(guān)基因日益受到關(guān)注,其中的長鏈非編碼RNA(long non-coding RNA,lncRNA)成為腫瘤研究的熱點(diǎn)[3-4]。lncRNA是一種非編碼RNA,其轉(zhuǎn)錄本的長度超過200個核苷酸,lncRNA可以和microRNA(miRNA)相互作用,作為一種相互競爭的內(nèi)源性RNA(competing endogenous RNA,ceRNA)來調(diào)節(jié)靶基因的表達(dá),這在腫瘤的起源和發(fā)展中扮演著重要的角色[5]。由美國政府發(fā)起的癌癥和腫瘤基因圖譜(TCGA)計劃[6],通過應(yīng)用基因測序技術(shù),繪制人類全部癌癥的基因組變異。本文下載了TCGA數(shù)據(jù)庫中的肝癌轉(zhuǎn)錄組數(shù)據(jù),利用perl語言和R語言進(jìn)行系統(tǒng)分析,旨在找出肝癌相關(guān)基因,為今后的實(shí)驗(yàn)研究提供依據(jù)。
1.1一般資料使用網(wǎng)站專用的工具下載肝癌的mRNA基因表達(dá)數(shù)據(jù)和miRNA基因表達(dá)數(shù)據(jù),收集患者的臨床信息。肝癌的基因測序數(shù)據(jù)424例,男281例,女143例,其中包括癌組織374例,癌旁正常組織50例?;虮磉_(dá)量用于差異基因分析和ceRNA網(wǎng)絡(luò)構(gòu)建,患者的臨床信息用于生存分析。
1.2差異基因分析鏈接http://bioconductor.org/biocLite.R網(wǎng)站下載R語言數(shù)據(jù)分析包“edgeR”和圖形創(chuàng)建包“gplots”,設(shè)置文件路徑讀入基因表達(dá)數(shù)據(jù),將癌組織的基因數(shù)據(jù)與正常組織的基因數(shù)據(jù)進(jìn)行比對分析,在R語言的分析代碼中設(shè)置差異倍數(shù)(foldChange)≥2,差異的顯著性(padj:調(diào)整P值)<0.01。
1.3生存分析TCGA數(shù)據(jù)庫中下載的患者臨床信息包含了患者的生存狀態(tài)及生存時間,提取生存狀態(tài)和生存時間后,用R語言中生存分析包“survival”尋找生存相關(guān)的差異表達(dá)mRNA、lncRNA和miRNA。
1.4構(gòu)建ceRNA網(wǎng)絡(luò)利用TCGA數(shù)據(jù)庫中差異表達(dá)的mRNA、lncRNA、miRNA,通過miRcode(www.mircode.org)來預(yù)測與差異lncRNA相互作用的miRNA,并與差異miRNA取交集。利用這些交集中的差異表達(dá)的miRNA在3個數(shù)據(jù)庫(miRDB、miRTarBase、TargetScan)中做比對分析后找出差異表達(dá)的miRNA和差異表達(dá)的mRNA之間的對應(yīng)關(guān)系。Cytoscape可以把三者之間的對應(yīng)關(guān)系進(jìn)行可視化處理,構(gòu)建一個ceRNA網(wǎng)絡(luò)圖。
2.1差異表達(dá)的mRNA、lncRNA和miRNA對肝癌的測序數(shù)據(jù)進(jìn)行分析后,共識別出差異表達(dá)的mRNA 1 992個,其中高表達(dá)的基因1 787個,低表達(dá)的基因205個;差異表達(dá)的lncRNA1 082個,其中高表達(dá)的基因1 024個,低表達(dá)的基因58個;差異表達(dá)的miRNA 122個,其中高表達(dá)的基因119個,低表達(dá)的基因3個(見圖1~2)。
注:橫坐標(biāo):底數(shù)是10,矯正P值取負(fù)對數(shù);縱坐標(biāo):底數(shù)是2,差異倍數(shù)取對數(shù)。黑色:無差異基因,紅色:高表達(dá)差異基因,
注:紅色:高表達(dá)差異基因,綠色:低表達(dá)差異基因。
2.2生存分析為了尋找在肝癌中重要的lncRNA,我們通過miRcode數(shù)據(jù)庫篩選和差異表達(dá)的miRNA相關(guān)的lncRNA 77個,對77個lncRNA進(jìn)行Cox多因素生存分析,設(shè)置P<0.01為篩選標(biāo)準(zhǔn),最終發(fā)現(xiàn)與肝癌預(yù)后相關(guān)的6個lncRNA組合(見表1、圖3),其中高表達(dá)的有5個,與肝癌的生存期呈正相關(guān);低表達(dá)的有1個,與肝癌的生存期呈負(fù)相關(guān)。與77個差異lncRNA相關(guān)的差異miRNA有16個,通過三個數(shù)據(jù)庫(miRDB、miRTarBase、TargetScan)預(yù)測得到的靶mRNA和差異表達(dá)的mRNA取交集,最終獲得與肝癌有關(guān)的mRNA有35個;同樣設(shè)置P<0.01為篩選標(biāo)準(zhǔn),對16個miRNA和35個mRNA做Cox多因素生存分析,發(fā)現(xiàn)與肝癌生存相關(guān)的miRNA有1個(見表2、圖4),mRNA有20個(見表3、圖5)。
表1 Cox回歸分析中篩選的差異lncRNATab 1 Differentially expressed lncRNAs screened from Cox regression analysis
表2 Cox回歸分析中篩選的差異miRNATab 2 Differentially expressed miRNAs screened from Cox regression analysis
表3 Cox回歸分析中篩選的差異mRNATab 3 Differentially expressed mRNAs screened from Cox regression analysis
2.3構(gòu)建ceRNA網(wǎng)絡(luò)為了更好地闡明肝癌基因潛在的作用途徑和網(wǎng)絡(luò),我們依據(jù)差異表達(dá)的mRNA、lncRNA和miRNA調(diào)控關(guān)系,構(gòu)建了ceRNA網(wǎng)絡(luò)關(guān)系圖。使用Cytoscape-3.5.1對肝癌的相關(guān)基因進(jìn)行了可視化,為了使圖形更加清晰易讀,我們只保留了有5個或5個以上連接點(diǎn)的lncRNA(見圖6)。
在ceRNA網(wǎng)絡(luò)中,包含了26個lncRNA,通過連接點(diǎn)計算后,我們發(fā)現(xiàn)有3個lncRNA TCL6、HOTTIP、PVT1與miRNA連接點(diǎn)≥10,推測這3個lncRNA可能在肝癌的發(fā)生、發(fā)展中起關(guān)鍵作用。有6個連接點(diǎn)以上的lncRNA還有16個,包含了肝癌生存期相關(guān)的3個基因AP002478.1、MYLK-AS1、C2orf48,這3個基因也可以作為后續(xù)肝癌研究中重點(diǎn)關(guān)注的對象。
我們還發(fā)現(xiàn),低表達(dá)的hsa-mir-424和高表達(dá)的hsa-mir-519d也在肝癌的基因調(diào)控中發(fā)揮著重要作用。肝癌基因中與has-mir-424有關(guān)聯(lián)的mRNA有13個,lncRNA有29個;與hsa-mir-519d有關(guān)聯(lián)的mRNA有9個,lncRNA有23個(見圖7)。hsa-mir-424和hsa-mir-519調(diào)控的mRNA中有10個與肝癌的生存后預(yù)后呈負(fù)相關(guān),有1個mRNA(CPEB3)與肝癌生存后預(yù)后呈正相關(guān)。
圖3 肝癌相關(guān)的6個lncRNA的生存曲線 Fig 3 Survival curves of 6 lncRNAs associated with liver cancer
圖4 肝癌相關(guān)的1個miRNA的生存曲線 Fig 4 Survival curve of one miRNA associated
在消化系統(tǒng)常見的惡性腫瘤中,肝癌的死亡率排在第三,僅次于胃癌和食管癌,給人民的健康安全帶來嚴(yán)重的危害[7]。隨著分子生物學(xué)的進(jìn)步和高通量基因組測序技術(shù)的發(fā)展,發(fā)現(xiàn)了越來越多的與癌癥相關(guān)的基因,其中就包括lncRNA,在癌癥發(fā)生和發(fā)展中起重要作用,lncRNA可通過表觀遺傳調(diào)控、RNA轉(zhuǎn)錄和功能調(diào)控、蛋白定位和活性調(diào)節(jié)、組蛋白修飾等機(jī)制調(diào)控癌癥的發(fā)生、發(fā)展[8-9],在肝癌的發(fā)病、進(jìn)展和癌細(xì)胞浸潤和轉(zhuǎn)移中發(fā)揮重要的調(diào)控作用[10]。
在我們的研究中,下載了TCGA數(shù)據(jù)庫中的全部肝癌的轉(zhuǎn)錄組數(shù)據(jù),確定了差異表達(dá)的lncRNA、miRNA、mRNA。然后又通過可視化的軟件Cytoscape建立了ceRNA網(wǎng)絡(luò),揭示了三者之間相互作用的關(guān)系。生存分析的使用讓我們了解到哪些基因與癌癥的生存和預(yù)后有關(guān),為下一步的實(shí)驗(yàn)提供依據(jù)。已經(jīng)有很多相關(guān)的研究揭示了lncRNA和肝癌之間的關(guān)系,TSANG等[11]報道,HOTTIP的低表達(dá)會減少HOXA基因的表達(dá),從而消弱肝癌的生長和轉(zhuǎn)移。而HOTTIP的高表達(dá)會增加肝癌生長和轉(zhuǎn)移的風(fēng)險,在我們的研究中也證實(shí)肝癌患者中的HOTTIP是高表達(dá)的lncRNA。我們對包括HOTTIP在內(nèi)的77個差異表達(dá)的lncRNA進(jìn)行了生存分析,結(jié)果顯示,低表達(dá)的HTR2A-AS1與肝癌的生存呈負(fù)相關(guān),高表達(dá)的AC073352.1、AL359878.1、AP002478.1、C2orf48、MYLK-AS1與肝癌的生存呈正相關(guān)。通過miRcode的注釋,和miRNA相互作用關(guān)系較強(qiáng)的lncRNA有TCL6、HOTTIP、PVT1,SU等[12]報道低表達(dá)的TCL6與腎細(xì)胞癌的預(yù)后不良有關(guān),本研究中,TCL6是高表達(dá)的基因,ceRNA網(wǎng)絡(luò)中顯示TCL6作用的miRNA達(dá)到12個。TSENG等[13]發(fā)現(xiàn)在原發(fā)性人類腫瘤中,PVT1與髓細(xì)胞瘤癌基因表達(dá)相關(guān),而在超過98%的髓細(xì)胞瘤癌基因復(fù)制增加的癌癥中,PVT1的表達(dá)量也相應(yīng)增加。lncRNA AP002478.1低表達(dá)提示肝癌預(yù)后良好,目前對這個lncRNA的功能還未見報道。
圖5 肝癌相關(guān)的20個mRNA的生存曲線 Fig 5 Survival curves of twenty mRNAs associated with liver cancer
注:○表示mRNA,?表示miRNA,◇表示lncRNA,紅色是高表達(dá)基因,藍(lán)色是低表達(dá)基因。
注:○表示mRNA,?表示miRNA,◇表示lncRNA,紅色是高表達(dá)基因,藍(lán)色是低表達(dá)基因。
在ceRNA網(wǎng)絡(luò)中,lncRNA可以作為miRNA“海綿”,對miRNA的作用有抑制作用。WANG等[14]研究發(fā)現(xiàn),HOTAIR通過對hsa-mir-217的下調(diào)來促進(jìn)肝癌的擴(kuò)散和發(fā)展;MAHMOUDI等[15]觀察到了hsa-mir-137在抑制癌細(xì)胞分化和增殖方面的作用。但我們通過374例TCGA數(shù)據(jù)庫的肝癌與癌旁組織對比發(fā)現(xiàn),低表達(dá)的hsa-mir-137肝癌患者存活時間更長,這些結(jié)果的差異還需要更多的證據(jù)來驗(yàn)證。其他兩個關(guān)鍵的miRNA是hsa-mir-424和hsa-mir-519d,在ceRNA的網(wǎng)絡(luò)中,has-mir-424和13個mRNA、29個lncRNA有相互調(diào)控的關(guān)系,has-mir-519d和9個mRNA、23個lncRNA有相互調(diào)控的關(guān)系調(diào)控,更值得關(guān)注的是,hsa-mir-424和hsa-mir-519調(diào)控的靶基因中有11個mRNA(E2F2、KIF23、POLQ、RRM2、E2F1、CCNE1、CLSPN、E2F7、CEP55、CBX2、CPEB3)與肝癌的生存期相關(guān)。據(jù)此推斷hsa-mir-424和hsa-mir-519d在肝癌的調(diào)控機(jī)制中發(fā)揮著重要作用,針對hsa-mir-424和hsa-mir-519d的研究可能會對肝癌的發(fā)生、發(fā)展調(diào)控帶來新的機(jī)遇。