国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

TCGA數(shù)據(jù)庫中不同種族肝細(xì)胞癌相關(guān)lncRNAs的篩選及功能預(yù)測(cè)

2019-10-24 08:28:08馬佳康任凱凱李雨濛孫金旗
關(guān)鍵詞:人種肝細(xì)胞白色

馬佳康,任凱凱,李雨濛,李 南,張 玲,王 健,孫金旗,周 博,馬 軍

0 引 言

原發(fā)性肝細(xì)胞癌是常見的惡性腫瘤[1],據(jù)歐美國(guó)家統(tǒng)計(jì)顯示,從2010年開始,男性肝細(xì)胞癌發(fā)病率處于平臺(tái)期,而女性肝細(xì)胞癌發(fā)病率卻在迅速增加;通過加強(qiáng)肝炎病毒篩檢和研發(fā)新的抗病毒藥物,可明顯降低肝細(xì)胞癌的風(fēng)險(xiǎn)[2]。因此,我們需要進(jìn)一步探索其發(fā)病機(jī)制,找到更有效的診斷標(biāo)記和治療靶點(diǎn)。

數(shù)據(jù)顯示人類基因組中90%以上的序列可以被轉(zhuǎn)錄,但只有1%~2%的序列可以編碼蛋白質(zhì)。根據(jù)其轉(zhuǎn)錄本的長(zhǎng)度可以分為<200 個(gè)核苷酸的小RNA,和>200 個(gè)核苷酸的長(zhǎng)RNA(lncRNAs)。近年來發(fā)現(xiàn)lncRNAs可能在腫瘤發(fā)生發(fā)展中發(fā)揮重要作用,但對(duì)于其生物學(xué)功能目前僅有少部分被證實(shí)。lncRNAs 具有多種功能,如誘餌、支架,指導(dǎo)信號(hào)分子參與許多重要的生物過程,如染色體沉默、基因組印記、染色質(zhì)修飾、轉(zhuǎn)錄調(diào)節(jié)和miRNAs 功能調(diào)節(jié)[3-4]。其中,lncRNAs 通過競(jìng)爭(zhēng)性內(nèi)源RNA(ceRNA)機(jī)制調(diào)控基因表達(dá)也已經(jīng)被證實(shí)[5-6]。肝細(xì)胞癌相關(guān)lncRNAs 的研究,將為其預(yù)防和控制提供新的思路和方法[7]。目前,已發(fā)現(xiàn)數(shù)十種和肝細(xì)胞癌相關(guān)的lncRNAs,如H19、HULC、MALAT-1、HOTAIR和HOTTIP 等[5,8-13]。本研究旨在分析TCGA 數(shù)據(jù)庫中白色人種、黑色人種和黃色人種肝細(xì)胞癌共有和特有l(wèi)ncRNAs差異譜并預(yù)測(cè)其功能和調(diào)控機(jī)制。

1 資料與方法

1.1 數(shù)據(jù)下載和差異基因篩選從TCGA 數(shù)據(jù)庫共下載349例肝細(xì)胞癌患者的臨床資料和轉(zhuǎn)錄組數(shù)據(jù)。另外下載相應(yīng)病例的miRNAs 測(cè)序數(shù)據(jù)。通過R 語言edgeR 包對(duì)mRNAs、lncRNAs 及miRNAs 的基因樣本分別進(jìn)行差異分析,標(biāo)準(zhǔn)為|log2FC|>2 且FDR<0.05[14]。

1.2 lncRNAs 篩選和功能分析通過對(duì)白色人種、黑色人種和黃色人種肝細(xì)胞癌患者的癌和癌旁組織進(jìn)行差異分析得到各自的差異的lncRNAs,并比較3 個(gè)人種差異lncRNAs 基因譜情況,采用韋恩圖找出3個(gè)人種共有的差異lncRNAs。

1.2.1 ceRNA 網(wǎng)絡(luò)構(gòu)建用肝細(xì)胞癌中差異的lncRNAs、mRNAs 和miRNAs,通過數(shù)據(jù)庫miRcode、starBase、miRDB、miRTarBase 和TargetScan 建立lncRNAs-miRNAs-mRNAs的關(guān)系對(duì),通過Cytoscape 軟件從而構(gòu)建ceRNA網(wǎng)絡(luò)。

1.2.2 lncRNAs 預(yù)后分析以本組所有肝細(xì)胞癌患者的臨床數(shù)據(jù)為基礎(chǔ),對(duì)3 個(gè)人種共同差異的lncRNAs 進(jìn)行Cox 回歸分析,按P<0.05 或P<0.01 選取lncRNAs,最終得到和肝細(xì)胞癌生存相關(guān)的lncRNAs組合。

1.2.3 lncRNAs 靶基因預(yù)測(cè)和功能預(yù)測(cè)對(duì)多因素Cox 分析得到的lncRNAs,通過MEM-Multi Experiment Matrix(https://biit.cs.ut.ee/mem/)做靶基因預(yù)測(cè)(pearson 相關(guān))。對(duì)lncRNAs 的靶基因通過R語言的clusterProfiler 包,進(jìn)行GO 及KEGG 分析,并對(duì)結(jié)果進(jìn)行可視化;使用Cytoscape 軟件的iRegulon插件預(yù)測(cè)分析調(diào)控這些靶基因的轉(zhuǎn)錄因子;以FDR<0.001,富集分?jǐn)?shù)>3.0 以及Targets>10 為篩選條件,來篩選相應(yīng)靶基因的轉(zhuǎn)錄因子。

1.3 特有的lncRNAs 相關(guān)分析分別對(duì)白色人種和黃色人種特有的lncRNAs 進(jìn)行多因素Cox 分析(黑色人種病例數(shù)太少不做分析),對(duì)靶基因分別進(jìn)行GO、KEGG分析和可視化;iRegulon插件預(yù)測(cè)相關(guān)轉(zhuǎn)錄因子。

2 結(jié) 果

2.1 差異lncRNAs 篩選白色人種篩選出的差異lncRNAs 上調(diào)989(94%),下調(diào)60(6%);黃色人種上調(diào)152(65%),下調(diào)83(35%);黑色人種上調(diào)301(77%),下調(diào)88(23%)。見圖1。

2.2 3 個(gè)人種共有l(wèi)ncRNAs 篩選、生存分析和功能預(yù)測(cè)通過韋恩圖取交集發(fā)現(xiàn),3 個(gè)人種共有的差異表達(dá)的lncRNAs 有49 個(gè),白色人種和黑色人種重疊基因21.5%,白色人種和黃色人種、黑色人種與黃色人種差別較大,其差異lncRNAs 重疊率僅為7.8%和5.8%,見圖2a。對(duì)49 個(gè)lncRNAs 進(jìn)行靶基因預(yù)測(cè),并建立了相關(guān)ceRNA 網(wǎng)絡(luò)圖,見圖2b,其中l(wèi)ncRNA HOTTIP、hsa-mir-424、hsa-mir-373、hsa-mir-182和hsa-mir-519d是重要的節(jié)點(diǎn)基因。

49個(gè)差異的lncRNAs行多因素Cox分析,建立了預(yù) 后 診 斷 組 合,含 有7 個(gè)lncRNAs(AC010280.2、AC099508.2、LINC02475、LINC02313、AC138356.1、LINC01224 以及LINC02561),組合能很好判斷患者的預(yù)后(AUC=0.709),其中LINC01224可預(yù)測(cè)到相應(yīng)的靶基因。對(duì)LINC01224預(yù)測(cè)的靶基因行GO富集發(fā)現(xiàn),其功能和DNA復(fù)制、轉(zhuǎn)位、基因表達(dá)調(diào)控、表觀遺傳、miRNAs 基因沉默及RNA 轉(zhuǎn)錄后基因沉默等有關(guān)。KEGG 分析顯示,LINC01224 和細(xì)胞周期調(diào)控、DNA 復(fù)制相關(guān)。見圖3。其靶基因的轉(zhuǎn)錄因子預(yù)測(cè)發(fā)現(xiàn),LINC01224 和TAF7、E2F4、HDAC2、NANOG、SOX5、E2F1、DEAF1、FOXN4、MAFB、ZNF513、TFDP3、ATF2、NKX2-3和EBF1相關(guān),見圖4。

圖1 不同人種肝細(xì)胞癌差異lncRNAs篩選Figure 1 Screening of differentially expressed lncRNAs in different human races in the TCGA database

圖2 共有的差異lncRNAs篩選和ceRNA調(diào)控網(wǎng)絡(luò)的構(gòu)建Figure 2 Screening of shared differentially expressed lncRNAs and construction of the ceRNA regulatory network

2.3 白色人種和黃色人種特有的lncRNAs相關(guān)分析維恩圖分析發(fā)現(xiàn),白色人種有724個(gè)特有l(wèi)ncRNAs。Cox生存相關(guān)分析后發(fā)現(xiàn)含11 個(gè)lncRNAs 的預(yù)后組合(AC008892.1、AC015722.2、AC073987.1、AC090568.2、AC136188.1、AL356215.1、AL591501.1、GACAT3、LINC02327、PLUT以及Z93403.1),組合能很好判斷患者的預(yù)后(AUC=0.767),但在11個(gè)基因中未預(yù)測(cè)到靶基因。黃色人種特有的lncRNAs 110個(gè),Cox分析后篩選出含6 個(gè)lncRNAs 的預(yù)后基因組合(AC006252.1、AC009005.1、AC025048.4、AC093609.1、AC126118.1以及AL024498.1),組合能很好判斷患者的預(yù)后(AUC=0.846)。黃色人種肝細(xì)胞癌生存相關(guān)的6個(gè)lncRNAs中,lncRNAs AC126118.1和AC093609.1可在現(xiàn)有MEM數(shù)據(jù)庫中找到靶基因,分別預(yù)測(cè)到34、37個(gè)靶基因。

圖3 LINC01224的GO、KEGG分析Figure 3 GO and KEGG analyses of LINC01224

圖4 LINC01224轉(zhuǎn)錄因子預(yù)測(cè)Figure 4 Transcription factor prediction analysis of LINC01224

AC093609.1 的靶基因通過GO 富集后結(jié)果顯示,其功能和離子通道活性如鈣通道活性、被動(dòng)跨膜轉(zhuǎn)運(yùn)蛋白活性有關(guān);KEGG 結(jié)果顯示其參與心肌病、心肌細(xì)胞腎上腺素能等信號(hào)通路的調(diào)控。預(yù)測(cè)得到AC093609.1 的轉(zhuǎn)錄因子為GLI2、FLI1 和HOXB7。AC126118.1 的靶基因通過GO 富集后發(fā)現(xiàn),其靶基因和多種代謝功能相關(guān),如羧酸分解代謝過程、脂肪酸β-氧化、脂肪酸分解代謝等;也與酶活性有關(guān),如?;o酶A 脫氫酶活性、氧化還原酶活性、ATP 酶活性等,還與跨膜運(yùn)動(dòng)相關(guān);KEGG 結(jié)果也顯示其參與脂肪酸降解、ABC 轉(zhuǎn)運(yùn)蛋白、氨基酸代謝等信號(hào)通路。AC126118.1 靶基因相關(guān)的轉(zhuǎn)錄因子有ESR1、ELK1、FOS、MYBL1、JDP2、EGR1、DEAF1 和POLR2A,見圖5、圖6。

圖5 lncRNAs AC126118.1和AC093609.1的功能預(yù)測(cè)分析Figure 5 Functional prediction analysis of the lncRNAs AC126118.1 and AC093609.1

圖6 lncRNAs AC126118.1和AC093609.1的轉(zhuǎn)錄因子預(yù)測(cè)Figure 6 Transcription factor prediction analysis of the lncRNAs AC126118.1 and AC093609.1

3 討 論

本研究首先分析了TCGA 數(shù)據(jù)庫中的HCC 的lncRNAs表達(dá)數(shù)據(jù),發(fā)現(xiàn)在3個(gè)人種中l(wèi)ncRNAs表達(dá)譜差異較大,其中白色人種和黑色人種的lncRNAs表達(dá)譜相似性更高一些,而黃色人種和白色人種以及黑色人種的差異較大。其中有49 個(gè)共同表達(dá)的差異lncRNAs 可以作為HCC 的共有診療標(biāo)志物。為了進(jìn)一步研究HCC 的發(fā)生機(jī)制和判斷這些指標(biāo)在診療中的價(jià)值,對(duì)49 個(gè)lncRNAs 進(jìn)一步行生物信息學(xué)分析,利用現(xiàn)有數(shù)據(jù)庫信息,成功構(gòu)建了ceRNA 網(wǎng)絡(luò),其中以hsa-mir-424,hsa-mir-519d,hsa-mir-182,hsa-mir-373 為中心,組成了lncRNAs 和mRNAs的調(diào)控網(wǎng)絡(luò),為今后進(jìn)一步研究HCC 的表觀遺傳學(xué)調(diào)控提供了一定線索。生存相關(guān)的基因常常在腫瘤發(fā)生發(fā)展中起著重要作用,因此本研究對(duì)共有l(wèi)ncRNAs 進(jìn)行Cox 回歸分析,發(fā)現(xiàn)了含有7 個(gè)lncRNAs的組合對(duì)HCC具有重要的預(yù)后價(jià)值。由于lncRNAs的研究數(shù)據(jù)尚少,本研究只發(fā)現(xiàn)LINC01224 有相應(yīng)的功能和信號(hào)通路數(shù)據(jù)。本研究對(duì)LINC01224進(jìn)行GO、KEGG 和轉(zhuǎn)錄因子網(wǎng)絡(luò)分析,這為L(zhǎng)INC01224的調(diào)控機(jī)制的研究奠定了基礎(chǔ)。

由于各人種存在一定的遺傳差異,因此在HCC發(fā)生發(fā)展中,lncRNAs 的表達(dá)譜有明顯差異,其中起重要調(diào)控作用的lncRNAs 也不同,在Venn 圖分析中,有更多的lncRNAs 表現(xiàn)為人種特異性。通過對(duì)這些人種特異lncRNAs 行COX 回歸分析,我們分別找出了與白色人種(11個(gè))和黃色人種(6個(gè))預(yù)后相關(guān)的lncRNAs組合,由于黑色人種例數(shù)較少,所以未對(duì)其進(jìn)行生存分析。2 個(gè)人種的生存相關(guān)lncRNAs組合中無重疊組分,說明HCC 相關(guān)的關(guān)鍵預(yù)后lncRNAs 存在差異。為了對(duì)白色人種和黃色人種預(yù)后相關(guān)的差異lncRNAs 作進(jìn)一步研究,我們對(duì)其進(jìn)行靶基因預(yù)測(cè),在MEM 數(shù)據(jù)中,未發(fā)現(xiàn)與白色人種HCC 預(yù)后相關(guān)的lncRNAs 的靶基因,說明對(duì)這些IncRNA 的功能目前未知。在黃色人種預(yù)后相關(guān)的lncRNAs 中,可 以 找 到lncRNAs AC126118.1 和AC093609.1 靶基因,通過GO、KEGG 和轉(zhuǎn)錄因子預(yù)測(cè)分析,有助于今后的功能研究。

TCGA 數(shù)據(jù)庫擁有海量的信息,包含轉(zhuǎn)錄組、表達(dá)譜、基因突變、單核苷酸多態(tài)性及甲基化等信息。通過生物信息學(xué)對(duì)現(xiàn)有的數(shù)據(jù)庫進(jìn)行挖掘,我們可以整合分析腫瘤相關(guān)異常信息,為進(jìn)一步的功能驗(yàn)證和機(jī)制研究奠定基礎(chǔ)。已發(fā)表的關(guān)于HCC 的數(shù)據(jù)挖掘報(bào)道,主要針對(duì)GEO 數(shù)據(jù),因?yàn)镚EO 數(shù)據(jù)庫建立較早[6,15],GEO 數(shù)據(jù)主要是芯片數(shù)據(jù),病例數(shù)較少,臨床信息不全面,影響了數(shù)據(jù)挖掘結(jié)果的質(zhì)量。在已發(fā)表的TCGA 數(shù)據(jù)挖掘文獻(xiàn)中,關(guān)于lncRNAs相關(guān)的整合分析[9,16],未考慮人種不同和lncRNAs表達(dá)的相關(guān)性。

本研究針對(duì)人種不同,分析了白色人種、黃色人種和黑色人種共有及特有的相關(guān)lncRNAs差異表達(dá)譜,并發(fā)現(xiàn)了一些不同人種共有和特有的和預(yù)后相關(guān)的重要lncRNAs,為今后深入的了解肝細(xì)胞癌的發(fā)病機(jī)制、尋找新的診療靶點(diǎn)提供了重要依據(jù)。

猜你喜歡
人種肝細(xì)胞白色
外泌體miRNA在肝細(xì)胞癌中的研究進(jìn)展
姐妹三人種芝麻
一斤干飯,九兩蘋果——“十六連豐”后,陜西人種啥?吃啥?
雪為什么是白色的
總之就是要選白色
總之就是要選白色
總之就是要選白色
肝細(xì)胞程序性壞死的研究進(jìn)展
肝細(xì)胞癌診斷中CT灌注成像的應(yīng)用探析
SIAh2與Sprouty2在肝細(xì)胞癌中的表達(dá)及臨床意義
宁化县| 抚顺县| 化隆| 高雄市| 新津县| 宁化县| 张掖市| 雷山县| 乐亭县| 微山县| 西昌市| 阿克| 林口县| 马关县| 西和县| 时尚| 静海县| 苏尼特右旗| 岱山县| 石景山区| 神池县| 沙湾县| 会理县| 孝感市| 祁门县| 恭城| 邵阳市| 塘沽区| 美姑县| 四平市| 沙坪坝区| 固始县| 平定县| 南城县| 南郑县| 德兴市| 泸定县| 遵义市| 简阳市| 雷州市| 安乡县|