陳鴻儒, 陳 聰, 曾懷才
(南華大學(xué) 公共衛(wèi)生學(xué)院預(yù)防醫(yī)學(xué)系,湖南 衡陽,421001)
miRNA(microRNA)是一類廣泛存在于動(dòng)植物和某些病毒內(nèi),長度為19-25 nt的內(nèi)源性單鏈非編碼小RNA,序列具有高度保守性[1]。miRNA主要通過與靶基因mRNA的3’端非翻譯區(qū)(3’UTR)結(jié)合,導(dǎo)致翻譯抑制或者降解,進(jìn)而調(diào)控靶基因的表達(dá)[2]。
has-miR-10a-5p是近年來新發(fā)現(xiàn)的miRNA,屬于miR-10基因家族,其聚集在染色體17長度為22 bp的位置中,具體基因位點(diǎn)在chr17:48 579 838-48 579 947處。近年國內(nèi)外研究表明,通過與靶基因相互作用,has-miR-10a-5p作為癌基因在多種腫瘤的發(fā)生發(fā)展中發(fā)揮作用[3-7]。目前研究miR-10a-5p與腫瘤抑制和發(fā)展的相關(guān)問題越來越多,所以對(duì)miR-10a-5p進(jìn)行靶基因相關(guān)生物信息學(xué)分析對(duì)今后探索miR-10a-5p功能和作用十分必要。相較于實(shí)驗(yàn)驗(yàn)證,生物信息學(xué)能對(duì)靶基因及相關(guān)通路進(jìn)行大量多樣高速的預(yù)測。本研究運(yùn)用生物信息學(xué)方法預(yù)測miR-10a-5p的靶基因,并對(duì)其靶基因集合進(jìn)行功能注釋(Gene Ontology, GO )和信號(hào)通路富集分析(Kyoto Encyclopedia of Genes and Genome Pathway, KEGG Pathway),為后續(xù)對(duì)miR-10a-5p 的靶基因鑒定及生物學(xué)功能研究提供理論基礎(chǔ)和思路。
使用在線工具miRbase(http://www.mirbase.org/)查找miR-10a-5p的染色體定位、堿基序列及不同動(dòng)物的成熟序列。并使用clustalx 2.1軟件分析物種保守性。
使用Pubmed(http://www.ncbi.nlm.nih.gov/pubmed/)查找已有文獻(xiàn)報(bào)道m(xù)iR-10a-5p靶基因的相關(guān)信息。采用Targetscan7.1(http://www.targetscan.org/vert_71/)、miRDB(http://www. http://mirdb.org/)、 mirDIP(http://ophid.utoronto.ca/mirDIP/index_ confirm.jsp)和DIANA TOOLS(http://diana.imis.athena-innovation.gr/DianaTools/index.php)4個(gè)在線靶基因預(yù)測工具預(yù)測miR-10a-5p的靶基因,并用Venny 2.1 (http://bioinfogp. cnb. csic.es/tools/venny/index.html)繪制4個(gè)數(shù)據(jù)庫預(yù)測靶基因的韋恩圖,取交集用于后續(xù)分析。
使用在線工具DAVID(http://david.abcc.ncifcrf.gov/)對(duì)交集靶基因進(jìn)行Gene Ontology功能富集分析(GO分析),細(xì)胞組分(cellular component,CC)、分子功能(molecular function,MF)、生物學(xué)過程(biological process,BP),用超幾何分布檢驗(yàn),以P<0.05為顯著性閾值,得到具有統(tǒng)計(jì)意義前10個(gè)GO注釋分析。
用DAVID數(shù)據(jù)庫中KEGG Pathway分析對(duì)交集靶基因進(jìn)行信號(hào)通路富集分析,具有統(tǒng)計(jì)意義前10個(gè)信號(hào)通路。
使用miRBase數(shù)據(jù)庫檢索miR-10a-5p的成熟序列,miR-10a-5p在已知的31個(gè)物種中存在成熟序列,并且使用數(shù)據(jù)庫下載了人(hsa)、小鼠(mmu)、大鼠(rno)、斑馬魚(dre)等15個(gè)物種的成熟序列(見圖1)。利用clustalx 2.1軟件,對(duì)其序列保守性進(jìn)行分析,結(jié)果表明miR-10a-5p在各物種之間具有高度的保守性的成熟序列為“uacccuguagauccgaauuugug”(見表1)。
表1 不同物種miR-10a-5p的成熟序列Table 1 Mature sequence of miR-10a-5p in different species
圖1 不同物種miR-10a-5p的成熟序列Fig.1 Mature sequence of miR-10a-5p in different species
Pubmed檢索文獻(xiàn)表明,miR-10a-5p通過在轉(zhuǎn)錄后水平調(diào)控其靶基因參與了多種疾病的發(fā)生發(fā)展及預(yù)后(見表2)。選用TargetScan、miRDB、mirDIP和DIANA TOOLS 4個(gè)在線數(shù)據(jù)庫預(yù)測的靶基因個(gè)數(shù)分別為341、233、660和472,用Venny 2.1對(duì)上述結(jié)果繪制韋恩圖取交集,得到79個(gè)預(yù)測靶基因的數(shù)據(jù)集(見表3)。作為后續(xù)分析的基因總集合(見圖2)。
表2 miR-10a-5p調(diào)控的靶基因參與人類疾病Table 2 miR-10a-5p target genes involved in human disease
表3 miR-10a-5p調(diào)控的靶基因數(shù)據(jù)集Table 3 Target gene data sets regulated by miR-10a-5p
圖2 miR-10a-5p的預(yù)測靶基因個(gè)數(shù)Fig.2 Predicted number of target genes of miR-10a-5p
將4個(gè)數(shù)據(jù)庫均能預(yù)測到的79個(gè)靶基因進(jìn)行GO分析,發(fā)現(xiàn)miR-10a-5p的靶基因主要富集于核質(zhì)、突觸、細(xì)胞間粘附鏈接、核基質(zhì)、組蛋白甲基轉(zhuǎn)移酶復(fù)合物等10個(gè)細(xì)胞組分(P<0.05,見圖3);參與肝臟發(fā)育、脂肪組織發(fā)育、神經(jīng)細(xì)胞凋亡負(fù)調(diào)控、RNA聚合酶Ⅱ啟動(dòng)子轉(zhuǎn)錄的起始、RNA聚合酶啟動(dòng)子轉(zhuǎn)錄的正調(diào)控、DNA模板轉(zhuǎn)錄等10個(gè)生物學(xué)過程(P<0.05,見圖4);顯著富集于染色質(zhì)結(jié)合、轉(zhuǎn)錄活性激活、RNA聚合酶Ⅱ遠(yuǎn)端增強(qiáng)子序列特異性DNA結(jié)合、RNA聚合酶Ⅱ轉(zhuǎn)錄因子活性配體激活的序列特異性DNA結(jié)合等9個(gè)分子功能(P<0.05,見圖5)。
圖3 miR-10a-5p靶基因細(xì)胞組分的GO功能分析Fig.3 GO function analysis of cell components of miR-10a-5p target gene
圖4 miR-10a-5p靶基因生物學(xué)過程的GO功能分析Fig.4 GO function analysis of the biological process of miR-10a-5p target gene
圖5 miR-10a-5p靶基因分子功能的GO功能分析Fig.5 GO function analysis of molecular function of miR-10a-5p target gene
利用DAVID數(shù)據(jù)庫中的工具Functional Annotation對(duì)靶基因集合進(jìn)行生物通路富集分析,其中79個(gè)靶基因具有相關(guān)的生物通路。以人類全基因組為背景,發(fā)現(xiàn)miR-10a-5p的靶基因在cAMP信號(hào)通路、TNF信號(hào)通路及AMPK信號(hào)通路中顯著富集(見圖6)。
圖6 miR-10a-5p靶基因KEGG通路富集分析Fig.6 KEGG pathway enrichment analysis of predicted target of miR-10a-5p
近年來,與miRNA相關(guān)的內(nèi)容已成為研究的熱點(diǎn)之一。越來越多的證據(jù)表明,miRNA能夠通過調(diào)控下游靶基因的表達(dá)從而發(fā)揮其功能,包括重要的生命活動(dòng),如細(xì)胞分化、增殖、細(xì)胞凋亡以及新陳代謝[9],并在腫瘤的發(fā)生發(fā)展、侵襲與轉(zhuǎn)移[10],以及治療、預(yù)后[11]等方面都有重要作用。而生物信息學(xué)在miRNA靶基因的預(yù)測等研究中發(fā)揮了重要作用,本研究預(yù)測靶基因使用了四種計(jì)算方法不同的miRNA靶基因預(yù)測軟件進(jìn)行,考慮到miRNA與靶基因結(jié)合位點(diǎn)的序列保守性、序列匹配、miRNA 與mRNA 雙鏈結(jié)合的熱穩(wěn)定性等因素來預(yù)測靶基因,具有高特異性和低假陽性率,將預(yù)測的靶基因取交集后作為靶基因集合,因此它作為分析的靶基因集合具有很好的代表性。
本研究中預(yù)測得到總共79個(gè)miR-10a-5p的靶基因, 靶基因存在細(xì)胞的各個(gè)組分中,具有染色質(zhì)結(jié)合、轉(zhuǎn)錄活性激活、RNA 聚合酶Ⅱ遠(yuǎn)端增強(qiáng)子序列特異性DNA結(jié)合和其它分子功能,并顯著富集于肝臟發(fā)育、脂肪組織發(fā)育、神經(jīng)細(xì)胞凋亡負(fù)調(diào)控等生物學(xué)過程;顯著富集于cAMP信號(hào)通路、TNF信號(hào)通路及AMPK信號(hào)通路。大量研究發(fā)現(xiàn),miR-10a-5p在細(xì)胞增殖和分化[11-12]過程中起著重要的調(diào)控作用,有研究發(fā)現(xiàn),阿茲海默癥(AD)中淀粉樣蛋白-β或TAU病理誘導(dǎo)的神經(jīng)元miR-10a-5p的升高[13],推測miR-10a-5p能調(diào)控神經(jīng)元及突觸的轉(zhuǎn)錄[14]。研究還表明滑膜細(xì)胞中miR-10a-5p的下調(diào)有助于TBX5控制的關(guān)節(jié)炎癥[15],并起到抑制各種炎性細(xì)胞因子的產(chǎn)生的作用。
大量研究表明,miR-10a-5p在多種惡性腫瘤中異常表達(dá)。例如,miR-10a-5p在宮頸癌和人胰腺導(dǎo)管腺癌中呈現(xiàn)高表達(dá)[3,5]。然而,一些研究發(fā)現(xiàn)miR-10a-5p在多種癌細(xì)胞中低表達(dá),如膽管癌、腎細(xì)胞癌[4,7]。近年來,一些研究證實(shí)miR-10a-5p通過調(diào)節(jié)其靶基因在抑制腫瘤細(xì)胞的增殖和轉(zhuǎn)移中起重要作用,例如miR-10a-5p可通過抑制MAPK8IP1的表達(dá),進(jìn)而促進(jìn)胃癌轉(zhuǎn)移[6]。在細(xì)胞凋亡和其他腫瘤過程中,已經(jīng)鑒定了miRNA表達(dá)的雙相模式(上調(diào)和下調(diào)),因此miR-10a-5p未來或許可以考慮作為腫瘤的早期診斷[16]和預(yù)后[17]的分子生物標(biāo)志物及治療腫瘤的潛在靶標(biāo)[18-19]。
本研究采用生物信息學(xué)方法對(duì)miR-10a-5p的GO功能富集分析和Pathway通路富集分析等數(shù)據(jù)進(jìn)行系統(tǒng)的挖掘,結(jié)果顯示miR-10a-5p在生長發(fā)育及腫瘤發(fā)生發(fā)展過程中的作用不容忽視,且本研究結(jié)果與現(xiàn)有對(duì)miR-10a-5p調(diào)控作用的研究報(bào)道基本一致,說明生物信息學(xué)分析具有可靠性。這些分析為有關(guān)miR-10a-5p在各生物學(xué)過程中的作用機(jī)制后續(xù)研究提供了一定的數(shù)據(jù)支持和探索思路。但由于預(yù)測靶基因過程中仍存在不可避免的假陽性率,因此,由本次實(shí)驗(yàn)結(jié)果篩選出的靶基因還需進(jìn)行實(shí)驗(yàn)驗(yàn)證,其功能和相關(guān)信號(hào)通路也有待進(jìn)一步研究。