王成坦,唐娟,毛福秀,楊玉瑩,袁珊,高蕊*
(1 石河子大學醫(yī)學院/新疆地方與民族高發(fā)病教育部重點實驗室,新疆 石河子 832000;2 石河子大學醫(yī)學院第一附屬醫(yī)院神經內科,新疆 石河子 832000)
中風是危害人類健康的一類頑疾,其預后取決于缺血再灌注損傷誘發(fā)神經細胞的受損情況。研究表明,卒中后神經元死亡數目與缺血時間成正比[1],因此,缺血性中風的早期診斷對于該疾病的治療與預后意義非凡。然而,目前在臨床應用方面尚未有一種可以單獨應用于腦卒中診斷的外周血生物學標志物[1]。MiRNA(micro RNA)在人類腦組織和中樞神經系統(tǒng)中富集[2],且對中風的發(fā)生、發(fā)展與預后發(fā)揮著重要作用[3]。本課題組前期研究發(fā)現,腦缺血再灌注后,低水平的miRNA-204可以減輕對其靶基因Nrn1的抑制作用,從而有助于形成適合神經修復的微環(huán)境[4]。在中樞神經系統(tǒng)疾病的發(fā)生發(fā)展中腦源性miRNA可以釋放入血,引起外周血中miRNA水平改變[5]。
SONODA T等[6]通過miRNA芯片技術分析發(fā)現:外周血中有10個miRNA的表達變化與預測的中風風險之間存在顯著相關性,其中有7個(miR-1268a、miR-1268b、miR-4433b-3p、miR-6089、miR-6090、miR-6752-5p和miR-6803-5p)在缺血性腦中風患者與正常受試者之間的表達具有顯著差異性。這表明外周血中腦源性miRNA的表達變化與卒中的病理生理進程密切相關,可能具有潛在的診斷與治療價值。隨著生物信息學技術的發(fā)展與進步,利用生物信息學技術對前期腦卒中患者及動物卒中模型外周血中海量的實驗性測序數據進行系統(tǒng)性的分析與挖掘,可能為尋找中風診斷標志物提供新的見解和方向。
大腦中動脈梗塞(MCAO,Middle Cerebral Artery Occlusion)模型是一種可以模擬腦缺血以及后續(xù)再灌注過程的動物模型,在研究缺血性中風中應用廣泛。我們通過GEO(Gene Expression Omnibus)數據庫下載了MCAO模型組與假手術組大鼠的外周血miRNA表達譜,應用R語言的limma包對測序數據進行miRNA差異分析,通過生物信息學方法預測其靶基因,并根據靶基因功能預測以及互作分析的連接度初步鑒定出核心靶基因。將上述核心靶基因在GEO數據庫中的缺血性卒中患者外周血mRNA(message RNA)表達譜數據中進行鑒定,獲得11個表達顯著差異的關鍵基因。最后,結合miRNA-mRNA靶向數據以及關鍵基因的互作數據構建miRNA-mRNA調控網絡,探討上述調控通路在中風發(fā)生發(fā)展過程中可能發(fā)揮的生物學作用。
在GEO數據庫(http://www.ncbi.nlm.nih.gov/geo/)中,獲取MCAO大鼠外周血miRNA表達數據集:GSE97532,其中包含3只MCAO大鼠與3只對照組大鼠。從GEO數據庫中獲取人類外周血mRNA表達譜數據集:GSE16561,涵蓋39個缺血性中風病人的外周血樣本與24個對照組受試者外周血樣本,兩組受試者的一般臨床信息見表格一。
差異分析使用基于R語言編寫的Limma軟件包,R語言是一種基于S語言的開源程序語言,因開源開放且具有完整的開發(fā)者生態(tài)對其進行拓展和維護,因此被廣泛應用于統(tǒng)計分析、繪圖、數據挖掘等方面。使用Limma軟件包進行差異分析的流程是:(1) 讀取原始數據矩陣;(2) 矩陣清洗與標準化;(3) 分組與差異分析。差異篩選標準為:差異倍數≥1.5,P<0.05。
表1 缺血性卒中與對照組一般臨床信息
應用miRbase數據庫(http://www.mirbase.org/)鑒定差異miRNA在大鼠和人類序列之間的保守性,獲取與人類序列高度同源的miRNA。應用miRDB軟件(http://www.mirdb.org/)預測保守miRNA的靶基因,篩選標準為:Target Score>80。
將預測得到的miRNA靶基因上傳至string數據庫(https://string-db.org/),預測靶基因之間的互作關系。將string數據庫預測結果導入cytoscape軟件(下載地址:https://cytoscape.org/),分析并鑒定出連接度(degree)位于前20的核心靶基因。
應用R語言的affy包對GSE16561芯片進行預處理,獲取芯片表達量,表達量的歸一化方法采用Z-Score法。提取20個核心基因在臨床外周血樣本中的表達信息,獲得缺血性卒中患者外周血中表達水平出現顯著改變的11個關鍵基因,差異分析使用 Student-T Test。
將差異miRNA與11個關鍵基因的靶向關系以及關鍵基因之間的相互作用關系合并后導入Cytoscape軟件,構建關鍵miRNA-mRNA調控網絡圖。
使用R語言的ClusterProfile包對關鍵基因進行GO(Gene Ontology)與KEGG(Kyoto Encyclopedia of Genes and Genomes)富集分析。
我們應用R語言的limma包分析MCAO大鼠外周血miRNA表達譜GSE97532,得到15個差異miRNA,其中,上調miRNA有9個,下調有6個(圖1A)。將差異基因按照表達量進行聚類,以鑒定差異基因的表達模式,直觀展示差異miRNA表達水平(圖1B)。應用miRbase數據庫分析得到11個在人類和大鼠之間高度保守的miRNA:miR-346、miR-182、miR-194-5p、miR-139-5p、miR-128-2-5p、miR-24-1-5p、miR-191b、miR-107-5p、miR-383-5p、miR-328b-3p、miR-23b-5p,它們的序列在人和大鼠之間高度同源(圖1C)。保守性高的miRNA往往提示其可能具有重要的生物學功能,因此在后續(xù)的分析過程中使用這11個miRNA。
圖1 大鼠MCAO模型外周血差異miRNA獲取與保守性分析
MiRNA的生物學功能主要通過調控下游靶標基因的表達水平來實現。因此,我們采用miRDB軟件預測miRNA的靶基因,設定嚴格的篩選標準,11條保守miRNA共預測到1467個靶基因。隨后,應用string數據庫,從基因共表達、基因融合、基因鄰接、文本數據挖掘、實驗證據證實等角度構建了差異miRNA靶基因之間的蛋白質-蛋白質互作網絡(PPI network,Protein-protein Interaction Network)。在所有的1467個靶基因中,有1451個蛋白質被納入本互作網絡,組成含有1451個節(jié)點和7961對相關關系的復雜網絡(圖2)。
一般認為節(jié)點連接度(degree)越高的基因可能在互作網絡中發(fā)揮更重要的作用,所以,我們應用cytoscape軟件分析該互作網絡并篩選出網絡中連接度位于前20的核心基因(hub gene)。在篩選出核心靶基因之后,我們進一步的使用cytoscape軟件從圖2的PPI網絡中提取出20個核心靶基因的互作關系網絡(圖3)。
圖2 靶基因的相互作用網絡圖
顏色從黃色到紅色代表著連接度(degree)由低到高,有互作關系的節(jié)點使用箭頭相連,箭頭所指為被調控關系圖3 TOP 20 核心基因互作關系圖
為了更進一步的明確核心靶基因與卒中疾病的關系,我們應用另一個mRNA的表達芯片GSE16561(包括39個中風病人外周血樣本與24個對照組外周血樣本),檢測20個核心靶基因的表達水平。結果發(fā)現有11個核心基因表達水平出顯著差異(圖4)。我們將這些在卒中患者外周血中顯著變化且密切參與疾病發(fā)生發(fā)展互作網絡的節(jié)點基因定為本研究的關鍵基因。絕大部分關鍵基因在卒中患者外周血中表達上調,僅有一個基因表達下調(圖4)。這些在疾病中發(fā)揮重要生物學作用的關鍵基因,也具有成為卒中后外周血診斷標志物的潛能。
缺血性卒中組與對照組相比較,顯著性檢驗使用Student-T Test,*P<0.05,**P<0.01,***P<0.001,****P<0.0001圖4 卒中患者外周血關鍵基因的表達驗證
在篩選并鑒定出差異miRNA的關鍵下游靶基因后,結合miRNA-mRNA靶向數據和關鍵基因蛋白質互作數據,應用cytoscape軟件構建了卒中后miRNA-mRNA互作網絡。從網絡互作角度分析卒中后關鍵差異表達miRNA可能的作用。發(fā)現有6個miRNA(miR-182、miR-191-5p、miR-383-5p、miR-139、miR-128-2-5p、miR-194-5p)靶向調控11個關鍵基因,其中miR-182靶向調控了CTTN,CREB1,GRB2,FOXO3,FBXW7五個關鍵基因(圖5)。
關鍵基因Notch1在互作網絡中的節(jié)點連接度僅次于miR-182,Notch1以及與其具有相互作用的3個基因共同被篩選為本研究的關鍵基因(圖5)。
紅色V形為miRNA,綠色圓形為靶基因,線段代表相連的兩節(jié)點之間具有互作關系圖5 卒中后關鍵miRNA-mRNA互作網絡
我們應用GO和KEGG富集分析,對這11個關鍵基因的功能進行了預測和分析。GO分析結果顯示:在生物學進程方面,造血調控、神經元死亡調控、對缺氧的反應等條目出現顯著富集(圖6A);在分子功能方面,主要富集在與基因轉錄調控相關的轉錄因子激活與結合領域(圖6B),這些條目與卒中的發(fā)生發(fā)展密切相關。KEGG富集結果顯示:PI3K-Akt信號通路、cAMP信號通路、Notch信號通路、MAPK信號通路等響應缺血性卒中的重要信號通路出現顯著富集,且這幾個信號通路之間存在相互作用,可以協(xié)同影響卒中的發(fā)生發(fā)展(圖6C)。
圖6 關鍵靶基因GO與KEGG富集分析結果
近年來缺血性卒中發(fā)病率不斷上升,已成為造成中國成年人死亡的第一大主因[7]。不同于出血性卒中,缺血性卒中起病時沒有典型的影像學特征表現,同時也缺乏可靠的分子診斷指標。在中風的相關研究中,有大量外周血表達變化的miRNA可能具有潛在的診斷和治療價值,LONG G等人證實miR-30a,miR-126和let-7b可用作診斷缺血性卒中的可靠標志物[8];MAKRIS K等發(fā)現miR-140-5p在卒中后外周血中表達顯著上調,可能具備作為中風后抑郁的獨立風險因素的價值[1]。LI等人報道,卒中后缺氧狀態(tài)下上調的HIF-1a可以激活miR-182,抑制氧依賴性HIF-1a的降解酶PHD2和FIH的激活,由此形成正反饋促進HIF-1a的不可逆激活[9]。但是在臨床應用方面,尚未有一種miRNA可以獨立作為腦卒中的生物學診斷標志物[1]。
本研究挖掘得到的15個差異miRNA,其中有11個是大在大鼠與人類中高度保守的miRNA,而原始文獻僅挖掘到7個差異miRNA,其中有5個與本研究相同[10]。原始文獻應用的篩選軟件是Affymetrix TAC,該軟件屬于芯片公司開發(fā)的軟件,應用人數較少,分析較粗糙。本研究使用基于R語言的Limma包,它有以下幾個優(yōu)點:(1) 采用線性模型,適用范圍廣,在復雜的實驗設計下也可以高效的處理數據;(2) 利用基因組數據的高度平行性,允許基因之間和樣本之間存在不同程度的變異性,即使在小樣本量的差異分析中也能保證分析的準確性;(3) 對表達譜數據整體進行分析處理,分析結果可以用于高層次基因表達特征分析、加權基因共表達網絡分析等后續(xù)分析[11]?;谝陨显颍琹imma包已成為應用最廣泛的芯片分析方法[11]。本研究挖掘出來的miR-182、miR-128等關鍵miRNA,曾經被多項研究證實在缺血性卒中病人的外周血中出現顯著表達變化[12-14],可能在中風的診斷、治療、預后等方面具有重要價值。
應用miRDB軟件,11條高度保守的miRNA通過嚴格的篩選閾值,共篩選得到1467個靶基因。通過構建靶基因之間的PPI網絡,分析網絡連接度,我們找出了連接度位于前20的核心基因。通過分析缺血性卒中患者外周血mRNA表達譜數據,鑒定出卒中患者外周血中表達顯著改變的11個關鍵基因。GO和KEGG富集分析結果顯示,這些關鍵基因及其相關信號通路與缺血性卒中的發(fā)生發(fā)展密切相關。cAMP通路是關鍵基因高度富集通路之一,11個關鍵基因中的FOS、 CREB1、RHOA、CREBBP等基因都與cAMP通路有關。cAMP通路可以調節(jié)卒中后的神經再生、血管生成、神經炎癥等生物學過程,是卒中后的重要調控通路[15]。CREB1是cAMP信號通路的關鍵蛋白,在癌癥合并缺血性中風病人外周血中,CREB1基因顯著高表達[16]。此外,Notch1在卒中后的腦血管內皮細胞中被激活,可以直接調節(jié)中風后的血管生成以及血腦屏障的完整性[17]。FOS基因在卒中梗死側的周圍持續(xù)高表達,并且在缺血性卒中病人的外周血中大量表達,這使其具備成為缺血性中風候選診斷標志物的潛能[18]。
結合miRNA-mRNA靶向數據、核心靶基因篩選、核心靶基因相互作用數據,本研究構建了卒中后的miRNA-mRNA表達調控網絡,包含6個關鍵miRNA與11個核心基因。在這6個關鍵miRNA中,3個下調的miRNA:miR-194-5p、miR-182、miR-139調控了PPP2CA、FOS、Notch1、GRB2、CTTN、FOXO3、CREB1、FBXW7、ITPKB 9個功能基因的轉錄本,其中僅有ITPKB在卒中后表達下調,其余mRNA及其互補結合的miRNA的表達水平均呈反比關系。這與miRNA的作用方式有關,miRNA可以通過結合在靶基因的3’UTR區(qū)域沉默mRNA的表達[19]。3個上調的miRNA:miR-128-2-5p、miR-191-5p、miR-383-5p可能參與RHOA、CREBBP、FOS靶基因的調控。正如KEGG富集結果(圖6C)所示,靶基因所參與的是一個復雜的調控網絡,最終所體現的表達水平變化是各因素綜合作用的結果。
結合靶基因所在的信號通路以及靶基因的表達譜數據,我們發(fā)現CREB1和Notch1在中風患者的血液樣本中顯著高表達(圖4),其相關通路——cAMP信號通路與Notch信號通路也被顯著富集并具有重要的互作調控關系(圖6C)。這提示我們,CREB1和Notch1以及靶向它的miR-182和miR-139可能在缺血性卒中的病理生理進程中發(fā)揮關鍵作用。前期研究表明,miR-182可作為中風早期診斷的外周血標志物[12]。miR-182可以通過調節(jié)靶基因的表達,影響中風后的組織損傷與修復過程。YI等[20]研究證實miR-182可以通過靶向調節(jié)ASPP家族的抑制因子來加重腦缺血再灌注損傷。而本研究發(fā)現,miR-182可能通過調控CREB1、GRB2、CTTN、FOXO3、FBXW7這5個關鍵基因影響cAMP信號通路、Notch信號通路、MAPK信號通路進而影響卒中后的病理生理進程。研究表明,miR-139可以通過直接靶向c-Jun調控缺血再灌注損傷后的炎癥反應[21]。miR-139也可以通過靶向抑制Notch1進而抑制腦膠質瘤細胞的遷移侵襲能力和上皮-間質轉化[22]。但是,miR-139靶向Notch1基因在腦卒中發(fā)生發(fā)展的作用尚未明確。我們證實了卒中后的關鍵作用因子miR-139和Notch1在外周血中的表達呈負相關,且miR-139和miR-182的靶基因作用途徑高度相關,miR-182的靶基因GRB2可與miR-139的靶基因Notch1的調節(jié)劑Deltex直接作用,抑制MAPK信號通路的激活[23]。這些結果表明,miR-182和miR-139可能通過調控下游一系列靶基因發(fā)揮協(xié)同效應進而影響信號通路的互作,參與缺血性中風的病理生理進程,而其聯(lián)合應用及作用機制有待更深入的探究。
綜上所述,本研究通過生物信息學方法,鑒定了中風后差異表達的15個miRNA,通過同源性分析鑒定出11個人和大鼠之間高度保守的miRNA,預測并篩選了其靶基因。應用靶基因功能富集分析和靶基因之間的蛋白質互作網絡解析,并與卒中患者外周血mRNA表達譜數據相結合,交集篩選出可能在中風的病理生理進程中起到關鍵作用的6個關鍵miRNA及其靶向的11個關鍵靶基因,構建了miRNA-mRNA表達調控網絡,對該調控網絡進行深度的功能分析。最終篩選出在缺血性卒中發(fā)揮關鍵作用的兩對miRNA-mRNA靶向關系對:miR-182-CREB1和miR-139-Notch1,它們在缺血性卒中疾病中的聯(lián)合作用機制和聯(lián)合診斷價值值得更進一步的研究與關注。