頡相君,張博,呂瑩,寧尚偉,曲書強
(1. 哈爾濱醫(yī)科大學附屬第二醫(yī)院兒內(nèi)科,黑龍江 哈爾濱 150086; 2. 哈爾濱醫(yī)科大學生物信息科學與技術學院,黑龍江 哈爾濱 150081)
隨著圍生醫(yī)學的不斷進步和發(fā)展,產(chǎn)前類固醇給藥、產(chǎn)后肺表面活性劑使用、更安全的呼吸機應用措施等使極早早產(chǎn)兒在新生兒重癥監(jiān)護病房的占比越來越高[1]。支氣管肺發(fā)育不良(bronchopulmonary dysplasia,BPD)是極早早產(chǎn)兒最常見的嚴重并發(fā)癥之一,歐洲23~31周齡出生的胎兒中有10%~25%會發(fā)展為BPD[2]。BPD主要由生理性肺發(fā)育障礙引起,發(fā)病機制復雜且未完全闡明,除高氣道壓力和氧損傷外,近年來產(chǎn)前和圍產(chǎn)期因素受到更多重視,主要包括遺傳易感性、表面活性劑穩(wěn)態(tài)不成熟、宮內(nèi)和圍產(chǎn)期感染、胎盤功能不全等[3]。
基因表達綜合數(shù)據(jù)庫(GEO)是一個國際公共存儲庫,存檔和免費分發(fā)高通量基因表達和其他功能基因組學數(shù)據(jù)集[4]。本研究旨在通過GEO數(shù)據(jù)挖掘,研究BPD與非BPD極早早產(chǎn)兒的差異表達基因及信號通路,為精準識別高危患兒提供理論依據(jù),更好地為BPD的防治提供服務。
以“bronchopulmonary dysplasia”為關鍵詞在GEO數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/geo/)查詢,限定研究物種為“Homo sapiens”進一步查看篩選后的數(shù)據(jù)集。下載基因表達數(shù)據(jù)集GSE8586,該數(shù)據(jù)集所用平臺為GPL570,芯片為Affymetrix Human Genome U133 Plus 2.0 Array,包括54例極早早產(chǎn)兒,其中20例患有BPD,34例未患BPD,分離臍帶組織得到RNA表達譜[5]。GEO數(shù)據(jù)庫是公開使用的資源,故并未提及道德認可。
使用GEO2R在線分析工具進行數(shù)據(jù)處理[6],以|log2FC|≥0.5(FC為差異倍數(shù))以及P<0.05作為差異表達基因的篩選標準,勾選自動數(shù)據(jù)標準化選項,得到BPD組與對照組的差異表達基因。選取排名前40的差異表達基因,使用TBtools繪制熱圖[7]。使用GraphPad Prism 9.0繪制差異表達基因的火山圖。
在基因功能注釋的在線工具DAVID2021中(https://david.ncifcrf.gov),根據(jù)基因本體(gene ontology,GO) 數(shù)據(jù)庫和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genomes,KEGG) 通路數(shù)據(jù)庫對差異表達顯著的基因進行生物學富集分析[8-9],以P<0.01、基因條目≥10為差異有統(tǒng)計學意義。
通過交互基因檢索工具STRING (https://cn.string-db.org)對差異表達顯著的基因構(gòu)建蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction, PPI)網(wǎng)絡[10],以結(jié)合分數(shù)≥0.4為閾值條件,隱藏網(wǎng)絡中離散的點,其余參數(shù)為默認。在Cytoscape3.8.2軟件(https://cytoscape.org)中對PPI網(wǎng)絡進行可視化處理。使用CytoHubba網(wǎng)絡分析插件計算蛋白之間的連接程度,度值越大,說明相互作用的蛋白節(jié)點越多,對網(wǎng)絡的影響也越大[11],篩選出PPI網(wǎng)絡的核心基因。
GEO2R分析設定條件為|log2FC|≥0.5且P<0.05,得到符合標準的765個差異表達基因,其中表達上調(diào)的基因有375個,表達下調(diào)的基因有390個。按照|log2FC|呈降序排列,選取排在前40的差異表達基因,用TBtools繪制熱圖(圖1),使用GraphPad Prism 9.0繪制差異表達基因火山圖(圖2)。
圖1 BPD與對照組差異表達基因熱圖
圖2 BPD與對照組差異表達基因火山圖
對篩選得到的差異表達基因進行GO注釋及KEGG富集分析(表1)。結(jié)果表明,生物學過程條目主要集中在細胞對鈣離子的反應、RNA聚合酶Ⅱ啟動子轉(zhuǎn)錄正調(diào)控、RNA聚合酶Ⅱ啟動子轉(zhuǎn)錄調(diào)控、心臟發(fā)育;細胞組分條目主要集中在染色質(zhì)、RNA聚合酶Ⅱ轉(zhuǎn)錄因子復合物、大分子復合物、轉(zhuǎn)錄因子復合物、細胞皮層、細胞核;分子功能條目主要集中在DNA結(jié)合轉(zhuǎn)錄因子活性、轉(zhuǎn)錄激活因子活性、RNA聚合酶Ⅱ轉(zhuǎn)錄調(diào)控區(qū)序列特異性結(jié)合、序列特異性雙鏈DNA結(jié)合、轉(zhuǎn)錄調(diào)控區(qū)序列特異性DNA結(jié)合、RNA聚合酶Ⅱ核心啟動子近端區(qū)域序列特異性DNA結(jié)合、RNA聚合酶Ⅱ轉(zhuǎn)錄因子活性、序列特異性DNA結(jié)合。KEGG富集分析結(jié)果表明差異表達基因主要在胰高血糖素信號通路和乳腺癌信號通路中富集。
表1 差異表達基因的GO注釋及KEGG富集分析
通過STRING在線工具和Cytoscape軟件,繪制差異表達基因的PPI網(wǎng)絡(圖3)。在PPI網(wǎng)絡中,有361個節(jié)點,777條邊。并用Cytoscape軟件的CytoHubba插件計算度值最高的前10個基因(圖4),Jun原癌基因(JUN)、Fos原癌基因(FOS)、SWI/SNF染色體重塑復合體亞基4(SMARCA4)、激活轉(zhuǎn)錄因子3(ATF3)、早期生長反應蛋白1(EGR1)、Erb-b2受體酪氨酸激酶(ERBB2)、過氧化物酶體增殖物激活受體(PPARA)、FosB原癌基因(FOSB)、核受體亞家族4A組成員1(NR4A1)、胰島素樣生長因子1(IGF1),在BPD中全部為下調(diào)基因。
紅色代表上調(diào)基因,綠色代表下調(diào)基因
紅色越深表示基因得分越高,生物學意義越顯著
BPD是一種多因素導致的疾病,存活患兒頻繁發(fā)生呼吸系統(tǒng)疾病,生活質(zhì)量和預期壽命下降,顯著影響衛(wèi)生服務質(zhì)量[1]。目前治療效果欠佳,以預防為主,現(xiàn)被認為是新生兒重癥監(jiān)護病房最棘手的問題之一。Jobe[12]認為導致發(fā)生BPD的損傷可能始于嬰兒分娩前肺部發(fā)育改變,可在出生時復蘇,然后因出生后暴露(氧氣、機械通氣、感染)而擴大。胎盤和臍帶組織可以反映宮內(nèi)環(huán)境,從臍帶組織著手或可以解決新生兒采血困難問題。
本文采用生物信息學方法,下載GES8586芯片基因,差異分析篩選出差異表達基因,共鑒定出375個上調(diào)差異表達基因,390個下調(diào)差異表達基因。構(gòu)建了PPI網(wǎng)絡來研究差異表達基因之間的相互關系,得到以JUN、FOS、SMARCA4、ATF3、EGR1為代表的核心基因,可能在BPD發(fā)生發(fā)展中起關鍵作用,證實了遺傳因素對BPD易感性的影響。
JUN家族主要由c-Jun, JunD和JunB等組成,F(xiàn)OS家族主要由c-Fos, Fra1, Fra2和FosB組成[13]。Jun和Fos蛋白家族成員結(jié)合可形成激活蛋白1(activator protein-1,AP-1)[14]。c-Jun、c-Fos表達主要定位于間質(zhì)成纖維細胞、氣道上皮細胞、肺泡巨噬細胞和肺泡上皮細胞。c-Jun、c-Fos的表達在BPD急性期達到峰值,二者參與基質(zhì)金屬蛋白酶-2(MMP-2)表達調(diào)控[15]。Kompass等[16]研究報道FOS是機械通氣肺中的一個早期反應基因,可被多種機械刺激和氧化應激誘導,并在肺泡的免疫激活中發(fā)揮顯著作用。ATF3是一種應激誘導的轉(zhuǎn)錄因子,在調(diào)節(jié)代謝、免疫中發(fā)揮重要作用。ATF3與多種細胞外信號有關,如內(nèi)質(zhì)網(wǎng)應激、細胞因子、趨化因子和脂多糖, 另外還被認為可防止氧化損傷,通過抑制巨噬細胞釋放CCl4來減輕炎癥反應[17]。ATF3的亮氨酸拉鏈(bZIP)域與其他含有bZIP結(jié)構(gòu)域的蛋白形成同源二聚體或異源二聚體,如AP-1[17]。EGR-1是一種可誘導的鋅指轉(zhuǎn)錄因子, 與缺氧、炎癥誘導的肺重塑,急性呼吸窘迫綜合征等發(fā)病機制有關[18-19]。有研究指出,EGR-1可能是牽張性肺部炎癥的早期啟動因子,并可在新生兒通氣過程中升高[20]。
富集分析結(jié)果表明,差異表達基因主要與細胞對鈣離子的反應、RNA聚合酶Ⅱ啟動子轉(zhuǎn)錄調(diào)控、心臟發(fā)育、細胞皮層、細胞核、DNA結(jié)合轉(zhuǎn)錄因子活性、胰高血糖素信號通路等有關。胰高血糖素信號可誘導細胞凋亡,但機制尚不清楚[21]。Peng等[22]研究表明胰高血糖素樣肽-1除參與血糖調(diào)節(jié)外,在抗凋亡、抗炎、緩解氧化應激損傷等方面也起作用,另外還能調(diào)節(jié)絲裂原活化蛋白激酶(mitogen-activated protein kinase,MAPK)信號轉(zhuǎn)導。已有多項研究表明到BPD的發(fā)生發(fā)展與MAPK信號通路有關[23-24],此外,AP-1受MAPK信號通路調(diào)控[25]。Sokolova等[26]報道AP-1位點在基質(zhì)金屬蛋白酶啟動子的轉(zhuǎn)錄激活中起主導作用,這與我們的結(jié)果相互印證。以上提示BPD可能與血糖有某種關聯(lián)。
綜上所述,本研究通過生物信息學篩選出BPD的差異表達基因,通過富集分析得到其信號通路,對后續(xù)研究BPD發(fā)病機制提供一定的參考。