貴州醫(yī)科大學(xué)寄生蟲學(xué)教研室 貴州 貴陽 550004
瘧疾是一種全球性蟲媒傳染病,因按蚊叮咬而感染瘧原蟲所引起的。目前盡管在控制瘧疾方面取得了持續(xù)的成功,但每年仍有2億多新感染,近50萬人死亡,其中大多數(shù)是5歲以下的嬰兒和兒童[1-2]。最嚴(yán)重的神經(jīng)系統(tǒng)并發(fā)癥為鬧瘧疾,四分之一的患兒在暴露后至少持續(xù)2年會(huì)出現(xiàn)神經(jīng)認(rèn)知障礙,包括行為問題,心理健康問題和癲癇的發(fā)展。這使得腦瘧疾成為該地區(qū)兒童神經(jīng)殘疾的主要原因。因此,利用生物信息學(xué)方法篩選腦瘧疾的分子靶標(biāo)并探討起生物學(xué)功能,對(duì)于該病的診斷治療及預(yù)防具有一定的臨床意義。
1.1 數(shù)據(jù)來源 從NCBI(National Center for Biotechnology Information)的GEO(Gene Expression Omnibus)中下載數(shù)據(jù)集GSE1124,該數(shù)據(jù)采用Affymetrix Human Genome U133B Array基因表達(dá)芯片平臺(tái)的GPL97檢測獲得。數(shù)據(jù)集中包括5例正常對(duì)照組兒童及4例患有腦瘧疾的兒童。
1.2 差異基因的篩選 數(shù)據(jù)標(biāo)準(zhǔn)化后,通過R軟件的limma包(version"3.6")進(jìn)行差異基因的分析,基因表達(dá)之間的q值通過T檢驗(yàn)確定,并使用Benjamin Hochberg(BH)方法進(jìn)行調(diào)整。以q值<0.05和|log 2fold change(FC)|>1為截?cái)鄻?biāo)準(zhǔn)的基因?yàn)椴町惢?Differentially expressed genes,DEGs)。
1.3 功能和KEGG富集分析 使用DAVID(https://david.ncifcrf.gov/)對(duì)DEGs進(jìn)行GO注釋和KEGG通路分析,DAVID是一個(gè)重要的在線分析工具,可以為大規(guī)模基因或蛋白列表提供系統(tǒng)、全面的生物功能注釋信息[4]。主要用于DGEs基因功能及途徑的富集分析。最后,利用R.的ggplot2對(duì)富集分析進(jìn)行可視化。P<0.05認(rèn)為有統(tǒng)計(jì)學(xué)意義。
1.4 PPI網(wǎng)絡(luò)分析 為了評(píng)估941個(gè)DEGs之間的交互關(guān)系,我們將DGEs的基因符號(hào)輸入到STRING(https://string-db.org/)(version11.0)中,相互作用得分是>0.7為顯著。然后利用Cytoscape軟件構(gòu)建PPI網(wǎng)絡(luò),利用插件分子復(fù)合物檢測Cyto Hubba對(duì)網(wǎng)絡(luò)模塊進(jìn)行篩選,以前10作為核心基因。
2.1 差異基因篩選結(jié)果 該數(shù)據(jù)集共獲得差異基因941個(gè),其中上調(diào)基因?yàn)?46個(gè),下調(diào)基因?yàn)?95個(gè)(圖1)。
圖1 GSE1124差異基因火山圖
2.2 差異基因的功能富集分析 為了進(jìn)一步了解差異基因的生物學(xué)功能,我們進(jìn)行的富集分析。其結(jié)果為,GO(Gene Onotology)中BP主要富集在T細(xì)胞分化,Notch信號(hào)通路的調(diào)控,前腦神經(jīng)元的生成等,CC主要富集在核被膜,呼吸鏈復(fù)合物IV等,MF主要富集在鈣離子跨膜轉(zhuǎn)運(yùn)蛋白活性,半乳糖基轉(zhuǎn)移酶活性等。KEGG(Kyoto Encyclopedia of Genes and Genomes)主要富集在JAK-STAT signaling pathway和鈣離子信號(hào)通路等。
2.3 PPI網(wǎng)絡(luò)分析及核心基因的篩選 根據(jù)PPI網(wǎng)絡(luò)分析,并用Cytoscape進(jìn)行可視化。利用cytoHubba進(jìn)行分析,根據(jù)degree前10進(jìn)行篩選基因,得到 RPS7,RPS24,RPS29,EGFR,RPL34,RPL22L1,RPL7,EIF3B,ELAVL1,SOCS3。Metscape分析后發(fā)現(xiàn)這10個(gè)差異基因主要富集于分解代謝過程的負(fù)調(diào)控及細(xì)胞質(zhì)的翻譯等(圖2)。
圖2 差異基因網(wǎng)路互作關(guān)系圖
重癥瘧疾是一種由宿主和寄生蟲因素共同驅(qū)動(dòng)的多系統(tǒng)疾病,在臨床上可表現(xiàn)為1個(gè)或多個(gè)以下綜合征:腦型瘧疾,黑水熱,嚴(yán)重貧血,急性呼吸窘迫綜合征,高寄生蟲血癥,代謝并發(fā)癥[3]。在在重型瘧疾中,腦型瘧疾是由寄生蟲依附于腦血管引起,癥狀可能包括精神狀態(tài)改變,昏迷,癲癇發(fā)作和顱內(nèi)壓升高等。撒哈拉以南非洲地區(qū)的兒童每年受害超過57.5萬例,受影響最大。幸存的患者神經(jīng)和認(rèn)知缺陷,行為困難和癲癇的風(fēng)險(xiǎn)增加,這使得腦瘧疾成為該地區(qū)兒童神經(jīng)殘疾的主要原因。因此,篩選出腦瘧疾的分子靶標(biāo)對(duì)于該病的預(yù)防和治療具有一定的指導(dǎo)性意義。
本研究從NCBI網(wǎng)站的GEO中篩選出兒童瘧疾的全血轉(zhuǎn)錄組,并進(jìn)行生物信息學(xué)的分析。結(jié)果顯示,對(duì)照組和鬧瘧疾組中共有941個(gè)差異表達(dá)基因,其主要富集于T細(xì)胞分化,Notch信號(hào)通路的調(diào)控,前腦神經(jīng)元的生成,呼吸鏈復(fù)合物IV,JAK-STAT signaling pathway和鈣離子信號(hào)通路等。在PPI網(wǎng)絡(luò)構(gòu)建中,我們也發(fā)現(xiàn)根據(jù)degree進(jìn)行分析得到10個(gè)核心基因,其中RPS7,RPS24,EGFR,RPL34,RPL22L1,SOCS3為 上 調(diào) 基 因,RPS29,RPL7,EIF3B,ELAVL 1為下調(diào)基因。提示,在兒童重癥瘧疾的鬧瘧疾中其疾病的發(fā)生發(fā)展收到基因組的調(diào)控。在更進(jìn)一步的富集分析后,我們發(fā)現(xiàn),這10個(gè)核心基因主要富集在病毒基因的表達(dá),ER靶向蛋白等有關(guān)。
RPS7,RPS24,RPL34,RPS29,RPL7,RPL22L1均是核糖體蛋白,是催化蛋白質(zhì)合成的細(xì)胞器,主要研究在腫瘤鄰域[5-6]。細(xì)胞因子信號(hào)傳導(dǎo)抑制因子3(SOCS3)是眾所周知的Janus激酶信號(hào)轉(zhuǎn)導(dǎo)子和轉(zhuǎn)錄激活因子3(JAK/STAT 3)信號(hào)通路的反饋抑制劑,其介導(dǎo)許多細(xì)胞因子,生長因子和激素的信號(hào)轉(zhuǎn)導(dǎo),在調(diào)節(jié)感染和炎癥性疾病結(jié)局中具有重要的作用。EGFR(表皮生長因子受體)是一種蛋白質(zhì)編碼基因。該基因編碼的蛋白是跨膜糖蛋白,它是蛋白激酶超家族的成員。該蛋白是表皮生長因子家族成員的受體。EGFR是一種細(xì)胞表面蛋白,可與表皮生長因子結(jié)合,從而誘導(dǎo)受體二聚化和酪氨酸自磷酸化,從而導(dǎo)致細(xì)胞增殖。它被很多的癌癥證實(shí)為疾病的驅(qū)動(dòng)因素而被認(rèn)為是分子靶標(biāo)[8-10]。
目前,對(duì)于兒童重癥瘧疾的死亡率有所降低,但是其發(fā)病機(jī)制仍舊不清楚。在我們目前的研究中,我們使用了生物信息學(xué)方法篩選了兒童腦瘧疾的DEGs,之后篩選出了核心基因并分析其生物學(xué),這個(gè)為兒童重癥瘧疾的發(fā)病機(jī)制提供了新的見解。