邵康梅,張 凡,蔡宏斌,魏海萍,陳圓圓,葛朝明*
(1.蘭州大學(xué)第二醫(yī)院神經(jīng)內(nèi)科,中國甘肅蘭州730030;2.甘肅省消化系腫瘤重點實驗室,中國甘肅蘭州730030)
阿爾茨海默病(Alzheimer’s disease,AD)是一種進行性神經(jīng)退行性疾病,其發(fā)病機制可歸因于大腦皮質(zhì)和邊緣區(qū)β淀粉樣蛋白(amyloid β-protien,Aβ)斑塊的胞外聚集和過度磷酸化的tau蛋白構(gòu)成的細胞內(nèi)神經(jīng)原纖維纏結(jié),其特點是記憶喪失和進行性神經(jīng)認知功能障礙[1]。AD是老年期最常見的癡呆類型,占老年期癡呆的60%~80%[2]。目前,AD的治療無特效藥物,尋找AD早期的治療靶點對疾病的治療至關(guān)重要。研究證實內(nèi)嗅皮層是AD進展中最早發(fā)生病變的部位[3~4]。
內(nèi)嗅皮層位于顳葉內(nèi)側(cè),參與最初的情景編碼,在記憶形成過程中起著不可或缺的作用,而且是海馬體和大腦皮層之間的關(guān)鍵通道[5]。AD中tau蛋白相關(guān)神經(jīng)原纖維纏結(jié)病理遵循一定的順序,首先影響內(nèi)嗅皮層,然后發(fā)展到邊緣系統(tǒng)和聯(lián)合皮層[5]。因此,在AD早期針對內(nèi)嗅皮層尋找其潛在治療靶點,對AD的治療具有重要的臨床意義。
本研究收集了GEO(Gene Expression Omnibus)數(shù)據(jù)庫中AD的內(nèi)嗅皮層表達譜數(shù)據(jù)集GSE-48350[6]、GSE26972[7]和 GSE118553[8]。通過批次矯正對多組數(shù)據(jù)聯(lián)合分析,篩選出差異表達基因(differentially expressed genes,DEGs),并對其進行GO(Gene Ontology)分析、KEGG(Kyoto Encyclopedia of Genes and Genomes)通路富集分析以及蛋白質(zhì)-蛋白質(zhì)相互作用(protein-protein interaction,PPI)網(wǎng)絡(luò)分析,結(jié)果提示血管細胞黏附分子1(vascular cell adhesion molecule 1,VCAM1)基因、CD44、原癌基因FOS和富含半胱氨酸的酸性分泌蛋白(secreted protein acidic and rich in cysteine,SPARC)基因在AD發(fā)生發(fā)展中發(fā)揮關(guān)鍵作用。VCAM1屬于黏附分子免疫球蛋白超家族,在衰老中與記憶和認知密切相關(guān)[9~10]。CD44是一種跨膜糖蛋白,參與透明質(zhì)酸代謝、激活淋巴細胞和釋放細胞因子過程,并且參與海馬記憶編碼、存儲或檢索過程[11~12]。c-Fos蛋白由FOS基因轉(zhuǎn)錄后翻譯產(chǎn)生,其參與了記憶的形成[13]。SPARC是調(diào)節(jié)細胞與其周圍細胞外基質(zhì)相互作用的細胞分子,其異常表達與腦組織炎癥的發(fā)生相關(guān)[14]。本研究闡明了AD在內(nèi)嗅皮層部位的發(fā)病機制并篩選出了AD治療的潛在靶點,為AD的防治提供了新的思路與線索。
本文使用的數(shù)據(jù)來自于美國國家生物技術(shù)信息中心(National Center for Biotechnology Information,NCBI)公共數(shù)據(jù)平臺的GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo)。檢索關(guān)鍵詞為“entorhinal cortex”,檢索條件為“Homo sapiens”和“expression profiling by array”,共檢索到13個數(shù)據(jù)集,排除缺乏正常對照組、晚發(fā)性AD、非AD研究的數(shù)據(jù)集,最終納入 GSE48350、GSE26972、GSE118553 數(shù)據(jù)集進行下一步分析。
在GEO數(shù)據(jù)庫中下載GSE48350、GSE26972、GSE118553矩陣數(shù)據(jù)[6~8]。運用R軟件處理芯片數(shù)據(jù),limma包用于數(shù)據(jù)的標(biāo)準(zhǔn)化以及內(nèi)嗅皮層和正常對照組的基因差異分析[15];利用K近鄰法(K-nearest neighbor,KNN)填充缺失值,采用 impute包進行芯片數(shù)據(jù)缺失值的處理[16]。運用R軟件中的sva包和limma包進行批次矯正[17],消除數(shù)據(jù)集間存在的異質(zhì)性。以|log2FC|>1(FC:fold change)和P<0.05為篩選條件篩選DEGs。
為了在功能層面上分析DEGs,利用Cytoscape軟件中的ClueGO插件對其進行GO/KEGG富集分析及數(shù)據(jù)可視化[18],得到DEGs富集的生物過程及通路,篩選標(biāo)準(zhǔn)為P<0.05。
本研究通過STRING數(shù)據(jù)庫(http://www.string-db.org/),以互作評分 combination score>0.4為條件構(gòu)建PPI網(wǎng)絡(luò)[19],使用Cytoscape軟件對DEGs所編碼蛋白質(zhì)的相互作用進行可視化展示[20]。其中,cytoHubba插件用于分析生物網(wǎng)絡(luò)中的關(guān)鍵基因[21],它包括最大集團中心度(maximal clique centrality,MCC)、最大鄰域組件密度(density of maximum neighborhood component,DMNC)、度(degree)、邊緣滲透組件(edge percolated component,EPC)、中介中心性(betweenness)、離心率(eccentricity)等拓撲分析方法[19]。為了提高預(yù)測結(jié)果的可靠性,運用不同的算法探索本研究的關(guān)鍵基因。
結(jié)合GSE48350和GSE118553數(shù)據(jù)集驗證關(guān)鍵基因在內(nèi)嗅皮層、海馬、中央后回、額上回、額葉皮層、顳葉皮層和小腦組織的表達水平是否有差異,并分析GSE118553數(shù)據(jù)集中無癥狀A(yù)D(asymptomatic Alzheimer’s disease,AsymAD)和 AD 患者內(nèi)嗅皮層數(shù)據(jù)。其中,AsymAD患者為認知功能正常但有明顯AD神經(jīng)病變的個體[8]。比較Asym-AD和AD患者的基因表達差異可能有助于闡明AD早期進展的特定生物學(xué)機制。
所有數(shù)據(jù)錄入SPSS 23.0軟件進行分析,對關(guān)鍵基因在腦組織不同部位的表達分析采用Mann-Whitney U檢驗,以P<0.05為差異具有統(tǒng)計學(xué)意義。
從GEO數(shù)據(jù)庫中下載的3個AD相關(guān)的內(nèi)嗅皮層芯片數(shù)據(jù)集的具體信息見表1。對3個數(shù)據(jù)集分別進行DEGs篩選,結(jié)果顯示:GSE48350中有43個DEGs,包括37個上調(diào)基因和6個下調(diào)基因;GSE26972中有266個DEGs,包括127個上調(diào)基因和139個下調(diào)基因;GSE118553中有93個DEGs,包括78個上調(diào)基因和15個下調(diào)基因。對3個數(shù)據(jù)集的DEGs繪制韋恩圖,結(jié)果提示三者間未見共同DEGs,說明這3個數(shù)據(jù)集之間存在異質(zhì)性,可能是由于發(fā)表時間不同、芯片檢測水平不一致,故需對 GSE48350、GSE26972、GSE-118553數(shù)據(jù)集的數(shù)據(jù)進行批次矯正。對合并的數(shù)據(jù)進行標(biāo)準(zhǔn)化處理后,結(jié)果顯示有17個DEGs,且均為上調(diào)基因(圖1)。
表1 AD內(nèi)嗅皮層各數(shù)據(jù)集的基本情況Table 1 Basic information of data sets of the entorhinal cortex with AD
圖1 AD內(nèi)嗅皮層DEGs的分布熱圖紅色代表表達水平高,綠色代表表達水平低。Fig.1 Heat map of DEGs in the entorhinal cortex with ADRed means higher expression,and green means lower expression.
對17個DEGs進行GO富集和KEGG通路富集在線分析。GO富集分析提示,DEGs主要富集在白細胞-細胞間黏附的正調(diào)控、細胞外基質(zhì)組織、皮質(zhì)類固醇反應(yīng)等11個生物過程(表2,圖2)。KEGG通路富集分析結(jié)果顯示,DEGs在卟啉和葉綠素代謝信號通路上顯著富集。
表2 DEGs的GO富集分析Table 2 GO analysis of DEGs
圖2 DEGs的GO富集分析圓形代表富集到的條目,連線代表兩個GO富集條目之間存在相同的DEGs,圖形越大表明富集到的基因數(shù)目越多。Fig.2 GO analysis of DEGsNodes represent GO terms.Lines indicate that overlapping DEGs exist between two GO terms.Larger nodes indicate more enriched DEGs.
對分析獲得的DEGs進行PPI網(wǎng)絡(luò)分析,結(jié)果如圖3所示,包含13個節(jié)點和31條相互作用關(guān)系。進一步基于cytoHubba插件中的多種計算方法,得到互作網(wǎng)絡(luò)中的關(guān)鍵基因為VCAM1、CD44、FOS 和 SPARC(表 3)。
表3 基于cytoHubba中各算法篩選的關(guān)鍵基因Table 3 Hub genes screened based on cytoHubba algorithm
圖3 DEGs的PPI網(wǎng)絡(luò)圖中顏色由紅到黃到藍表明相應(yīng)基因得分由高到低。Fig.3 PPI network of DEGsColors ranging from red to yellow to blue indicate gene scores from high to low.
運用GSE48350數(shù)據(jù)集驗證VCAM1、CD44、FOS和SPARC基因在內(nèi)嗅皮層、海馬、中央后回和額上回的表達是否有差異。研究發(fā)現(xiàn),VCAM1在內(nèi)嗅皮層的表達水平顯著高于中央后回和額上回(P<0.01,圖 4A);CD44和 SPARC 在海馬的表達水平顯著高于內(nèi)嗅皮層(P<0.05),但在內(nèi)嗅皮層的表達水平顯著高于中央后回和額上回(P<0.01,圖4B和圖4D);FOS在海馬中的表達水平顯著高于中央后回和額上回(P<0.01),而海馬中的表達水平高于內(nèi)嗅皮層,但差異無統(tǒng)計學(xué)意義(P>0.05,圖4C)。結(jié)合GSE118553數(shù)據(jù)集再次探究關(guān)鍵基因在內(nèi)嗅皮層、額葉皮層、顳葉皮層和小腦組織中的表達情況。我們發(fā)現(xiàn)VCAM1、CD44、FOS和SPARC基因在內(nèi)嗅皮層的表達水平顯著高于其他部位(P<0.01,圖 5)。
圖4 關(guān)鍵基因在內(nèi)嗅皮層、海馬、中央后回和額上回組織中的表達水平Fig.4 The expression levels of hub genes in the entorhinal cortex,hippocampus,postcentral gyrus and superior frontal gyrus*:P<0.05;**:P<0.01.
圖5 關(guān)鍵基因在顳葉皮層、小腦、額葉皮層和內(nèi)嗅皮層組織中的表達水平Fig.5 The expression levels of hub genes in the temporal cortex,cerebellum,frontal cortex and entorhinal cortex**:P<0.01.
AsymAD是AD的前驅(qū)階段,我們結(jié)合GSE-118553數(shù)據(jù)集對AsymAD和AD患者內(nèi)嗅皮層中關(guān)鍵基因的表達做進一步分析。結(jié)果顯示,與Asym-AD患者相比,VCAM1、CD44、FOS和 SPARC 基因在AD患者內(nèi)嗅皮層中顯著高表達(P<0.01,圖6)。
圖6 關(guān)鍵基因在AD和AsymAD患者內(nèi)嗅皮層中的表達水平Fig.6 The expression levels of hub genes in the entorhinal cortex between AD and asymptomatic patients**:P<0.01.
近年來大量研究者為探究AD發(fā)生發(fā)展的潛在機制和篩選治療靶點,構(gòu)建了一系列生物大數(shù)據(jù)集。GSE48350數(shù)據(jù)集包含來自正常人(20~99歲)和AD患者海馬、內(nèi)嗅皮層、額葉上回、中央后回4個腦區(qū)的微陣列數(shù)據(jù)[6]。通過對該數(shù)據(jù)的分析,Berchtold等[22]發(fā)現(xiàn)在衰老和AD進展中突觸相關(guān)基因的表達逐漸下調(diào)。此外,通過構(gòu)建正常老年人、AsymAD和AD患者的內(nèi)嗅皮層、額葉皮層、顳葉皮層和小腦組織微陣列表達譜芯片(GSE118553),Patel等[8]發(fā)現(xiàn)AsymAD和AD患者的能量代謝與谷氨酸-谷氨酰胺循環(huán)失調(diào)有關(guān)。Berson等[7]通過對來源于AD患者內(nèi)嗅皮層的芯片數(shù)據(jù)(GSE26972)展開分析發(fā)現(xiàn),核內(nèi)不均一核糖核蛋白(heterogeneous nuclear ribonucleoprotein,hnRNP)A/B 剪接因子在AD患者內(nèi)嗅皮層中選擇性缺失,而且敲除hnRNP A/B可導(dǎo)致初級神經(jīng)元選擇性剪接損傷和樹突損失。
為探究內(nèi)嗅皮層在AD發(fā)生發(fā)展過程中的機制,本研究對GEO數(shù)據(jù)庫中3個AD患者內(nèi)嗅皮層數(shù)據(jù)集(GSE48350、GSE26972、GSE118553)進行了整合和差異基因篩選,并針對篩選出的差異基因進行了GO/KEGG富集分析和PPI分析,結(jié)果提示 VCAM1、CD44、FOS和 SPARC參與多條信號通路并在AD中發(fā)揮關(guān)鍵作用。VCAM1是黏附分子免疫球蛋白超家族的成員,于1989年首次被鑒定為位于內(nèi)皮細胞表面的一種90 kD糖蛋白,其功能主要是介導(dǎo)單核細胞和淋巴細胞對內(nèi)皮細胞的黏附[9,23]。多項研究證實,VCAM1在AD患者血液、腦脊液標(biāo)本中異常高表達[24~27]。最新研究發(fā)現(xiàn),在年老小鼠海馬區(qū)的腦內(nèi)皮細胞中VCAM1高表達,通過抑制VCAM1基因或使用抗VCAM1抗體可逆轉(zhuǎn)年老小鼠腦內(nèi)小膠質(zhì)細胞活性和認知功能障礙等衰老方面的變化[10]。另有研究報道,VCAM1水平與短期記憶和繪畫得分呈顯著負相關(guān),即血漿中VCAM1表達越高,AD患者記憶力及視空間功能越差[28]。焦谷氨酸-Aβ是AD中Aβ斑塊的主要成分,在谷氨?;h(huán)化酶催化下,截短的Aβ肽發(fā)生吡咯?;磻?yīng),產(chǎn)生焦谷氨酸-Aβ,增強其聚集傾向[29]。相關(guān)研究報道,VCAM1與AD患者谷氨?;h(huán)化酶活性密切相關(guān),是抑制谷氨酰基環(huán)化酶的潛在藥效學(xué)指標(biāo)[30]。目前,探究VCAM1在AD內(nèi)嗅皮層部位的相關(guān)研究很少報道,僅Pang等[26]研究提示VCAM1在內(nèi)嗅皮層及海馬中高表達,這與我們的結(jié)果(圖4A)一致。此外,我們首次發(fā)現(xiàn)VCAM1在AD患者內(nèi)嗅皮層中的表達水平顯著高于AsymAD患者(圖6A),提示在AD早期VCAM1在內(nèi)嗅皮層部位出現(xiàn)表達異常。
CD44是一種跨膜糖蛋白,正常組織中CD44在調(diào)節(jié)透明質(zhì)酸代謝、激活淋巴細胞和釋放細胞因子方面起著至關(guān)重要的作用[11]。Uberti等[31]證實AD患者淋巴細胞CD44基因的表達水平較正常人升高。小膠質(zhì)細胞是中樞神經(jīng)系統(tǒng)的天然免疫細胞,在AD小鼠早期,小膠質(zhì)細胞CD44的表達升高[32]。另一項研究發(fā)現(xiàn),CD44S和CD44剪接變異體(CD44V6和CD44V10)在AD患者的神經(jīng)母細胞瘤細胞和原代神經(jīng)元中被Aβ肽誘導(dǎo)表達,其中CD44V10特異性干擾小RNA(small interfering RNA,siRNA)和抗CD44V10抗體都能保護神經(jīng)細胞使其免受Aβ誘導(dǎo)的毒性[33]。目前,關(guān)于CD44在AD患者內(nèi)嗅皮層部位的相關(guān)研究未見報道。本研究發(fā)現(xiàn)CD44在AD內(nèi)嗅皮層部位高表達,且在AD患者內(nèi)嗅皮層中的表達水平高于AsymAD患者。其與VCAM1共同參與白細胞-細胞間黏附的正調(diào)控通路和細胞外基質(zhì)組織通路。研究報道,CD44作為糖胺多糖透明質(zhì)酸的受體,參與海馬記憶編碼、存儲或檢索過程[12]。我們發(fā)現(xiàn),CD44在內(nèi)嗅皮層及海馬顯著富集,且在海馬的表達水平顯著高于內(nèi)嗅皮層(圖4B)。因此,我們推斷CD44在內(nèi)嗅皮層和海馬記憶形成及儲存中發(fā)揮關(guān)鍵作用。
FOS基因編碼產(chǎn)生c-Fos蛋白。研究證實,c-Fos蛋白是神經(jīng)可塑性的關(guān)鍵蛋白質(zhì),參與了記憶的形成[13,34]。有研究表明,海馬神經(jīng)元的突觸可塑性變化在老年癡呆的病理過程中占據(jù)重要的地位,可能是AD學(xué)習(xí)和記憶障礙的神經(jīng)生物學(xué)基礎(chǔ)[35]。此外,F(xiàn)OS還可通過調(diào)節(jié)腸道微生物-GLP-1(glucagon-like peptide-1)/GLP-1R(glucagon-like peptide-1 receptor)通路,發(fā)揮良好的抗AD作用[36]。通過對AD患者外周血單個核細胞的基因表達譜進行測定,Leandro等[37]不僅發(fā)現(xiàn)炎癥和免疫相關(guān)信號通路顯著上調(diào),而且發(fā)現(xiàn)FOS可作為AD患者外周血的潛在生物標(biāo)志物。為進一步分析AD中不同細胞亞型的特異性調(diào)節(jié)機制和各細胞亞群的功能差異,Grubman等[38]構(gòu)建了AD內(nèi)嗅皮層的單細胞圖譜,其研究證實FOS在AD患者的星形膠質(zhì)細胞亞群中顯著高表達,而且星形膠質(zhì)細胞也是AD早期的生物標(biāo)志物并參與AD疾病進展[39]。本研究發(fā)現(xiàn)FOS在海馬及內(nèi)嗅皮層組織中顯著富集(圖4C),且FOS在AD患者內(nèi)嗅皮層中的表達水平顯著高于AsymAD患者(圖6C)。
SPARC是調(diào)節(jié)細胞與其周圍細胞外基質(zhì)相互作用的細胞分子,同時參與細胞外基質(zhì)的組裝、沉積和生長因子信號[40]。針對AD患者腦脊液的蛋白質(zhì)組學(xué)分析發(fā)現(xiàn),SPARC表達升高,且可能具有預(yù)測早期AD發(fā)生的作用[41]。Strunz等[14]通過分析AD患者顳皮質(zhì)發(fā)現(xiàn),SPARC顯著高表達,并與Aβ蛋白相結(jié)合,參與腦組織炎癥的發(fā)生。本研究發(fā)現(xiàn),SPARC在AD患者內(nèi)嗅皮層和海馬組織中顯著高表達,且其在海馬的表達水平顯著高于內(nèi)嗅皮層(圖4D)。同樣,SPARC在AD患者內(nèi)嗅皮層中的表達水平顯著高于AsymAD患者(圖6D)。
綜上所述,本研究運用多芯片聯(lián)合分析,發(fā)現(xiàn)VCAM1、FOS、CD44和SPARC在AD患者內(nèi)嗅皮層部位發(fā)揮重要作用。此外,本研究結(jié)合相關(guān)數(shù)據(jù)再次驗證了關(guān)鍵基因在腦組織不同部位及AD患者與AsymAD患者之間的表達水平具有差異性。研究結(jié)果為闡明AD疾病發(fā)生發(fā)展的潛在機制提供了新的思路,也為篩選AD的治療藥物提供了新的靶點。但該結(jié)論仍需要進一步的臨床大樣本驗證及機制探究。