宋向虎 李雪卉 龐朝陽 魏彥玉
摘要:阿爾茲海默?。ˋlzheimers disease,AD)是一種神經退行性疾病.臨床上以記憶障礙、視空間技能損害、執(zhí)行功能障礙以及人格行為改變等全面性癡呆表現(xiàn)為特征.AD致病源現(xiàn)今不明確,其中有毒物質損害使得腦內區(qū)域性能量代謝減退是AD發(fā)生的病因特征之一,而電子傳遞鏈(ETC)在能量代謝中扮演著重要角色.通過差異分析(LIMMA)及加權基因共表達網(wǎng)絡(WGCNA)構建獲得聚類基因,并對聚類后基因進行生理分析(GO)、通路分析(KEGG)后鎖定ETC,以及對其進行表達量分析及相關系數(shù)矩陣的構建,并結合臨床指標(MMSE)解釋說明,最終驗證了ETC的異常對阿爾茲海默病存在影響的事實.
關鍵詞:差異分析; 加權基因共表達網(wǎng)絡; 相關系數(shù)矩陣; 電子傳遞鏈
中圖分類號:Q811.4? 文獻標志碼:A? 文章編號:1001-8395(2024)05-0662-08
doi:10.3969/j.issn.1001-8395.2024.
阿爾茲海默?。ˋlzheimers disease,AD)是一種多因素疾病[1-4],其臨床表現(xiàn)為記憶喪失、視空間障礙、人格行為改變等全面性癡呆特征.在眾多的成因中,能量代謝[5-6]一直作為研究的前沿.成年人腦中含有860億神經元,而每個神經元都需要能量來維持人體正常生理機能的運轉,因此大腦消耗的能量巨大[7].能量產生的方式有厭氧糖酵解、戊糖磷酸途徑、檸檬酸循環(huán)和線粒體階段的電子傳遞鏈(electron transport chain,ETC)等[8-10],眾多途徑完成了人體能量的產生及運轉.
ETC在能量代謝中扮演著重要的角色[11-12],是眾多產能途徑中產能最多的一個途徑,ETC是通過一系列的氫和電子傳遞效應所構成的連續(xù)反應體系,并在此過程中伴隨著能量的釋放和物質的轉移.該體系一共包含了4個復合體[13-14]:復合體I是NADH和輔酶Q氧化還原復合體[15],完成一系列氧化還原操作后將電子傳遞給輔酶Q,復合體I接受NADH的電子并將其轉化為泛醌;復合體II含有琥珀酸脫氫酶,將琥珀酸的電子轉移為泛醌[16];復合體III是細胞色素c還原酶復合體[17],復合體III具有質子泵功能,將從復合體I和II得到的部分電子繼續(xù)傳遞,剩余電子加入循環(huán),復合體III含有細胞色素b和鐵硫蛋白,將泛醌的電子轉移到細胞色素c;復合體IV是細胞色素c氧化還原酶復合體[18],它含有細胞色素a、b和c,為合成水,將電子傳遞給一分子氧和兩分子水,并伴隨巨大能量的產生,這就是整個氧化還原[19-20]的過程.在眾多階段中,ETC處于產能后期并伴隨大量能量的誕生,大量能量也將維持人腦神經元的正常生理功能[21-22].因此,可知ETC在所有產能途徑中的重要性.本文的目的在于通過生物信息學手段對上萬個基因進行過濾及篩選找出目標基因,并對篩選后目標基因網(wǎng)絡進行分析并最終總結出ETC與AD之間存在的關系.
1 材料和方法
1.1 數(shù)據(jù)獲取及預處理 本文使用公開的基因表達數(shù)據(jù)集(https://www.ncbi.nlm.nih.gov/geo/)中下載的GSE1297數(shù)據(jù)集.GSE1297數(shù)據(jù)集是使用GPL96平臺獲取的,該數(shù)據(jù)集包含了31名患者(9名正常、7名輕度、8名中度、7名重度)總共2萬多個基因,以及不同的臨床特征,如年齡、性別、臨床病情評分數(shù)據(jù)(MMSE、BRAAK)等.
獲取數(shù)據(jù)集后,對數(shù)據(jù)集進行預處理操作并保留多版本進行實驗使用.第一版保留其原始數(shù)據(jù);第二版將所有數(shù)據(jù)對數(shù)化處理,以2為基數(shù)對序列中的每個數(shù)據(jù)進行對數(shù)運算,該操作可減少噪聲對于數(shù)據(jù)的影響;第三版對原始數(shù)據(jù)進行標準化處理,以ZScore歸一化算法作用于序列輸出標準化數(shù)據(jù).以上處理后數(shù)據(jù)將在實驗不同階段進行使用.
1.2 研究步驟及方法
1.2.1 研究內容 在本次研究中將以雙路徑交集原則來尋找關鍵基因,該方法尋找到的目標基因將更為準確及有效.路徑一使用LIMMA差異分析得到差異基因;路徑二使用WGCNA構建網(wǎng)絡篩選關鍵模塊.最終,通過富集分析得到研究的目標基因,并鎖定研究重點為ETC. 之后,對ETC以多個維度分析其與AD之間存在的關系.維度一:表達量分析可以清晰觀察基因網(wǎng)絡在AD不同階段表達量變化情況;維度二:臨床指標線性擬合圖可以觀察表達水平和現(xiàn)實臨床情況的變化趨勢;維度三:相關性分析可以對比正常情況與重度情況下基因網(wǎng)絡間相關性變化水平.通過多維度分析,推斷出本次研究關于ETC與AD之間存在的內在聯(lián)系.
1.2.2 LIMMA差異分析 差異分析的原則是確定組間差異是否顯著大于組內差異,其本質是廣義線性模型,LIMMA差異分析將對每個基因的表達量擬合出一個線性方程.差異分析的目的在于判斷樣本間所存在的差異性,確定差異基因,所研究的目標基因便是由差異基因深入挖掘得到.
1.2.3 相關性分析 相關性分析是指分析同一位置的2個或多個變量之間相關性的統(tǒng)計分析方法.我們使用皮爾遜相關系數(shù)法進行相關性計算,該方法用于反映2個變量A和B的線性相關性.相關性值在-1~1之間,相關性絕對值越大,變量相關性越強.
1.2.4 加權基因共表達網(wǎng)絡(WGCNA)分析 加權基因共表達網(wǎng)絡分析是用來描述不同樣本之間基因相關性的系統(tǒng)生物學方法,主要步驟包括相關系數(shù)計算、基因模塊確定、共表達網(wǎng)絡構建、模塊與性狀相關性篩選.方法目的在于尋找協(xié)同表達的基因模塊.在本實驗中,使用臨床評分系數(shù)指標BRAAK、MMSE作為將模塊與性狀關聯(lián)的指標參考值.通過模塊內聚類和臨床評分指標相關聯(lián)程度篩選出重點研究模塊.
1.2.5 富集分析(GO、KEGG) 富集分析指將基因按照已驗證知識,對篩選后基因進行具體分類的過程.富集分析后的基因將表現(xiàn)出部分共性,通過富集分析可判斷指定基因群所具有的功能特性.
GO數(shù)據(jù)庫的全稱是基因本體論(gene ontology,GO),它將基因分為3類:細胞成分(cellular component,CC)、分子功能(molecular function,MF)和生物過程(biological process,BP).KEGG數(shù)據(jù)庫是一個用于路徑(pathway)比較的數(shù)據(jù)庫.GO分析和KEGG分析便是針對基于不同分類思想而儲存的基因相關功能的數(shù)據(jù)庫進行的富集分析.通過GO分析,可以了解基因在這3類中的作用,通過KEGG分析,可以知道各基因間路徑關系.
1.2.6 臨床評分指標(MMSE、BRAAK) 臨床評分指標指的是迷你精神狀態(tài)檢查( mini-mental state examination,MMSE)評分和大腦衰老與再生動力學(brain aging and regeneration kinetics,BRAAK)的分期.其中,MMSE評分越低,癡呆程度越高;BRAAK分期越高,淀粉樣斑塊和神經原纖維纏結越多,神經元死亡越嚴重.在本文中,將樣本數(shù)據(jù)與MMSE、BRAAK指標相結合來篩選和研究基因與AD的關系.
2 基因網(wǎng)絡確認與數(shù)據(jù)分析
2.1 基因網(wǎng)絡尋找
2.1.1 差異基因表達分析 輸入經過對數(shù)化處理后的GSE1297數(shù)據(jù)集(樣本數(shù)為31個,基因數(shù)為22 283個),并將正常情況樣本(樣本數(shù)為9)設置為對照組,嚴重情況樣本(樣本數(shù)為7)設置為實驗組進行差異分析,選擇差異倍數(shù)為1.5,顯著性閾值<0.05,并以Benjamini-Hochberg作為校正方法,最終得到了1 717個差異基因(圖1),其中748個基因呈現(xiàn)上調的趨勢,969個基因呈現(xiàn)下降的趨勢.
2.1.2 共表達網(wǎng)絡構建與分析 輸入經過對數(shù)化處理后的GSE1297數(shù)據(jù)集來構建共表達網(wǎng)絡(樣本數(shù)為31個,基因數(shù)為22 283個),并設置靈敏度為3,模
塊合并閾值為0.25,最終聚類得到共25個模塊(圖2),模塊間關聯(lián)程度使用距離進行表示,其值的大小表示該模塊與其他模塊間關聯(lián)的程度,值與顏色對應,顏色程度越接近表明了模塊間相關性越強.
為了進一步確定重點模塊,在此基礎上將樣本中MMSE和BRAAK臨床評分作為指標,計算各模塊與臨床評分指標之間的相關性(圖3),這樣便于篩選出與疾病最有關聯(lián)的模塊.最終,選擇了最明顯的4個共表達模塊(棕色、綠色、青色、綠松石),使用0.8 mm閾值、0.1 gs閾值和0.1重量閾值從4個表達模塊中提取關鍵基因,最終棕色模塊基因有57個、綠色模塊基因有173個、青色模塊基因有33個、綠松石模塊基因有478個.而通過分析其相關性絕對值及對應目標基因,最終將目光鎖定在綠松石模塊作為重點研究模塊.后續(xù)的研究將以綠松石模塊繼續(xù)深入鎖定基因網(wǎng)絡并多維度進行分析解釋其生理機制.
2.1.3 GO和KEGG分析 在前面研究的基礎上,對從LIMMA差異分析獲得的差異基因和加權基因共表達網(wǎng)絡(WGCNA)的綠松石模塊分別進行了GO和KEGG富集分析,使用Benjamini-Hochberg作為FDR方法,以顯著性閾值小于0.05進行篩選,得到了2條路徑的兩類GO和KEGG分析結果如圖4所示,該序列圖的縱坐標表示聚類后基因在生理上所屬的類別,橫坐標表示該類別基因占比情況.點的大小表示聚類基因數(shù)量關系.
有趣的是,差異基因與綠松石模塊經過GO和KEGG分析的結果可知其與神經性疾病和能量代謝存在著高度相關,于是深入到模塊內尋找,發(fā)現(xiàn)2種篩選結果存在著交集基因,并且分布于ETC各個復合體中.這說明ETC在神經性疾病中扮演著重要的角色,這也表明了研究的正確性,于是將相同基因提取作為研究重點,提取NDUFA5(復合體I)、NDUFB5(復合體I)、SDHB(復合體II)、UQCRC1(復合體III)和COX7C(復合體IV),并以此5個基因作為一個基因網(wǎng)絡進行后續(xù)研究和分析.
2.2 基因網(wǎng)絡分析
2.2.1 表達量分析 表達量分析可以直觀地了解AD各個階段表達量的變化情況,從而推斷出病情在該階段的生物活性.使用標準化后的數(shù)據(jù)集,將每個階段的表達水平的總和與該階段樣本數(shù)量做商表示該階段的平均樣本表達水平. 通過表1可直觀地發(fā)現(xiàn),5個基因隨著AD病情的加重其表達水平是持續(xù)遞減的.表達量的遞減說明各復合體隨著AD病情的
加重復合體基因數(shù)量在逐漸減少,而減少的基因將影響復合體正常的生理功能,將導致ETC中各個環(huán)節(jié)傳遞物質的減少,也使每個階段所轉移的電子數(shù)量減少,而電子數(shù)量的減少最終也會導致整個氧化還原過程所產生能量的減少.能量供應的不足使神經元大量死亡,從而使人體受到了損害.
2.2.2 各復合體亞基表達水平與臨床指標的關系將各亞基的表達水平作為橫軸,臨床指標MMSE作為縱軸,繪制各復合體亞基表達水平與臨床指標MMSE線性擬合圖(圖5),可明顯觀察出各復合體與AD的關系.通過圖5可以發(fā)現(xiàn),病情與各復合體的表達水平是呈比例變化的,這可以說明各復合體基因對于評判AD病情是有依據(jù)的,當表達量逐漸減少時,患者的癡呆程度越來越嚴重.
2.2.3 復合體相關性分析 相關性分析是指對同一位置的2個或多個變量之間的相關性進行分析的統(tǒng)計分析方法.在這項研究中,使用皮爾遜相關系數(shù)方法進行相關性分析,該方法用于反映2個變量A和B之間的線性相關性,r值在-1~1之間,絕對值越大表示相關性越強.
輸入GSE1297數(shù)據(jù)集的正常階段計算正常情況下的相關系數(shù)矩陣(圖6),矩陣圖橫縱坐標表示基因名稱,顏色深淺表示相關性水平.通過圖6可以觀察各個基因之間存在著較高的相關性,這表明了復合體之間相互存在高度聯(lián)系,這也符合客觀事實,復合體I到IV之間存在著不同程度的物質交換,并將電子依次傳遞給后者,它們共同的運作完成了整個ETC.
接著輸入GSE1297數(shù)據(jù)集的嚴重階段計算嚴重情況下的相關系數(shù)矩陣(圖7),通過圖7可以發(fā)現(xiàn)除個別基因間相關性有減少,幾乎所有基因之間相關性都在上升,復合體之間的相關性較正常情況下得到了提升,這說明了他們在疾病情況下互相間的影響是更為強烈的,因為ETC的每個復合體之間是環(huán)環(huán)相扣的,當某一部分復合體出現(xiàn)問題后,將會影響其他復合體的正常生理功能,所以導致病情越來越嚴重.
3 探討與假說
能量代謝在AD中起著重要作用.各項研究表明,人腦含有大量的神經元細胞,當能量供應出現(xiàn)問題后會導致大量神經元細胞的死亡,從而影響AD的發(fā)生.本研究深入能量代謝的關鍵環(huán)節(jié)——ETC,通過LIMMA差異分析和WGCNA雙路徑尋找并鎖定關鍵基因,構成了基因閉環(huán)(復合體I:NDUFA5,NDUFB5;復合體II:SDHB;復合體III:UQCRC1;復合體IV:COX7C).
通過表達量分析,可以知道該閉環(huán)基因群隨著病情的加重其各個基因的表達水平是遞減,這說明AD的發(fā)生影響著各個基因正常的生理功能,而ETC的主要作用在于物質傳遞與電子轉移,并在結尾階段發(fā)生氧化還原反應釋放大量的能量供人體所需,表達量的減少導致產生能量的減少,從而影響人體正常生理功能.在正常情況下,基因群各基因保持較高相關性,該現(xiàn)象是因為ETC是一個依次傳遞的模式,所以在正常情況下它們各基因間存在著相互作用,但是在疾病嚴重階段,它們相關性都得到提升,這能夠說明隨著病情的加重,當某一復合體出現(xiàn)問題后,它將影響其他復合體的生理功能,從而使得整個系統(tǒng)受到影響.
于是提出ETC與AD關系的假說,當毒性物質的累積導致線粒體損傷和能量供應減少后誘發(fā)AD的發(fā)生,AD的出現(xiàn)影響了ETC整個物質傳遞與電子轉移的功能,各個復合體的表達量都減少,使得整個系統(tǒng)各環(huán)節(jié)物質傳遞及電子轉移數(shù)量減少,當氧化還原反應所需物質與電子數(shù)量過少情況下,最終環(huán)節(jié)產生能量的數(shù)量過少,這直接使得大腦神經元能量供給不足,從而導致了神經元的死亡,并間接使得AD的病情越來越重.
4 結論
阿爾茲海默?。ˋD)是最常見的神經退行性疾病,其特征是有毒物質的損害.毒性的積累導致線粒體損傷和能量供應減少.在線粒體中,ETC是能量供應的主要環(huán)節(jié),人體內大部分能量由ETC提供.本文提出假說隨著AD病發(fā)的出現(xiàn),ETC的4個復合體正常的生理功能受到了影響,活性開始下降.ETC所傳遞的物質與電子數(shù)量開始減少,最終使得在ETC末端產生能量數(shù)量減少,而大腦活動需要消耗巨大能量,能量供應不足導致神經元開始死亡,使整個病情越發(fā)嚴重,最終導致AD的病情走向嚴重期,甚至導致患者并發(fā)癥和死亡的出現(xiàn).
參考文獻
[1] DUBOIS B, HAMPEL H, FELDMAN H H, et al. Preclinical Alzheimers disease: definition, natural history, and diagnostic criteria[J]. Alzheimers & Dementia,2016,12(3):292-323.
[2] HAMPEL H, VERGALLO A, AGUILAR L F, et al. Precision pharmacology for Alzheimers disease[J]. Pharmacological Research,2018,130:331-365.
[3] XIONG J, PANG X P, SONG X H, et al. The coherence between PSMC6 and α-ring in the 26S proteasome is associated with Alzheimers disease[J]. Frontiers in Molecular Neuroscience,2024,16:1330853.
[4] YANG L, PANG X P, GUO W B, et al. An exploration of the coherent effects between METTL3 and NDUFA10 on Alzheimers disease[J]. International Journal of Molecular Sciences,2023,24(12):10111.
[5] 胡鈺慧,何玲. 線粒體功能障礙與阿爾茲海默病發(fā)病的相關性研究進展[J]. 藥學研究,2020,39(2):101-104.
[6] SHAKIR M N, DUGGER B N. Advances in deep neuropathological phenotyping of Alzheimers disease: past, present, and future[J]. Journal of Neuropathology and Experimental Neurology,2022,81(1):2-15.
[7] 姜紅升,尹博文,尹立勇,等. 神經元表達下調基因9在人腦膠質瘤中的表達[J]. 河北醫(yī)科大學學報,2018,39(7):787-791.
[8] MAILLOUX R J, BRIAULT R, LEMIRE J, et al. The tricarboxylic acid cycle, an ancient metabolic network with a novel twist[J]. PLoS One,2007,2(8):e690.
[9] 邱小忠,陳瑗,周玫. 線粒體氧應激損傷的防御體系[J]. 生命的化學,2001,21(2):141-143.
[10] ZHANG X, ALSHAKHSHIR N, ZHAO L Q. Glycolytic metabolism, brain resilience, and Alzheimers disease[J]. Frontiers in Neuroscience,2021,15:662242.
[11] GUAN S T, ZHAO L, PENG R Y. Mitochondrial respiratory chain super complexes: from structure to function[J]. International Journal of Molecular Sciences,2022,23(22):13880.
[12] NESCI S, TROMBETTI F, PAGLIARANI A, et al. Molecular and supramolecular structure of the mitochondrial oxidative phosphorylation system: implications for pathology[J]. Life,2021,11(3):242.
[13] DU Z Q, ZHOU X T, LAI Y Z, et al. Structure of the human respiratory complex II[J]. Proceedings of the National Academy of Sciences of the United States of America,2023,120(18):e2216713120.
[14] IAKOVOU E, KOURTI M. A comprehensive overview of the complex role of oxidative stress in aging, the contributing environmental stressors and emerging antioxidant therapeutic interventions[J]. Frontiers in Aging Neuroscience,2022,14:827900.
[15] KAILA V R I. Long-range proton-coupled electron transfer in biological energy conversion: towards mechanistic understanding of respiratory complex I[J]. Journal of the Royal Society: Interface,2018,15(141):20170916.
[16] MARKEVICH N I, GALIMOVA M H, MARKEVICH L N. Hysteresis and bistability in the succinate-CoQ reductase activity and reactive oxygen species production in the mitochondrial respiratory complex II[J]. Redox Biology,2020,37:101630.
[17] BRZEZINSKI P, MOE A, DELROTH P. Structure and mechanism of respiratory III-IV super complexes in bioenergetic membranes[J]. Chemical Reviews,2021,121(15):9644-9673.
[18] ADAMOWICZ-SKRZYPKOWSKA A, KWASNIAK-OWCZAREK M, VAN AKEN O, et al. Joint inhibition of mitochondrial complex IV and alternative oxidase by genetic or chemical means represses chloroplast transcription in Arabidopsis[J]. Philosophical Transactions of the Royal Society of London Series B: Biological Sciences,2020,375(1801):20190409.
[19] 張艷馥,沙偉. 氧化磷酸化作用及其解偶聯(lián)劑[J]. 生物學教學,2007,32(8):66-67.
[20] ADIELE R C, ADIELE C A. Mitochondrial regulatory pathways in the pathogenesis of Alzheimers disease[J]. Journal of Alzheimers Disease,2016,53(4):1257-1270.
[21] YU Y G, AKIF A, HERMAN P, et al. A 3D atlas of functional human brain energetic connectome based on neuropil distribution[J]. Cerebral Cortex,2023,33(7):3996-4012.
[22] ARDANAZ C G, RAMREZ M J, SOLAS M. Brain metabolic alterations in Alzheimers disease[J]. International Journal of Molecular Sciences,2022,23(7):3785.
Analysis of the Impact of Electronic Transport Chainson Alzheimers Disease
SONG Xianghu1, LI Xuehui2, PANG Chaoyang 1, WEI Yanyu 2
(1. School of Computer Science, Sichuan Normal University, Chengdu 610101, Sichuan;
2.? National Key Laboratory of Science and Technology on Vacuum Electronics, School of Electronic Science and Engineering,University of Electronic Science and Technology of China, Chengdu 611731, Sichuan)
Abstract:Alzheimers disease is a neurodegenerative disease. In clinical manifestations, comprehensive dementia is characterized by memory impairment, impaired visual spatial skills, and executive dysfunction, as well as personality and behavioral changes. The etiology of AD is diverse and currently unclear. The damage by toxic substances leading to regional energy metabolism decline in the brain is one of the etiological features of AD. Electron transfer chain plays an important role in energy metabolism. Cluster genes were obtained through differential analysis (LIMMA) and weighted gene co expression network (WGNCA) construction, and the clustered genes were subjected to physiological analysis (GO) and pathway analysis (KEGG) before locking in ETC. The expression level analysis and construction of correlation coefficient matrix were conducted on it, and combined with clinical indicators (MMSE) explanation, so that the abnormality of ETC has an impact on Alzheimers disease was ultimately verified.
Keywords:differential analysis; weighted gene co expression network; correlation coefficient matrix; electronic transfer chain
(編輯 余 毅)
項目基金:國家自然科學基金(61988102)
*通信作者簡介:龐朝陽(1970—),男,教授,主要從事算法分析設計與數(shù)據(jù)挖掘的研究,E-mail:cypang@sicnu.edu.cn
魏彥玉(1971—),男,教授,長江學者,主要從事醫(yī)學相關的交叉學科的研究,E-mail:yywei@uestc.edu.cn
引用格式:宋向虎,李雪卉,龐朝陽,等. 電子傳遞鏈對阿爾茲海默病的影響分析[J]. 四川師范大學學報(自然科學版),2024,47(5):662-669.