石 磊 李萬(wàn)鵬 安軍鈺 劉怡 吳鵬 吳文宇 曹云山 黃晏
[摘要] 目的 基于生物信息學(xué)技術(shù)挖掘糖尿病心肌?。―C)相關(guān)差異表達(dá)基因及其功能。 方法 應(yīng)用生物信息學(xué)方法分析基因表達(dá)譜數(shù)據(jù)集GSE4547。 結(jié)果 挖掘原始芯片數(shù)據(jù),篩選到79個(gè)差異表達(dá)基因?;诨虮倔w論功能注釋和相關(guān)通路分析,以及通過(guò)構(gòu)建差異共表達(dá)基因蛋白質(zhì)互作網(wǎng)絡(luò)及模塊分析后,最終獲得Hk2、Col1a2、Col1a1、Col3a1、Slc2a1、Cpt1a、Slc2a4、Cd36、Ucp3、Pdk4 10個(gè)關(guān)鍵基因?yàn)殒滊遄艟卣T導(dǎo)DC的關(guān)鍵基因。 結(jié)論 最終獲得的10個(gè)關(guān)鍵基因可能成為未來(lái)治療糖尿病心肌病的潛在治療靶點(diǎn),為今后探究與DC相關(guān)基因和信號(hào)通路的功能變化提供新的視角和導(dǎo)向。
[關(guān)鍵詞] 糖尿病心肌病;GEO數(shù)據(jù)庫(kù);差異表達(dá)基因;基因芯片;生物信息學(xué)技術(shù)
[中圖分類號(hào)] R587.2? ? ? ? ? [文獻(xiàn)標(biāo)識(shí)碼] A? ? ? ? ? [文章編號(hào)] 1673-7210(2019)08(c)-0019-05
[Abstract] Objective To explore differentially expressed genes and their function related to diabetic cardiomyopathy (DC) based on bioinformatics technology. Methods The gene expression profile data set GSE4547 was analyzed using bioinformatics methods. Results The original chip data was mined and 79 differentially expressed genes were screened. Based on gene ontology functional annotation and related pathway analysis, as well as the construction of differentially coexpressed genes protein-protein interaction and module analysis, 10 key genes of Hk2, Col1a2, Col1a1, Col3a1, Slc2a1, Cpt1a, Slc2a4, Cd36, Ucp3 and Pdk4 were finally obtained as the key genes of Streptozozin induced DC. Conclusion The 10 key genes eventually obtained may become potential therapeutic targets for the treatment of DC in the future, and provide a new perspective and guidance for the exploration of functional changes of DC related genes and signaling pathways in the future.
[Key words] Diabetic cardiomyopathy; GEO database; Differentially expressed genes; Gene chip; Bioinformatics technology
糖尿病心肌病(diabetic cardiomyopathy,DC)是一種特殊的心臟疾病,其發(fā)生與心臟組織對(duì)胰島素代謝作用的抵抗、代償性高胰島素血癥和高血糖等有關(guān),與冠狀動(dòng)脈疾病和高血壓等其他心臟危險(xiǎn)因素?zé)o關(guān)[1]。盡管研究已證實(shí),多種因素可能共同促進(jìn)DC的進(jìn)展,但是推動(dòng)這些病理過(guò)程的確切分子機(jī)制尚不完全清楚[2]。研究表明[3],DC可能是一種由多種基因和多個(gè)信號(hào)通路參與的疾病。本研究擬利用生物信息學(xué)技術(shù)從GEO數(shù)據(jù)庫(kù)中挖掘與DC相關(guān)的差異表達(dá)基因,從而探究與DC相關(guān)的基因和信號(hào)通路的功能變化,為DC的發(fā)病機(jī)制及可能存在的治療靶點(diǎn)提供新的視角和導(dǎo)向。
1 材料與方法
1.1 基因芯片數(shù)據(jù)的獲取
從GEO數(shù)據(jù)庫(kù)下載GSE4547基因表達(dá)譜數(shù)據(jù)集,該芯片分析基于GPL85平臺(tái)。GSE4547數(shù)據(jù)集包括3、28、42 d標(biāo)本,本研究選取42 d糖尿病心肌病小鼠模型4只和對(duì)照組小鼠4只。標(biāo)本類型為小鼠心肌組織。
1.2 相關(guān)差異表達(dá)基因數(shù)據(jù)的處理
下載DC組織基因芯片GSE4547的探針文件和CELL數(shù)據(jù)壓縮包后,通過(guò)R軟件對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理后,采用Limma包進(jìn)行差異表達(dá)值計(jì)算,以變化倍數(shù)>2(|log FC|>1)且P < 0.05選取差異表達(dá)基因[4]。通過(guò)R軟件的gplots包繪制熱圖(heatmap)。
1.3 差異表達(dá)基因數(shù)據(jù)的功能和富集分析
應(yīng)用DAVID軟件進(jìn)行基因本體論(gene ontology,GO)功能注釋和京都基因與基因組百科全書(Kyoto encyclopedia of genes and genome,KEGG)進(jìn)行通路分析,以P < 0.05為選取標(biāo)準(zhǔn)。
1.4 構(gòu)建差異共表達(dá)基因蛋白質(zhì)互作網(wǎng)絡(luò)及模塊
利用String軟件對(duì)差異表達(dá)基因間的差異共表達(dá)基因蛋白質(zhì)互作網(wǎng)絡(luò)(protein-protein interaction,PPI)進(jìn)行評(píng)價(jià)。將從String中獲得的聯(lián)合評(píng)分>0.4的中等置信度的相互作用的節(jié)點(diǎn)數(shù)據(jù)導(dǎo)入Cytoscape軟件進(jìn)行模塊分析。
1.5 確定關(guān)鍵基因
應(yīng)用Cytoscape軟件中的cytoHubba插件通過(guò)MCC、MNC和DMNC算法分別獲得了前15位基因,繪制韋恩圖后獲得關(guān)鍵基因。
2 結(jié)果
2.1 糖尿病心肌組織的差異表達(dá)基因
通過(guò)R語(yǔ)言中的Affy包、Limaa包對(duì)原始芯片數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化后進(jìn)行差異表達(dá)分析,最終獲得79個(gè)差異表達(dá)基因(包括40個(gè)上調(diào)基因、39個(gè)下調(diào)基因)。見(jiàn)圖1。
2.2 差異表達(dá)基因功能和通路途徑分析
使用DAVID在線分析軟件進(jìn)行GO分析和KEGG通路分析后,這些差異表達(dá)基因在生物學(xué)過(guò)程中(biological process)主要參與了藥物反應(yīng)等,見(jiàn)圖2A;在細(xì)胞組件(cellular component)中主要集中在線粒體,見(jiàn)圖2B;在分子功能層面(molecular function)主要參與了C3HC4型RING指結(jié)構(gòu)域結(jié)合等功能,見(jiàn)圖2C;差異表達(dá)基因中9個(gè)最顯著差異的KEGG通路,它們主要集中在金黃色葡萄球菌感染等信號(hào)通路,見(jiàn)圖2D。
2.3 差異共表達(dá)基因蛋白質(zhì)互作網(wǎng)絡(luò)及模塊分析
將得到的差異基因?qū)氲絊tring在線分析軟件中,得到差異共表達(dá)基因PPI,該網(wǎng)絡(luò)由56個(gè)節(jié)點(diǎn)、98條邊組成,見(jiàn)圖3A,將數(shù)據(jù)導(dǎo)入Cytoscape軟件中MCODE插件進(jìn)行模塊分析,截?cái)鄻?biāo)準(zhǔn)是degree cut-off≥2,a k-core≥3。進(jìn)而確定3個(gè)可視化模塊,見(jiàn)圖3B~D,其中圖3B由5個(gè)節(jié)點(diǎn)和10條邊組成,圖3C由4個(gè)節(jié)點(diǎn)和6條邊組成,圖3D由4個(gè)節(jié)點(diǎn)和5條邊組成。
2.4 關(guān)鍵基因的確定
關(guān)鍵基因是根據(jù)cytoHubba中3種排序方法將基因重疊確定的,見(jiàn)圖4。最終獲得Hk2、Col1a2、Col1a1、Col3a1、Slc2a1、Cpt1a、Slc2a4、Cd36、Ucp3、Pdk4 10個(gè)關(guān)鍵基因?yàn)殒滊遄艟兀⊿TZ)誘導(dǎo)DC的關(guān)鍵基因。見(jiàn)表1、圖5。
3 討論
基于基因表達(dá)數(shù)據(jù)庫(kù)挖掘疾病的差異表達(dá)基因,現(xiàn)已成為當(dāng)今生物醫(yī)學(xué)領(lǐng)域研究的熱點(diǎn)之一[5]。DC是糖尿病患者后期一種嚴(yán)重威脅生命的并發(fā)癥,其進(jìn)展為心力衰竭的主要病理生理學(xué)特征是胰島素抵抗、心臟胰島素信號(hào)傳遞受損、高血糖等。然而,糖尿病與心血管疾病關(guān)系的復(fù)雜性是減少DC發(fā)生和進(jìn)展的重要挑戰(zhàn)之一[6]。本研究應(yīng)用生物信息學(xué)技術(shù),挖掘GEO數(shù)據(jù)庫(kù)中涉及DC的基因芯片數(shù)據(jù),探究DC相關(guān)基因和信號(hào)通路的功能變化。在本研究中,應(yīng)用生物信息學(xué)技術(shù)分析后最終獲得了10個(gè)關(guān)鍵差異表達(dá)基因:Hk2、Col1a2、Col1a1、Col3a1、Slc2a1、Cpt1a、Slc2a4、Cd36、Ucp3、Pdk4。
HK2是一種己糖激酶的同工酶,其通過(guò)催化葡萄糖磷酸化發(fā)揮對(duì)葡萄糖-6-磷酸的抑制作用[7]。有研究指出,HK2活性降低會(huì)引起細(xì)胞內(nèi)葡萄糖磷酸化障礙,從而導(dǎo)致糖耐量受損[8]。COL1A1、COL1A2、COL3A1是屬于膠原蛋白家族的成員。COL1A1、COL1A2和COL3A1是Ⅰ型膠原的主要組成部分[9]。糖尿病心肌纖維化病理表現(xiàn)為膠原大量沉積,導(dǎo)致心室壁的僵硬度增高和順應(yīng)性降低,主要原因?yàn)棰裥湍z原蛋白的過(guò)量表達(dá)[10]。Gaikwad等[11]發(fā)現(xiàn),糖尿病組小鼠心肌中Col3a1表達(dá)下降,可能與組蛋白H3在胰島素抵抗條件下參與心臟和腎臟的共價(jià)修飾有關(guān),具體機(jī)制仍有待進(jìn)一步闡明。
SLC2A1、SLC2A4分別編碼葡萄糖轉(zhuǎn)運(yùn)蛋白1(GLUT1)、葡萄糖轉(zhuǎn)運(yùn)蛋白4(GLUT4)。葡萄糖通過(guò)葡萄糖轉(zhuǎn)運(yùn)體進(jìn)入心肌細(xì)胞,其中GLUT1和GLUT4在數(shù)量上最為重要[12]。Kainulainen等[13]在糖尿病小鼠模型中發(fā)現(xiàn),隨著GLUT1和GLUT4表達(dá)下降,出現(xiàn)胰島素抵抗,干擾心肌細(xì)胞胰島素信號(hào)通路,導(dǎo)致心肌細(xì)胞代謝紊亂,進(jìn)而發(fā)展為心肌纖維化和舒張功能不全。CPT1A是線粒體中脂肪酸氧化的一種關(guān)鍵酶,Jeffrey等[14]在實(shí)驗(yàn)中發(fā)現(xiàn),直接抑制Cpt1a的攝取是將心肌能量代謝從游離脂肪酸轉(zhuǎn)化為葡萄糖利用的有效途徑。鏈霉素誘導(dǎo)的糖尿病大鼠經(jīng)Cpt1抑制劑處理后,心肌葡萄糖氧化速率增加,心臟功能恢復(fù)[15]。CD36是一種脂肪酸轉(zhuǎn)位酶。在糖尿病表型小鼠模型中,敲除Cd36后心肌組織脂質(zhì)積累減少、葡萄糖氧化增加進(jìn)而使心臟功能恢復(fù)[16]。
UCP3是線粒體負(fù)離子載體蛋白家族中的一員,主要參與線粒體能量代謝和氧化應(yīng)激。Umbarkar等[17]在誘導(dǎo)大鼠糖尿病模型中觀察到糖尿病組心肌組織中UCP3蛋白表達(dá)量顯著增加。Boudina等[18]在實(shí)驗(yàn)中發(fā)現(xiàn)與野生型小鼠相比,從2型糖尿病小鼠分離、灌注的心臟能量代謝效率降低,ATP生成減少。PDK4是細(xì)胞中參與葡萄糖代謝氧化的關(guān)鍵調(diào)節(jié)酶之一。Thapa等[19]的研究數(shù)據(jù)表明,adropin在心肌細(xì)胞中通過(guò)降低Pdk4的表達(dá)來(lái)降低對(duì)丙酮酸脫氫酶(PDH)活性的抑制,從而促進(jìn)心肌葡萄糖的利用。
綜上,本研究應(yīng)用生物信息學(xué)技術(shù)挖掘GEO數(shù)據(jù)庫(kù),最終獲得Hk2、Col1a2、Col1a1、Col3a1、Slc2a1、Cpt1a、Slc2a4、Cd36、Ucp3、Pdk4 10個(gè)關(guān)鍵基因。初步揭示了這些關(guān)鍵基因可能成為未來(lái)治療糖尿病心肌病的潛在治療靶點(diǎn),為今后探究與DC相關(guān)基因和信號(hào)通路的功能變化提供新的視角和導(dǎo)向。
[參考文獻(xiàn)]
[1]? Jia G,Whaley-Connell A,Sowers JR. Diabetic cardiomyopathy:a hyperglycaemia- and insulin-resistance-induced heart disease [J]. Diabetologia,2018,61(1):21-28.
[2]? Varga ZV,Giricz Z,Liaudet L,et al. Interplay of oxidative,nitrosative/nitrative stress,inflammation,cell death and autophagy in diabetic cardiomyopathy [J]. Biochim Biophys Acta,2015,1852(2):232-242.
[3]? Varma U,Koutsifeli P,Benson VL,et al. Molecular mechanisms of cardiac pathology in diabetes - Experimental insights [J]. Biochim Biophys Acta Mol Basis Dis,2018, 1864(5 Pt B):1949-1959.
[4]? Ritchie ME,Phipson B,Wu D,et al. limma powers differential expression analyses for RNA-sequencing and microarray studies [J]. Nucleic Acids Res,2015,43(7):e47.
[5]? Min S,Lee B,Yoon S. Deep learning in bioinformatics [J]. Brief Bioinform,2017,18(5):851-869.
[6]? Jia G,DeMarco VG,Sowers JR. Insulin resistance and hyperinsulinaemia in diabetic cardiomyopathy [J]. Nat Rev Endocrinol,2016,12(3):144-153.
[7]? Nederlof R,Eerbeek O,Hollmann MW,et al. Targeting hexokinase Ⅱ to mitochondria to modulate energy metab-olism and reduce ischaemia-reperfusion injury in heart [J]. Br J Pharmacol,2014,171(8):2067-2079.
[8]? Mueckler M,Thorens B. The SLC2(GLUT)family of membrane transporters [J]. Mol Aspects Med,2013,34(2/3):121-138.
[9]? Eghbali M,Weber KT. Collagen and the myocardium: fibrillar structure, biosynthesis and degradation in relation to hypertrophy and its regression [J]. Mol Cell Biochem,1990,96(1):1-14.
[10]? Tang M,Zhang W,Lin H,et al. High glucose promotes the production of collagen types Ⅰ and Ⅲ by cardiac fibroblasts through a pathway dependent on extracellular-signal-regulated kinase 1/2 [J]. Mol Cell Biochem,2007, 301(1/2):109-114.
[11]? Gaikwad AB,Gupta J,Tikoo K. Epigenetic changes and alteration of Fbn1 and Col3A1 gene expression under hyperglycaemic and hyperinsulinaemic conditions [J]. Biochem J,2010,432(2):333-341.
[12]? Barrett EJ,Schwartz RG,F(xiàn)rancis CK,et al. Regulation by insulin of myocardial glucose and fatty acid metabolism in the conscious dog [J]. J Clin Invest,1984,74(3):1073-1079.
[13]? Kainulainen H,Breiner M,Schürmann A,et al. In vivo glucose uptake and glucose transporter proteins GLUT1 and GLUT4 in heart and various types of skeletal muscle from streptozotocin-diabetic rats [J]. Biochim Biophys Acta,1994,1225(3):275-282.
[14]? Jeffrey FM,Alvarez L,Diczku V,et al. Direct evidence that perhexiline modifies myocardial substrate utilization from fatty acids to lactate [J]. J Cardiovasc Pharmacol,1995,25(3):469-472.
[15]? Wall SR,Lopaschuk GD. Glucose oxidation rates in fatty acid-perfused isolated working hearts from diabetic rats [J]. Biochim Biophys Acta,1989,1006(1):97-103.
[16]? Yang J,Sambandam N,Han X,et al. CD36 deficiency rescues lipotoxic cardiomyopathy [J]. Circ Res,2007,100(8):1208-1217.
[17]? Umbarkar P,Singh S,Arkat S,et al. Monoamine oxidase-A is an important source of oxidative stress and promotes cardiac dysfunction,apoptosis,and fibrosis in diabetic cardiomyopathy [J]. Free Radic Biol Med,2015,87:263-273.
[18]? Boudina S,Sena S,Theobald H,et al. Mitochondrial energetics in the heart in obesity-related diabetes:direct evidence for increased uncoupled respiration and activation of uncoupling proteins [J]. Diabetes,2007,56(10):2457-2466.
[19]? Thapa D,Stoner MW,Zhang M,et al. Adropin regulates pyruvate dehydrogenase in cardiac cells via a novel GPCR-MAPK-PDK4 signaling pathway [J]. Redox Biol,2018,18:25-32.
(收稿日期:2019-03-18? 本文編輯:張瑜杰)