劉會平 劉湘茹 李 智
【提 要】 目的 通過加權(quán)基因共表達網(wǎng)絡(luò)分析(weighted gene co-expression network analysis,WGCNA)分析久坐影響成年人胰島素敏感性的關(guān)鍵基因及其相關(guān)功能和機制。方法 針對下載于NCBI的人類基因表達匯編(gene expression omnibus,GEO)數(shù)據(jù)庫的數(shù)據(jù)集GSE9103,利用WGCNA進行模塊化分析,并通過相關(guān)性分析和網(wǎng)絡(luò)可視化確定模塊內(nèi)關(guān)鍵hub基因及其調(diào)控網(wǎng)絡(luò),再對關(guān)鍵hub基因進行基因本體GO分析和基因集富集GSEA分析。結(jié)果 通過構(gòu)建共表達網(wǎng)絡(luò),最終得到5個基因模塊,其中yellow模塊與久坐呈正相關(guān),而NDUFA9為其樞紐基因;tan模塊與久坐呈負相關(guān),而MYBPC2為其樞紐基因。進一步對GO和GSEA分析發(fā)現(xiàn),yellow模塊基因包括NDUFA9主要發(fā)揮線粒體形成、有氧呼吸、脂肪酸降解等生物學(xué)功能并參與物質(zhì)代謝、三羧酸循環(huán)、阿爾茨海默氏癥、帕金森病相關(guān)通路;而tan模塊基因包括MYBPC2則與骨骼肌收縮、糖原代謝、心臟發(fā)育相關(guān)。結(jié)論 本研究通過構(gòu)建基因共表達網(wǎng)絡(luò)篩選出與久坐生活方式顯著相關(guān)的2個關(guān)鍵基因模塊和2個樞紐基因;這2個模塊基因分別通過線粒體功能、物質(zhì)代謝和骨骼肌收縮、糖原代謝而影響成年人對胰島素的敏感性。
胰島素敏感性降低是導(dǎo)致肥胖、代謝綜合癥、糖尿病、高脂血癥等多種慢性疾病的重要臨床問題,隨著年齡的增長,其發(fā)生風(fēng)險顯著增加。線粒體功能障礙表現(xiàn)為線粒體還原酶活性、蛋白質(zhì)合成和表達以及DNA(mtDNA)豐度的下降,多見于上述人群[1]。已有報道顯示,在老年、2型糖尿病患者和肥胖者以及2型糖尿病患者的后代等群體內(nèi),胰島素敏感性與肌肉線粒體功能密切相關(guān)。肌肉線粒體功能障礙是產(chǎn)生胰島素敏感性下降甚至胰島素抵抗的重要影響因素[2]。也有研究表明,久坐的生活方式引起顯著的胰島素抵抗,定期運動可提高胰島素敏感性,均與年齡無關(guān),但有研究發(fā)現(xiàn)老年人較年輕人具有顯著的線粒體功能障礙[3]。因此,有必要進一步針對久坐的生活方式引起胰島素敏感性下降的具體機制進行深入研究。
本研究利用加權(quán)基因共表達網(wǎng)絡(luò)分析(WGCNA),從大量基因中篩選與久坐的生活方式密切相關(guān)的樞紐基因,結(jié)合對基因模塊的基因本體分析和基因集富集分析,進行功能注釋,探討久坐的生活方式較定期運動更可能引起胰島素抵抗的相關(guān)分子機制與調(diào)控網(wǎng)絡(luò)。
1.數(shù)據(jù)集和研究對象
本研究分析的數(shù)據(jù)集GSE9103下載于NCBI的GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/geo)。該研究納入的40名健康人中,老年人(59~76歲)20人,年輕人(18~30歲)20人。久坐組研究對象(10名老年人、10名年輕人)的運動時間每周少于2次,每天少于30分鐘;而運動組研究對象(10名老年人、10名年輕人)在過去至少4年的時間內(nèi)每周運動6天且每天騎車或跑步至少1小時。研究對象均需填寫業(yè)余時間活動調(diào)查表,并經(jīng)過病史、體檢、分級跑步機測試、血化驗(如血脂、激素水平、血糖檢測)的篩選。有代謝性疾病或心血管疾病病史、血糖>99mg/dl、體重指數(shù)>28kg/m2、應(yīng)用影響研究測量結(jié)果的藥物、貧血、妊娠、藥物/物質(zhì)成癮濫用者被排除。基因組數(shù)據(jù)的獲得方法如下:研究對象經(jīng)過一次分級跑步機測試,此后7天內(nèi)嚴格控制飲食與運動,并在測試后第630小時利用局麻下經(jīng)皮細針穿刺取腓腸肌活組織(約350~400mg)進行基因組分析。詳細信息參見已發(fā)表論文[3]。
2.基因數(shù)據(jù)的獲得
提取研究對象腓腸肌活組織中的總RNA并應(yīng)用Human Genome U133 Plus 2.0 進行基因表達微陣列分析,獲得該數(shù)據(jù)集series matrix數(shù)據(jù),以方差最大的探針為基本單位進行后續(xù)分析。
3.基因共表達網(wǎng)絡(luò)構(gòu)建與關(guān)鍵樞紐基因的篩選
利用R軟件的WGCNA工具包,構(gòu)建基因共表達網(wǎng)絡(luò)并篩選出與表型高度相關(guān)的基因模塊。再通過計算模塊中每個基因與該模塊(module membership,MM)的相關(guān)系數(shù),篩選出核心基因(GS 絕對值>0.2,MM絕對值>0.8),納入string數(shù)據(jù)庫(https://string-db.org/)構(gòu)建基因相互作用網(wǎng)絡(luò),再利用Cytoscape和cytoHubba MCC法進行可視化分析與前10位關(guān)鍵作用基因的鑒定篩選。
4.基因GO與GSEA分析
Metascape 平臺基因注釋分析數(shù)據(jù)庫可對輸入基因進行基因本體(GO)分析。分別提交tan和yellow模塊包含的基因,輸入物種和分析物種均選擇為“H.sapiens”,設(shè)置P<0.01,進行 GO 分析,保存結(jié)果,并按照每個條目涉及的靶點數(shù)目進行排序,篩選排名靠前的生物過程和通路,采用 GraphPad Prism 7.0 軟件對結(jié)果可視化。
應(yīng)用Gene Set Enrichment analysis 3.0版軟件,以hubgenes的表達值為表型,先后以MSigDB在線基因集數(shù)據(jù)庫的KEGG/ GO gene sets作為參考基因集,對基因表達譜進行基因集富集分析(GSEA)。隨機組合次數(shù)設(shè)置為1000次。以P<0.05,且FDRq<0.25為具有統(tǒng)計學(xué)意義。
5.統(tǒng)計分析
WGCNA[4]基于兩個假設(shè):表達模式近似的基因可能接受共調(diào)控或處于同一通路;表達網(wǎng)絡(luò)符合無尺度分布。由此根據(jù)表達相似性,將基因劃分為不同模塊并找出樞紐基因。進行WGCNA之前,首先進行數(shù)據(jù)預(yù)處理,構(gòu)建N×M矩陣(N=樣本數(shù),M=基因數(shù))。通過層次聚類方法,去除離群樣本。基于pickSoftThreshold函數(shù)篩選軟閾值構(gòu)建鄰接矩陣和拓撲矩陣,以使基因分布符合無尺度網(wǎng)絡(luò)。根據(jù)相異度對基因進行聚類,使用動態(tài)剪切法將聚類樹剪切為不同模塊,以每個模塊的第一主成分基因為特征向量基因。根據(jù)表型與特征向量基因的相關(guān)性挖掘相關(guān)性P值最小且具有統(tǒng)計學(xué)意義的模塊。通過計算模塊所包含基因的內(nèi)部連接度篩選出樞紐基因。
1.基因模塊與核心基因鑒定
共5000個基因用于WGCNA。以鄰接矩陣權(quán)重參數(shù)(軟閾值)β=16、每個基因網(wǎng)絡(luò)模塊最少的基因數(shù)目為30作為標(biāo)準(zhǔn),最終獲得black、blue、greenyellow、tan和yellow 5個模塊,以|MM|>0.9和|GS|>0.2為參數(shù)篩選出其核心基因分別為GORASP2、LINC00491、S100A4、MYBPC2和NDUFA9。再根據(jù)各個模塊的特征向量,分別計算模塊與 2 個表型(久坐和定期運動)的相關(guān)性。如圖1所示,yellow模塊(400個基因)與久坐呈正相關(guān)(COR=0.53),而tan模塊(30個基因)與久坐呈負相關(guān)(COR=-0.62)。
圖1 與定期運動相比,久坐者共篩選出5000基因與久坐顯著相關(guān)的基因模塊與核心基因
2.yellow模塊樞紐基因網(wǎng)絡(luò)分析
將yellow模塊的樞紐基因上傳string數(shù)據(jù)庫,利用cytoscape進行網(wǎng)絡(luò)可視化,并利用cytohubba插件的MCC方法篩選出前10位基因,包括ATP、MRPL、NDUF家族等在共表達網(wǎng)絡(luò)和蛋白相互作用網(wǎng)絡(luò)皆重要的關(guān)鍵作用基因(圖2)。
圖2 分析明確久坐相關(guān)的基因與yellow模塊基因顯著相關(guān)并進行網(wǎng)絡(luò)可視化篩選yellow模塊的前10位關(guān)鍵基因
3.yellow模塊樞紐基因的功能分析
如圖3和表1所示,yellow模塊基因行GO分析顯示其具有線粒體形成、有氧呼吸、脂肪酸代謝等生物學(xué)功能如mitochondrial envelope/matrix/respiratory chain complex III,aerobic respiration,fatty acid degradation/beta-oxidation using acyl-CoA dehydrogen等。進一步KEGG分析則富集了KEGG_OXIDATIVE_PHOSPHORYLATION、KEGG_CITRATE_CYCLE_TCA_CYCLE、KEGG_PORPHYRIN_AND_CHLOROPHYLL_METABOLISM、KEGG_ALZHEIMER_DISEASE、KEGG_PARKINSONS _ DISEASE等與糖脂代謝、三羧酸循環(huán)、阿爾茨海默氏癥、帕金森病密切相關(guān)的信號通路。
圖3 Metascape平臺對yellow模塊基因進行GO分析明確其生物學(xué)功能
表1 久坐者骨骼肌中顯著上調(diào)且與NDUFA9共表達的yellow模塊基因的GSEA分析
4.tan模塊樞紐基因網(wǎng)絡(luò)分析
tan模塊中,與MYBPC2密切相關(guān)的蛋白包括多種能夠調(diào)節(jié)骨骼肌功能、減少細胞凋亡、抑制炎癥、調(diào)節(jié)血脂代謝和抑制血管新生等的蛋白質(zhì),如:GLRX、PHKA1、NIBAN1、CYP27A1、TNNI2、CD38、TNNT3、ATP2A1、PPP1R3D、CASQ1、MTHFD2、ANKRD23、TNFRSF1A等(圖4)。
5.tan模塊樞紐基因的功能分析
tan模塊基因行GO分析富集了調(diào)節(jié)骨骼肌收縮、糖原/蛋白代謝、凋亡、氧化還原酶活性及心臟發(fā)育等生物學(xué)功能(圖5)。KEGG分析按本研究標(biāo)準(zhǔn)未能成功富集信號通路。
圖4 分析明確久坐相關(guān)的基因與tan模塊基因顯著相關(guān)并進行網(wǎng)絡(luò)可視化篩選tan模塊的關(guān)鍵節(jié)點基因
圖5 Metascape平臺對tan模塊基因進行GO分析明確其生物學(xué)功能
據(jù)報道,yellow模塊的代表基因如ATP、NDUF和MRPL家族蛋白分別具有調(diào)節(jié)線粒體呼吸鏈功能和線粒體內(nèi)蛋白質(zhì)合成的生物學(xué)功能,是影響線粒體形成和功能的重要因素。其中,ATP5F1B、ATP5MC3和ATP5ME編碼的蛋白為線粒體合成酶的重要亞基,對線粒體合成ATP具有重要的調(diào)節(jié)作用。已有研究表明,上述ATP家族蛋白表達升高與肥胖、高血壓[5]、血脂代謝異常[6]、胰島素抵抗[7]、2型糖尿病、腎積水、惡性腫瘤侵襲特性和轉(zhuǎn)移耐藥等臨床問題密切相關(guān)[8]。NDUFA9 和NDUFS2編碼的蛋白質(zhì)分別是NADH脫氫酶復(fù)合體的疏水蛋白部分和核心亞基,NADH脫氫酶復(fù)合體是位于線粒體內(nèi)膜的電子傳輸鏈中的第一個酶復(fù)合物。因此,NDUF家族蛋白對調(diào)節(jié)線粒體呼吸鏈功能具有重要作用。NDUF家族蛋白可引起新生兒Leigh綜合征、惡性腫瘤的轉(zhuǎn)移潛能、視神經(jīng)病變、早發(fā)精神分裂癥等臨床問題[9-10]。MRPL15和MRPL41編碼的蛋白質(zhì)是線粒體核糖體蛋白,有助于線粒體內(nèi)蛋白質(zhì)的合成。二者的臨床報道很少,目前發(fā)現(xiàn)其表達增加與ER陽性的乳腺癌相關(guān)[11],而相對較多的基礎(chǔ)研究主要發(fā)現(xiàn)其與細胞周期抑制和凋亡相關(guān)[12]。本研究利用骨骼肌標(biāo)本的基因組學(xué)分析發(fā)現(xiàn),與定期運動相比,久坐的生活方式導(dǎo)致上述基因增加,并發(fā)現(xiàn)其通過發(fā)揮促進線粒體的形成、呼吸鏈、脂肪酸降解、細胞色素C釋放、輔酶A水解等功能調(diào)節(jié)糖脂代謝、三羧酸循環(huán)、阿爾茨海默氏癥、帕金森病相關(guān)通路。因此,上述基因及其調(diào)節(jié)的相關(guān)通路,可能是久坐患者發(fā)生胰島素抵抗的重要機制,其對胰島素抵抗以及相關(guān)疾病的影響值得深入研究。
另一方面,久坐者的MYBPC2基因顯著低表達。該基因編碼的是快速型蛋白肌球蛋白結(jié)合蛋白C,與肥厚性心肌病的發(fā)生、發(fā)展相關(guān)[13]。本研究發(fā)現(xiàn)的MYBPC2網(wǎng)絡(luò)互作蛋白中,GLRX編碼蛋白催化谷胱甘肽還原反應(yīng),在抗氧化防御系統(tǒng)中發(fā)揮重要作用[14]。PHKA1編碼磷酸化酶激酶,異??梢鹛窃A積病[15]。CYP27A1編碼細胞色素P450超家族蛋白,催化涉及藥物代謝和膽固醇,類固醇和其他脂質(zhì)合成的許多反應(yīng),對于調(diào)節(jié)膽固醇的體內(nèi)平衡非常重要[16]。TNNI2編碼快縮肌蛋白,參與組成肌鈣蛋白復(fù)合體,調(diào)節(jié)骨骼肌與血管平滑肌功能,還具有抑制腫瘤發(fā)生發(fā)展的作用[17]。TNNT3、ATP2A1、ANKRD23及CASQ1均參與骨骼肌收縮與功能的調(diào)節(jié)[18-20]。PPP1R3D編碼絲蘇氨酸蛋白磷酸化酶,而TNFRSF1A編碼腫瘤壞死因子超家族蛋白,二者均具有廣泛的調(diào)節(jié)作用,參與多種細胞生物學(xué)活動如細胞生存、凋亡和炎癥等[21]。本研究發(fā)現(xiàn)tan模塊中MYBPC2及其網(wǎng)絡(luò)互作蛋白在久坐者體內(nèi)較規(guī)律運動者顯著減低,可能為久坐者的骨骼肌收縮、糖原代謝等活動減低的適應(yīng)性反應(yīng),但同時可能是引起胰島素抵抗的重要機制。
本研究通過對基因數(shù)據(jù)集GSE9103進行基因組學(xué)WGCNA分析,針對定期運動者與久坐者的基因表達譜,構(gòu)建了與久坐密切相關(guān)的基因共表達網(wǎng)絡(luò),并對核心樞紐基因及其功能機制進行了多重分析,從基因水平上揭示了缺乏運動導(dǎo)致胰島素抵抗的發(fā)生機制,對于探討胰島素抵抗以及相關(guān)疾病的調(diào)控機制和靶點具有重要意義。