覃文濤,胡 陽,蔣銘楊,薄占東
(廣西醫(yī)科大學(xué)第一附屬醫(yī)院,南寧 530021)
激素性股骨頭壞死(steroid-induced avascular necrosis of the femoral head,SANFH)因其發(fā)病率和致殘率高,已成為骨科常見且難治的疾病之一。近年來糖皮質(zhì)等類固醇激素應(yīng)用逐漸廣泛,進(jìn)一步的增加了SANFH 的發(fā)病率[1]。然而,SANFH 的發(fā)病機(jī)制一直以來都未有定論,多種治療方法的療效欠佳,因此,探索SANFH 的發(fā)病分子機(jī)制,已經(jīng)迫在眉睫。加權(quán)基因共表達(dá)網(wǎng)絡(luò)(weighted gene co-expression network analysis,WGCNA)是一種通過分析基因之間的相關(guān)性,將表達(dá)模式相似的基因分裝在一個基因模塊中,鑒定基因模塊與表型的關(guān)系的一種網(wǎng)絡(luò)分析方法[2-3]??梢愿鶕?jù)模塊與表型之間的相關(guān)性程度來鑒定生物標(biāo)記物或者關(guān)鍵靶點。
本研究通過使用WGCNA 方法來鑒定早期SANFH 發(fā)生的潛在生物學(xué)標(biāo)記物,從而提高早期SANFH的診斷治療,降低致殘率。
1.1 數(shù)據(jù)下載 從GEO(Gene Expression Omnibus,https//www.ncbi.nlm.nih.gov/gds)數(shù)據(jù)庫中下載SANFH的芯片表達(dá)數(shù)據(jù)及臨床信息(GSE123568),平臺注釋文件是Affymetrix 人基因表達(dá)陣列(GPL15207),GSE123568 數(shù)據(jù)集中包括10 例正常組和30例SANFH組表達(dá)數(shù)據(jù)。
1.2 篩選差異基因(DEGs)用R軟件(版本3.6.3)對芯片數(shù)據(jù)集進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理和探針注釋,用“l(fā)imma”包進(jìn)行樣本差異分析[4-5],將差異倍數(shù)(FC)取以2 為底的對數(shù),并以|Log2FC|>1,P<0.05 作為DEGs的篩選條件。
1.3 WGCNA 共表達(dá)模塊分析 使用R 的“WGCNA”包構(gòu)建SANFH相關(guān)的加權(quán)共表達(dá)網(wǎng)絡(luò)[6],去掉表達(dá)量小于0.5 的樣本,然后計算無尺度分布拓?fù)渚仃?,利用“pickSoftThreshold”函數(shù)挑選出最佳軟閾值β,并計算每個基因的皮爾森相關(guān)系數(shù),以加權(quán)相關(guān)系數(shù)構(gòu)建鄰接矩陣,再將鄰接矩陣轉(zhuǎn)換為拓?fù)渲丿B矩陣,以此構(gòu)建聚類樹,將模塊內(nèi)基因數(shù)目大于50 的進(jìn)行保留,相似度大于0.25 的模塊進(jìn)行合并,根據(jù)SANFH組和正常組的表達(dá)差異,選擇最優(yōu)模塊。
1.4 功能富集分析 在WGCNA 最優(yōu)模塊中選擇核心基因(R>0.8,P<0.01),通過與DEGs的交集得到交集基因,利用R 的“clusterProfiler”包對交集基因進(jìn)行基因本體論(GO)和京都基因和基因組百科全書(KEGG)功能富集[7],取富集結(jié)果中P<0.05 和adjustP<0.05的前10個項目進(jìn)行展示。
1.5 蛋白質(zhì)互作網(wǎng)絡(luò)(PPI)圖構(gòu)建及關(guān)鍵(Hub)基因選擇 在線String 數(shù)據(jù)庫(https://string-db.org/cgi/input.pl)可以預(yù)測蛋白質(zhì)之間的相互作用關(guān)系[8],上傳交集基因到String 數(shù)據(jù)庫中,相互作用的最低閾值選擇0.40,其他設(shè)置默認(rèn),導(dǎo)出結(jié)果文件。將得到的結(jié)果文件導(dǎo)入Cytoscape3.7.2中,按照高表達(dá)基因標(biāo)記為紅色,低表達(dá)設(shè)為藍(lán)色,顏色深度表示差異大小來繪制PPI圖,并使用cytoHubba對網(wǎng)絡(luò)進(jìn)行計算分析[9],尋找Hub基因。在網(wǎng)絡(luò)中,分別計算出評價每個節(jié)點重要性的3 個指標(biāo):節(jié)點度(degree)、緊密度(closeness)和中心度(betweenness),篩選出排名前10的節(jié)點,它們共同的節(jié)點就是Hub基因。
1.6 Hub 基因功能及診斷性能分析R 的“cluster-Profiler”包完成對Hub基因的功能富集,挑選出P<0.05 的富集結(jié)果,用“plotROC“包對Hub 基因進(jìn)行診斷性分析[10],繪制受試者工作特征曲線(ROC 曲線)。為探索Hub基因之間的相互聯(lián)系,利用Gene-MANIA(http://genemania.org/)數(shù)據(jù)庫線上分析[11-12],構(gòu)建出Hub基因之間的互作網(wǎng)絡(luò)圖。
1.7 統(tǒng)計學(xué)方法 本研究所有數(shù)據(jù)采用R 軟件分析,差異分析采用貝葉斯算法,相關(guān)性分析采用皮爾森相關(guān)性分析,兩組間的數(shù)據(jù)分析采用雙尾t檢驗,適當(dāng)?shù)臅r候用Welcht檢驗,以P<0.05為差異具有統(tǒng)計學(xué)意義。
2.1 差異基因 根據(jù)GEO 數(shù)據(jù)庫獲得的40 例樣本,經(jīng)過差異分析,得到滿足條件的384個DEGs,包括119 個上調(diào)基因,265 個下調(diào)基因,并以火山圖和熱圖對DEGs進(jìn)行展示,見圖1?;鹕綀D中綠色表示下調(diào),紅色表示上調(diào),熱圖顯示DEGs 的表達(dá)在SANFH組和正常組中有明顯差異。
2.2 WGCNA 和最優(yōu)模塊選擇 用R 軟件計算分析,確定了軟閾值β=14,經(jīng)過動態(tài)切割法得到分層聚類樹,見圖2A,共得到4個模塊,模塊特征的皮爾森相關(guān)性分析矩陣可以看出,turquoise模塊與SANFH 的相關(guān)性最高(R=0.72,P<0.001),見圖2B,以R>0.8,P<0.01 選取該模塊的基因(n=375),并與DEGs取交集得到交集基因(n=225)。
2.3 交集基因GO 和KEGG 富集 利用R 的“clusterProfiler”包對225 個交集基因進(jìn)行GO 和KEGG功能富集分析,見圖3,GO富集結(jié)果顯示,交集基因主要富集在紅細(xì)胞發(fā)育、紅細(xì)胞分化、骨髓細(xì)胞穩(wěn)態(tài)、骨髓細(xì)胞發(fā)育和骨髓細(xì)胞分化等生物學(xué)功能(BP)上,細(xì)胞成份(CC)上主要在細(xì)胞器外膜、線粒體外膜和皮質(zhì)細(xì)胞骨架有富集,此外還參與了分子功能(MF)的富集,包括泛素樣蛋白轉(zhuǎn)移酶活性、結(jié)合酶活性和細(xì)胞骨架的結(jié)構(gòu)成分等。KEGG富集分析與線粒體、泛素介導(dǎo)的蛋白水解和導(dǎo)管酸分泌物等通路有關(guān)。
2.4 Hub 基因的PPI 構(gòu)建 將225 個交集基因?qū)隨tring 數(shù)據(jù)庫,得到所有蛋白互作網(wǎng)絡(luò)圖,使用Cytoscape3.7.2 軟件的cytoHubba 計算出degree、closeness 和betweenness 3 種節(jié)點打分排名前10 的關(guān)鍵基因,并找出所包含的共同的基因,這些基因就是Hub 基因,最終找到4 個Hub 基因,即GATA1、SLC4A1、EPB42 和DMTN,并構(gòu)建了其關(guān)鍵基因的PPI圖,見圖4。
圖1 差異基因的火山圖和熱圖
圖2 WGCNA結(jié)果
圖3 交集基因的GO和KEGG功能富集分析
圖4 蛋白網(wǎng)絡(luò)互作圖
2.5 Hub 基因的分析 每個Hub 基因在SANFH 中都有明顯的差異表達(dá),且表達(dá)都低于正常組,功能富集結(jié)果顯示,Hub基因主要在凝血、紅細(xì)胞和骨髓細(xì)胞發(fā)育、穩(wěn)態(tài)及分化等分子生物學(xué)途徑上有富集,見表1,這與DEGs 的富集結(jié)果有一致性。Hub基因的診斷性ROC 曲線顯示,4 個基因在SANFH中具有很好的診斷價值,見圖5A?;蛑g的網(wǎng)絡(luò)互作圖也顯示Hub基因之間聯(lián)系緊密,見圖5B。
表1 Hub基因的GO富集情況
圖5 Hub基因的診斷價值及其基因互作網(wǎng)絡(luò)分析
SANFH是一種發(fā)病機(jī)制復(fù)雜,致殘率極高的疾病,對中青年患者影響極大。截止目前,由類固醇激素引起的股骨頭壞死依然是非創(chuàng)傷性股骨頭壞死最常見的病因[13]。近年來,類固醇激素的大量應(yīng)用導(dǎo)致SANFH 的患者逐年增加,為臨床治療工作帶來極大的負(fù)擔(dān)[14]。由于其發(fā)病機(jī)制尚不明確,目前很難找到針對患者早期的預(yù)防及治療措施[15]。隨著分子生物的發(fā)展,已有一批學(xué)者將目光投向基因?qū)用娴难芯浚赟ANFH 的發(fā)病進(jìn)程中基因的改變扮演著重要的角色[16-17],因此找到SANFH相關(guān)的致病基因,探明其具體的發(fā)生機(jī)制對臨床SANFH 的早期診斷具有很重要的意義。
本研究通過對GEO 數(shù)據(jù)庫中的GSE123568 芯片數(shù)據(jù)進(jìn)行差異分析,找到正常組與SANFH 組間差異表達(dá)的基因,其中滿足條件的差異基因共384個,其中上調(diào)的有119 個,下調(diào)的有265 個,下調(diào)基因明顯多于上調(diào)基因,提示SANFH 發(fā)生時大部分基因的表達(dá)下調(diào)。通過WGCNA 挖掘出與SANFH相關(guān)性高的基因,將得到的結(jié)果與之前的差異基因取交集,得到同時具有差異性和相關(guān)性的交集基因。對相關(guān)度更高的交集基因進(jìn)行GO和KEGG功能富集,發(fā)現(xiàn)這些基因主要富集在紅細(xì)胞和骨髓細(xì)胞的發(fā)育、分化及穩(wěn)態(tài)上。而有研究報道,骨髓基質(zhì)細(xì)胞的凋亡是SANFH發(fā)生的主要特點之一[18],激素可以促進(jìn)骨髓基質(zhì)細(xì)胞向脂肪細(xì)胞細(xì)胞轉(zhuǎn)化,抑制其向成骨細(xì)胞的方向的分化,從而導(dǎo)致骨壞死,進(jìn)而發(fā)展為股骨頭壞死[19]。同時有研究發(fā)現(xiàn),促紅細(xì)胞生成素可以通過刺激網(wǎng)織紅細(xì)胞的增值和分化,促進(jìn)血管生成來預(yù)防類固醇激素引起的股骨頭壞死發(fā)生[20]。這些研究與交集基因富集的結(jié)果有較好的一致性,提示在交集基因中存在對股骨頭壞死發(fā)生和發(fā)展起到關(guān)鍵作用的基因。
通過Cytoscape3.7.2軟件的相關(guān)節(jié)點算法分析,最后從交集基因中找到了4 個Hub 基因:GATA1、SLC4A1、EPB42 和DMTN,這可能是SANFH 發(fā)生的關(guān)鍵基因。4 個Hub 基因在正常組和SANFH 組中的表達(dá)差異明顯,在SNAFH 組中均出現(xiàn)低表達(dá)。從富集的結(jié)果可以看出,Hub 基因的富集結(jié)果與384 個差異基因的富集結(jié)果具有一致性,進(jìn)一步證實了這4 個基因的關(guān)鍵作用。GATA1 是類紅細(xì)胞發(fā)育的轉(zhuǎn)錄激活或者抑制因子,有研究顯示,GATA1 在低氧環(huán)境中可以誘導(dǎo)紅系造血[21],而在早期SANFH 中,缺血缺氧是骨壞死中的重要表現(xiàn)[22],使用一定量的糖皮質(zhì)激素后可以阻礙股骨頭內(nèi)的血液供應(yīng)[23],從而形成缺血缺氧的環(huán)境。本研究中,GATA1 在SANFH 中表達(dá)降低,可能造成股骨頭缺氧加重。SLC4A1、EPB42 和DMTN 3 者具有類似的功能,均在維持紅細(xì)胞正常的形態(tài)和功能上具有重要的作用[24-26],他們在SANFH中表達(dá)含量也明顯下降,可能導(dǎo)致股骨頭內(nèi)正常紅細(xì)胞含量降低,造成股骨頭內(nèi)缺血缺氧。因此,從4 個Hub 基因的相關(guān)性研究中,表明低表達(dá)的Hub 基因是SANFH 發(fā)展中的危險因素,在SANFH 的早期發(fā)病中具有重要的研究價值。對經(jīng)常需要服用激素的患者,及時檢測血液中4 個Hub 基因的表達(dá),將會一定程度上提高早期SANFH 的診斷率和治療效果,從而降低致殘率。
綜上所述,本研究采用生物信息學(xué)分析的方法,發(fā)現(xiàn)4個Hub基因在SANFH中的表達(dá)具有顯著差異,低表達(dá)的Hub基因可能通過參與缺氧信號通路來促進(jìn)SANFH 的發(fā)展,為臨床SANFH 的早期診斷和治療提供了可靠的分子標(biāo)記,同時也為今后探明SANFH的發(fā)病機(jī)制提供了一個參考方向。