夏 慧 葉 尚 劉福林 王寶峰,4
1深圳出入境邊防檢查總站醫(yī)院 廣東 深圳 518013;2深圳市南山區(qū)蛇口人民醫(yī)院 廣東 深圳 518067;3法國國家健康與醫(yī)學(xué)研究院附屬于巴黎大學(xué) 法國 巴黎 75006;4鄂爾多斯婦產(chǎn)醫(yī)院婦產(chǎn)科 內(nèi)蒙古 鄂爾多斯 017000
先兆子癇(pre-eclampsia,PE)往往伴隨于妊娠期高血壓而發(fā)生,是妊娠期高血壓疾病的常見并發(fā)癥,其全球范圍內(nèi)的發(fā)病率約為2%~8%,而其所致的孕產(chǎn)婦死亡率占比高達(dá)14%[1,2]。研究表明胎盤滋養(yǎng)細(xì)胞在母體子宮內(nèi)膜的異常植入可導(dǎo)致子宮螺旋動脈的重建異常而導(dǎo)致母體與胎兒血液在進(jìn)入胎盤內(nèi)流動時發(fā)生不暢而引起母體血壓增高,從而導(dǎo)致PE的發(fā)生[3]。同樣地,胎盤發(fā)育異常也可胎兒宮內(nèi)發(fā)育遲緩(intrauterine growth restriction,IUGR),其與PE同屬于嚴(yán)重妊娠疾病,表現(xiàn)為胎盤因素等所致的胎兒在宮內(nèi)的生長發(fā)育受限,導(dǎo)致胎兒的健康及生命遭受嚴(yán)重威脅[4,5]。然 而,無論是PE還是IUGR,盡管已有大量研究,但其具體發(fā)生機(jī)制尚不十分清楚。
本研究利用加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析(weighted correlation network analysis,WGCNA)分析了由Awamleh等[6]上傳的關(guān)于正常胎盤、PE胎盤、IUGR胎盤及PE+IUGR胎盤組織的基因測序數(shù)據(jù)集,從更宏觀的角度探討了在PE及IUGR發(fā)生中起重要作用的基因集,并且本研究還系統(tǒng)比較了主要富集通路在兩種疾病中所起的作用及其差別。本研究所運(yùn)用的WGCNA方法已證實廣泛運(yùn)用于分析高通量數(shù)據(jù)集,在尋找基因間的關(guān)聯(lián)性及構(gòu)建共表達(dá)網(wǎng)絡(luò)上具有重要作用[7]。通過新方法的運(yùn)用,本研究旨在為PE及IUGR的研究提供更廣闊的思路。
1.1 高通量數(shù)據(jù)集的收集進(jìn)入NCBI的GEO數(shù)據(jù)庫(http://www.ncbi.nlm.nih.gov/gds/),并下載GSE114691。GSE114691由Awamleh等[6]上傳,其來源于患有或不患有PE及IUGR的患者,包括21個無疾病對照組胎盤組織,20個PE胎盤組織,18個IUGR胎盤組織以及20個PE及IUGR混合并發(fā)癥的胎盤組織。從組織內(nèi)分離RNA后由Illumina HiSeq 2000平臺進(jìn)行檢測。
1.2 WGCNA分析運(yùn)用R軟件(version 3.60)中的Affy包(version 1.64)對原始數(shù)據(jù)進(jìn)行預(yù)處理,包括讀取原始數(shù)據(jù),歸一化矯正,去除包含缺失值的行。構(gòu)建以患有或不患有PE及IUGR的表型文件。將所有不包含缺失值的行納入WGCNA分析,本研究中共納入12 084個基因。運(yùn)用WGCNA包(version 1.67)對樣本進(jìn)行聚類以剔除離群樣本,篩選軟閾值進(jìn)行網(wǎng)絡(luò)構(gòu)建,將鄰接矩陣轉(zhuǎn)換為拓?fù)渲丿B矩陣用于篩選相關(guān)模塊并以不同顏色表示,構(gòu)建基因與性狀散點圖并繪制相關(guān)性熱圖。
1.3 關(guān)鍵基因的富集分析及比較提取相關(guān)系數(shù)(r)大于0.4以上的彩色模塊中的基因進(jìn)行基因本體論(gene ontology,GO)富集分析和京都基因與基因組百科全書通路(Kyoto encyclopedia of genes and genomes,KEGG)分析。分析的可視化由R包clusterProfiler(version 3.14)執(zhí)行并且以P<0.05作為篩選標(biāo)準(zhǔn)。最后,比較對照組、PE組、IUGR組、PE&IUGR組基因富集分析的結(jié)果。
2.1 樣本聚類及性狀匹配下載原始數(shù)據(jù),并用Affy包進(jìn)行原始數(shù)據(jù)整理。通過排除缺失值以滿足WGCNA算法分析模式。最后納入12 084個基因用于后續(xù)分析。對不同組別的樣本表達(dá)矩陣進(jìn)行組合,構(gòu)建WGCNA分析所需要的矩陣形式,同時構(gòu)建樣本表型文件。對對照組、PE組、IUGR組及PE&IUGR組的樣本進(jìn)行K-means方式聚類,同時對樣本所屬性狀進(jìn)行了匹配。結(jié)果顯示IUGR5樣本明顯偏離群體,故予以剔除后再進(jìn)行分析。
2.2 軟閾值篩選及共表達(dá)模塊構(gòu)建以及模塊與基因相關(guān)性熱圖運(yùn)用WGCNA計算共表達(dá)網(wǎng)絡(luò)相關(guān)性首先需要確定用于分析的軟閾值,本研究設(shè)定1~30范圍進(jìn)行分析,當(dāng)r2大于0.9時則選取用于后續(xù)分析。本例中選取的軟閾值為22。同樣的,本研究成功獲取多種顏色共表達(dá)模塊,并且對模塊進(jìn)行了合并處理以剔除只包含少量基因的共表達(dá)模塊。最后,本研究通過熱圖呈現(xiàn)了基因與模塊間的相關(guān)系數(shù),其中較相關(guān)區(qū)域(淺黃色)提示了關(guān)鍵模塊與基因的存在(圖1)。
圖1 共表達(dá)模塊構(gòu)建及合并后模塊中基因的相關(guān)系數(shù)熱圖
2.3 共表達(dá)模塊篩選與基因性狀系數(shù)散點圖運(yùn)用WGCNA分析性狀表型與不同模塊之間的關(guān)系,可得到如下所示的相關(guān)系數(shù)熱圖(圖2A)。結(jié)果顯示多數(shù)模塊與正常對照組相關(guān),少數(shù)模塊與其它疾病組具有相對較低的相關(guān)性。接著提取不同模塊中的基因與性狀的相關(guān)系數(shù)作散點圖,下圖只展示部分代表性模塊。結(jié)果顯示,在PE組藍(lán)色模塊中,有323個基因與此性狀具有相關(guān)性,相關(guān)系數(shù)較高(r=0.42,P<0.05);在IUGR組灰色模塊中,318個基因與性狀具有相關(guān)性,相關(guān)系數(shù)較高(r=0.4,P<0.05)。本研究保留PE組(圖2B)及IUGR組(圖2C)有意義模塊中的基因進(jìn)行后續(xù)分析及比較。
圖2 共表達(dá)模塊與性狀相關(guān)系數(shù)熱圖及基因性狀相關(guān)系數(shù)散點圖
2.4 PE及IUGR組關(guān)鍵模塊中基因富集分析及比較納入PE組及IUGR組關(guān)鍵模塊中基因用于富集分析。本研究采納了GO分析中的生物過程(biological process,BP)分析,以及KEGG的信號通路(Pathway)分析,展示了富集程度最顯著的15個詞條。結(jié)果顯示,PE組中GO_BP分析提示了蛋白合成及折疊、DNA轉(zhuǎn)錄、DNA損傷調(diào)節(jié)、細(xì)胞周期等的異常(圖3A),同時KEGG信號通路提示了RNA降解、剪接體、脂質(zhì)代謝及激素合成等方面的異常(圖3B)。IUGR組中GO_BP分析提示了甾體類激素合成、細(xì)胞黏附、免疫反應(yīng)等方面的異常(圖3C),同時KEGG信號通路提示了補(bǔ)體反應(yīng)、氨基酸代謝、糖代謝、磷酸化反應(yīng)、p53信號通路等方面的異常(圖3D)。同時本研究比較了PE組及IUGR組富集詞條,結(jié)果顯示,GO_BP分析在兩組中具有較大差異,無具有統(tǒng)計學(xué)意義的詞條重復(fù)(圖3E);而KEGG通路提示除甲狀旁腺激素代謝及壽命調(diào)節(jié)通路的重疊外,無其它具有統(tǒng)計學(xué)意義的詞條重復(fù)(圖3F)。這些結(jié)果反映了本研究篩選基因及其對應(yīng)通路的特異性。
圖3 PE組及IUGR組關(guān)鍵基因的富集分析及比較
PE及IUGR在致孕產(chǎn)婦及胎兒死亡方面具有高危性,而其相關(guān)基因及其通路的研究仍不明了,既往關(guān)于PE及IUGR的研究,以本例所下載數(shù)據(jù)集的相關(guān)文獻(xiàn)為例,一般采用優(yōu)化t檢驗檢測不同組別之間的基因表達(dá)并篩選出最具表達(dá)差異的基因集,隨后對這些數(shù)據(jù)集進(jìn)行富集分析。然而,單純的差異基因表達(dá)檢測忽略了基因表達(dá)在生物體內(nèi)的相關(guān)性,割裂了基因表達(dá)的整體性,片面地富集最高差異表達(dá)的基因會喪失更全面的通路信息,而WGCNA通過計算相關(guān)性則尤其適用于分析具有n×m矩陣形式的臨床樣本微列陣數(shù)據(jù)[7]。
WGCNA包被廣泛用于構(gòu)建共表達(dá)網(wǎng)狀,分析基因與性狀之間的關(guān)系,探索有意義的表達(dá)模塊,計算相關(guān)性,可視化等,其近年來尤其用于探索腫瘤基因表達(dá)與臨床表征之間的關(guān)系,然而WGCNA鮮少用于探索研究人母胎臨床表征及疾病之間的關(guān)系。既往文獻(xiàn)僅涉及運(yùn)用WGCNA探索全基因組表達(dá)與母體體重指數(shù)及胎兒生長之間的關(guān)系,以及用于發(fā)現(xiàn)與妊娠期糖尿病相關(guān)的潛在生物學(xué)標(biāo)志物[8-10]。目前尚無研究運(yùn)用WGCNA探索PE及IUGR的特異基因及相關(guān)通路。因此,本研究旨在通過WGCNA法分析PE及IUGR的特異基因及相關(guān)通路。值得注意的是,雖然本研究并無一般研究中的臨床特征指標(biāo)(如年齡、體質(zhì)量等),但本研究創(chuàng)意性地將正常、PE、IUGR、PE&IUGR作為了樣本的臨床表型進(jìn)行相關(guān)性分析。
本研究剔除了IUGR第5個樣本,因聚類分析結(jié)果顯示其為離群值,從樣本聚類結(jié)果來看,樣本聚類結(jié)果較為緊密,適用于后續(xù)分析。后續(xù)分析結(jié)果提示大量基因與正常對照組相關(guān),而少量與PE或IUGR有關(guān)。鑒于導(dǎo)致疾病發(fā)生的基因或參與通路可能占總體基因的比例較小,大部分的基因整體表達(dá)趨于正常,此結(jié)果則可能是合理的。而PE&IUG聯(lián)合組未能檢測到大量較高相關(guān)性的基因則可能歸因于其各自特異性的基因及通路較少重合,從而形成數(shù)據(jù)噪音,影響了對潛在有效基因的檢測,降低了基因與該性狀的相關(guān)程度。本研究的富集分析結(jié)果提示,PE與細(xì)胞生命周期有關(guān),這與既往關(guān)于胎盤細(xì)胞衰老在胎盤中作用的研究[11]一致;同時PE發(fā)生伴隨的DNA轉(zhuǎn)錄過程及蛋白質(zhì)合成及代謝異常也見諸于既往的報道[12]之中。IUGR的發(fā)生及參與的甾體類激素合成、氨基酸代謝、p53信號通路等同樣在既往研究[13-15]中有報道。故而說明本研究中可能存在尚未經(jīng)其他研究提及的有用通路,而這些通路可能具有進(jìn)一步的研究價值。此外,本研究還通過基因與通路的熱圖展示了參與相關(guān)通路的相應(yīng)基因群。例如在IUGR組中,熱 圖 顯 示CFLAR、CRY 2、FBXO32、FOXO1、FOXO3、KLF9參與了細(xì)胞受糖皮質(zhì)激素刺激的反應(yīng)過程,這既與之前的系列研究[13,16]所得的糖皮質(zhì)激素參與IUGR發(fā)生的結(jié)論一致,又彌補(bǔ)了既往研究在探究其中具體基因方面的缺陷。
因此,本研究通過新方法WGCNA的運(yùn)用,分析了PE及IUGR組臨床樣本的微列陣數(shù)據(jù),揭示了PE及IUGR的發(fā)生發(fā)展過程中所涉及到的各自特異性的參與基因及相應(yīng)信號通路,為進(jìn)一步研究PE及IUGR的胎盤發(fā)生機(jī)制提供了新思路。