楊健康 馮家祺 張平 曹光瓊 何黎 吳文娟
671000云南,大理大學(xué)基礎(chǔ)醫(yī)學(xué)院(楊健康);昆明醫(yī)科大學(xué)第一附屬醫(yī)院皮膚科(馮家祺、何黎、吳文娟),體檢中心(曹光瓊);云南曲靖市第一人民醫(yī)院檢驗科(張平)
痤瘡是一種常見的皮膚疾病,重型痤瘡是痤瘡中最嚴(yán)重的一類,它主要表現(xiàn)為廣泛分布的炎癥性皮損,經(jīng)常導(dǎo)致患者的心理問題[1?2]。遺傳因素在重型痤瘡的發(fā)生中發(fā)揮重要作用[3]。全基因組關(guān)聯(lián)研究(GWAS)是一種發(fā)現(xiàn)疾病易感基因的有效方法[4?5]。針對中國人群重型痤瘡的GWAS研究曾發(fā)現(xiàn)2個新的易感基因[6]。但是,基因通常通過基因通路的形式在疾病的發(fā)生、發(fā)展中發(fā)揮作用[7]。因此,有必要進(jìn)行基因通路分析,研究基因通路與疾病的關(guān)系,從而為全基因組關(guān)聯(lián)研究提供有益補(bǔ)充。為了研究基因通路與重型痤瘡的關(guān)系,我們進(jìn)行重型痤瘡全基因組通路分析,希望提高對重型痤瘡發(fā)病機(jī)制的認(rèn)識。
分析來源于重型痤瘡全基因組關(guān)聯(lián)研究的單核苷酸多態(tài)性(SNP)芯片數(shù)據(jù)[6]。采用美國Illumina公司HumanOmniZhongHua?8型芯片,于安徽醫(yī)科大學(xué)皮膚病學(xué)教育部重點實驗室行芯片掃描。數(shù)據(jù)集包括1 056例重型痤瘡患者和1 056例健康對照的芯片數(shù)據(jù),每個樣本檢測900 015個SNP位點。所有的重型痤瘡患者都經(jīng)皮膚科副主任或主任醫(yī)師診斷為4型(Pillsbury分級系統(tǒng)):除顏面及胸背部泛發(fā)的粉刺、丘疹、膿皰外,皮損炎癥重,并有囊腫、結(jié)節(jié)和瘢痕。本研究經(jīng)昆明醫(yī)科大學(xué)第一附屬醫(yī)院醫(yī)學(xué)倫理委員會批準(zhǔn),患者及健康對照均簽署知情同意書。標(biāo)本由昆明醫(yī)科大學(xué)第一附屬醫(yī)院、云南曲靖市第一人民醫(yī)院、安徽醫(yī)科大學(xué)第一附屬醫(yī)院等全國三十余家醫(yī)院合作收集完成。
1.數(shù)據(jù)質(zhì)控:對原始的SNP芯片數(shù)據(jù)進(jìn)行嚴(yán)格的質(zhì)量控制,以去除不合格的樣本和SNP位點。首先對標(biāo)本進(jìn)行質(zhì)控,排除檢出率(call rates)<98%的樣本,剩下合格的1 031份病例樣本和1 031份健康對照樣本。接著對SNP位點進(jìn)行質(zhì)控,①排除所有樣本中檢出率<98%的SNP位點;②排除所有樣本中最小等位基因頻率(MAF)<0.01的SNP位點;③排除健康對照樣本中嚴(yán)重偏離哈迪-溫伯格平衡(P< 1× 10?4)的SNP位點。經(jīng)過質(zhì)控,共篩出合格的SNP位點809 305個。
2.SNP位點分析:使用Plink v1.90軟件[8]對SNP位點進(jìn)行l(wèi)ogistic回歸分析。使用Q?Q圖評估群體分層的大小及對結(jié)果的影響。使用Haploview v4.2軟件做全基因組曼哈頓圖。
3.基因分析:使用VEGAS軟件計算[9],采用蒙特卡羅(Monte Carlo)法統(tǒng)計基因與重型痤瘡的相關(guān)性,P值代表基因與重型痤瘡相關(guān)的顯著性水平。為了包括基因調(diào)控區(qū)的SNP位點,將基因的范圍定義為編碼序列(CDS)和20 kb的5′UTR及20 kb的3′UTR。接著將SNP定位到基因上。計算P值時,考慮了同一基因上所有SNP位點的影響,并且使用HapMap CHB和JPT的數(shù)據(jù)進(jìn)行連鎖不平衡校正。
4.通路分析:使用在線工具WebGestalt進(jìn)行基因通路分析[10]。該基因通路為KEGG數(shù)據(jù)庫定義的基因通路。為了減少通路大小對結(jié)果的影響,僅對包括10~200個基因的通路進(jìn)行分析。采用超幾何分布檢驗計算每條通路的P值,使用錯誤發(fā)現(xiàn)率(FDR)對得到的結(jié)果進(jìn)行多重檢驗校正,校正后P<0.05視為通路與重型痤瘡相關(guān)。
40 920個SNP位點的P值小于0.05,見全基因組曼哈頓圖(圖1)。從圖2可以看出所有SNP位點對應(yīng)的P值整體上沒有偏離零假設(shè)分布,提示病例對照樣本匹配良好,人群分層因素對結(jié)果影響較小,與重型痤瘡顯著相關(guān)的SNP位點應(yīng)該是真實的相關(guān)信號。
所有基因中,919個對應(yīng)的P值小于0.05,其中12個P值小于0.001,見表1。
發(fā)現(xiàn)5條顯著的基因通路(P<0.05),見表2。根據(jù)KEGG通路分類,可以將這5條通路分為代謝(1條)、內(nèi)分泌系統(tǒng)(1條)、癌癥(1條)、免疫系統(tǒng)(2條)。
圖1 全基因組關(guān)聯(lián)分析曼哈頓圖 不同的顏色分別代表23對染色體;縱坐標(biāo)為每個單核苷酸多態(tài)性(SNP)位點的-log10(P)值,該值越大代表該位點的等位基因頻率在病例組與對照組間的差異越顯著
查詢PubMed數(shù)據(jù)庫和CNKI數(shù)據(jù)庫,截至2018年6月,未檢索到重型痤瘡全基因組通路研究的相關(guān)文獻(xiàn),本研究可能是國際上第一個重型痤瘡的全基因組通路研究,將有利于加深我們對于重型痤瘡發(fā)病機(jī)制的認(rèn)識。本研究發(fā)現(xiàn)的通路中有2個與免疫反應(yīng)和炎癥相關(guān),分別是丙型肝炎和高親和力IgE受體信號通路。這和目前普遍認(rèn)為重型痤瘡是炎癥性疾病的認(rèn)識一致[11?12]。研究認(rèn)為,炎癥反應(yīng)會刺激毛囊皮脂腺導(dǎo)管角化過度,從而影響皮脂的正常排出[13]。
圖2 全基因組關(guān)聯(lián)分析Q-Q圖 橫坐標(biāo)為809 305個單核苷酸多態(tài)性(SNP)位點-log10(P)值的期望值,縱坐標(biāo)為-log10(P)值的觀察值,圖中觀察值與期望值沒有偏離零假設(shè)分布,提示病例對照樣本匹配良好,人群分層因素對結(jié)果影響較小
表1 基因分析發(fā)現(xiàn)的12個與重型痤瘡關(guān)系最密切的基因
表2 通路分析方法發(fā)現(xiàn)的與重型痤瘡相關(guān)的5條基因通路
本研究發(fā)現(xiàn)一些新的基因通路可能與重型痤瘡相關(guān),提示除了炎癥、免疫相關(guān)通路以外,其他通路可能也參與重型痤瘡的發(fā)生和發(fā)展。比如酪氨酸代謝通路,酪氨酸對于神經(jīng)遞質(zhì)多巴胺的合成也發(fā)揮重要作用[14]。多巴胺是可以使人產(chǎn)生快樂的神經(jīng)遞質(zhì)[15]。一項針對新加坡青少年進(jìn)行的研究發(fā)現(xiàn),痤瘡的嚴(yán)重程度與精神壓力呈正相關(guān)[16]。因此,酪氨酸代謝可能對于重型痤瘡患者的精神壓力也有重要的影響[17]。催乳素信號通路和腎細(xì)胞癌通路與痤瘡的關(guān)系未見相關(guān)文獻(xiàn)報道,需要進(jìn)一步的功能研究來明確。
本次基因分析發(fā)現(xiàn)12個基因的P值小于0.001,其中包括重型痤瘡全基因組關(guān)聯(lián)研究發(fā)現(xiàn)的DDB2基因。DDB2基因編碼的蛋白是一個新發(fā)現(xiàn)的與雄激素受體有相互作用的蛋白,可能通過泛素化使雄激素受體蛋白被蛋白酶體降解[18]。其他基因如CLLU1OS、IL3與炎癥相關(guān),IL3在激活與調(diào)節(jié)免疫細(xì)胞和介導(dǎo)T、B細(xì)胞增殖與分化及痤瘡的炎癥反應(yīng)中起重要作用[19]。
本研究結(jié)果只是針對中國人群重型痤瘡GWAS研究的全基因組通路分析,部分結(jié)果也可能存在假陽性的問題,有待新的重型痤瘡GWAS研究對這些結(jié)果進(jìn)行驗證。我們發(fā)現(xiàn)一些可能與重型痤瘡發(fā)病相關(guān)的基因通路,有望為后續(xù)的研究提供一些思路。