徐 盼,張 震,崔磊磊,楊 斌,段艷宇
(江西農(nóng)業(yè)大學(xué)省部共建豬遺傳改良與養(yǎng)殖技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,南昌 330045)
?
白色杜洛克×二花臉資源家系豬血液性狀的系統(tǒng)遺傳學(xué)研究
徐盼,張震,崔磊磊,楊斌,段艷宇*
(江西農(nóng)業(yè)大學(xué)省部共建豬遺傳改良與養(yǎng)殖技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,南昌 330045)
摘要:為揭示家豬血細(xì)胞性狀的遺傳基礎(chǔ),本研究整合白色杜洛克×二花臉豬F2資源家系肌肉血細(xì)胞性狀eQTL和全基因關(guān)聯(lián)分析結(jié)果,鑒別影響血細(xì)胞性狀的候選基因。研究測(cè)定了1 149個(gè)個(gè)體的18種血常規(guī)和593個(gè)個(gè)體肌肉轉(zhuǎn)錄本表達(dá)水平,對(duì)1 020個(gè)個(gè)體進(jìn)行基因分型。轉(zhuǎn)錄組表達(dá)水平與血常規(guī)數(shù)據(jù)的關(guān)聯(lián)性使用斯皮爾曼系數(shù)進(jìn)行評(píng)估,將血細(xì)胞性狀相關(guān)聯(lián)的轉(zhuǎn)錄本進(jìn)行eQTL定位并進(jìn)行基因富集分析,結(jié)合前期本試驗(yàn)的GWAS結(jié)果進(jìn)行綜合分析。結(jié)果,當(dāng)P<5×10-4時(shí)檢測(cè)到血細(xì)胞相關(guān)的eQTLs有122個(gè),其中有9個(gè)順式eQTLs和63個(gè)反式eQTLs。通過(guò)eQTL定位確定SERPINB6為影響紅細(xì)胞性狀的候選基因,基因富集分析鑒別到影響紅細(xì)胞性狀的候選基因?yàn)镻TPRC和ITGA8,GWAS和eQTL的綜合分析發(fā)現(xiàn)影響紅細(xì)胞性狀相關(guān)的基因?yàn)門(mén)MED9、PCK1、TINAGL1和SORL1。本研究通過(guò)結(jié)合前期GWAS結(jié)果和肌肉轉(zhuǎn)錄本表達(dá)數(shù)據(jù)進(jìn)行綜合分析鑒別到7個(gè)與紅細(xì)胞性狀相關(guān)的基因,其中TMED9、PCK1、TINAGL1和SORL1是GWAS和eQTL共有的候選基因。
關(guān)鍵詞:豬;血液性狀;肌肉;表達(dá)數(shù)量性狀位點(diǎn);全基因組關(guān)聯(lián)分析;候選基因
血細(xì)胞指血液中的細(xì)胞,主要包括紅細(xì)胞、白細(xì)胞和血小板。在正常生理情況下,血細(xì)胞數(shù)量及形態(tài)維持相對(duì)穩(wěn)定[1]。它的異常改變可以反映機(jī)體的異常變化,因此以檢測(cè)血細(xì)胞形狀和數(shù)量的血常規(guī)檢測(cè)是臨床診斷的常用手段。紅細(xì)胞主要功能是運(yùn)輸氧,數(shù)量偏高或偏低,對(duì)于身體健康都會(huì)產(chǎn)生不利的影響。如果血紅蛋白正常,紅細(xì)胞平均體積低,一般是地中海貧血基因攜帶的表現(xiàn),常出現(xiàn)頭暈、氣短、心悸等典型癥狀。如果血紅蛋白和血細(xì)胞數(shù)都很高,可能是真性紅細(xì)胞增多癥,造成脾肥大及脾梗死。白細(xì)胞是身體的免疫衛(wèi)士,它的數(shù)量異常是感染性和炎癥性疾病的重要指標(biāo)。如細(xì)菌、病毒感染可致白細(xì)胞數(shù)量偏低,嚴(yán)重創(chuàng)傷、白血病可致白細(xì)胞數(shù)量偏高。血小板在止血過(guò)程起重要作用,其數(shù)量的減少可能是由于特發(fā)性血小板減少性紫癜(ITP)導(dǎo)致,該疾病會(huì)引起機(jī)體胃腸道出血[2]。
臨床常見(jiàn)血液病有白血病、再生障礙性貧血、血小板減少癥、淋巴瘤等,引起血液疾病的因素十分復(fù)雜,包括物理、化學(xué)、遺傳等因素。鑒于血液病是全球高發(fā)疾病之一,大規(guī)模基因組關(guān)聯(lián)分析(GWAS)已經(jīng)揭示血細(xì)胞性狀的遺傳機(jī)理非常復(fù)雜。P.Van der Harst等[3]對(duì)135 367個(gè)人的紅血細(xì)胞進(jìn)行GWAS分析鑒別,得到75個(gè)數(shù)量性狀位點(diǎn)(QTL),這些位點(diǎn)共解釋了4%~9%的表型變異。本實(shí)驗(yàn)室利用白色杜洛克×二花臉豬F2資源家系通過(guò)對(duì)豬60K芯片與F2個(gè)體的血細(xì)胞性狀開(kāi)展GWAS分析鑒別,得到18個(gè)性狀的185個(gè)基因組水平SNPs[4]。F.Zhang等[5]在血緣相近的蘇太群體開(kāi)展GWAS分析鑒別到44個(gè)基因組顯著水平的SNPs。由于血細(xì)胞性狀的復(fù)雜性,在GWAS分析后的因果基因鑒別就顯得異常艱難。
為了彌補(bǔ)GWAS分析只鑒別基因組內(nèi)SNPs與表型的關(guān)系,整合系統(tǒng)生物學(xué)通過(guò)增加與參與性狀功能的關(guān)鍵組織的表達(dá)譜分析,通過(guò)整合SNPs、表達(dá)譜和表型的數(shù)據(jù)確定表達(dá)數(shù)量性狀位點(diǎn)(eQTL),這為鑒別因果基因提供了功能學(xué)信息。E.E.Schadt等[6]通過(guò)GWAS和eQTL的整合分析鑒別到SORT1和CELSR2為與冠心病和血漿低密度脂蛋白膽固醇水平相關(guān)的候選易感基因。C.Y.Chen等[7]綜合分析GWAS、eQTL及性狀相關(guān)基因表達(dá)成功獲得一個(gè)影響低密度脂蛋白膽固醇水平的候選基因。本研究以實(shí)驗(yàn)室前期構(gòu)建的白色杜洛克×二花臉豬資源家系F2群體為研究對(duì)象,綜合分析GWAS和肌肉eQTL,鑒別影響家豬血細(xì)胞性狀的候選基因以揭示其遺傳機(jī)制,為人類(lèi)血液病的研究提供重要的參考。
1材料與方法
本研究中DNA、RNA提取與血液采集均在省部共建豬遺傳改良與養(yǎng)殖技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室進(jìn)行。
1.1試驗(yàn)動(dòng)物和樣品采集
本研究中的試驗(yàn)群體為實(shí)驗(yàn)室前期構(gòu)建的白色杜洛克×二花臉豬資源家系F2群體。該群體包含1 912個(gè)個(gè)體,是由2頭白色杜洛克公豬和17頭二花臉母豬交配產(chǎn)生的三代群體。試驗(yàn)動(dòng)物飼養(yǎng)于標(biāo)準(zhǔn)豬舍內(nèi),統(tǒng)一飼喂。試驗(yàn)動(dòng)物在(240 ± 3)日齡屠宰,屠宰前禁食12 h。試驗(yàn)動(dòng)物屠宰時(shí)采集血液注入EDTA抗凝管中,均勻混合,于24 h內(nèi)送至江西南昌大學(xué)第一附屬醫(yī)院。試驗(yàn)動(dòng)物屠宰后30 min內(nèi)收集肌肉樣品置于液氮,然后保存于-80 ℃超低溫冰箱內(nèi)。采集豬耳組織提取DNA。所有樣品的采集符合農(nóng)業(yè)部關(guān)于試驗(yàn)動(dòng)物的保護(hù)條例和使用指南。
1.2血常規(guī)檢測(cè)
使用CD1700全血分析儀(Abbott,USA)檢測(cè)了1 149個(gè)個(gè)體的紅細(xì)胞、白細(xì)胞和血小板3大類(lèi)共18個(gè)血常規(guī)性狀,其中紅細(xì)胞包括:紅細(xì)胞壓積(HCT)、血紅蛋白(HGB)、平均紅細(xì)胞血紅蛋白含量(MCH)、平均紅細(xì)胞血紅蛋白濃度(MCHC)、平均紅細(xì)胞體積(MCV)、紅血球計(jì)數(shù)(RBC)和紅細(xì)胞體積分布寬度(RDW)7項(xiàng)指標(biāo);白細(xì)胞包括:粒細(xì)胞計(jì)數(shù)(GRAN)、粒細(xì)胞的數(shù)量百分?jǐn)?shù)(GRAR)、單核細(xì)胞計(jì)數(shù)(MON)、單核細(xì)胞數(shù)的百分比(MONR)、淋巴細(xì)胞計(jì)數(shù)(LYM)、淋巴細(xì)胞計(jì)數(shù)百分比(LYMA)和白血細(xì)胞計(jì)數(shù)(WBC)7項(xiàng)指標(biāo);血小板包括:血小板壓積(PCT)、血小板分布寬度(PDW)、血小板數(shù)(PLT)及平均血小板體積(MPV)4項(xiàng)指標(biāo)。
1.3DNA提取及豬60K SNP芯片
豬耳組織樣品用酚/氯仿法提取基因組DNA。經(jīng)過(guò)質(zhì)量檢測(cè),1 020頭F2個(gè)體的DNA樣品統(tǒng)一稀釋至20 ng·μL-1,按Illumina 芯片標(biāo)準(zhǔn)流程用iScan掃描儀(Illumina,USA)進(jìn)行60K SNP芯片分型。對(duì)SNP進(jìn)行質(zhì)控,檢測(cè)率<95%、次等位基因頻率<5%、哈代-溫伯格檢驗(yàn)(HWE)P<5×10-6、性染色體連鎖的SNP被篩除。白色杜洛克×二花臉豬F2資源群體有39 454個(gè)SNPs通過(guò)了質(zhì)量控制。
1.4RNA提取及轉(zhuǎn)錄組測(cè)序
按照說(shuō)明書(shū)使用TRIzol (Invitrogen,USA)試劑提取了593頭F2個(gè)體的肌肉總RNA。使用2100 Bioanalyzer (Agilent,UK)和瓊脂糖凝膠電泳檢測(cè)總RNA質(zhì)量。使用oligo-dT磁珠(Invitrogen,USA)將mRNA從總RNA中分離出來(lái),磁珠上的oligo-dT與mRNA的polyA雜交后作為模板用oligo-dT引物合成雙鏈cDNA。使用限制性酶NlaⅢ和MmeⅠ(New England Biolabs,UK)消化雙鏈cDNA,將cDNA片段兩端連接到Illumina特定的接頭,高保真聚合酶擴(kuò)增構(gòu)建測(cè)序文庫(kù)后使用GA Ⅱ測(cè)序儀(Illumina,USA)測(cè)序。
1.5統(tǒng)計(jì)分析
每個(gè)轉(zhuǎn)錄本表達(dá)水平的中值用log2計(jì)量。在少于20%的個(gè)體中表達(dá)的轉(zhuǎn)錄本被濾去,其余轉(zhuǎn)錄本進(jìn)行后續(xù)分析。表型數(shù)據(jù)及基因表達(dá)數(shù)據(jù)使用穩(wěn)健線性回歸模型進(jìn)行性別、批次和親緣關(guān)系的調(diào)整?;虮磉_(dá)水平與表型數(shù)據(jù)的關(guān)聯(lián)使用R程序包中斯皮爾曼系數(shù)進(jìn)行評(píng)估,設(shè)定保守閾值P<5×10-4時(shí)調(diào)整多重檢驗(yàn)。利用基于R程序包中GenABEL內(nèi)mmscore的混合線性模型繪制性狀相關(guān)的eQTL圖譜,其中性別和批次作為固定效應(yīng),由全基因組SNP基因型信息推算的樣本間親緣關(guān)系矩陣作為遺傳協(xié)方差。采用bonferroni校正多重檢驗(yàn)效應(yīng)?;蚋患治鍪褂迷诰€工具DAVID。本研究將QTT與轉(zhuǎn)錄起始位點(diǎn)5.0 Mb區(qū)間內(nèi)存在的eQTL定義為順式eQTL,否則歸類(lèi)為反式eQTL。
2結(jié)果
2.1表型測(cè)定結(jié)果
白色杜洛克×二花臉豬資源家系F2群體240日齡的18種血常規(guī)表型測(cè)定結(jié)果如表1,測(cè)量值由“平均值±標(biāo)準(zhǔn)差”表示。測(cè)量個(gè)體數(shù)不同是由整個(gè)群體分若干批次屠宰及數(shù)據(jù)經(jīng)過(guò)正態(tài)分布篩選導(dǎo)致。2.2全基因組關(guān)聯(lián)分析結(jié)果
白色杜洛克×二花臉豬資源家系F2群體的240日齡血常規(guī)性狀全基因組關(guān)聯(lián)分析結(jié)果見(jiàn)表2。影響240日齡血常規(guī)的基因組顯著水平最強(qiáng)相關(guān)SNPs集中在7、8號(hào)染色體,且HCT和HGB擁有相同的最強(qiáng)相關(guān)SNPs,MCH、MCV和RBC也共享最強(qiáng)相關(guān)SNP。
2.3數(shù)量性狀轉(zhuǎn)錄本eQTL定位
本研究進(jìn)行了593頭F2個(gè)體肌肉轉(zhuǎn)錄組測(cè)序,檢測(cè)全基因組轉(zhuǎn)錄本的表達(dá)水平。所有轉(zhuǎn)錄本進(jìn)行質(zhì)控后共獲得23 727個(gè)肌肉轉(zhuǎn)錄本進(jìn)入下一步分析。使用斯皮爾曼系數(shù)評(píng)估肌肉轉(zhuǎn)錄本表達(dá)水平與表型數(shù)據(jù)的關(guān)聯(lián)性,當(dāng)閾值P<5×10-4時(shí),鑒別到78個(gè)轉(zhuǎn)錄本即數(shù)量性狀轉(zhuǎn)錄本(QTT)的表達(dá)水平與血紅蛋白(HGB)、紅細(xì)胞數(shù)目(RBC)、紅細(xì)胞壓積(HCT)、平均紅細(xì)胞體積(MCV)、平均紅細(xì)胞血紅蛋白含量(MCH)和白細(xì)胞數(shù)目(WBC)有關(guān)聯(lián)。用這78個(gè)肌肉轉(zhuǎn)錄本與39 454個(gè)豬60K芯片SNPs進(jìn)行eQTL映射,當(dāng)閾值P<10-5時(shí),78個(gè)肌肉轉(zhuǎn)錄本映射到122個(gè)eQTLs,每個(gè)轉(zhuǎn)錄本映射到1~9個(gè)eQTL,未檢測(cè)到所有轉(zhuǎn)錄本共有的eQTL。為了鑒別上述eQTL與QTT的關(guān)系,通過(guò)eQTL的SNP與QTT轉(zhuǎn)錄起始位點(diǎn)在豬物理圖譜上位置進(jìn)行比對(duì)確定兩者間的距離并將兩者各自位置相對(duì)照的關(guān)系進(jìn)行分析,結(jié)果見(jiàn)表3和圖1。圖1中對(duì)角線的點(diǎn)表示順式eQTL的位置,其余點(diǎn)表示反式eQTL的位置。122個(gè)eQTLs中有9個(gè)順式eQTLs,63個(gè)反式eQTLs和50個(gè)未知作用的eQTLs。未知作用eQTL的轉(zhuǎn)錄本或SNP在豬參考基因組上不能準(zhǔn)確地被映射到。7號(hào)染色體上存有數(shù)量最多的eQTL,MCH和MCV的順式eQTL也位于7號(hào)染色體且有重疊,因此本研究確定7號(hào)染色體SERPINB6是位置候選基因。2.4GO & KEGG富集分析
將上述定位到eQTL的對(duì)應(yīng)基因進(jìn)行GO & KEGG富集分析(Gene Ontology & KEGG pathway enrichment anakysis)。紅細(xì)胞類(lèi)eQTL對(duì)應(yīng)基因的GO & KEGG富集分析結(jié)果見(jiàn)圖2??v坐標(biāo)表示性狀相關(guān)的轉(zhuǎn)錄本GO分析后形成的分類(lèi),數(shù)據(jù)標(biāo)簽表示每個(gè)分類(lèi)對(duì)應(yīng)的基因。其中,紅細(xì)胞類(lèi)eQTL參與了糖異生過(guò)程、DNA及丙酮酸的代謝調(diào)節(jié)、單糖生成、乙醇生成、碳水化合物生成和T細(xì)胞受體、細(xì)胞粘附分子的信號(hào)通路。紅細(xì)胞性狀鑒別到的eQTL所參與的信號(hào)通路與紅細(xì)胞的功能關(guān)系密切。通過(guò)GO & KEGG富集分析,本研究確定PTPRC和ITGA8為候選基因。
表1白色杜洛克×二花臉豬資源家系F2群體240日齡18種血常規(guī)表型測(cè)定結(jié)果Table 1Descriptive statistics of 18 hematological traits at day 240 in the White Duroc × Erhualian pigs F2resource population
白色杜洛克×二花臉豬資源家系F2群體的3個(gè)日齡段18種血常規(guī)表型測(cè)定結(jié)果詳情見(jiàn)參考文獻(xiàn)[4]Descriptive statistics of 18 hematological traits at 3 growth stages in the F2pigs resource population have been shown in reference[4]
表2白色杜洛克×二花臉豬資源家系F2群體240日齡血常規(guī)性狀全基因組關(guān)聯(lián)分析部分結(jié)果
Table 2Genome-wide significant loci associated with hematological traits at day 240 in the White Duroc × Erhualian pigs F2resource population by the single-marker analysis
只列出達(dá)到基因組顯著水平的最強(qiáng)相關(guān)SNPs。白色杜洛克×二花臉豬資源家系F2群體的3個(gè)日齡段血常規(guī)性狀全基因組關(guān)聯(lián)分析結(jié)果詳情見(jiàn)參考文獻(xiàn)[4]
The lead SNPs at the significant level were only listed.Genome-wide significant loci associated with hematological traits by the single-marker analysis has been shown in reference [4] in the F2pigs resource population
表3白色杜洛克×二花臉豬資源家系F2群體240日齡血常規(guī)性狀相關(guān)eQTL結(jié)果Table 3Results of eQTL associated with hematological traits at day 240 in the White Duroc × Erhualian pigs F2resource population
2.5eQTL和GWAS的整合分析
綜合分析白色杜洛克×二花臉豬資源家系F2群體血常規(guī)性狀GWAS和eQTL數(shù)據(jù)來(lái)鑒定影響血液性狀候選基因。結(jié)果發(fā)現(xiàn),在GWAS最高SNP位置的5.0 Mb區(qū)域內(nèi)有4個(gè)紅細(xì)胞性狀相關(guān)的反式調(diào)控eQTLs,對(duì)應(yīng)的轉(zhuǎn)錄本分別為gnl|UG|Ssc# PTG01_0098_D10、gnl|UG|Ssc# LVR01_0039_D11、gnl|UG|Ssc# S18548948和gnl|UG|Ssc# S26395831。通過(guò)基因注釋查找出gnl|UG|Ssc# PTG01_0098_D10為SSC2上TMED9基因,gnl|UG|Ssc# LVR01_0039_D11為SSC17上PCK1 基因,gnl|UG|Ssc# S18548948為SSC6上TINAGL1基因,gnl|UG|Ssc# S26395831為SSC9上SORL1基因。紅細(xì)胞性狀相關(guān)eQTL和GWAS整合分析的結(jié)果見(jiàn)圖3和圖4。通過(guò)eQTL和GWAS整合分析確定該4個(gè)基因?yàn)楸狙芯揩@得的新的影響紅細(xì)胞性狀的候選基因。
3討論
GWAS為人類(lèi)復(fù)雜性疾病的分子遺傳機(jī)制提供了很多線索,但也有很大的局限性。GWAS依賴(lài)統(tǒng)計(jì)方法分析遺傳因素與復(fù)雜性疾病的關(guān)系,可能會(huì)出現(xiàn)假陽(yáng)性和假陰性結(jié)果,鑒別到的SNPs只是與疾病相關(guān)的SNPs,許多SNPs為常見(jiàn)變異且位于內(nèi)含子區(qū)域或者基因間,這會(huì)影響GWAS可靠性和精確性。GWAS難以檢測(cè)到罕見(jiàn)SNPs導(dǎo)致只有一小部分SNPs可以解釋其遺傳變異。由于各個(gè)群體具有不同的等位基因頻率和連鎖不平衡區(qū)域,因此GWAS即使檢測(cè)到很多SNPs但鮮有相同位點(diǎn)被檢測(cè)到,W.Z.Luo等[8]和J.Y.Wang等[9]兩項(xiàng)研究只有1個(gè)位點(diǎn)相同。GWAS需要通過(guò)試驗(yàn)設(shè)計(jì)、分析方法的改進(jìn)、大群體反復(fù)驗(yàn)證和大量功能試驗(yàn)的驗(yàn)證來(lái)鑒別復(fù)雜性疾病的致病基因。
目前,許多科學(xué)家通過(guò)GWAS、eQTL和生物網(wǎng)絡(luò)的綜合分析手段已成功鑒定出復(fù)雜性疾病相關(guān)的基因位點(diǎn)和信號(hào)通路。Y.H.Hsu等[10]結(jié)合全基因組關(guān)聯(lián)分析和基因表達(dá)譜分析得到RAP1A、TBC1D8、OSBPL1A為骨質(zhì)疏松癥相關(guān)基因。H.Zhong等[11]利用基因表達(dá)的遺傳信息和可公開(kāi)獲得的GWAS結(jié)果發(fā)現(xiàn)了Ⅱ型糖尿病相關(guān)的新的信號(hào)途徑。J.Ma等[12]在豬骨骼肌中找到了導(dǎo)致高糖原含量和低肉質(zhì)的基因—PHKG1,極大地促進(jìn)了含杜洛克血統(tǒng)豬種的肉質(zhì)遺傳改良。綜合分析的方法為解析復(fù)雜性疾病的發(fā)病機(jī)制開(kāi)辟了另一條道路。
肌肉是人和動(dòng)物機(jī)體中代謝十分活躍的組織,通過(guò)乳酸循環(huán)與血液、肝、腎及其他器官形成了密切的聯(lián)系。在紅細(xì)胞內(nèi)乳酸的運(yùn)輸途徑多達(dá)3條[13]。鑒于血液和肌肉之間的內(nèi)在聯(lián)系,我們進(jìn)行了肌肉轉(zhuǎn)錄組測(cè)序,并且將血液表型相關(guān)的轉(zhuǎn)錄本與豬60K芯片SNPs進(jìn)行eQTL定位。由于我們僅將與血液表型相關(guān)的轉(zhuǎn)錄本進(jìn)行eQTL分析,因此得到的反式調(diào)控eQTL多于順式調(diào)控eQTL。從圖1可以看到MCH和MCV的順式eQTL位于7號(hào)染色體且位置重疊。7號(hào)染色體上存在數(shù)量最多的eQTL,與GWAS在此染色體定位到大量SNPs相一致,但大量反式eQTL的存在也提示血液性狀受到更多微效基因的控制。通過(guò)豬60K芯片SNPs進(jìn)行eQTL映射后,確定7號(hào)染色體上的SER-PINB6是位置候選基因。SERPINB6編碼的蛋白
已被確定為胎盤(pán)凝血酶抑制劑[14],是絲氨酸蛋白酶抑制劑超家族成員之一,絲氨酸蛋白酶抑制劑是結(jié)構(gòu)相關(guān)蛋白質(zhì),調(diào)節(jié)絲氨酸蛋白酶的活性,絲氨酸蛋白酶參與凝血、纖維蛋白溶解、炎癥、細(xì)胞凋亡和腫瘤發(fā)生等過(guò)程[15-17],因此SERPINB6可以抑制凝血酶等胰蛋白酶樣蛋白酶。
本研究通過(guò)GO & KEGG 富集分析確定PTPRC和ITGA8為影響血液性狀的候選基因,這2個(gè)基因與血細(xì)胞數(shù)量和形態(tài)有關(guān)。PTPRC在除紅細(xì)胞和血小板外的所有造血細(xì)胞內(nèi)特異表達(dá),它是白細(xì)胞共同抗原[18-19],參與調(diào)節(jié)造血細(xì)胞生長(zhǎng)、分化和活化[20-21]。PTPRC與淋巴瘤、B細(xì)胞慢性淋巴細(xì)胞性白血病、毛細(xì)胞白血病和急性非淋巴細(xì)胞白血病的發(fā)生有著密切的關(guān)系。ITGA8的突變會(huì)造成雙側(cè)腎發(fā)育不全[22]。人和動(dòng)物出生后腎取代肝成為紅細(xì)胞生成素(EPO)主要合成場(chǎng)所,而EPO是紅細(xì)胞生成的主要調(diào)節(jié)劑,因此ITGA8與紅細(xì)胞的生成存在一定的聯(lián)系。
本研究結(jié)合實(shí)驗(yàn)室前期的GWAS研究成果及eQTL進(jìn)行綜合分析,獲得4個(gè)新的影響紅細(xì)胞的候選基因TMED9、PCK1、TINAGL1和SORL1。TMED9是位于內(nèi)質(zhì)網(wǎng)和高爾基體編碼轉(zhuǎn)運(yùn)蛋白的基因,目前鮮有關(guān)于TMED9功能的報(bào)道,但TMED9可以與IKBKE、TRAF6形成基因網(wǎng)絡(luò),IKBKE參與許多信號(hào)途徑,包括toll樣受體信號(hào)和信號(hào)轉(zhuǎn)導(dǎo),誘導(dǎo)細(xì)胞凋亡[23]。PCK1編碼PEPCK-C,它是肝和腎中一個(gè)關(guān)鍵的糖異生酶[24]。在PCK1調(diào)控區(qū)域內(nèi)含有脂肪特異性啟動(dòng)子PCK2,PCK2的C、T等位基因?qū)Ψ逝中廷蛐吞悄虿』颊叩奶腔t蛋白A1c水平有共顯性效應(yīng)[25-26]。TINAGL1也被稱(chēng)為腎上腺皮質(zhì)成帶因子1,其編碼的蛋白質(zhì)與腎小管間質(zhì)性腎炎抗原序列相似,該基因與腎上腺皮質(zhì)細(xì)胞的成帶分化緊密相關(guān)[27]。作為I型跨膜蛋白,SORL1包含不同的結(jié)構(gòu)域,同時(shí)屬于低密度脂蛋白受體家族和液泡蛋白分選10結(jié)構(gòu)域受體家族。SORL1在淀粉樣前體蛋白的轉(zhuǎn)運(yùn)和加工方面起關(guān)鍵監(jiān)管作用[28],同時(shí)參與β淀粉樣蛋白的破壞[29],與ApoE基因互作[30],對(duì)阿爾茨海默氏病具有積極的作用[31]。這4個(gè)基因均尚未有與血液性狀相關(guān)的報(bào)道,因而需要進(jìn)一步研究。
4結(jié)論
本研究測(cè)定了白色杜洛克×二花臉豬資源家系F2群體1 149個(gè)個(gè)體的18種血常規(guī)性狀,進(jìn)行了1 020頭F2個(gè)體的60K SNP芯片分型和593頭F2個(gè)體的肌肉轉(zhuǎn)錄組測(cè)序,使用回歸模型分析與血細(xì)胞性狀關(guān)聯(lián)的轉(zhuǎn)錄本,得到78個(gè)與血細(xì)胞強(qiáng)相關(guān)的轉(zhuǎn)錄本。用血細(xì)胞性狀強(qiáng)關(guān)聯(lián)的轉(zhuǎn)錄本進(jìn)行eQTL定位,得到122個(gè)eQTLs,其中有9個(gè)順式eQTLs和63個(gè)反式eQTLs。通過(guò)eQTL定位、GWAS和eQTL的綜合分析鑒別到與紅細(xì)胞性狀相關(guān)的基因中TMED9、PCK1 、TINAGL1和SORL1是GWAS和eQTL共有的候選基因。
致謝:江西農(nóng)業(yè)大學(xué)黃路生教授在試驗(yàn)材料和研究思路設(shè)計(jì)方面提供了重要指導(dǎo),在此表示衷心感謝!感謝江西農(nóng)業(yè)大學(xué)省部共建豬遺傳改良與養(yǎng)殖技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室的全體老師和學(xué)生在群體屠宰、樣品采集和統(tǒng)計(jì)分析過(guò)程中提供的幫助。
參考文獻(xiàn)(References):
[1]EVANS D M,F(xiàn)RAZER I H,MARTIN N G.Genetic and environmental causes of variation in basal levels of blood cells[J].TwinRes,1999,2(4):250-257.
[2]CHU Y W,KORB J,SAKAMOTO K M.Idiopathic thrombocytopenic purpura[J].PediatrRev,2000,21(3):95-104.
[3]VAN DER HARST P,ZHANG W,MATEO LEACH I,et al.Seventy-five genetic loci influencing the human red blood cell[J].Nature,2012,492(7429):369-375.
[4]ZHANG Z,HONG Y,GAO J,et al.Genome-wide association study reveals constant and specific loci for hematological traits at three time stages in a White Duroc×Erhualian F2resource population[J].PLoSOne,2013,8(5):e63665.
[5]ZHANG F,ZHANG Z Y,YAN X M,et al.Genome-wide association studies for hematological traits in Chinese Sutai pigs[J].BMCGenet,2014,15:41.
[6]SCHADT E E,MOLONY C,CHUDIN E,et al.Mapping the genetic architecture of gene expression in human liver[J].PLoSBiol,2008,6(5):e107.
[7]CHEN C Y,YANG B,ZENG Z,et al.Genetic dissection of blood lipid traits by integrating genome-wide association study and gene expression profiling in a porcine model[J].BMCGenomics,2013,14:848.
[8]LUO W Z,CHEN S K,CHENG D X,et al.Genome-wide association study of porcine hematological parameters in a Large White×Minzhu F2resource population[J].IntJBiolSci,2012,8(6):870-881.
[9]WANG J Y,LUO Y R,F(xiàn)U W X,et al.Genome-wide association studies for hematological traits in swine[J].AnimGenet,2013,44(1):34-43.
[10]HSU Y H,ZILLIKENS M C,WILSON S G,et al.An integration of genome-wide association study and gene expression profiling to prioritize the discovery of novel susceptibility loci for osteoporosis-related traits[J].PLoSGenet,2010,6(6):e1000977.
[11]ZHONG H,YANG X,KAPLAN L M,et al.Integrating pathway analysis and genetics of gene expression for genome-wide association studies[J].AmJHumGenet,2010,86(4):581-591.
[12]MA J,YANG J,ZHOU L,et al.A splice mutation in the PHKG1 gene causes high glycogen content and low meat quality in pig skeletal muscle[J].PLoSGenet,2014,10(10):e1004710.
[13]GARCIA C K,GOLDSTEIN J L,PATHAK R K,et al.Molecular characterization of a membrane transporter for lactate,pyruvate,and other monocarboxylates:implications for the Cori cycle[J].Cell,1994,76(5):865-873.
[14]COUGHLIN P B,TETAZ T,SALEM H H.Identification and purification of a novel serine proteinase inhibitor[J].JBiolChem,1993,268(13):9541-9547.
[15]GETTINS P G.Serpin structure,mechanism,and function[J].ChemRev,2002,102(12):4751-4804.
[16]SILVERMAN G A,BIRD P I,CARRELL R W,et al.The serpins are an expanding superfamily of structurally similar but functionally diverse proteins.Evolution,mechanism of inhibition,novel functions,and a revised nomenclature[J].JBiolChem,2001,276(36):33293-33296.
[17]POTEMPA J,KORZUS E,TRAVIS J.The serpin superfamily of proteinase inhibitors:structure,function,and regulation[J].JBiolChem,1994,269(23):15957-15960.
[18]OMARY M B,TROWBRIDGE I S,BATTIFORA H A.Human homologue of murine T200 glycoprotein[J].JExpMed,1980,152(4):842-852.
[19]DALCHAU R,KIRKLEY J,F(xiàn)ABRE J W.Monoclonal antibody to a human leukocyte-specific membrane glycoprotein probably homologous to the leukocyte-common (L-C) antigen of the rat[J].EurJImmunol,1980,10(10):737-744.
[20]CHARBONNEAU H,TONKS N K,WALSH K A,et al.The leukocyte common antigen (CD45):a putative receptor-linked protein tyrosine phosphatase[J].ProNatlAcadSciUSA,1988,85(19):7182-7186.
[21]PINGEL J T,THOMAS M L.Evidence that the leukocyte-common antigen is required for antigen-induced T lymphocyte proliferation[J].Cell,1989,58(6):1055-1065.
[22]HUMBERT C,SILBERMANN F,MORAR B,et al.Integrin alpha 8 recessive mutations are responsible for bilateral renal agenesis in humans[J].AmJHumGenet,2014,94(2):288-294.
[23]ROBSON J E,EATON S A,UNDERHILL P,et al.MicroRNAs 296 and 298 are imprinted and part of the GNAS/Gnas cluster and miR-296 targets IKBKE and Tmed9[J].RNA,2012,18(1):135-144.
[24]TILGHMAN S M,HANSON R W,BALLARD F J.Hormonal regulation of phosphoenolpyruvate carboxykinase (GTP) in mammalian tissues[M].In:Hanson R W,Mehlman M A(eds).Gluconeogenesis:Its Regulation in Mammalian Species Rw Hanson & MA Mehlman.Wiley,New York,1976:47-91.
[25]BEALE E G,HAMMER R E,ANTOINE B,et al.Disregulated glyceroneogenesis:PCK1 as a candidate diabetes and obesity gene[J].TrendsEndocrinolMetab,2004,15(3):129-135.
[26]DUPLUS E,BENELLI C,REIS A F,et al.Expression of phosphoenolpyruvate carboxykinase gene in human adipose tissue:induction by rosiglitazone and genetic analyses of the adipocyte-specific region of the promoter in type 2 diabetes[J].Biochimie,2003,85(12):1257-1264.
[27]MUKAI K,MITANI F,NAGASAWA H,et al.An inverse correlation between expression of a preprocathepsin B-related protein with cysteine-rich sequences and steroid 11β-hydroxylase in adrenocortical cells[J].JBiolChem,2003,278(19):17084-17092.
[28]ANDERSEN O M,REICHE J,SCHMIDT V,et al.Neuronal sorting protein-related receptor sorLA/LR11 regulates processing of the amyloid precursor protein[J].ProcNatlAcadSciUSA,2005,102(38):13461-13466.
[29]CAGLAYAN S,TAKAGI-NIIDOME S,LIAO F,et al.Lysosomal sorting of amyloid-β by the SORLA receptor is impaired by a familial Alzheimer’s disease mutation[J].SciTranslMed,2014,6(223):223ra20.
[30]YIN R H,YU J T,TAN L.The role of SORL1 in Alzheimer’s disease[J].MolNeurobiol,2015,51(3):909-918.
[31]ROGAEVA E,MENG Y,LEE J H,et al.The neuronal sortilin-related receptor SORL1 is genetically associated with Alzheimer disease[J].NatGenet,2007,39(2):168-177.
(編輯郭云雁)
A Systems Genetics Study of Hematological Traits in a White Duroc × Erhualian Pigs F2Resource Population
XU Pan,ZHANG Zhen,CUI Lei-lei,YANG Bin,DUAN Yan-yu*
(StateKeyLaboratoryforPigGeneticImprovementandProductionTechnology,JiangxiAgriculturalUniversity,Nanchang330045,China)
Key words:pig;hematological traits;muscle;expression quantitative trait loci;genome-wide association study;candidate gene
Abstract:To dissect the hereditary basis for hematological traits,we integrated the results of genome-wide association study and muscle expression quantitative loci(eQTL) analysis to identify the candidate genes in a White Duroc×Erhualian pigs F2resource population on the basis of systems genetics.In this study,the 18 hematological parameters of 1 149 pigs were measured and the expressed transcripts of muscles in 593 pigs were detected,1 020 individuals were genotyped.The correlations between gene expressions and phenotypic data were evaluated using Spearman correlation coefficient.Those eQTL were identified by aligning the related transcripts with the pig reference genome and their ontology enrichment were also implemented.We also performed the integrated analysis by incorporating eQTL information into our blood-based GWAS data.In this study,122 eQTLs were identified including 9 cis-eQTLs and 63 trans-eQTLs with a conservative thresholdP<5×10-4.Of them,SERPINB6 was an identified candidate gene by eQTL.PTPRCandITGA8 were prioritized as candidate genes by gene ontology enrichment analysis.TMED9,PCK1,TINAGL1 andSORL1 were highlighted as the most promising candidate genes by integrative eQTL and GWAS analysis.We identified 7 novel candidate genes by integrating the previous blood-based genome-wide association study and muscle gene expression profiles analysis.PCK1,TMED9,TINAGL1 andSORL1 shared the association signals of GWAS and eQTL.
doi:10.11843/j.issn.0366-6964.2016.02.004
收稿日期:2015-02-16
基金項(xiàng)目:國(guó)家高技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)(2013AA102502);江西省科技廳科技支撐項(xiàng)目(2009BNA06900)
作者簡(jiǎn)介:徐盼(1988-),男,江蘇南京人,博士生,主要從事動(dòng)物遺傳育種研究,E-mail:panxu_nj@hotmail.com *通信作者:段艷宇,博士,講師,Tel/Fax:0791-83813080,E-mail:yanyuduan@hotmail.com
中圖分類(lèi)號(hào):S828;S813.3
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):0366-6964(2016)02-0232-09