樊慶燦,王金玉,王文浩
(1.宜春學院生命科學與資源環(huán)境學院,江西宜春 336000;2.揚州大學動物科技學院,江蘇揚州 225009)
優(yōu)質黃羽肉雞以肉質鮮美、營養(yǎng)豐富、適應性廣和抗病力強等優(yōu)點聞名于世,肉質性狀改良一直是育種工作者孜孜不倦的追求,但由于肉質性狀指標難以確定,而且每個人口味有一定差距,選擇有很大的難度。肉質性狀中肌肉蛋白、脂肪和肌苷酸含量是肉質性狀選擇中極為重要的3 個指標,影響著黃羽肉雞的營養(yǎng)和口味,相關單核苷酸多態(tài)性(Single Nucleotide Polymorphisms,SNPs)和候選基因的研究一直是研究的重點,也獲得了一些有關這些指標的候選基因,如FUNAAB[1]、ACOT13[2]和KLF6[3]等。隨著全基因組關聯(lián)分析(Genome-wide Association Study,GWAS)的興起,雞肉質性狀的GWAS 也獲得了一些成果,篩選出一批影響肌肉脂肪和蛋白等的SNPs、miRNA、長鏈非編碼RNA(LncRNA)和候選基因[4-6]。由于雞肉質性狀比較多,且每個性狀均是受多基因控制的數(shù)量性狀,加上品種、飼養(yǎng)環(huán)境、營養(yǎng)狀況、飼養(yǎng)時間的差異,GWAS 篩選到的位點和基因往往在其他品種中并不顯著,需要對這些位點進行驗證,才能為肉質性狀的選擇提供幫助。本研究根據(jù)Liu 等[5]研究結果,篩選出16個可能影響肉質性狀的SNPs,分別與200 個京海黃雞肌肉中的脂肪、蛋白和肌苷酸含量進行關聯(lián)分析,篩選影響肉質指標的遺傳標記,探討相關的基因功能。同時,根據(jù)顯著位點對所有個體進行個體評定,為實驗群體相關性狀的選擇提供參考。
1.1 篩選多態(tài)位點 根據(jù)Liu 等[5]篩選的影響肉質性狀的GWAS 結果,選取與屠宰肉質性狀達到基因組關聯(lián)顯著并在數(shù)據(jù)庫中有明確基因注釋的16 個SNPs 作為分子標記,與京海黃雞肌肉蛋白、脂肪和肌苷酸含量進行關聯(lián)分析,并對它們的位置進行注釋。
1.2 實驗材料 實驗動物為京海黃雞母雞,飼養(yǎng)于江蘇省南通市京海黃雞純種廠。整個群體按照飼養(yǎng)標準進行飼養(yǎng),實驗過程中未發(fā)生重大疾病,整體健康狀況較好。16 周齡時屠宰,采集全血、胸肌樣和腿樣。利用Ezup柱式血液基因組抽提試劑盒(上海生工生物工程技術服務有限公司)提取基因組DNA,并進行純度檢測,1%凝膠電泳無拖帶,OD260/OD280值在1.7~1.8,檢測合格后進行Illumina 雞60K SNP 芯片(GPL18807)分型鑒定。使用全自動脂肪抽提儀測量胸肌脂肪(FBM)和腿肌脂肪(FLM),全自動定氮儀測量胸肌蛋白(PBM)和腿肌蛋白(PLM),高效液相色譜分析儀測量胸肌肌苷酸(IBM)和腿肌肌苷酸(ILM)。
1.3 關聯(lián)分析及相關軟件 表型數(shù)據(jù)的整理使用Excel 2016,SPSS 22.0進行性狀間皮爾森關聯(lián)分析,利用R 3.60進行性狀間的關聯(lián)作圖。利用Plink 1.07 進行分型數(shù)據(jù)與表型數(shù)據(jù)的線性回歸分析、顯著位點的連鎖不平衡分析和個體評分,在關聯(lián)分析前用Plink 將表型數(shù)據(jù)進行標準化,獲得標準回歸系數(shù)。線性回歸分析模型如下:
Y=b+b1X1+b2X2+b3X1×X2+e
其中,X1為加性效應值,X2為顯性效應值,X1×X2為顯性效應和加性效應的互作效應值,e 是隨機效應值。本文中計算等位基因效應值指的是加性效應值。根據(jù)模型的標準回歸系數(shù)和個體基因型,計算個體指定性狀的得分,統(tǒng)計個體選擇性狀的所有得分。
根據(jù)歐洲生物信息研究所EMBL 數(shù)據(jù)庫(http://asia.ensembl.org/index.html)中提供的數(shù)據(jù)查找距離顯著位點最近的基因。美國國立生物技術信息中心NCBI數(shù)據(jù)庫(https://www.ncbi.nlm.nih.gov/)查找基因功能和相關文獻,在加利福利亞大學UCSC 數(shù)據(jù)庫(http://genome.ucsc.edu/cgi-bin/hgGateway?redirect=manual&source=genome.ucsc.edu)進行LncRNA 基因cDNA 的序列比對。
2.1 關聯(lián)分析的SNPs 由表1 可知,篩選到的16 個SNPs 其中8 個位于3 號染色體上,2 號和4 號染色體分別有2 個,另外4 個分別位于1 號、5 號、17 號和23 號染色體上。
2.2 性狀間的相關性 由圖1 可知,圖中圓點位置表示個體表型值的分布,圓點分布越趨于直線,表明關聯(lián)性越強。皮爾森相關分析發(fā)現(xiàn)FBM 和FLM 之間關聯(lián)不顯著,但FLM 比FBM 數(shù)值大,腿肌中脂肪含量較高。PBM 和PLM 的關聯(lián)分析發(fā)現(xiàn)二者極顯著相關,分布較為集中,不隨其他性狀的變化而變化。IBM 和ILM 二者之間關聯(lián)極顯著,F(xiàn)LM 和IBM、PBM 和IBM 間也存在極顯著相關。
2.3 關聯(lián)分系及相關基因 由表2 可知,共發(fā)現(xiàn)4 個SNPs與4 個指標關聯(lián)顯著,分別分布在1 號、3 號和4 號(2個)染色體上。1 號染色體上的rs13964189 與PBM 關聯(lián)顯著,且等位基因C 頻率為0.28,是正效應。3 號染色體上的rs14366948 與ILM 關聯(lián)顯著,等位基因G 基因頻率為0.4,是負效應。位于4 號染色體上的rs15619099和rs1643656,最小等位基因為A 和G,分別對PLM 和IBM 產生負效應和正效應,且二者之間并無明顯的連鎖不平衡現(xiàn)象(R2=0.05)。
表1 SNP 位點的位置
由表3 可知,4 個基因中的2 個為LncRNA,EMBL序列號為ENSGALG00000053546和ENSGALG000000 52764,顯著位點位于基因上下游。但ENSGALG00000 053546位于rs14366948 的下游14.4 Mb 處。另外2 個編碼基因分別為DACH1和LDB2基因,SNPs 都位于基因的內含子中。
表2 顯著關聯(lián)的多態(tài)位點和性狀
表3 SNPs 相關基因及注釋
2.4 個體評價 根據(jù)線性回歸模型原理,標準回歸系數(shù)的正負代表正負效應,大小可以表示自變量對應變量的效應大小,因此可以將回歸模型中的標準回歸系數(shù)設為等位基因效應值,若個體基因型為純合型,分值為2 倍的標準回歸系數(shù)。采用這種方法計算效應SNPs 位點和對應性狀的得分,可以對目標性狀進行標記輔助選育。本研究利用篩選的4 個顯著位點進行京海黃雞個體評定,為京海黃雞的肌肉蛋白含量和肌苷酸含量的選育提供參考。
3.1 關聯(lián)顯著的SNPs 和性狀 研究發(fā)現(xiàn)16 個SNPs 中的4 個分別與肌肉蛋白和肌苷酸關聯(lián)顯著,并未發(fā)現(xiàn)與脂肪性狀關聯(lián)顯著的SNPs。與Liu 等[5]的GWAS 實驗結果相比有差異,原因可能是品種的差異和分析方法的差別,另外研究設計的指標容易被一些背景因素影響,如個體間的營養(yǎng)、飼養(yǎng)環(huán)境、健康狀況差異等,這些因素會導致個體間存在個體差異,混淆結果。因此應該對篩選到的SNPs 和基因進行多品種多層次的驗證。本研究篩選的SNPs 就是重復驗證后獲得的,具有較好的參考意義。
3.2 顯著SNPs 分布及相關基因分析 顯著影響黃羽肉雞PBM 的rs13964189 位于1 號染色體上161 Mb 附近,雞該區(qū)域的功能研究較少,但有研究發(fā)現(xiàn)該區(qū)域染色體上的SNPs 與雞的多個屠宰性狀關聯(lián)顯著[7]。rs13964189 是編碼基因DACH1的內含子多態(tài)位點。內含子是非編碼序列,位于外顯子間,但研究表明,內含子內的序列通過可變剪切調節(jié)基因的表達,是轉錄后調控的重要組成部分[8]。DACH1 是一種核蛋白,通過直接結合特定的DNA 序列或與其他轉錄因子相互作用,調節(jié)靶基因表達[9]。研究表明,DACH1 能夠阻斷wnt、轉化生長因子β、細胞周期蛋白d1 和雌激素受體α的信號傳導,并以p53 依賴的方式阻斷了adc 細胞的生長并增強了細胞周期停滯[10-11]。由此可見,該基因多方面參與細胞生長和動物生長發(fā)育的調節(jié)。有研究表明,DACH1基因能夠影響雞的脛長和脛重[7]。
rs14366948 位于3 號染色體65 Mb 附近,有研究發(fā)現(xiàn)該區(qū)域附近SNPs 與黃羽肉雞的全凈膛重關聯(lián)顯著[12]。該位點為基因間隔序列內的多態(tài)位點,距離ENSGALG00000053546 基因14.4 Mb。該基因與ENS GALG00000052764 均為LncRNA。LncRNA 為含有200 個以上核苷酸的RNA 轉錄物[13],參與了X 染色體沉默,基因組印記以及染色質修飾、轉錄激活、轉錄干擾和核內運輸?shù)榷喾N重要的調控過程,從多個層面上參與了細胞分化和個體發(fā)生的調節(jié)[14],是轉錄后調控中重要的一環(huán)。LncRNA 在醫(yī)學上研究相對較多,并有完善的數(shù)據(jù)庫,但有關雞的LncRNA 功能研究報道較少,本實驗篩選到的2 個相關LncRNA 的功能未見報道,序列比對也未發(fā)現(xiàn)相關研究。
rs15619099 和rs16436561 均位于4 號染色體上的78~79 Mb 的區(qū)域內,多次研究發(fā)現(xiàn)該區(qū)域內的SNPs與雞的生長性狀和屠宰性狀關聯(lián)顯著[12,15],并顯著影響牛、馬等多種動物的生長性狀[16-17]。rs16436561 位于LDB2(LIM Domain Binding 2)的內含子中,LDB2是基因結構域結合蛋白,是一種蛋白質輔因子,參與組成神經系統(tǒng)和造血系統(tǒng)在內的多蛋白復合物[18]。LDB作為核接頭與轉錄因子形成四聚體、六聚體或其他高階蛋白質復合物,從而實現(xiàn)其功能[19]。該基因參與胚胎時期血管形成和腦的發(fā)育過程[20]。研究發(fā)現(xiàn),LDB2 內的SNPs 與雞的生長性狀關聯(lián)顯著[21-22]。
本研究利用已發(fā)表的關聯(lián)分析結果篩選肉質性狀SNPs,并與京海黃雞的肌肉脂肪、蛋白和肌苷酸含量進行關聯(lián),結果發(fā)現(xiàn)了4 個SNPs 分別與PBM、PLM、IBM 和ILM 關聯(lián)顯著,4 個相關基因中2 個為具有轉錄調節(jié)作用的LncRNA,另外2 個為核蛋白DACH1 和結構域結合蛋白LDB2,兩者均能參與基因的表達調節(jié)。本研究利用4 個顯著位點分別進行性狀的個體評分,為實驗群體目標性狀的選育提供參考。