萬九生 李 靜 陳 超 鄧衛(wèi)東 岳 銳 徐 虎 黎立光
全基因組關聯(lián)分析(GWAS)是一種在關聯(lián)分析的基礎上利用群體的連鎖不平衡,對全基因組范圍內的遺傳標記進行檢測,以定位影響表型性狀的遺傳因素的分析方法。隨著二代基因組測序技術不斷發(fā)展更新,測序費用逐步降低,為畜禽高密度芯片的開發(fā)以及全基因組重測序的應用奠定了基礎。
全基因組關聯(lián)分析(GWAS)是最早研究復雜性狀和疾病遺傳變異的有效方法,其核心是研究分子變異和目標表型性狀之間的關聯(lián)。尤其是近幾年來隨著高通量測序和高分辨的代謝檢測技術的不斷發(fā)展,以及多種生物信息學技術和統(tǒng)計學方法發(fā)展,這些為復雜性狀基因變異的精細定位提供基礎。2005 年,Science雜志首次報道了年齡相關性視網膜黃斑變性GWAS結果,在醫(yī)學界和遺傳學界引起了極大的轟動,此后一系列GWAS 陸續(xù)展開。2006 年,波士頓大學醫(yī)學院聯(lián)合哈佛大學等多個研究機構報道了基于佛明翰心臟研究樣本關于肥胖的GWAS 結果,已經陸續(xù)報道了關于人類身高、體重、血壓等主要性狀,以及視網膜黃斑、乳腺癌、前列腺癌、白血病、冠心病、肥胖癥、糖尿病、精神分裂癥、風濕性關節(jié)炎等幾十種威脅人類健康的常見疾病的GWAS結果,累計發(fā)表了近萬篇論文,確定了一系列疾病發(fā)病的致病基因、相關基因、易感區(qū)域和SNP 變異。此外,復雜疾病GWAS方法學(如研究設計、統(tǒng)計分析、結果的解釋)也取得了極大的進步,因此稱為“GWAS第一次浪潮”。
同時,動、植物中重要的經濟性狀、農藝性狀關聯(lián)分析也已經大量開展。利用GWAS 開展對豬、牛、羊、雞等動物經濟性狀的研究,集中在繁殖性能、生長發(fā)育、免疫力等方面。例如:豬生長性狀的GWAS 分析發(fā)現(xiàn),在對杜洛克豬進行采食行為(日采食量、日采食次數(shù)、日采食總時間)的全基因組關聯(lián)分析中,鑒定到SSC14 上的MW4 基因與日采食次數(shù)具有較強的關聯(lián),同時發(fā)現(xiàn)促進多肽分泌等基因與采食行為極顯著相關。繁殖性狀GWAS的研究發(fā)現(xiàn)。趙科偉等人以白色杜洛克X二花臉的F2 資源家系群體為研究對象,開展了GWAS 研究,檢測到與了右側和左側附睪重、左側睪丸重、精子密度以及總精子數(shù)等性狀顯著相關的5 個SNP 位點。第一篇關于雞的GWAS 的研究報道是利用兩個F2 群體的全基因組30000 個SNP,分別發(fā)現(xiàn)15 個和24 個與腹脂性狀顯著相關的標記。
傳統(tǒng)遺傳育種中,犬的品種改良和行為性狀選育工作主要是觀察后代的表型,通過表型差異進行選育。自從分子生物技術手段在動物遺傳育種中的研究和實踐中得到廣泛使用以來,已在很多經濟動物上發(fā)現(xiàn)了決定其重要經濟性狀的主效基因和連鎖分子標記,極大地促進了動物育種工作的開展。隨著犬基因組測序完成和大量分子標記和基因的定位完成,以分子標記輔助選擇技術為解決犬形態(tài)性狀的遺傳改良提供了新的方向和手段。
基于全基因組關聯(lián)分析(GWAS)技術在闡明自然群體物種復雜性狀形成的強大優(yōu)勢,借助機器學習算法開展分析處理,結合家犬測序大數(shù)據(jù),通過犬的表型數(shù)據(jù)進行全基因組關聯(lián)分析,挖掘與犬生長發(fā)育、體型外貌、行為性狀相關等的候選基因,獲得調控重要性狀分子標記,進而以分子標記輔助選擇技術為犬進行育種改良。
Parker 等人于2009 在Science 雜志上報道,通過多個具有矮腿性狀和不具有矮腿性狀的家犬品系的基因組多態(tài)位點關聯(lián)分析發(fā)現(xiàn)了影響身體大小的附效基因——纖維原細胞生長因子4(FGF4)反轉座基因,發(fā)現(xiàn)所有家犬矮腿品系的18 號染色體上均有一個FGF4 反轉座基因的插入,而非矮腿品系家犬均沒有這段插入。通過全基因組關聯(lián)分析發(fā)現(xiàn)纖維細胞生長因子4(FGF4)基因在軟骨細胞中的特異表達決定了短肢性狀及骨頭的長寬比例,該基因的表達與軟骨發(fā)育不良密切相關,軟骨發(fā)育不良是一種腿短的表型,可定義至少19 個犬種,包括臘腸犬、柯基犬和貝塞獵犬(如圖1)。
圖1
Cadieu 等人通過對來自80 個不同品種的超過1000 頭家犬進行全基因組關聯(lián)分析(GWAS),鑒定到了分別與皮毛的生長模式、毛長和卷曲3 個性狀相關的3 個基因,即RSPO2、FGF5 和KRT71。僅僅考慮這3 個基因的基因型,便可以解釋80%家犬中皮毛的生長模式、毛長和卷曲的性狀差異。在家犬中許多看起來差異很大的被毛表型,均是由這3 個基因組的相應基因型的不同組合所導致的(如圖2)。RSPO2 基因3’端167 個堿基的缺失產生了犬的硬卷毛及長眉、胡須等性狀,F(xiàn)GF5 基因單堿基突變造成第95 位氨基酸由半胱氨酸變成苯丙氨酸,使犬的短毛或硬卷毛性狀被長毛性狀所替代,KRT71 基因第151位氨基酸的異義突變直接影響了犬被毛是卷毛還是直毛。
圖2
隨著全基因組測序技術的不斷發(fā)展,利用全基因組測序揭示選擇和變異下的基因組區(qū)域對形態(tài)的影響已經非常成熟。Jocelyn 等人分析了722頭犬的全基因組序列(WGS),通過選擇性掃描分析和全基因組關聯(lián)分析(GWAS)研究,結果確定了強影響的突變與16 種表型相關。其中影響品種犬身高、體重差異的相關基因有ESR1、IGF1、LCORL、STC2、GHR、IRS4 等。以及作為多基因特征的壽命具有顯著相關性:LCORL、HMGA2、IGF1 和CFA26基因座。同時證實了與先前報道一致的家犬體重與壽命之間的相關性:大型品種犬(平均體重>30 kg)平均壽命較短(約8~10 年),而小微型和寵物犬品種(平均體重<10kg),其壽命可到18 歲及以上。
借助全基因組關聯(lián)分析(GWAS)技術應用在警犬領域,結合重要警用性狀的表型數(shù)據(jù)進行全基因組關聯(lián)分析,進行全面深入的數(shù)據(jù)探究,挖掘與警用性能性狀相關的候選基因。為全面揭示警犬優(yōu)良警用性能的遺傳機理奠定了基礎。尋找分子標記,確定的相關分子標記可以為下一步深入開展警犬群體遺傳研究提供研究基礎,提高警犬育種的效率,提升警犬品質。提升警犬的裝備配發(fā)數(shù)量與質量,參與反恐維穩(wěn)、處置突發(fā)事件、參與重大活動的安全防范等公安實戰(zhàn)業(yè)務,有效提高警犬的戰(zhàn)斗力。