郭亞東,王文權(quán),孟乾,徐大鳳,李雪燕,于雯雯*
(1.如東縣漁政監(jiān)督大隊,江蘇 南通 226241;2.江蘇省海洋水產(chǎn)研究所,江蘇省魚類遺傳育種重點實驗室,江蘇 南通 226007;3.煙臺市芝罘區(qū)現(xiàn)代海洋產(chǎn)業(yè)發(fā)展促進中心,山東 煙臺 264001)
對目標(biāo)性狀關(guān)聯(lián)基因進行篩選和定位,是水產(chǎn)動物遺傳育種研究的前提和基礎(chǔ)。傳統(tǒng)的基因定位方法,需要對整個遺傳群體進行多態(tài)性標(biāo)記分析,成本較高?;旌戏蛛x分析法(Bulked segregant analysis, BSA),是根據(jù)研究的目的性狀,從子代分離群體中,選取2 組表型差異的極端個體,分別等量混合構(gòu)建DNA 池,進行標(biāo)記差異分析,2 池間的DNA 差異片段即為候選區(qū)域。該方法可以相對較低的成本,快速檢測分子標(biāo)記與目標(biāo)性狀的關(guān)聯(lián),常被用于生物體極端性狀相關(guān)基因的定位與挖掘[1]。
BSA 技術(shù)最早由Michelmore 等[2],于1991年應(yīng)用于萵苣抗霜霉病基因相關(guān)標(biāo)記的篩選,成功獲得3 個與霜霉病抗性基因Dm5/8 緊密連鎖的RAPD標(biāo)記。BSA 法在農(nóng)作物基因篩選與定位中應(yīng)用最為普遍[3],在畜禽[4]、林木[5]、水產(chǎn)動物[6]研究中,也顯示出巨大的應(yīng)用潛力和發(fā)展前景。隨著分子標(biāo)記技術(shù)和近10年來新一代測序(NGS)技術(shù)的發(fā)展,BSA 方法和技術(shù)體系也逐漸得到發(fā)展和完善。與此同時,不斷降低的測序成本加速了基于NGS 的BSA 在水產(chǎn)中的應(yīng)用?,F(xiàn)對BSA 技術(shù)在水產(chǎn)動物方面的應(yīng)用研究,特別是基于測序的BSA 方法在基因定位上最新研究進展進行綜述。
BSA 技術(shù)的進步,依賴于分子標(biāo)記技術(shù)的發(fā)展。在測序成本大幅降低之前,BSA 方法主要采用傳統(tǒng)分子標(biāo)記技術(shù),如限制性片段長度多態(tài)性(RFLP)、隨機擴增多態(tài)性DNA(RAPD)、簡單序列重復(fù)(SSR)、擴增片段長度多態(tài)性(AFLP)等。
1999年,Palti 等[7]首次將BSA 方法用于水產(chǎn)動物目標(biāo)基因篩選,利用抗傳染性造血器官壞死?。↖HN)的切喉鱒(Oncorhynchus clarki)與虹鱒(Oncorhynchus mykiss),雜交獲得16 個全同胞雜交家系,這些家系在受IHN 病毒攻擊后,收集易感群體和耐受群體,采用RFLP 標(biāo)記技術(shù)和BSA 方法,獲得33 個差異性位點。此后,BSA 被廣泛應(yīng)用于水產(chǎn)動物目標(biāo)基因的篩選與定位研究,尤其是在性別研究領(lǐng)域。Felip 等[8]利用BSA-AFLP 法,在虹鱒中篩選出19 對與性別相關(guān)的AFLP 引物,并將其中15 個轉(zhuǎn)化為特異性序列擴增(SCAR)標(biāo)記,其中1個標(biāo)記被成功定位于Y 染色體的性位點附近。Lee等[9-10]采用BSA 方法,從尼羅羅非魚(Oreochromis niloticus)中分別獲得了與性別相關(guān)的8 個SSR 標(biāo)記和3 個AFLP 標(biāo)記。此外,BSA 法結(jié)合傳統(tǒng)分子標(biāo)記技術(shù),還被應(yīng)用于日本對蝦(Penaeus japonicus)[11]、斑節(jié)對蝦(Penaeus monodon)[12]、巨骨舌魚(Arapaima gigas)[13]性別基因相關(guān)研究中。BSA 法在貝類殼色和魚類耐溫、蝦類生長相關(guān)研究中,也取得一些進展。Qin 等[14]通過將橙殼色與白殼色海灣扇貝(Argopecten irradians)雜交,獲得F1 代分離群體,采用BSAAFLP 方法,篩選出6 個與殼色顯著相關(guān)的標(biāo)記,這6 個標(biāo)記全部位于同一個連鎖群,且其中一個標(biāo)記(F1f335)與橙殼基因完全連鎖。Ge 等[15]采用BSA法,在太平洋牡蠣(Crassostrea gigas)中篩選出7 個與殼色緊密相關(guān)的多態(tài)性AFLP 片段,成功開發(fā)了1 個共顯性SCAR 標(biāo)記,并將其整合到先前構(gòu)建的連鎖圖譜中。Chen 等[16]使用BSA 方法,篩選和鑒定了與大黃魚(Larimichthys crocea)耐熱性相關(guān)的4 個SSR 擴增片段,這些片段被克隆和測序后,顯示核心序列都是“AC”重復(fù)。袁晨浩[17]也采用BSA-SSR 技術(shù),在紅鰭東方鲀(Takifugu rubripes)耐低溫和不耐低溫群體間,篩選出3 個有顯著差異的擴增片段。在生長性狀相關(guān)基因的研究方面,He 等[18]采用BSA方法,結(jié)合RAPD 技術(shù),篩選與中國對蝦(Fenneropenaeus chinensis)生長性狀相關(guān)的候選標(biāo)記,獲得了9 個與生長性狀相關(guān)的RAPD 標(biāo)記,其中包括7 個正相關(guān)和2 個負(fù)相關(guān),并最終轉(zhuǎn)化獲得2 個差異性的SCAR 標(biāo)記。隨著NGS 技術(shù)的發(fā)展,傳統(tǒng)分子標(biāo)記技術(shù)逐漸被邊緣化,基于傳統(tǒng)分子標(biāo)記技術(shù)BSA在水產(chǎn)動物基因定位中,也逐漸被淘汰。
隨著NGS 技術(shù)的研究進展,使得通過轉(zhuǎn)錄組測序(RNA-seq)分析,可以在轉(zhuǎn)錄組水平上快速、全面的了解變異,將BSA 與RNA-seq 相結(jié)合的綜合技術(shù)方案又被稱為BSR(Bulked segregant RNAseq),將對基因表達(dá)和基因定位的研究相結(jié)合,通過檢測單核苷酸多態(tài)性(SNP)和計算基因頻率,尋找控制不同性狀的關(guān)鍵基因[19]。
BSR 技術(shù)于2012年在植物研究中被較早報道[20-21]。2013年,Wang 等[22]較早將BSR 技術(shù)應(yīng)用于水產(chǎn)動物基因研究,篩選(Ictalurus sp.)腸道敗血癥(ESC)抗病相關(guān)基因,在易感魚和抗性魚中,分別鑒定出1 240 和224 個基因于ESC 感染后差異表達(dá),獲得17 個可能與抗病相關(guān)的候選基因。該研究認(rèn)為,BSR 技術(shù)較基因芯片分析技術(shù)更加靈敏、成本更低,尤其適用于對各種表型性狀相關(guān)基因進行分析。Dai 等[23]使用剩余采食量(RFI)作為飼料效率的衡量標(biāo)準(zhǔn),通過BSR 分析,獲得11 026 個在凡納濱對蝦(Litopenaeus vannamei)高效和低效集群之間表現(xiàn)出顯著等位基因失衡的SNP 標(biāo)記,其中568 個標(biāo)記位于差異表達(dá)基因中。Wang 等[24]在凡納濱對蝦Zoea I 幼體階段,獲得了60 個雌性和雄性之間的差異表達(dá)基因,注釋了其中41 個基因,并最終獲得了2 個與性別完全連鎖的基因,這2 個基因可能位于凡納濱對蝦的性別決定區(qū)域。Liu 等[25]利用基于基因組和遺傳連鎖群的BSR 分析,將卵形鯧鲹(Trachinotus blochii)的耐缺氧相關(guān)SNPs,定位于18 和22 號連鎖群,并在肝臟中獲得17 個差異表達(dá)基因。對這些基因的注釋分析表明,葡萄糖和脂質(zhì)代謝的平衡,在魚類缺氧耐受性中起著關(guān)鍵作用。2019年,Wan 等[26]將BSR 與GWAS 分析方法相結(jié)合,在大黃魚中發(fā)現(xiàn)了IL10、THBS1、IGSF21 等9 個抗香魚假單胞菌(Pseudomonas plecoglossicida)感染的基因,獲得了5 個可以解釋56.6%的遺傳變異的SNP 標(biāo)記。上述研究表明,借助BSR 與GWAS 方法,分別在轉(zhuǎn)錄組和基因組水平鑒定候選基因,可以有效提高候選基因篩選的準(zhǔn)確性。
隨著NGS 成本的不斷降低以及第三代測序(PacBio 或Nanopore 測序)和Hi-C 技術(shù)的廣泛應(yīng)用,主要水產(chǎn)養(yǎng)殖動物全基因組測序均已完成[27],為表型性狀相關(guān)基因的篩選和定位提供了極大的便利。盡管測序成本大幅下降,但在種群規(guī)模上,對每個個體的基因組重測序進行遺傳分析,仍然局限于少數(shù)模式物種。采用BSA 方法,從2 個具有相對性狀的群體中,構(gòu)建DNA 混合池,進行混池測序(Poolseq),可大幅降低測序成本,且可無偏地從大量個體中確定全基因組等位基因頻率[28],快速檢測和注釋與性狀相關(guān)的基因位點,是一種經(jīng)濟高效的方法,適合在表型性狀明顯分離的群體中定位相關(guān)基因。
2019年,Wan 等[29]采用全基因組重測序和BSA方法,鑒定了與團頭魴(Megalobrama amblycephala)肌間刺(IB)數(shù)相關(guān)的SNP。分別在6 號和11 號染色體,獲得了2 個SNP 富集區(qū)域,使用52 個SNP 進行數(shù)據(jù)可靠性驗證,其中5 個SNP 與IB 數(shù)性狀顯著相關(guān)。Cui 等[6]也采用此方法獲得了3 個與IB 數(shù)量顯著相關(guān)的SNP,這些標(biāo)記有效提高了IB 性狀的表型解釋率,對鯉標(biāo)記輔助選擇育種具有重要意義。在基因組數(shù)據(jù)的基礎(chǔ)上,將BSA 法與其他基因定位方法相結(jié)合或采用多種BSA 算法聯(lián)合分析,可有效提高基因定位精度。Luo 等[30]在基因組重測序基礎(chǔ)上,通過BSA 結(jié)合全基因組關(guān)聯(lián)分析(GWAS),在轉(zhuǎn)基因黃河鯉(Cyprinus carpio L)中,從最初篩選出的含48 個SNP 標(biāo)記的23 個生長相關(guān)候選基因中,成功鑒定了2 個生長相關(guān)基因。Zhang 等[31]收集了37 個黃姑魚(Nibea albiflora)紅頭病易感和抗病群體的樣本,進行Pool-seq 測序后,采用χ2檢驗、logit 回歸分析和G'值算法3 種BSA 算法聯(lián)合分析,將抗紅頭病基因定位在22 號染色體上10.90~13.11 Mb。通過功能基因注釋,在該區(qū)域發(fā)現(xiàn)了12 個參與免疫反應(yīng)的基因,主要基因均存在于NF-κB 信號通路,提示該信號通路可能在紅頭病抗性中起重要作用。
隨著NGS 技術(shù)的發(fā)展,基于測序的BSA 技術(shù),在許多物種檢測中得以應(yīng)用,大大減少了整體測序量和數(shù)據(jù)分析的工作量,該技術(shù)不僅提高了性狀相關(guān)基因的檢測效率,而且降低了測序成本,成為目前較為流行的基因定位方法。該技術(shù)也存在不足之處,如無法精細(xì)定位基因的區(qū)間,比較適合于質(zhì)量性狀基因定位。對于數(shù)量性狀位點(QTL)來說,只能對其主效的QTL 進行標(biāo)記定位,對于微效QTL 則無能為力,而且靈敏度和精確度要低于其他的QTL 定位方法。所以在數(shù)量性狀基因定位方面,BSA 法應(yīng)用較少,主要集中在抗性性狀相關(guān)基因方面。目前大多數(shù)與BSA 相關(guān)的報告,僅提供性狀的初始定位結(jié)果,通常具有幾兆的堿基的分辨率。因此,如何在BSA 作圖的基礎(chǔ)上精細(xì)作圖,尤其是提高數(shù)量性狀相關(guān)基因定位精度,可采取以下策略進一步提高定位精度。
(1)增加具有極端表型的分離群體的大小,水產(chǎn)動物一般繁殖能力較強,適當(dāng)擴大群體規(guī)模,可以覆蓋更多的重組體,從而提高重組熱點區(qū)域的定位分辨率。
(2)采用BSA 方法進行初級作圖,得到一個峰相對較高(可靠性高)的作圖區(qū)間,設(shè)計一個均勻分布的基于SNP 的競爭性等位基因特異性PCR(KASP)標(biāo)記,或裂解擴增多態(tài)性序列(CAPS),從不包含在極端池中個體的分離群體中,隨機選擇數(shù)百個體進行基因分型,構(gòu)建目標(biāo)區(qū)間的遺傳圖譜和QTL 圖譜[32]。
(3)將BSA 與多組學(xué)相結(jié)合,也是實現(xiàn)精細(xì)定位和候選基因篩選的有力策略。例如,BSA 和轉(zhuǎn)錄組分析聯(lián)合,進行共定位,在定位區(qū)間內(nèi)的差異表達(dá)分析,有利于候選基因篩選[33];BSA 結(jié)合自然種群的GWAS 分析,能提高定位精度[34]。
(4)采用合適的算法或多種算法聯(lián)合分析。歐氏距離法(ED)、SNP-index 法和G' 值法是目前常用的幾種定位算法。ED 法無須雙親基因信息,但高度依賴遺傳分離群體(如,雙親雜合度高的F1 群體),適合對水產(chǎn)動物進行基因定位,但易產(chǎn)生假陽性;SNP-index 法得到的定位區(qū)間較大,但顯著性較低,對數(shù)量性狀基因定位的敏感度較低;G'值法具有較低的假陽性率,定位精度也更高,但不具備校正其他干擾因素的能力[35]。綜合采用多種算法進行基因定位,也可有效提高定位精度[31]。
隨著越來越多的水產(chǎn)動物全基因組測序完成,以及相關(guān)算法和軟件的逐步完善,采用BSA 方法進行基因定位的精度和準(zhǔn)確性,都會有很大提高,在水產(chǎn)動物性別、體色、抗性、生長等性狀相關(guān)基因精細(xì)定位中的重要性,將日益凸顯,成為水產(chǎn)動物遺傳育種研究的重要工具。