鄒 杰,彭慧婧,鄭德斌,張守都
( 1.廣西科學(xué)院,廣西 南寧 530000; 2.廣西海洋研究所有限責(zé)任公司,廣西 北海 536000; 3.天津渤海水產(chǎn)研究所,天津 300457; 4.山東省海洋科學(xué)研究院,山東 青島 266000 )
合浦珠母貝(Pinctadafucatassp.martensii),又稱馬氏珠母貝,是我國(guó)培育海水珍珠的主要貝類。廣西為合浦珠母貝主產(chǎn)地和南珠發(fā)源地,近年來(lái),養(yǎng)殖環(huán)境日漸劣化、養(yǎng)殖群體生長(zhǎng)性狀衰退、繁育個(gè)體趨小型化等因素,均限制了南珠產(chǎn)業(yè)的健康可持續(xù)發(fā)展。由于重新選育合浦珠母貝優(yōu)良品種所需成本高、時(shí)間長(zhǎng),為適應(yīng)新的養(yǎng)殖形勢(shì)和環(huán)境變化,需要快速改良廣西合浦珠母貝的種質(zhì)資源,雜交育種是能夠短時(shí)間內(nèi)提升種質(zhì)資源的方式之一。有關(guān)不同地理群體合浦珠母貝雜交研究較多[1-2],其具有一定的雜種優(yōu)勢(shì)[3],但關(guān)于廣西合浦珠母貝地理群體內(nèi)雜交的研究較少。要加快廣西合浦珠母貝群體雜交育種應(yīng)用,首先要了解廣西合浦珠母貝主要群體的遺傳背景。目前廣西合浦珠母貝地理群體內(nèi)經(jīng)人工繁育或選育分化成3個(gè)主要群體:選育群體“海選1號(hào)”、養(yǎng)殖群體和野生繁育群體。選育群體是以廣西潿洲島海域野生群體選育出的優(yōu)質(zhì)新品種,已在廣東和廣西應(yīng)用多年,生長(zhǎng)性狀具有顯著優(yōu)勢(shì)[4];養(yǎng)殖群體則是合浦傳統(tǒng)南珠養(yǎng)殖區(qū)繼代繁育養(yǎng)殖群體,存在一定的抗逆優(yōu)勢(shì);野生群體表型分化較大,遺傳資源可能具有潛在的復(fù)雜多態(tài)性。這3個(gè)分化群體可作為廣西合浦珠母貝群體雜交親本的潛在來(lái)源群。由于長(zhǎng)期混雜養(yǎng)殖,3個(gè)分化群體間理論上存在基因交流,在進(jìn)行雜交育種時(shí)應(yīng)首先掌握選擇親本群體的真實(shí)遺傳分化狀況,分析不同群體的近交水平遺傳分化程度,進(jìn)而提升雜交育種的預(yù)期效果。鑒于遺傳標(biāo)記多態(tài)性可有效分析合浦珠母貝的遺傳差異[5-6],筆者通過(guò)對(duì)3個(gè)群體中的適齡種貝作為樣本進(jìn)行簡(jiǎn)化基因組測(cè)序,通過(guò)單核苷酸多態(tài)標(biāo)記解析3個(gè)樣本群間的遺傳關(guān)系,從一定程度上反映3個(gè)群體的遺傳背景,探索出不同群體間的最佳雜交組合方式,為廣西合浦珠母貝雜交育種中的親本選擇提供參考。
分別從野生群體(F1)、選育群體(“海選1號(hào)”F4)和養(yǎng)殖群體中隨機(jī)挑選15個(gè)2齡種貝,組成3個(gè)樣本群體,分別采集軟體部-80 ℃保存(3個(gè)月內(nèi)),利用1端EcoRⅠ(G^AATTC)和2端NlaⅢ(Hin1Ⅱ,CATG^)進(jìn)行雙酶切,將質(zhì)檢合格的DNA樣品500 ng采用ddRAD建庫(kù)方式構(gòu)建長(zhǎng)度在300~500 bp的雙端測(cè)序文庫(kù),基于Illunima HiSeq 2500高通量測(cè)序。
1.2.1 數(shù)據(jù)質(zhì)控
對(duì)片段測(cè)序得到的原始讀長(zhǎng)進(jìn)行數(shù)據(jù)評(píng)估,得到各個(gè)樣品的原始數(shù)據(jù),通過(guò)堿基質(zhì)量值(Q)進(jìn)行質(zhì)控獲得高質(zhì)量數(shù)據(jù)。
堿基質(zhì)量值(Q)與錯(cuò)誤率(Re)的關(guān)系式為:
Q=-10lgRe
1.2.2 信息分析
將序列讀長(zhǎng)使用BWA比對(duì)到近緣[7]參考物種覆瓦珠母貝(P.imbricata)染色體上(GCA_002216045.1_PinMar1.0),根據(jù)高質(zhì)量數(shù)據(jù)在參考染色體的定位結(jié)果,未掛載上染色體的拼接序列共同作為參考基因組,使用Picard(0.7.17-r1188)的Mark Duplicate工具去除重復(fù),屏蔽PCR重復(fù)數(shù)據(jù)的影響,使用GATK進(jìn)行變異檢測(cè),變異位點(diǎn)質(zhì)量值重新校正,后進(jìn)行測(cè)序深度過(guò)濾,平均測(cè)序深度為5×,最小等位基因頻率為0.05,樣品信息完整度為0.70,變異位點(diǎn)質(zhì)量值Q>30,過(guò)濾獲取可靠變異結(jié)果形成單核苷酸多態(tài)標(biāo)記,用于后續(xù)分析?;趩魏塑账岫鄳B(tài)標(biāo)記,對(duì)序列雙端比對(duì)基因組率超90%個(gè)體,通過(guò)軟件GCTA(1.92.1,http://cnsgenomics.com/software/gcta/#Overview)進(jìn)行主成分分析,得到樣品的主成分,運(yùn)用R軟件繪制主成分分析圖,利用軟件FastTree(2.1.9)中的極大似然法構(gòu)建極大似然進(jìn)化樹;使用軟件PopLDdecay(https://github.com/BGI-shenzhen/PopLDdecay)進(jìn)行連鎖不平衡衰減分析,參數(shù)為:-OutPairLD5;在軟件vcftools(0.1.16)中,參數(shù)設(shè)為以100 kb為一個(gè)滑動(dòng)窗口,10 kb為步長(zhǎng)取一個(gè)區(qū)域,計(jì)算群體在這個(gè)區(qū)域內(nèi)的群體分化指數(shù)(Fst);在R軟件(R包:detectRUNS)中,設(shè)定每一個(gè)滑動(dòng)窗口至少要有20個(gè)單核苷酸多態(tài)標(biāo)記,滑動(dòng)窗口閾值使用默認(rèn)參數(shù)0.05,每一個(gè)滑動(dòng)窗口中允許的相反基因型數(shù)目為1個(gè),每一個(gè)滑動(dòng)窗口中允許丟失的基因型為1個(gè),組成長(zhǎng)純合片段(ROH)之間的單核苷酸多態(tài)標(biāo)記的最大間隔為1 Mb,長(zhǎng)純合片段的最小長(zhǎng)度設(shè)為0.25 Mb,基于參考染色體統(tǒng)計(jì)長(zhǎng)純合片段,基于每條染色體分析近交系數(shù)(FROH)。
FROH=∑LROH/Lgenome
式中,∑LROH為染色體上長(zhǎng)純合片段的長(zhǎng)度之和,Lgenome為染色體的物理總長(zhǎng)度。
45個(gè)樣品共產(chǎn)生49.79 Gb高質(zhì)量數(shù)據(jù),對(duì)測(cè)序數(shù)據(jù)進(jìn)行質(zhì)控評(píng)估結(jié)果見表1,質(zhì)控平均Q30為92.17%,3群體GC含量34.59%~35.04%,低于AT含量。組裝參考基因組大小為990 984 031 bp,未掛載參考染色體的基因組大小為137 058 386 bp,樣品平均比對(duì)讀長(zhǎng)為768 337 bp,平均覆蓋基因組大小為85 103 126 bp,平均覆蓋深度為13.84,平均基因組覆蓋深度為0.99,選育群體的平均比對(duì)、雙端比對(duì)讀長(zhǎng)均較低。
表1 不同群體測(cè)序堿基分布和與參考基因組比對(duì)結(jié)果(均值)Tab.1 Distribution and comparison of sequencing bases with reference genome in different populations (mean)
樣品與參考基因組之間單核苷酸多態(tài)標(biāo)記檢測(cè)平均轉(zhuǎn)換數(shù)量為206 641個(gè),平均顛換數(shù)量為184 471個(gè)(圖1a),轉(zhuǎn)換/顛換為1.12,轉(zhuǎn)換發(fā)生率高于顛換,平均雜合類型單核苷酸多態(tài)標(biāo)記數(shù)量為151 042個(gè),野生群體雜合程度最高,平均純合單核苷酸多態(tài)標(biāo)記數(shù)量為240 070個(gè),選育群體平均純合單核苷酸多態(tài)標(biāo)記數(shù)量高于野生群體和養(yǎng)殖群體。群體單核苷酸多態(tài)標(biāo)記過(guò)濾后,1、3、9和10號(hào)染色體單核苷酸多態(tài)標(biāo)記數(shù)量較多(圖1b),以20 kb為一個(gè)窗口,統(tǒng)計(jì)窗口內(nèi)的單核苷酸多態(tài)標(biāo)記數(shù)量,單核苷酸多態(tài)標(biāo)記在染色體上的密度分布較均勻(圖1c),染色體單核苷酸多態(tài)標(biāo)記較多與其長(zhǎng)度相關(guān)。統(tǒng)計(jì)單群體內(nèi)的雙等位基因型群體遺傳指標(biāo)平均值,群體信息統(tǒng)計(jì)見表2,群體內(nèi)單核苷酸多態(tài)標(biāo)記統(tǒng)計(jì)數(shù)量超過(guò)58萬(wàn)個(gè),選育群體的觀測(cè)雜合度最低,平均近交系數(shù)(Fis)與養(yǎng)殖群體相近,野生群體觀測(cè)雜合度最高,近交系數(shù)(Fis)最低,野生群體相對(duì)具有較好的群體遺傳多態(tài)。
表2 群體遺傳信息統(tǒng)計(jì)Tab.2 The statistics of population genetic information
圖1 單核苷酸多態(tài)標(biāo)記統(tǒng)計(jì)Fig.1 SNP statisticsa.單核苷酸多態(tài)類型變異數(shù)量統(tǒng)計(jì);b.染色體單核苷酸多態(tài)標(biāo)記數(shù)量統(tǒng)計(jì);c.染色體單核苷酸多態(tài)標(biāo)記密度分布.a.SNP type variation statistics; b.statistics of chromosome SNPs; c.distribution of chromosome SNP density.
利用與參考染色體高比對(duì)(>90%)樣品的單核苷酸多態(tài)標(biāo)記進(jìn)行系統(tǒng)進(jìn)化樹(圖2)和主成分(圖3)分析,結(jié)果顯示,選育群體與養(yǎng)殖群體部分樣品親緣關(guān)系較近,預(yù)示選育群體和養(yǎng)殖群體可能有部分相同的親本來(lái)源,主成分分析基本將樣品分成3個(gè)類群,主成分1顯示野生群體分類較好,主成分2顯示選育群體和養(yǎng)殖群體存在群體交雜,分析結(jié)果與進(jìn)化樹分析一致。通過(guò)計(jì)算區(qū)域平均遺傳分化指數(shù)(Fst),野生群體-選育群體、野生群體-養(yǎng)殖群體和選育群體-養(yǎng)殖群體的遺傳分化指數(shù)均值分別為0.068、0.065和0.030,選育群體和養(yǎng)殖群體之間的遺傳分化指數(shù)最低,多態(tài)性相近,進(jìn)一步表明部分親本來(lái)源相同的可能性較大。
圖2 系統(tǒng)進(jìn)化樹Fig.2 Phylogenetic tree個(gè)體編號(hào)中,M1表示野生群體,M2表示選育群體,M3表示養(yǎng)殖群體.In the individual number, M1 represents wild population, M2 represents breeding population and M3 represents cultured population.
圖3 主成分分析Fig.3 Analysis of principal component analysis
野生群體、選育群體和養(yǎng)殖群體的平均長(zhǎng)純合片段數(shù)分別為59.1、49.5個(gè)和56.6個(gè),長(zhǎng)純合片段平均長(zhǎng)度分別為0.312、0.313Mb和0.311Mb,平均單核苷酸多態(tài)標(biāo)記含量為59、50個(gè)和73個(gè),1號(hào)和10號(hào)染色體長(zhǎng)純合片段平均含量較多,為6.5個(gè),7號(hào)最少,為1.9個(gè)?;陂L(zhǎng)純合片段分布和比例計(jì)算的近交系數(shù)(FROH)見圖4,野生群體、選育群體和養(yǎng)殖群體的近交系數(shù)(FROH)分別為0.0149~0.0240、0.0159~0.0201和0.0170~0.0246,14號(hào)染色體近交系數(shù)(FROH)最高,野生群體近交系數(shù)(FROH)略高于選育群體和養(yǎng)殖群體,3個(gè)群體近交系數(shù)(FROH)均低于0.060。整個(gè)染色體內(nèi)的連鎖不平衡衰減結(jié)果見圖5。一般把連鎖不平衡系數(shù)(r2)降低至0.1~0.2時(shí)的遺傳距離認(rèn)為是該物種的衰減距離。r2為0.2時(shí),野生群體、選育群體和養(yǎng)殖群體的平均連鎖不平衡的距離為0.4、0.4 kb和0.2 kb;r2降為0.1時(shí),野生群體、選育群體和養(yǎng)殖群體的平均連鎖不平衡距離增至40.5、>300.0 kb和4.0 kb。衰減速度為養(yǎng)殖群體>野生群體>選育群體,養(yǎng)殖群體具有較高的群體內(nèi)核酸多態(tài)性(表2),結(jié)果與其衰減速度最快相一致,選育群體由于連續(xù)多年人工選育,群體內(nèi)核酸多態(tài)性較低,衰減速度最慢。
圖4 不同染色體近交系數(shù)統(tǒng)計(jì)Fig.4 Statistics of FROH in different chromosomes紅色代表野生群體,綠色代表選育群體,藍(lán)色代表養(yǎng)殖群體.Wild population is shown in red color, breeding population is shown in green color and cultured population is shown in blue color.
圖5 不同群體連鎖不平衡衰減Fig.5 Linkage disequilibrium decay in different populations
為獲取有效的雜種優(yōu)勢(shì),雜交親本應(yīng)選用不同分化亞群或具有較好遺傳資源的群體(系)或品系,并從來(lái)源群體中選擇具備一定表型優(yōu)勢(shì)的親本,野生群體作為來(lái)源時(shí)應(yīng)該純化親本[8]。合浦珠母貝養(yǎng)殖性狀中生長(zhǎng)速度[9]和存活率均是影響產(chǎn)珠的重要選擇性狀,在難以估計(jì)存活性狀的情況下,生長(zhǎng)相關(guān)表型性狀成為親本的首選性狀,筆者均利用人工繁選群體作為親本的來(lái)源群,保證了親本的純化和優(yōu)勢(shì)性狀親本的選擇,方便準(zhǔn)確分析適合作為雜交親本的遺傳信息。
本研究中,3個(gè)群體經(jīng)過(guò)群體多態(tài)指數(shù)比較、主成分分析交叉位點(diǎn)和系統(tǒng)進(jìn)化樹分析得出,選育群體和養(yǎng)殖群體群體分化程度最低。遺傳分化指數(shù)是衡量群體間的遺傳分化程度的重要指標(biāo),當(dāng)0<遺傳分化指數(shù)<0.05時(shí),表明各群體之間分化很小,幾乎可以忽略;當(dāng)遺傳分化指數(shù)>0.05時(shí),各群體之間才存在中度以上的遺傳分化[10]。馬氏珠母貝的不同殼色家系間遺傳分化指數(shù)為0.113~0.793[11],表明各個(gè)家系之間存在極大的分化,可能與連續(xù)多年的家系選育以及近交引起家系內(nèi)基因頻率發(fā)生較大變化有關(guān);在馬氏珠母貝近交與雜交4個(gè)家系間的平均遺傳分化指數(shù)為0.1049[12],表明4個(gè)家系間存在中度的遺傳分化,同雜交和近交的不同交配方式對(duì)基因頻率改變存在重要關(guān)系;本研究的平均遺傳分化指數(shù)相對(duì)較低,其中野生群體-選育群體和野生群體-養(yǎng)殖群體的遺傳分化指數(shù)均值分別為0.068和0.065,表明野生群體-選育群體、野生群體-養(yǎng)殖群體之間存在中等程度的分化,與選育群體的連續(xù)多年選育,以及養(yǎng)殖群體在養(yǎng)殖中被有意識(shí)作為一個(gè)獨(dú)立群體繁育有關(guān)。選育群體-養(yǎng)殖群體的遺傳分化指數(shù)均值為0.030,表明選育群體和養(yǎng)殖群體間幾乎沒有遺傳分化,表明本研究中的2個(gè)群體間的基因頻率差別不大,群體來(lái)源相同或部分個(gè)體來(lái)源相同的可能性較大,這可能與本研究選用來(lái)源群體的粗放保種以及生產(chǎn)中的不當(dāng)操作串種有較大關(guān)系。廣西合浦珠母貝產(chǎn)業(yè)受養(yǎng)殖環(huán)境的影響,導(dǎo)致傳統(tǒng)養(yǎng)殖群體萎縮,而隨著選育群體在廣西的推廣應(yīng)用力度加大,一定程度上造成傳統(tǒng)養(yǎng)殖群體與選育群體的混雜并存,且選育群體本身具有優(yōu)勢(shì)生長(zhǎng)表型性狀[4],所以在選擇同質(zhì)種貝樣本時(shí),樣本同源的概率較大。連鎖不平衡衰減速度能夠反映群體選擇強(qiáng)度或群體多態(tài)性[13],野生群體受人工選擇的壓力較小,養(yǎng)殖群體雖然多態(tài)性標(biāo)記數(shù)量(546 380個(gè))最多,但與選育群體分化程度偏低。為了引入更多的優(yōu)秀基因,在沒有專門化群系條件下,進(jìn)行快速育種時(shí)可優(yōu)先考慮野生群體×選育群體或野生群體×養(yǎng)殖群體雜交組合方式。而通過(guò)全基因組關(guān)聯(lián)分析時(shí),連鎖不平衡衰減越快,分析所需的標(biāo)記密度越大,與目標(biāo)性狀表型變異關(guān)聯(lián)的顯著性位點(diǎn)離功能基因位點(diǎn)距離會(huì)越近,進(jìn)行全基因組關(guān)聯(lián)分析時(shí),野生群體×養(yǎng)殖群體雜交組合方式可提高基因定位精度。
水產(chǎn)動(dòng)物具有較強(qiáng)的繁殖力,在短期內(nèi)經(jīng)過(guò)高強(qiáng)度的人工選擇可以實(shí)現(xiàn)性狀的快速改良,同時(shí)也意味著繁育的大部分個(gè)體父母本可能來(lái)自少數(shù)個(gè)體,育種群體的近交系數(shù)可能升高很快[14-15]。已有研究表明,貝類存在明顯的近交衰退問題[16-18]。了解群體的繁殖規(guī)律并掌握群體近交系數(shù),有助于了解父母本的親緣關(guān)系,并通過(guò)雜交的方式降低近交的影響[12]。本研究結(jié)果顯示,野生群體、選育群體和養(yǎng)殖群體的群體內(nèi)近交系數(shù)(Fis)分別為0.2075、0.3449和0.3465,選育群體和養(yǎng)殖群體接近近交系(Fis>0.375)[19]的水平,選育群體和養(yǎng)殖群體可以被視為具有一定純化水平的群系,無(wú)論是雜交育種或通過(guò)雜交方式降低群體近交系數(shù),野生群體均可作為主要親本群。近交系數(shù)在進(jìn)行雜交子代的遺傳參數(shù)分析時(shí),可作為重要的參考依據(jù)。一般雜交父本和母本分別來(lái)自不同群體(系),父本和母本被默認(rèn)為無(wú)親緣關(guān)系,但父本或母本個(gè)體間卻存在一定的親緣關(guān)系,利用基因型作為固定效應(yīng)計(jì)算親緣系數(shù)會(huì)優(yōu)于系譜計(jì)算。長(zhǎng)純合片段反映了子代從有共同祖先的親代遺傳了相同的染色體片段[20],也可以幫助了解群體近交程度和群體多樣性,相較于群體內(nèi)近交系數(shù)Fis,基于長(zhǎng)純合片段所計(jì)算的近交系數(shù)FROH更接近于真實(shí)近交水平,已在畜禽遺傳研究中普遍應(yīng)用[21-22],而本研究結(jié)果中,野生群體、選育群體和養(yǎng)殖群體的近交系數(shù)(FROH)分別為0.0149~0.0240、0.0159~0.0201和0.0170~0.0246,3個(gè)群體近交系數(shù)(FROH)相近并低于多數(shù)畜禽(FROH>0.05)[23-25],同時(shí)結(jié)果也明顯低于群體信息統(tǒng)計(jì)計(jì)算的近交系數(shù),除物種差異因素外,結(jié)果偏低也與簡(jiǎn)化測(cè)序結(jié)果與基因組覆蓋率低有關(guān),且多數(shù)貝類沒有明顯性染色體[26],計(jì)算時(shí)以全基因組長(zhǎng)度作為參數(shù)。近交系數(shù)(FROH)可作為群體內(nèi)無(wú)直接親緣關(guān)系個(gè)體的親緣關(guān)系參考系數(shù),在缺少基因型計(jì)算親緣系數(shù)時(shí),近交系數(shù)(FROH)可直接作為合浦珠母貝選擇群體的近交系數(shù)進(jìn)行因子計(jì)算,不同染色體長(zhǎng)純合片段的分布也表明了3個(gè)群體從共同祖先遺傳染色體概率相近。
筆者通過(guò)分析廣西合浦珠母貝3個(gè)不同群體間的遺傳關(guān)系,發(fā)現(xiàn)不同群體間存在一定程度的遺傳分化,并指出通過(guò)野生群體×選育群體或野生群體×養(yǎng)殖群體組合方式開展雜交育種,具有較大獲得雜種優(yōu)勢(shì)的潛力。研究結(jié)果可為廣西合浦珠母貝通過(guò)雜交育種對(duì)種質(zhì)資源改良提供新的思路和途徑。