李光華 金方彭 周 睿 武祥偉 吳俊頡 冷 云 高海濤 張文魁
(1. 云南省漁業(yè)科學(xué)研究院, 昆明 650111; 2. 云南農(nóng)業(yè)大學(xué), 昆明 650000)
SNP是指在基因組水平上由單個(gè)核苷酸堿基的轉(zhuǎn)換或顛換引起的DNA序列多態(tài)性, 由于基因組DNA的任何堿基均有可能發(fā)生變異, 所以SNP幾乎遍布整個(gè)基因組, 是動(dòng)植物中普遍存在的一種分子標(biāo)記; SNP具有數(shù)量多、分布廣泛、代表性強(qiáng)、遺傳穩(wěn)定性好、便于高通量、高度自動(dòng)化檢測(cè)分析等優(yōu)點(diǎn), 通過(guò)研究其在生物基因組中的分布即能夠全面地反映群體的遺傳及變異水平[1]。
短須裂腹魚(yú)[Schizothoraxwangchiachii (Fang)]隸屬于鯉形目(Cypriniformes)鯉科(Cyprinidae)裂腹魚(yú)亞科(Schizothoracinae)裂腹魚(yú)屬(Schizothorax),分布于金沙江水系, 且其肉質(zhì)細(xì)嫩, 味道鮮美, 是金沙江及其所屬支流的主要經(jīng)濟(jì)魚(yú)類之一[2]。短須裂腹魚(yú)也是金沙江中游龍開(kāi)口水電站和阿海水電站進(jìn)行增殖放流的土著魚(yú)類之一。因此, 短須裂腹魚(yú)具有相對(duì)較高的經(jīng)濟(jì)價(jià)值與生態(tài)價(jià)值[3]。但近年來(lái), 因其棲息地建設(shè)水壩, 棲息環(huán)境遭破壞, 加之人類活動(dòng)影響等原因致使短須裂腹魚(yú)的自然種群資源量急劇下降。目前, 對(duì)短須裂腹魚(yú)的研究主要集中在人工馴養(yǎng)、人工繁殖[4]、幼魚(yú)行為學(xué)[5]、胚胎發(fā)育和仔魚(yú)早期發(fā)育特性研究[6]等方面, 還未見(jiàn)短須裂腹魚(yú)的SNP標(biāo)記開(kāi)發(fā)與遺傳多樣性水平的研究報(bào)道。
本文采用SLAF-seq技術(shù)開(kāi)發(fā)了短須裂腹魚(yú)的SNP標(biāo)記, 并進(jìn)一步分析了金沙江短須裂腹魚(yú)自然種群的遺傳多樣性水平。本研究為短須裂腹魚(yú)的種質(zhì)資源保護(hù)與開(kāi)發(fā)利用提供了有效工具及理論依據(jù)。
2016年7月于短須裂腹魚(yú)主要分布區(qū)域金沙江阿海(N26°50′; E100°42′)和龍開(kāi)口江段(N27°23′;E100°31′)采集樣本20尾, 體長(zhǎng)10—15 cm, 體重100—150 g, 取魚(yú)尾鰭固定于液氮中, 并及時(shí)保存于-85℃冰箱中備用。
采用傳統(tǒng)的酚-氯仿方法抽提基因組DNA[7], 采用紫外分光光度法與瓊脂糖凝膠電泳檢測(cè)抽提質(zhì)量并測(cè)算基因組DNA的的濃度。抽提的基因組DNA置于-20℃冰箱中備用。
根據(jù)Sun等[15]的方法構(gòu)建短須裂腹魚(yú)SLAF-seq文庫(kù)。選擇斑馬魚(yú)基因組(http://www.ncbi.nlm.nih.gov/genome/?term=Zebrafish)作為參考基因組進(jìn)行基因組電子酶切預(yù)測(cè), 內(nèi)切酶的選擇原則為: 避免具重復(fù)序列的酶切片段, 酶切片段均勻分布于基因組上, 并使酶切片段數(shù)符合預(yù)期SLAF標(biāo)簽數(shù)。操作流程為: 在酶切片段3′端加poly (A)、連接Dualindex專用測(cè)序接頭、PCR擴(kuò)增、純化、混樣、切膠回收目的片段, 并將目的片段使用Illumina Hiseq 2500進(jìn)行雙末端測(cè)序(PE100)。選用日本晴水稻(Oryza sativa ssp. japonica)基因組(http://rapdb.dna.affrc.go.jp/)為對(duì)照組(Control)(選日本晴水稻(Oryza sativa ssp. japonica)基因組作為對(duì)照組是因?yàn)樗娜蚪M序列質(zhì)量非常好, 比對(duì)準(zhǔn)確率高), 進(jìn)行同樣流程的測(cè)序, 以評(píng)估建庫(kù)方案的準(zhǔn)確性。
根據(jù)序列相似度, 將聚類于一起的reads定義為一個(gè)SLAF標(biāo)簽。根據(jù)SLAF標(biāo)簽在不同樣品間的等位基因數(shù)和基因序列間的差異程度篩選多態(tài)性的SLAF標(biāo)簽, 并以每個(gè)SLAF標(biāo)簽中測(cè)序深度最高的序列類型作為參考序列, 利用bwa[16]將測(cè)序reads比對(duì)到參考基因組上, 并使用GATK[17]和samtools[18]2種方法開(kāi)發(fā)SNP, 以2種方法得到的SNP標(biāo)記交集作為最終可靠的SNP標(biāo)記數(shù)據(jù)集。
對(duì)獲取的SNP位點(diǎn)進(jìn)行篩選, 標(biāo)準(zhǔn)為次要基因型頻率(MAF)大于0.05、完整度大于0.8; 使用符合條件的SNP用于短須裂腹魚(yú)群體遺傳多樣性和遺傳結(jié)構(gòu)分析。
使用Power-Marker V3.25軟件計(jì)算觀測(cè)等位基因數(shù)(Observed allele number, No)、期望等位基因數(shù)(Expected allele number, Ne)、觀測(cè)雜合度(Observed heterozygosity, Ho)、期望雜合度(Expected heterozygosity, He)、多態(tài)性信息含量(PIC); 使用Admixture軟件[9]分析短須裂腹魚(yú)的群體結(jié)構(gòu), 使用Cluster軟件[10]進(jìn)行主成分分析, 使用SPAGeDi軟件[11]進(jìn)行個(gè)體間的親緣關(guān)系分析, 使用MEGA5軟件[8]與Neighbor-Joining算法構(gòu)建個(gè)體間的進(jìn)化關(guān)系分析。
通過(guò)對(duì)斑馬魚(yú)基因組進(jìn)行酶切預(yù)測(cè), 選擇RsaⅠ+HaeⅢ內(nèi)切酶組合酶切短須裂腹魚(yú)基因組,目標(biāo)酶切片段長(zhǎng)度為414—464, 預(yù)測(cè)可獲得144842個(gè)SLAF標(biāo)簽(表1)。測(cè)序獲得日本晴水稻(Control)數(shù)據(jù)量為0.72 Mreads, 與參考基因組比對(duì),Paired-end mapped reads、single-end mapped reads和unmapped reads占總reads的比例分別為94.73%、1.38%與3.89%(表2); 由此可知, 雙端比對(duì)效率較高, 比對(duì)結(jié)果較好。另外, 日本晴水稻測(cè)序reads插入片段中殘留酶切位點(diǎn)的比列為5.27%, 酶切效率為94.73%, 表明酶切效果較好。上述數(shù)據(jù)顯示本研究的SLAF-seq測(cè)序文庫(kù)構(gòu)建正常。從20個(gè)短須裂腹魚(yú)樣本中共獲得80.08百萬(wàn)序列(MReads)數(shù)據(jù), 平均Q30(測(cè)序正確率為99.9%的堿基比例)為94.79%, 平均GC含量為40.16%, 表明測(cè)序質(zhì)量較高, 測(cè)序結(jié)果可靠。
從20個(gè)短須裂腹魚(yú)樣本中共獲得709758個(gè)SLAF標(biāo)簽, 平均每個(gè)樣本獲得240498個(gè)SLAF標(biāo)簽,平均測(cè)序深度為95.9 1x; 其中多態(tài)性SLAF標(biāo)簽共有243304個(gè)。從20個(gè)樣本的SLAF標(biāo)簽中共鑒別777082個(gè)SNP標(biāo)記, 每個(gè)樣本獲得到409005—564000個(gè)SNP標(biāo)記, 平均每個(gè)樣本獲得515493個(gè)SNP標(biāo)記; 樣本中SNP位點(diǎn)的雜合率為20.08%—26.09%, 平均雜合率為24.11%; 樣本中SNP位點(diǎn)的完整度(SNP位點(diǎn)在所有樣本中的信息完整度)為52.63%—72.57%, 平均完整度為66.33%。根據(jù)選擇標(biāo)準(zhǔn), 從獲得SNP標(biāo)記中選擇598354個(gè)有效SNP進(jìn)行群體遺傳多樣性分析, 詳見(jiàn)表1。
根據(jù)得到的原始SNP計(jì)算各遺傳多樣性參數(shù)的平均值, 得到的統(tǒng)計(jì)結(jié)果是觀測(cè)等位基因數(shù)(Observed allele number)為2.00, 期望等位基因數(shù)(Expected allele number)為1.52, 觀測(cè)雜合度(Observed heterozygosity)為0.20, 期望雜合度(Expected_heterozygosity)為0.31, 多態(tài)性信息含量(PIC)為0.25,次要等位基因頻率(MAF)為0.23。
Neighbor-joining (Kimura 2-parameter模型,1000次bootstrap)進(jìn)化樹(shù)顯示20尾短須裂腹魚(yú)樣本來(lái)源于2個(gè)亞群(圖1)。
admixture[9]軟件分析短須裂腹魚(yú)的群體結(jié)構(gòu),假設(shè)群體的分群數(shù)(K值)為1—20, 結(jié)果顯示K=8時(shí)cross-validation errors的數(shù)值最大, 表明本研究采集的20尾短須裂鰒魚(yú)樣本并非來(lái)源于同一群體, 金沙江阿海到龍口江段的短須裂腹魚(yú)群體遺傳背景較復(fù)雜, 群體間存在混合現(xiàn)象, 這可能是人工增殖放流后和野生資源共存的結(jié)果。對(duì)聚類結(jié)果的交叉驗(yàn)證結(jié)果(圖2)表明, 當(dāng)K=1時(shí)交叉驗(yàn)證錯(cuò)誤率最小, 說(shuō)明最優(yōu)分群數(shù)為1, 可以推測(cè)金沙江阿海到龍口江段的短須裂腹魚(yú)可能來(lái)自于同一個(gè)原始祖先。
表1 樣品SLAF標(biāo)簽和SNP信息統(tǒng)計(jì)Tab. 1 SLAF number and SNP information statistics of samples
圖1 短須裂腹魚(yú)遺傳進(jìn)化樹(shù)Fig. 1 The phylogenetic tree of Schizothorax wangchiachii
主成分分析(PCA)是一種純數(shù)學(xué)的運(yùn)算方法,可以將多個(gè)相關(guān)變量經(jīng)過(guò)線性轉(zhuǎn)換選出較少個(gè)數(shù)的重要變量, 其結(jié)果可以用于與其他聚類方法的結(jié)果相互驗(yàn)證。本研究中主成分分析(Principal components analysis, PCA)結(jié)果表明20個(gè)短須裂腹魚(yú)個(gè)體分布在較大的聚類空間上, 部分個(gè)體之間的遺傳異質(zhì)性較大(圖3、4), 這與admixture軟件的分析結(jié)果相一致。
使用SPAGeDi[11]軟件可以對(duì)自然群體兩兩個(gè)體間的親緣關(guān)系(Relative kinship)進(jìn)行估計(jì)。親緣關(guān)系本身是定義兩特定材料之間的遺傳相似度與任意材料之間的遺傳相似度的相對(duì)值, 因此當(dāng)結(jié)果出現(xiàn)兩材料之間的親緣關(guān)系值小于0時(shí), 則直接定義為0[12]。親緣關(guān)系值Kinship的頻率分布見(jiàn)圖5,20尾短須裂腹魚(yú)樣本中, 親緣關(guān)系位于0—0.05的頻率較高, 但有少部分樣本的Kinship值位于0.05—0.15, 表明20尾短須裂腹魚(yú)樣本中多數(shù)個(gè)體的親緣關(guān)系很近, 小部分樣本的親緣關(guān)系相對(duì)較遠(yuǎn), 這可能是由于繁殖時(shí)期洄游后雜交造成的。
圖2 短須裂腹魚(yú)Admixture各個(gè)K值的交叉驗(yàn)證錯(cuò)誤率Fig. 2 The error rate of Schizothorax wangchiachii admixture K value by cross validation
圖3 短須裂腹魚(yú)基于前3個(gè)主成分的樣品聚類圖Fig. 3 The error rate of K values for Schizothorax wangchiachii by cross validation
研究表明, 序列變異位點(diǎn)的轉(zhuǎn)換在魚(yú)類近親種間出現(xiàn)較頻繁, 而顛換則多在較遠(yuǎn)緣種間發(fā)生; 而在同種魚(yú)不同個(gè)體間, 轉(zhuǎn)換往往在數(shù)量上遠(yuǎn)超過(guò)顛換, 兩者比例為5∶1, 甚至高達(dá)10∶1[16]。在本研究短須裂腹魚(yú)轉(zhuǎn)換顛換比值(Ti/Tv)均大于1, 說(shuō)明短須裂腹魚(yú)mtDNA控制區(qū)的變異更多的是發(fā)生在嘌呤與嘌呤或者嘧啶與嘧啶之間, 而嘌呤與嘧啶或嘧啶與嘌呤之間的顛換則發(fā)生得相對(duì)較少, 即轉(zhuǎn)換的發(fā)生率高于顛換。
多態(tài)信息含量(PIC)反映了位點(diǎn)在群體中的多樣性狀況, 一般認(rèn)為 PIC>0.5時(shí)為高度多態(tài)性位點(diǎn),0.25<PIC<0.5時(shí)為中度多態(tài)性位點(diǎn), PIC<0.25時(shí)為低度多態(tài)性位點(diǎn)[17,18]。本研究中多態(tài)信息含量0.2562, 表明所選的個(gè)位點(diǎn)均為中度多態(tài)性位點(diǎn), 多態(tài)性高; 期望等位基因數(shù)為1.5272, 觀測(cè)等位基因數(shù)為2.0050, 表明其等位基因分布均勻。適合短須裂腹魚(yú)的遺傳多樣性研究。
雜合度的高低反映了群體遺傳一致性的程度,基因雜合度又稱為基因多樣度, 是度量群體遺傳變異的最合適參數(shù)之一, 其位點(diǎn)的平均雜合度近似反映了群體遺傳變異程度的高低[19,20]。雜合度越高的生物群體變異越大, 對(duì)環(huán)境變化和自然選擇的適應(yīng)能力也越強(qiáng)[21,22], 在本研究中觀測(cè)雜合度和期望雜合度均值為0.2007和0.3160, 相比同為同一水系同為鯉科的金沙江觀音巖段圓日銅魚(yú)(均值為0.8520和0.8383)[23]以及長(zhǎng)江水系巖元、攀枝花、宜賓、合江、木洞、宜昌的圓口銅魚(yú)群體(均值為0.8593和0.8405)[24]多態(tài)性較低。
多樣性指數(shù)是群落豐度的指標(biāo), 指數(shù)越高, 該群落越穩(wěn)定(種群間聯(lián)系越緊密, 越多樣); 香濃指數(shù)是用來(lái)反應(yīng)群體的多樣性的高低, 指數(shù)越大, 多樣性越高。本研究短須裂腹魚(yú)多樣性指數(shù)為0.3386,香濃指數(shù)為0.4827, 觀測(cè)雜合度遠(yuǎn)低于期望雜合度,說(shuō)明該江段短須裂腹魚(yú)群體的變異程度不高, 對(duì)環(huán)境變化和自然選擇能力不強(qiáng); 多樣性指數(shù)較低, 說(shuō)明該群體較不穩(wěn)定; 香濃指數(shù)表明, 群體的多樣性偏低。整體分析表明, 該江段的短須裂腹魚(yú)群體處于較低的遺傳多樣性水平, 可能降低了其對(duì)環(huán)境變化的應(yīng)對(duì)能力與適應(yīng)能力。
圖4 短須裂腹魚(yú)樣品聚類結(jié)果Fig. 4 Sample clustering results of Schizothorax wangchiach
圖5 短須裂腹魚(yú)親緣關(guān)系圖Fig. 5 Genetic relationship figure of Schizothorax wangchiachii
參考文獻(xiàn):
[1]Qu J J, Yu M, Dong L, et al. Applications of SNP in animal and plant genetic breeding [J]. Journal of Northeast Agricultural University, 2011, 42(12): 9—13 [曲娟娟, 于敏, 董蕾, 等. SNP在動(dòng)植物遺傳育種中的應(yīng)用. 東北農(nóng)業(yè)大學(xué)學(xué)報(bào), 2011, 42(12): 9—13]
[2]Chu X L, Chen Y R. The Fauna of Fishes from Yunnan:the first volume [M]. Beijing: Academic Press. 1989,296—297 [褚新洛, 陳銀瑞. 云南魚(yú)類志: 上冊(cè). 北京: 科學(xué)出版社. 1989, 296—297]
[3]Liu Y T, Leng Y, Xu W Y, et al. The primary exploration of Schizothorax wangchiachii artificial propagation[J]. Reservoir Fisheries, 2007, 27(5): 31—32 [劉躍天, 冷云, 徐偉毅, 等. 短須裂腹魚(yú)人工繁殖初探. 水利漁業(yè),2007, 27(5): 31—32]
[4]Xu W Y, Leng Y, Liu Y T, et al. Research on Schizothorax wangchiachii domestication culture trial [J]. Reservoir Fisheries, 2003, 23(3): 16—17 [徐偉毅, 冷云, 劉躍天, 等. 短須裂腹魚(yú)馴化養(yǎng)殖試驗(yàn)研究. 水利漁業(yè), 2003,23(3): 16—17]
[5]Liang X. The behavior research on the wild juvenile Schizothorax wangchiachii [J]. Modern Agricultural Science and Technology, 2011, (5): 321—322 [梁祥. 野生短須裂腹魚(yú)幼魚(yú)行為學(xué)研究. 現(xiàn)代農(nóng)業(yè)科技, 2011, (5):321—322]
[6]Zuo P X, Li G H, Leng Y, et al. Embryonic and Early Larval Development of Schizothorax wangchiachii [J].Journal of Hydroecology, 2015, 36(3): 77—82 [左鵬翔,李光華, 冷云, 等. 短須裂腹魚(yú)胚胎與仔魚(yú)早期發(fā)育特性研究. 水生態(tài)學(xué)雜志, 2015, 36(3): 77—82]
[7]Xiao M S, Cui F, Kang J. Genetic structure and variation of wild Ophicephalus argus cantor from Huaihe River based on MtDNA D-loop sequences [J]. Journal of Huazhong Normal University (Natural Science), 2009,47(1): 82—90 [肖明松, 崔峰, 康健. 淮河烏鱧線粒體DNA控制區(qū)結(jié)構(gòu)分析及遺傳多樣性研究. 華中師范大學(xué)學(xué)報(bào): 自然科學(xué)版, 2009, 47(1): 82—90]
[8]Koichiro T, Daniel P, Nicholas P. MEGA5: Molecular evolutionary genetics analysis using maximum likelihood,evolutionary distance, and maximum parsimony methods[J]. Molecular Biology and Evolution, 2011, 28(10):2731—2739
[9]Alexander D H, Novembre J, Lange K. Fast model-based estimation of ancestry in unrelated individuals [J]. Genome Research, 2009, 19(9): 1655—1664
[10]Price A L, Patterson N J, Plenge R M, et al. Principal components analysis corrects for stratification in genomewide association studies [J]. Nature Genetics, 2006,38(8): 904—909
[11]Hardy O J, Vekemans X. SPAGeDi: a versatile computer program to analyse spatial genetic structure at the individual or population levels [J]. Molecular Ecology Notes,2002, 2(4): 618—620
[12]Su W J, Zhao N, Lei J, et al. SNP sites developed by specific length amplification fragment sequencing (SLAF-seq) in sweet potato [J]. Scientia Agricultura Sinica,2016, 49(1): 27—34 [蘇文瑾, 趙寧, 雷劍, 等. 基于SLAF-seq技術(shù)的甘薯SNP位點(diǎn)開(kāi)發(fā). 中國(guó)農(nóng)業(yè)科學(xué),2016, 49(1): 27—34]
[13]Li H, Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform [J]. Bioinformatics,2009, 25(14): 1754—1760
[14]McKenna A, Hanna M, Banks E, et al. The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data [J]. Genome Research, 2010, 20(9): 1297—1303
[15]Li H, Handsaker B, Wysoker A, et al. The sequence alignment/map format and SAMtools [J]. Bioinformatics,2009, 25(16): 2078—2079
[16]Meyer A, lson. Origin of tetrapods inferred from their mitochondrial DNA affiliation to lungfish [J]. Journal of Molecular Evolution, 1990, 31(5): 359—364
[17]Hou N, Zhang Y, Lu C Y, et al. Genetic potential analysis of Germany mirror carp (Cyprinus carpio L.) using micro satellite markers [J]. Hereditas (Beijing), 2007,29(12): 1509—1518 [侯寧, 張研, 魯翠云, 等. 微衛(wèi)星DNA標(biāo)記分析德國(guó)鏡鯉的遺傳潛力. 遺傳, 2007,29(12): 1509—1518]
[18]Wright. Evolution and the Genetics of Populations [M].Chicago: University of Chicago Press. 1978
[19]Nei M. Estimation of average heterozygosity and genetic distance from a small number of individuals [J]. Genetics,1978, 89(3): 583—590
[20]Nei M, Maruyama T, Chakraborty R. The bottleneck effect and genetic variability in populations [J]. Evolution,1975, 29(1): 1—10
[21]Beardmore J A, Mair G C, Lewis R I. Biodiversity in aquatic systems in relation to aquaculture [J]. Aquaculture Research, 1997, 28(10): 829—839
[22]Xu Z, Primavera J P, Pena L D, et al. Genetic diversity of wild and cultured Black Tiger Shrimp (Penaeus monodom) in the Philippines using microsatellites [J]. Aquaculture, 2001, 199(1-2): 13—40
[23]Wang W, Zhou Q, Zhang S L, et al. Micro satellite genetic diversity analysis of the Coreius guichenoti in the Guanyinyan section of Jinsha River [J]. Freshwater Fisheries, 2015, 46(6): 22—26 [王偉, 周瓊, 張沙龍, 等. 金沙江觀音巖段圓日銅魚(yú)的微衛(wèi)星遺傳多樣性分析. 淡水漁業(yè), 2015, 46(6): 22—26]
[24]Yuan X P, Yan L, Xu S Y, et al. Genetic diversity of bronze gudgeon (Coreius heterodon) and largemouth bronze gudgeon (C. guichenoti) in Yangtze River Basin[J]. Journal of Fishery Sciences of China, 2008, 15(3):377—385 [袁希平, 嚴(yán)莉, 徐樹(shù)英, 等. 長(zhǎng)江流域銅色和圓口銅色的遺傳多樣性. 中國(guó)水產(chǎn)科學(xué), 2008, 15(3):377—385]