王雨吉,孟學(xué)平,易樂飛
( 江蘇海洋大學(xué) 海洋科學(xué)與水產(chǎn)學(xué)院,江蘇 連云港 222005 )
西施舌(Coelomactraantiquata)俗稱“海蚌”,是瓣鰓綱、蛤蜊科的一種雙殼貝類。其足大如舌,肉質(zhì)飽滿肥嫩,與鮑、海參媲美,是國宴上的珍饈美饌。西施舌最初由Spengler于1802年在南海發(fā)現(xiàn)并命名[1],長期以來,分布于太平洋西部(特別是我國沿海)的西施舌被視為同一個物種[2]。但是近十多年的研究發(fā)現(xiàn),分布于我國北方和南方的西施舌形態(tài)不完全相似,而且彼此間存在較大遺傳差異。形態(tài)學(xué)多元統(tǒng)計分析發(fā)現(xiàn),福建與江蘇的西施舌群體在5個數(shù)量性狀上均表現(xiàn)出顯著與極顯著差異[3]。生化水平等位酶的研究表明,福建、江蘇兩地西施舌有一定遺傳分化[4];大量DNA水平分析表明,南、北西施舌遺傳差異已經(jīng)達到了種間差異水平[5-9]。比較分析發(fā)現(xiàn),南、北西施舌間的差異甚至達到了四角蛤蜊(Mactraveneriformis)和中國蛤蜊(M.chinensis)的種間差異水平[7]。因此建議將我國西施舌劃分為2個物種或隱種,即分布于江蘇、山東的北方西施舌和分布于福建的南方西施舌[8]。物種的重新劃分迫切需要對2種西施舌的種質(zhì)資源進行重新評估,為后續(xù)的開發(fā)、利用和保護提供理論基礎(chǔ)。2種西施舌的形態(tài)差異不大,不易區(qū)分。貝類幼體形態(tài)特征通常不明顯,成體形態(tài)特征易受環(huán)境影響,這也增加了鑒別難度。如何準(zhǔn)確鑒別2種西施舌也是一個迫切需要解決的問題。
微衛(wèi)星序列,又稱簡單重復(fù)序列(SSR),廣泛存在于真核生物基因組內(nèi),具有多態(tài)性高、保守性高、共顯性遺傳、檢測方便等特點[10],已廣泛應(yīng)用于遺傳圖譜構(gòu)建、數(shù)量性狀位點定位、群體遺傳學(xué)、進化遺傳學(xué)、種質(zhì)鑒定與輔助育種等研究領(lǐng)域[11-12]。在物種鑒定方面,微衛(wèi)星已經(jīng)成功應(yīng)用于四大家魚[13]、黃顙魚屬(Pelteobagrus)[14]和扇貝[15]等水產(chǎn)生物的物種鑒別。來自轉(zhuǎn)錄組的微衛(wèi)星標(biāo)記不僅具備上述特點,還與基因功能直接關(guān)聯(lián),相應(yīng)的微衛(wèi)星引物保守性高、通用性強[16]。所以基于轉(zhuǎn)錄組開發(fā)2種西施舌微衛(wèi)星分子標(biāo)記有助于解決上述問題。
目前西施舌微衛(wèi)星分子標(biāo)記的相關(guān)報道不多[17-18],因此筆者以西施舌轉(zhuǎn)錄組數(shù)據(jù)為基礎(chǔ),綜合利用多種生物信息學(xué)工具,挖掘西施舌微衛(wèi)星序列,并統(tǒng)計轉(zhuǎn)錄組中微衛(wèi)星序列的發(fā)生頻率、重復(fù)基元以及物種特異性微衛(wèi)星分子標(biāo)記,為2種西施舌的鑒別,種質(zhì)資源評估、開發(fā)、利用和保護提供理論基礎(chǔ)。
西施舌轉(zhuǎn)錄組原始測序數(shù)據(jù)下載自NCBI的SRA數(shù)據(jù)庫(https:∥www.ncbi.nlm.nih.gov/sra)和GSA數(shù)據(jù)庫(https:∥bigd.big.ac.cn/gsa)。其中,南方西施舌個體取自福建福州(SRR7699535、SRR7700826)和福建長樂(SRR3107264),北方西施舌個體取自江蘇啟東(SRR3107263)和山東日照(CRX028172、CRX 025974)。取每個西施舌個體的外套膜、閉殼肌和斧足組織,混合后用于RNA抽提、建庫和測序。為準(zhǔn)確地獲得直系同源基因,從SRA數(shù)據(jù)庫中還下載了中國蛤蜊、四角蛤蜊和薄殼馬珂蛤(Mactrotomafragilis)轉(zhuǎn)錄組原始測序數(shù)據(jù)(SRR-1263980、SRR7876669、SRR7876670、SRR4431559、SRR4431558、SRR8217819)。
轉(zhuǎn)錄組原始數(shù)據(jù)的預(yù)處理和從頭組裝參考文獻[8]的方法進行。首先使用Trimmomatic程序[19]去除原始數(shù)據(jù)中的低質(zhì)量reads(Q≤20)、接頭以及小于50 nt的reads,然后使用Karaken程序[20]去除可能的污染序列,接著使用Trinity程序[21]軟件進行轉(zhuǎn)錄組的從頭組裝,最后使用TGICL程序[22]去除組裝產(chǎn)物中的冗余序列,從而獲得非冗余的轉(zhuǎn)錄本。
將中國蛤蜊、四角蛤蜊和薄殼馬珂蛤轉(zhuǎn)錄組與2種西施舌的轉(zhuǎn)錄組合并。使用OrthoFinder[23]從中搜索得到直系同源基因組。使用iqtree程序[24]在每個直系同源基因組內(nèi)利用最大似然法構(gòu)建系統(tǒng)進化樹,然后使用PhyloTreePruner程序[25]對樹進行解析,最后挑選出一對一關(guān)系的直系同源基因。
使用MISA程序[26]進行微衛(wèi)星位點搜索。篩選標(biāo)準(zhǔn)為單堿基、二堿基、三堿基、四堿基、五堿基、六堿基重復(fù),且各類型重復(fù)次數(shù)分別不小于10次、7次、5次、5次、5次、5次。若100 bp內(nèi)出現(xiàn)2個或2個以上的微衛(wèi)星,則視為復(fù)合型微衛(wèi)星。將搜索結(jié)果導(dǎo)入到Excel軟件中,對微衛(wèi)星的基本信息進行統(tǒng)計分析。
試驗材料共21個個體,其中南方西施舌樣本共10個,采集自福建漳州,北方西施舌樣本共11個,采集自山東日照。取閉殼肌,采用Ezup柱式動物組織基因組DNA抽提試劑盒[生工生物工程(上海)股份有限公司]抽提21個個體的基因組DNA,-20 ℃保存?zhèn)溆谩?/p>
隨機選取14組含有不同微衛(wèi)星序列的直系同源基因,采用Primer Premier 5程序在直系同源基因的保守區(qū)設(shè)計引物。從南方、北方西施舌中各隨機選擇2個個體的總DNA進行引物初篩。從中篩選出擴增條帶清晰且穩(wěn)定的4對引物(表1)用于后續(xù)樣品擴增,熒光標(biāo)記引物由生工生物工程(上海)股份有限公司合成。
表1 微衛(wèi)星引物信息Tab.1 SSR primers information
PCR反應(yīng)在25 μL體系中進行,體系中包含20~50 ng模板DNA,10 pmol正向、反向引物,10 pmol dNTP,1 U Taq DNA聚合酶[生工生物工程(上海)股份有限公司]。熒光PCR擴增采用兩步PCR擴增法。首先95 ℃預(yù)變性3 min;然后進行第1步PCR擴增:94 ℃變性30 s,60 ℃退火30 s,72 ℃延伸30 s,共10個循環(huán);最后進行第2步PCR擴增:94 ℃變性30 s,55 ℃退火30 s,72 ℃延伸30 s,共35個循環(huán)。PCR產(chǎn)物送生工生物工程(上海)股份有限公司進行毛細管電泳檢測(3730XL,美國ABI公司),利用GeneMarker分析軟件對原始數(shù)據(jù)進行分析,以確定PCR產(chǎn)物片段大小。
原始數(shù)據(jù)拼接后,在北方西施舌轉(zhuǎn)錄組中得到272 074個unigene,N50為869 bp,從中檢測到18 611個微衛(wèi)星,復(fù)合型微衛(wèi)星為674個,分布于16 348條unigene中,平均每16.6個unigene中含有1個微衛(wèi)星,平均跨度為9.3 kb,出現(xiàn)頻率(含有微衛(wèi)星位點的unigene數(shù)量/unigene總數(shù)量)為6.0%,發(fā)生頻率(微衛(wèi)星個數(shù)/unigene總數(shù)量)為6.8%,有1758條unigene含有1個以上微衛(wèi)星。在南方西施舌轉(zhuǎn)錄組中得到287 887個unigene,N50為1297 bp,從中檢測到27 553個微衛(wèi)星位點,復(fù)合型微衛(wèi)星為1143個,分布于23 614條unigene中,平均每10.5個unigene中含有1個微衛(wèi)星,平均跨度為8.4 kb,出現(xiàn)頻率為8.2%,發(fā)生頻率為9.6%,有3189條unigene含有1個以上微衛(wèi)星。從分布情況來看,南方西施舌轉(zhuǎn)錄組中的微衛(wèi)星比北方西施舌更密集。
重復(fù)基元種類、數(shù)量以及優(yōu)勢重復(fù)基元在2種西施舌的轉(zhuǎn)錄組中存在差異(表2)。在北方西施舌的18 611個完美型微衛(wèi)星中共有63種重復(fù)基元,二至五堿基重復(fù)基元分別有3、10、24、24種;在南方西施舌的27 553個完美型微衛(wèi)星中共有89種重復(fù)基元,多于北方種,其二至五堿基重復(fù)基元分別為3、10、28、43種,此外,還發(fā)現(xiàn)了3種六堿基重復(fù)基元。在北方西施舌和南方西施舌轉(zhuǎn)錄組中二堿基重復(fù)中的優(yōu)勢基元均為AT/AT,分別有1119和2176個,占完美型微衛(wèi)星總數(shù)的6.01%和7.9%。三堿基重復(fù)中的優(yōu)勢基元不一致,分別為AAC/GTT和ATC/ATG,數(shù)量為1765個和2408個,占微衛(wèi)星總數(shù)的9.5%和8.7%。四堿基重復(fù)中的優(yōu)勢基元分別為AATC/ATTG和AAAC/GTTT,數(shù)量為137個和376個,占微衛(wèi)星總數(shù)的0.7%和1.4%。
表2 微衛(wèi)星重復(fù)基元出現(xiàn)情況Tab.2 The occurrence of different motifs of SRRs
在北方西施舌和南方西施舌轉(zhuǎn)錄組中,微衛(wèi)星重復(fù)拷貝次數(shù)最高為31和40次,最低均為5次。當(dāng)微衛(wèi)星重復(fù)拷貝次數(shù)為10次時,微衛(wèi)星數(shù)量最多,豐度最大。含5~10次重復(fù)的微衛(wèi)星在2個種中最多,這些微衛(wèi)星在北方西施舌中有14 087個,占總微衛(wèi)星的75.7%,在南方西施舌中有20 139個,占總微衛(wèi)星的73.1%。
在北方西施舌和南方西施舌轉(zhuǎn)錄組中微衛(wèi)星重復(fù)基元長度區(qū)間分別為10~75 bp和10~116 bp,其中最長的基元分別為五堿基的15次重復(fù)(75 bp)和四堿基的29次重復(fù)(116 bp)。在2個種中除了單堿基重復(fù)外,最常見的微衛(wèi)星長15 bp,分別有3552個和4581個,分別占完美型微衛(wèi)星總數(shù)的19.09%和16.6%,均為三堿基的5次重復(fù)。微衛(wèi)星的長度與發(fā)生頻率呈負相關(guān)。11~15 bp的短微衛(wèi)星數(shù)量最多,發(fā)生頻率為5.58%和7.35%;其次為16~20 bp的微衛(wèi)星,發(fā)生頻率為0.96%和1.52%;21~25 bp的微衛(wèi)星的發(fā)生頻率為0.26%和0.57%;大于26 bp的微衛(wèi)星的發(fā)生頻率0.04%和0.13%。
Temnykh等[27]按照堿基長度差異將微衛(wèi)星分成2類:當(dāng)微衛(wèi)星長度≥20 bp時具有高度多態(tài)性(Ⅰ型);微衛(wèi)星長度>12 bp且<20 bp時具有中等多態(tài)性(Ⅱ型);而≤12 bp的微衛(wèi)星多態(tài)性較低,但具有突變潛能。本試驗中,在北方西施舌中,7240個微衛(wèi)星(38.90%)為Ⅰ型微衛(wèi)星,1293個微衛(wèi)星(6.95%)為Ⅱ型微衛(wèi)星;在南方西施舌中,10 867個微衛(wèi)星(39.44%)為Ⅰ型微衛(wèi)星,2718個微衛(wèi)星(9.86%)為Ⅱ型微衛(wèi)星。
在2個種的轉(zhuǎn)錄組中一共檢索出4916組一對一關(guān)系的直系同源基因。這些微衛(wèi)星被分為3類:第1類為兩者均無微衛(wèi)星的直系同源基因組,有3695組;第2類為只有一方有微衛(wèi)星的直系同源基因組,有911組;第3類為兩者均有微衛(wèi)星的直系同源基因組,有310組。第3類直系同源基因中,有252組在2個種中含有相同的微衛(wèi)星序列,不能用于區(qū)分西施舌的2個種。其余58組在2個種中含有不同的微衛(wèi)星重復(fù)次數(shù)。對這58組直系同源基因和第2類直系同源基因(合計969組)進行進一步的篩選,剔除單堿基重復(fù)微衛(wèi)星、旁側(cè)序列長度不足20 bp的直系同源基因后,余下409組。在這409組直系同源基因中,2個種間的微衛(wèi)星序列長度不同,但是微衛(wèi)星序列兩側(cè)序列相似,這種含微衛(wèi)星序列的直系同源基因有利于設(shè)計通用引物,使用這些通用引物可在2種西施舌中擴增出不同大小的條帶,進而可以作為潛在的物種特異性分子標(biāo)記來區(qū)分2種西施舌。
利用4對熒光標(biāo)記微衛(wèi)星引物對21個西施舌個體進行PCR擴增,擴增產(chǎn)物經(jīng)毛細管電泳檢測后,每對引物在每個個體中均獲得了清晰、明確的DNA片段,且無雜峰(圖1顯示了部分結(jié)果),4個微衛(wèi)星位點在21個個體上的基因型見表3。引物OG449和OG4144多態(tài)性較高,分別檢測到了10個和8個等位基因;引物OG2700和OG3080多態(tài)性較低,分別檢測到了5個和3個等位基因(表3)。在這4對微衛(wèi)星引物中,沒有1對微衛(wèi)星引物能單獨區(qū)分南方、北方西施舌,但是使用引物組合還是可以初步區(qū)分南方、北方西施舌。引物OG4144在北方西施舌中擴增產(chǎn)物大于380 bp,在南方西施舌中小于380 bp;引物OG3080在北方西施舌中擴增一定會出現(xiàn)489 bp的產(chǎn)物(圖1a),在南方西施舌中一定會出現(xiàn)492 bp的產(chǎn)物(圖1b)。
表3 4個微衛(wèi)星位點基因型Tab.3 The genotypes at 4 SSRs loci
圖1 引物OG3080對南方、北方西施舌擴增產(chǎn)物的帶型Fig.1 Amplification bands in northern and southern lineage of surf clam C. antiquata using primer OG3080
筆者對2種西施舌轉(zhuǎn)錄組進行了微衛(wèi)星挖掘,北方西施舌每隔9.3 kb出現(xiàn)1個微衛(wèi)星,出現(xiàn)頻率為6.0%,南方西施舌每隔8.4 kb出現(xiàn)1個微衛(wèi)星,出現(xiàn)頻率為8.2%。與其他貝類相比,它們的微衛(wèi)星的出現(xiàn)頻率均高于馬氏珠母貝(Pinctadafucatamartensii)心臟(5.98%)[28],均低于馬氏珠母貝血細胞(11.0%)[29]、“渤海紅”扇貝(A.irradians)(11.0%)、墨西哥灣扇貝(A.irradiansconcentricus)(9.0%)[30]、織錦巴非蛤(Paphiatextile)(10.0%)[31]轉(zhuǎn)錄組微衛(wèi)星出現(xiàn)頻率。這表明不同物種之間或同物種之間,甚至是同一物種不同組織間,因為物種和組織差異導(dǎo)致表達的mRNA種類、序列和豐度不同,因此挖掘出的微衛(wèi)星分布情況也隨之不同。
大多數(shù)貝類的微衛(wèi)星主要以二堿基和三堿基重復(fù)為主要類型??O蟶(Sinonovaculaconstricta)、“渤海紅”扇貝和墨西哥灣扇貝轉(zhuǎn)錄組微衛(wèi)星的優(yōu)勢基元為三堿基重復(fù),分別占各自微衛(wèi)星位點總數(shù)的37.13%、46.66%和45.61%[30,32];而蝦夷扇貝(Patinopectenyessoensis)的優(yōu)勢重復(fù)類型為二堿基重復(fù),占40.54%[33]。2種西施舌的優(yōu)勢重復(fù)類型均為三堿基重復(fù),分別占各自微衛(wèi)星位點總數(shù)的25.5%和25.6%,占比少于上述物種。不同貝類的優(yōu)勢微衛(wèi)星重復(fù)類型有所不同,產(chǎn)生這種差異的原因可能是多樣的。這種差異可能是物種固有特性的體現(xiàn),也可能是由分析方法和組學(xué)數(shù)據(jù)不同所致。轉(zhuǎn)錄組可以看作基因組的一個子集,所以基于不同的組學(xué)數(shù)據(jù)必然導(dǎo)致不同的結(jié)果;不同分析方法的算法基礎(chǔ)不同,所以基于不同的分析軟件也會導(dǎo)致不同的結(jié)果。
當(dāng)近緣種形態(tài)差異不明顯時,微衛(wèi)星標(biāo)記可有效鑒別近緣物種。這種鑒別技術(shù)往往依賴于通用性強且特異性高的幾對PCR引物。引物的通用性要求引物的結(jié)合位點必須位于基因的保守區(qū),引物的特異性要求擴增產(chǎn)物必須位于基因的高變區(qū)。如果引物和被擴增片段都位于保守區(qū),那么不能有效地區(qū)分物種;如果引物和被擴增片段均位于高變區(qū),那么只能鑒別出物種內(nèi)部的不同組群。在含有微衛(wèi)星的直系同源基因上設(shè)計引物能夠很好地實現(xiàn)引物的通用性和特異性。雖然使用非同源位置的微衛(wèi)星標(biāo)記也可以鑒別近緣物種,但是這種擴增產(chǎn)物并不都是同源產(chǎn)物,擴增產(chǎn)物大小與物種間的親緣關(guān)系無明顯的相關(guān)性。非同源產(chǎn)物和擴增產(chǎn)物大小異源同型會嚴(yán)重干擾系統(tǒng)發(fā)育、群體遺傳學(xué)和進化研究[34],而使用直系同源基因內(nèi)的微衛(wèi)星標(biāo)記可以有效避免此類問題。將引物設(shè)計在直系同源基因的微衛(wèi)星側(cè)翼的保守序列上,僅擴增高變的微衛(wèi)星位點,可以有效鑒別這2種西施舌。有409組直系同源基因在2種西施舌中呈現(xiàn)了多態(tài)性的微衛(wèi)星序列,這些序列的發(fā)現(xiàn)為通用引物設(shè)計和西施舌物種鑒別奠定了基礎(chǔ)。
貝類微衛(wèi)星的挖掘傳統(tǒng)上采用磁珠雜交篩選、建立cDNA文庫的方式檢索微衛(wèi)星位點。李晶晶[17]用磁珠雜交篩選和表達序列標(biāo)簽(EST)數(shù)據(jù)庫檢索2種方法從西施舌閉殼肌中鑒定出51條含微衛(wèi)星的序列,包含12種重復(fù)基元。朱立靜等[18]用生物素—磁珠吸附法從西施舌中篩選出38個微衛(wèi)星位點,包含5種重復(fù)基元。但是這些方法效率較低,信息獲取度也較低。隨著高通量測序的飛速發(fā)展,基于轉(zhuǎn)錄組數(shù)據(jù)檢索微衛(wèi)星的方法得到廣泛應(yīng)用,這種方法獲得的微衛(wèi)星不僅具有一般分子標(biāo)記的特點,而且信息量大、通用性好、快速高效[35]。因此,本試驗中,使用基于轉(zhuǎn)錄組的方法得到了很多微衛(wèi)星,顯著多于上述研究。這些微衛(wèi)星將為2種西施舌的鑒別,種質(zhì)資源評估、開發(fā)、利用和保護奠定理論基礎(chǔ)。
在北方西施舌轉(zhuǎn)錄組中微衛(wèi)星出現(xiàn)頻率為6.0%,含63種重復(fù)基元;南方西施舌的微衛(wèi)星出現(xiàn)頻率為8.2%,含89種重復(fù)基元。在2個隱種的轉(zhuǎn)錄組中,除了單堿基重復(fù)外,優(yōu)勢重復(fù)類型均為三堿基重復(fù),三堿基重復(fù)的優(yōu)勢基元分別為AAC/GTT和ATC/ATG,最常見的微衛(wèi)星長度均為15 bp。微衛(wèi)星的重復(fù)次數(shù)主要集中在5~10次。有409組直系同源基因在2個隱種中含有不同的微衛(wèi)星序列,可以作為潛在的物種特異性分子標(biāo)記。