劉其則,陳忠蔭,廖征藍,夏 巖,郭 坤,杜 宇,林熾賢
(1.海南熱帶海洋學院a.水產(chǎn)與生命學院;b.海南省兩棲爬行動物研究重點實驗室;c.熱帶海洋生物資源利用與保護教育部重點實驗室,海南 三亞,572022;2.溫州大學 生命與環(huán)境科學學院,浙江 溫州 325035)
SSR(Simple sequence repeat)是一類常用的微衛(wèi)星分子標記,通常是由1~6個堿基組成的基本單位重復多次組成的一小段DNA序列[1]。SSR在真核生物基因組中廣泛存在,具有豐富的多態(tài)性。SSR廣泛用于遺傳圖譜構(gòu)建、遺傳多樣性分析、數(shù)量性狀基因座(QTL)分析和系譜分析等[2-5]。傳統(tǒng)的SSR開發(fā)技術(shù)的過程煩瑣,效率較低?;谵D(zhuǎn)錄組測序得到的SSR具有數(shù)目多和質(zhì)量優(yōu)等特點,已被廣泛用于植物種質(zhì)資源分析和譜系分析[6-7]。近年來,科研工作者對多種魚類進行了基于轉(zhuǎn)錄組測序的SSR位點開發(fā),為輔助分子育種提供了良好的遺傳信息基礎[8]151,[9]123,[10]。
北草蜥(Takydromusseptentrionalis)是蜥蜴科草蜥屬的一種爬行動物,為中國特有種,這種方式的SSR位點開發(fā)在越來越多的類群中都有不同程度的開展,以此進行種群遺傳、親子鑒定和遺傳圖譜等相關(guān)研究[11]。北草蜥廣泛分布于我國的華北地區(qū),其系統(tǒng)發(fā)育樹的構(gòu)建和遺傳結(jié)構(gòu)的分析有助于人們了解爬行動物的進化過程中的重要事件。北草蜥生境類型較多,體色變化具有環(huán)境溫度依賴性,在其不同種群間也存在體色變化能力的差異[12]。說明北草蜥皮膚顏色和變化能力都與環(huán)境有很強相關(guān)性,在基因水平上也可能存在很大的種群差異性。本文基于北草蜥皮膚的轉(zhuǎn)錄組測序結(jié)果分析,得到了大量的SSR位點和SNP信息;從SSR位點和SNP信息的分布特點、出現(xiàn)的頻率等方面進行分析,旨在為北草蜥的基因克隆、遺傳圖譜構(gòu)建和進化關(guān)系分析等提供理論方法。
依據(jù)文獻報道[12]8,下載北草蜥轉(zhuǎn)錄組測序數(shù)據(jù)。該數(shù)據(jù)是對來自湖南桂陽種群的雄性北草蜥皮膚樣品,進行Illumina HiSeq測序后,通過Trinity軟件拼接得到unigenes。
通過SSR分析軟件Micro SAtellite(MI-SA)對417 190條unigenes序列進行SSR搜索,設定篩選條件:重復單位的堿基數(shù)目為1~6個,SSR序列總長度大于10 bp,單堿基的重復基元的重復次數(shù)大于10,剩余的重復基元的重復次數(shù)大于5次[13]。
通過Trinity拼接了9個樣本的轉(zhuǎn)錄組測序結(jié)果(表1),得到417 190條轉(zhuǎn)錄本序列,合計全長479 055 094 bp。共計識別到60 968個SSR位點,其中包含SSR位點的轉(zhuǎn)錄本數(shù)目為56 456條(占總轉(zhuǎn)錄本數(shù)目的13.53%)。所有轉(zhuǎn)錄本序列中的10 644個unigenes有1個以上的SSR位點,存在復合形式的SSR位點的數(shù)量有4 513個。北草蜥中存在豐富的SSR類型,1~6個核苷酸重復的類型都存在。不同類型的核苷酸重復含量差異較大,單核苷酸重復型有27 028個(44.33%);2核苷酸重復型和3核苷酸重復型分別有17 876個(29.31%)和13 332個(21.87%);4~6核苷酸重復型含量極少,位點總數(shù)占比只有4.48%,其中,4核苷酸重復型有2 580個(4.23%),5核苷酸重復型和6核苷酸重復型分別只有112個(0.18%)和40個(0.07%)。不同個類型的SSR位點的序列總長度不一樣,從大到小依次:1、2、3、4、5、6核苷酸重復型。SSR位點的平均長度為15.80 bp(963 422 bp÷60 968),各SSR位點的平均長度依次:11.15、17.32 、19.76、32.60、32.68、32.10 bp。從整體上看,在北草蜥轉(zhuǎn)錄組中,平均約7.86 kb出現(xiàn)1個SSR位點。
表1 北草蜥SSR類型和分布情況
在北草蜥轉(zhuǎn)錄組的SSR位點中,完美型重復(P型)有52 498個,復合型重復(C型)有3 957個。P型SSR位點有6種,分別為完美單堿基重復(P1)、完美雙堿基重復(P2)、完美3堿基重復(P3)、完美4堿基重復(P4)、完美5堿基重復(P5)和完美6堿基重復(P6)。其中:P1、P2和P3數(shù)量較多,分別為274.46、251.49、224.04 kb;其次是P4,為69.10 kb;而P5和P6數(shù)量很少,分別只有3.48 kb和1.03 kb。在北草蜥轉(zhuǎn)錄組中,平均每Mb上有0.009個完美重復的SSR。
依據(jù)北草蜥轉(zhuǎn)錄組中不同類型的SSR位點重復次數(shù)分布的結(jié)果顯示,一共有106種重復基元,1~6核苷酸重復基元的種類依次為2、4、10、33、31和26。單核苷酸重復型有A/T和C/G 2種,其出現(xiàn)的次數(shù)占絕對優(yōu)勢,分別有8 665個和18 363個,占總SSR數(shù)目的14.21%和30.12%。2核苷酸重復型中,AC/GT和AG/CT出現(xiàn)相對較多,分別有9 968和5 670個,占總SSR數(shù)目的16.35%和9.30%。3核苷酸重復型中,AAT/ATT數(shù)量最多有5 252個,占總SSR數(shù)目的8.61%;其次是AGG/CCT和AGC/CTG,分別有1 252和1 236個。4核苷酸重復型中的重復基元只有9個出現(xiàn)的次數(shù)超過100次,依次為AAGG/CCTT、AGAT/ATCT、AAAG/CTTT、AAAC/GTTT、AAAT/ATTT、AGGG/CCCT、AGGC/CCTG、ACAG/CTGT、ACAT/ATGT。5~6核苷酸重復型的基元較多,但是每個基元出現(xiàn)的次數(shù)都很少。
在北草蜥轉(zhuǎn)錄組SSR位點中,重復的次數(shù)有5~94次,其中,10次重復出現(xiàn)的概率最大,有14 700個位點出現(xiàn)10次重復,占比24.11%;其次是6次重復出現(xiàn)的概率,共有10 157個位點,占比16.66%;重復次數(shù)為13次及以上的位點較少,總占比10.96%。單核苷酸重復型、2~3核苷酸重復型的SSR位點的重復次數(shù)比4~6核苷酸重復型的SSR位點的重復次數(shù)更多,其中,以單核苷酸重復型SSR的重復次數(shù)類型的數(shù)目最多(表2)。
表2 北草蜥不同類型SSR重復次數(shù)分布
對SSR的長度分析發(fā)現(xiàn),北草蜥轉(zhuǎn)錄組SSR的長度分布在10~102 bp。其中:小于12 bp的SSR位點為20 727個;12~20 bp的SSR位點為31 297個;大于20 bp的SSR位點為8 944個。在所有SSR位點中,高度多態(tài)性和中度多態(tài)性的SSR位點占總數(shù)的66%。
通過分析得到SNP位點有1 097 299個,平均每kb有5.73個SNP位點。其中:轉(zhuǎn)換型SNP位點有C/T和A/G 2種,其位點分別有366 261和372 000個,占總位點數(shù)的比例為67.28%;顛換型SNP位點有A/T、A/C、T/G和C/G 4種,其位點分別有89 567、87 601、88 436和93 434個,占總位點數(shù)的比例為32.72%。
本研究在417 190條unigenes覆蓋的參考基因組序列中,共檢測到P型和C型2種SSR位點共計60 968 個,其中:P型位點較多,占位點總數(shù)的86.11%;C型位點極少,只占位點總數(shù)的6.50%。在所有SSR位點中,低核苷酸(1~3)重復型出現(xiàn)次數(shù)占所有核苷酸重復類型(1~6核苷酸重復型)出現(xiàn)次數(shù)的比例明顯高于多核苷酸(4~6)重復型出現(xiàn)的比例,這與魚類和昆蟲中的研究結(jié)果類似[8]151,[9]125,[14]104,[15]12,[16]1803,[17]47,[18]54,[19]11。中度多態(tài)性的SSR位點的數(shù)目也明顯多于高度多態(tài)性SSR位點數(shù)目,這也與魚類和昆蟲的研究結(jié)果類似[8]151,[9]125,[14]104,[15]12,[16]1803,[17]47,[18]54,[19]11。
在魚類中,銀鯧(Pampusargenteus)和江鱈(Lotalota)中的SSR以單核苷酸重復的數(shù)目最多;牙鲆(Paralichthysolivaceus)和印尼虎魚(Datnioidesmicrolepis)中則以2核苷酸重復型的數(shù)目最多[9]125,[14]103,[16]1802,[19]10。分析具體使用的篩選條件時發(fā)現(xiàn):銀鯧和江鱈中,重復序列的閾值設定在了10 bp[14]103,[15]11;牙鲆和印尼虎魚中,篩選閾值設定在了15 bp[9]123,[19]10。因此,篩選條件的差異可能是影響單核苷重復型和2核苷酸重復型SSR的數(shù)目產(chǎn)生差異的原因之一。但是在昆蟲中,溫帶臭蟲中SSR以單核苷酸重復型的數(shù)目最多;印度谷螟(Plodiainterpunctella)中SSR以2核苷酸重復型的數(shù)目最多;桔小實蠅(Bactroceradorsalis)中SSR以3核苷酸重復型的數(shù)目最多[16]1803,[18]54。研究其分析方法發(fā)現(xiàn),在這3種昆蟲的研究中選擇的閾值是相同的[16]1802,[18]53,說明不同物種間SSR類型還是存在顯著差異。但總體來說,低核苷酸(1~3)重復型出現(xiàn)次數(shù)占所有核苷酸重復類型(1~6核苷酸重復)出現(xiàn)數(shù)目的比例明顯高于多核苷酸(4~6)重復型出現(xiàn)的比例,中度多態(tài)性的SSR位點的數(shù)目也明顯多于高度多態(tài)性SSR位點數(shù)目[8]151,[9]125,[14]104,[15]11,[16]1803,[17]46,[18]54,[19]11。由于本研究采用的篩選閾值較為寬泛,因此可以篩選到更多的SSR位點,這有利于后續(xù)關(guān)于北草蜥體色種群遺傳的相關(guān)性研究。
在對北草蜥轉(zhuǎn)錄組中的SSR位點進行分析發(fā)現(xiàn),單核苷酸重復型有C/G的出現(xiàn)的次數(shù)顯著多于A/T出現(xiàn)的次數(shù)。但是在江鱈、印尼虎魚等魚類,溫帶臭蟲(Cimexlectularius)、印度谷螟(Plodiainterpunctella)等昆蟲中,以及在大熊貓(Ailuropodamelanoleuca)等哺乳類的大多數(shù)物種中,單核苷酸重復型中A/T基因序列最為豐富[14]104,[16]1803,[17]47,[19]11,[20]。因此,北草蜥中單核苷酸重復型中C/G基因序列的高豐度可能是較為獨特的存在。2核苷酸重復型中,AC/GT和AG/CT出現(xiàn)頻率較高,而AC/GT基因序列最為豐富,這與江鱈、印尼虎魚和奧地利羅非魚(Oreochromisniloticus)等物種中的發(fā)現(xiàn)相一致[8]151,[15]11,[19]10。但是在印度谷螟和桔小實蠅等昆蟲中,AT/AT基因序列出現(xiàn)的頻率最高[18]53,[19]10。北草蜥中3核苷酸重復型和4核苷酸重復型的基元主要以AAT/ATT和AAGG/CCTT為主,而江鱈中主要以CTC/GAG和ATAC/GTAT為主[15]13,印度谷螟中則以CCG/CGG和AAAT/ATTTT為主[17]45。這表明3核苷酸重復型和4核苷酸重復型在物種中的變異比單核苷酸重復型和2核苷酸重復型都大。這可能與3核苷酸重復型基因序列除了形成了不同的DNA結(jié)構(gòu)外,還可能與物種進化中產(chǎn)生物種特異性細胞因子時發(fā)揮著重要作用有關(guān)[21]。
(責任編輯:潘學峰)