杜詩雨,張康琴,潘 達,孫紅英
(南京師范大學(xué)生命科學(xué)學(xué)院,江蘇省生物多樣性與生物技術(shù)重點實驗室,江蘇 南京 210023)
格氏束腰蟹(Somanniathelphusagrayi(Alcock,1909))(=Parathelphusa(Parathelphusa)chongiWu,1935)隸屬于擬地蟹總科(Gecarcinudoidea Rathbun,1904),擬地蟹科(Gecarcinucidae Rathbun,1904),束腰蟹屬(SomanniathelphusaBott,1968),喜生活在泥洞中[1-2]. 其最顯著的特征為雄性腹部第五、六節(jié)呈束腰狀[1].
近年來,高通量測序技術(shù)結(jié)合生物信息學(xué)注釋分析的方法已廣泛應(yīng)用于動物線粒體基因組的測定[3-7]. 由于線粒體基因組具有基因組小、大多為母系遺傳、進化速率快以及缺少內(nèi)含子等特點,被廣泛地應(yīng)用于種群遺傳、物種鑒定、分子進化和不同分類水平上的系統(tǒng)發(fā)生關(guān)系等研究[8]. 此外,由于線粒體基因功能上受約束,在DNA序列進化上相對保守,因此在基因的排列和DNA序列進化兩個層面上都可以為動物的系統(tǒng)進化研究提供豐富的信息[9].
迄今為止,已知的擬地蟹科淡水蟹類的線粒體基因組僅束腰蟹屬兩種:波陽束腰蟹(SomanniathelphusaboyangensisDai,Peng & Zhou,1994[17])和壩王束腰蟹(SomanniathelphusabawangensisDai & Xing,1994[14]),這兩種線粒體基因組排列呈現(xiàn)出了相同的基因排列順序[14]. 但是,現(xiàn)有線粒體基因組數(shù)據(jù)的匱乏,阻礙了擬地蟹科的分子進化和系統(tǒng)分類研究. 本文以格氏束腰蟹為研究對象,利用高通量測序技術(shù)首次測定了其線粒體基因組近全長序列,并通過序列比對和比較研究,解析了格氏束腰蟹線粒體基因組的結(jié)構(gòu)特征和基因排列順序. 該研究結(jié)果為束腰蟹屬近緣物種的系統(tǒng)分類和擴散提供了新的分子依據(jù).
格氏束腰蟹標(biāo)本在2015年10月11日采于云南省玉溪市華寧縣盤溪鎮(zhèn)(103.0631°E,24.2019°N). 標(biāo)本在采集并記錄生境后立即保存于95%乙醇中. 根據(jù)《中國動物志》(束腹蟹科,溪蟹科)[1]在體式顯微鏡(Nikon SMZ645)下對標(biāo)本進行分類鑒定. 標(biāo)本保存在南京師范大學(xué)生命科學(xué)學(xué)院,江蘇省生物多樣性與生物技術(shù)重點實驗室.
將存放于95%乙醇中的樣本取出,用已滅菌的鑷子在無菌環(huán)境下取適量的鰓組織樣本,浸泡于生理鹽水中,每30 min更換一次生理鹽水,進行脫醇處理. 使用動物基因組DNA提取試劑盒(通用型)(Generay Biotech)進行DNA的提取(具體操作步驟參照試劑盒說明書),獲得總DNA樣品. 使用瓊脂糖凝膠電泳檢測其完整性,并使用微量分光光度計檢測其濃度及質(zhì)量. 將質(zhì)量達標(biāo)后的DNA樣品送至北京諾禾致源科技股份有限公司進行高通量測序.
本文使用MitoZ v1.04[21]將測序結(jié)果(clean data)進行序列組裝和注釋. 隨后根據(jù)目前NCBI已知的 2種束腰蟹(波陽束腰蟹和壩王束腰蟹)線粒體基因組注釋結(jié)果進行手動校對,從而獲得格氏束腰蟹的線粒體基因組全序列. 并將注釋后的線粒體基因組序列使用MITOS Web Server(http://mitos.bioinf.uni-leipzig.de/index.py)進行再次識別確認(rèn).
用MEGA v7.0[22]進行堿基組成、密碼子使用情況和蛋白編碼基因同義密碼子相對使用率(Relative Synonymous Condon Usage,RSCU)的計算. 利用通用公式:AT-skew=(A-T)/(A+T),GC-skew=(G-C)/(G+C)進行堿基偏斜率的計算[23]. 使用在線MITOS Web Server對所有物種的tRNA基因二級結(jié)構(gòu)進行預(yù)測. 使用VARNA v3-93[24]和Rnaviz 2.0.3[25]對預(yù)測的tRNA基因二級結(jié)構(gòu)進行繪制,并使用Adobe Photoshop CS 6.0進行最終的修飾與美化.
圖1 格氏束腰蟹線粒體基因組結(jié)構(gòu)圖Fig.1 Mitogenomic map of Somanniathelphusa grayi
格氏束腰蟹線粒體基因組為長度17 654 bp的未閉合環(huán)狀DNA(圖1),其序列已提交至GenBank,檢索號為OM214524. 該線粒體基因組共有37個基因:13個蛋白質(zhì)編碼基因(PCGs),22個轉(zhuǎn)運RNA基因(tRNA gene)和2個核糖體RNA基因(rRNA gene). 由于主非編碼區(qū)(main non-coding region,mNCR)序列有著冗長的AT重復(fù),對該區(qū)段DNA序列的拼接造成干擾. 這種情況在節(jié)肢動物線粒體基因組中比較常見. 本文該種的mNCR所在片段區(qū)域在測定時同樣遇到此類情況,導(dǎo)致未能被完整測序. 有23個基因由正鏈編碼:9個PCGs(atp6,atp8,cox1,cox2,cox3,cob,nad2,nad3和nad6)和14個tRNA基因(trnI,trnM,trnW,trnL2,trnD,trnK,trnG,trnA,trnR,trnN,trnS1,trnE,trnT和trnS2);其余14個基因由反鏈編碼:4個PCGs(nad1,nad4,nad4L和nad5),8個tRNA基因(trnQ,trnC,trnY,trnF,trnH,trnP,trnL1和trnV)和2個rRNA基因(rrnL和rrnS)(表1),這與泛甲殼類和短尾下目線粒體基因組祖先型的編碼方向一致[19,26]. 該線粒體基因組堿基組成AT含量高達72.8%(35.1% A,18.4% C,8.8% G,37.7% T,表2),其AT偏斜率為-0.0357,GC偏斜率為-0.3529(表2).
表1 格氏束腰蟹線粒體基因組特征及波陽束腰蟹和壩王束腰蟹線粒體基因組特征Table 1 Mitogenomic features of Somanniathelphusa grayi,S.boyangensis and S.bawangensis
續(xù)表1 Table 1 continued
在格氏束腰蟹線粒體基因組中,共存在11處重疊區(qū),其長度范圍在1 bp~10 bp(表1);共存在18處間隔區(qū),其長度范圍在1 bp~344 bp,其中最長的間隔區(qū)位于nad3和trnA之間(表1),而在已公布的波陽束腰蟹和壩王束腰蟹線粒體基因組中,其最長間隔區(qū)均位于rrnS和trnI之間,長度分別為188 bp和 186 bp(表1). 由于每個線粒體基因組序列具有不等的基因間隔非編碼序列(intergenic noncoding sequences,IGNs),在十足目線粒體基因組中也經(jīng)常發(fā)現(xiàn)基因重疊和非編碼區(qū)[27-29],淡水蟹即是如此. 一些重疊區(qū)在淡水蟹類線粒體基因組中是相對保守的,這些重疊區(qū)也存在于格氏束腰蟹線粒體基因組中,例如,atp8和atp6之間的重疊序列為ATAA;nad4和nad4L之間的重疊序列為ATGTTAA[7,10-11,14,20].
在格氏束腰蟹的13個蛋白質(zhì)編碼基因中,所有蛋白質(zhì)編碼基因均為典型的ATN起始密碼子,其中,cox1,cox2,cox3,atp8,nad2,nad4,nad4L和cob的起始密碼子為ATG;atp6,nad1,nad3,nad5和nad6的起始密碼子為ATA. 與已有的兩種束腰蟹線粒體基因組序列相比,除壩王束腰蟹的nad3為ATC,nad5為ATG外,其余基因起始密碼子均相同(表1). 而終止密碼子中,除nad5和cox3的終止密碼子為不完整的TA,cob的終止密碼子為不完整的T外,其余10個蛋白質(zhì)編碼基因均為完整的終止密碼子(TAA或TAG),和已知的2條束腰蟹線粒體情況相同(表1). 蛋白質(zhì)編碼基因的起始密碼子通常是ATN,但終止密碼子主要是TAA,而TAG、TA和T很少,這種現(xiàn)象也發(fā)生在其他短尾下目物種中[7,14,17,28-30].
在13個蛋白質(zhì)編碼基因中,atp8的A+T含量最高,為76.9%;cox1的A+T含量最低,為65.2%(表2). 位于正鏈上的蛋白質(zhì)編碼基因發(fā)生了T偏斜(AT偏斜率為-0.157 0)和C偏斜(GC偏斜率為-0.279 7);而位于反鏈上的蛋白質(zhì)編碼基因發(fā)生了T偏斜(AT偏斜率為-0.199 4)和較明顯的G偏斜(GC偏斜率為0.412 2)(表2).
RFID防偽平臺負(fù)責(zé)對商品上的RFID電子標(biāo)簽進行防偽溯源信息(生產(chǎn)日期、物流信息等)的寫入并上傳至溯源信息管理平臺。為了實現(xiàn)溯源這項功能, 采集成功的RFID標(biāo)簽數(shù)據(jù)還需要進行相應(yīng)的處理和數(shù)據(jù)存儲。防偽平臺的硬件結(jié)構(gòu)如圖4所示:
表2 格氏束腰蟹線粒體基因組堿基組成Table 2 Nucleotide composition of mitochondrial genome of Somanniathelphusa grayi
格氏束腰蟹的密碼子使用總數(shù)為3 711次,其中使用頻率最高的密碼子是亮氨酸(UUA-Leu)(共被使用351次,RSCU=3.53). 蛋白編碼基因的同義密碼子相對使用率情況如圖2所示. 其中,亮氨酸Leu(595次)、苯丙氨酸Phe(355次)和異亮氨酸Ile(336次)是使用最頻繁的3個氨基酸(圖2),約占34.65%.
圖2 格氏束腰蟹、波陽束腰蟹和壩王束腰蟹線粒體基因組蛋白質(zhì)編碼基因同義密碼子相對使用率Fig.2 The relative synonymous codon usage(RSCU)of 13 PCGs in Somanniathelphusa grayi,S.boyangensis and S.bawangensis
格氏束腰蟹的22個tRNA基因的二級結(jié)構(gòu)圖如圖3所示. 除了trnS1-AGN缺少一個穩(wěn)固的雙氫尿嘧啶(DHU)臂,其余所有tRNA基因的二級結(jié)構(gòu)均為典型的三葉草結(jié)構(gòu),即擁有4個恒定臂. 其中trnS1-AGN二級結(jié)構(gòu)DHU臂的缺失在大部分后生動物中均有報道[31-32],且在很多短尾下目物種中也發(fā)現(xiàn)了這種情況[7,17-18,20].
22個tRNA基因的長度范圍為63 bp~74 bp(表1),由于各可變環(huán)長度有所不同,以及DHU臂和TΨC臂的長度變化使得各tRNA基因的長度有所差異[33]. 其中,15種tRNA基因(trnA,trnR,trnD,trnC,trnQ,trnE,trnG,trnH,trnK,trnF,trnP,trnS1,trnS2,trnY,trnV)共存在30對GU堿基錯配(圖3),多數(shù)發(fā)生在DHU臂,氨基酸接受(AA)臂和反密碼子(AC)臂,較少數(shù)發(fā)生在TΨC臂,trnC和trnQ中的錯配數(shù)最多,均為 4對(圖3).
2個rRNA基因,即rrnL和rrnS,分別位于trnL1和trnV,trnV和trnI之間(表1).rrnL和rrnS的長度分別為1 310 bp和837 bp,其AT含量分別為76.2%和77.4%(表1).
圖3 格氏束腰蟹22個tRNA基因二級結(jié)構(gòu)圖Fig.3 Secondary structures of 22 tRNA genes from Somanniathelphusa grayi
與短尾下目祖先型線粒體排列順序(brachyuran ground-pattern mitochondrial gene order,BMGO)相比較發(fā)現(xiàn),格氏束腰蟹的線粒體排列順序發(fā)生了較明顯的變化. Jia等[17]在研究波陽束腰蟹的線粒體基因組排列順序時,認(rèn)為mNCR位于rrnS與trnI之間,長度為188 bp(表1),AT含量為87.8%. 而目前已知的海洋類短尾下目物種的mNCR長度范圍在332 bp~2 140 bp[14]. 因此,Zhang等在分析壩王束腰蟹和波陽束腰蟹的線粒體基因組后,通過序列長度,AT含量和串聯(lián)重復(fù)元件等綜合比較發(fā)現(xiàn),認(rèn)為壩王束腰蟹和波陽束腰蟹的mNCR均應(yīng)位于trnC與trnQ之間[14],修正了波陽束腰蟹的線粒體基因排列順序,認(rèn)為波陽束腰蟹與壩王束腰蟹擁有相同的基因排列順序[14]. 而本文所研究的格氏束腰蟹線粒體基因組排列順序與波陽束腰蟹和壩王束腰蟹的線粒體基因排列順序均相同.
迄今為止,約有55.2%的已知的短尾下目物種發(fā)生線粒體基因組重排情況. 格氏束腰蟹與此前所報道的2種束腰蟹的基因排列順序一致,即擬地蟹線粒體基因組排列類型I(gecarcinucid mitochondrial gene order pattern I,GMGO1)(圖4),該重排類型涉及6個tRNA基因(trnR,trnN,trnF,trnP,trnQ和trnC),1個PCG(nad5)和1個mNCR的排列順序變化(圖4). 這些基因的重排可以用置換[34]和復(fù)制/隨機丟失(TDRL)[35]模型進行解釋. 本文通過以下3個假設(shè)步驟解釋了GMGO1的形成過程:首先,mNCR從[rrnS-trnI]基因簇中移出(圖5a),然后移入[trnW-trnC]基因簇中(圖5 b);其次,基因簇[trnR-trnN-trnS1-trnE-trnH-trnF-nad5-nad4-nad4L-trnT-trnP-nad6-cob-trnS2-nad1-trnL1-rrnL-trnV-rrnS-mNCR-trnI-trnQ-trnM-nad2-trnW-trnC](圖5c)被串聯(lián)復(fù)制并生成兩組相同的基因簇[trnR-trnN-trnS1-trnE-trnH-trnF-nad5-nad4-nad4L-trnT-trnP-nad6-cob-trnS2-nad1-trnL1-rrnL-trnV-rrnS-mNCR-trnI-trnQ-trnM-nad2-trnW-trnC-trnR-trnN-trnS1-trnE-trnH-trnF-nad5-nad4-nad4L-trnT-trnP-nad6-cob-trnS2-nad1-trnL1-rrnL-trnV-rrnS-mNCR-trnI-trnQ-trnM-nad2-trnW-trnC](圖5d);最后,串聯(lián)復(fù)制后生成的基因簇在隨機丟失26個基因之后,形成了目前已知的線粒體基因重排類型,GMGO1.
BMGO:短尾下目祖先型線粒體基因排列順序;GMGO1:擬地蟹線粒體基因組排列順序;箭頭顯示重新排列的基因或基因塊圖4 BMGO和GMGO1兩種基因排列順序的比較Fig.4 Comparison of gene arrangements of BMGO and GMGO1
(a)BMGO基因排列順序;(b)mNCR的異位;(c)重復(fù)基因區(qū)域;(d)26個基因的串聯(lián)重復(fù)(16個tRNA基因,7個PCGs,2個rRNA基因和1和mNCR):trnR/trnN/trnF/nad5/trnP/nad1/trnL1/rrnL/trnV/rrnS/trnI/trnM/nad2/trnW/trnS1/trnE/trnH/nad4/nad4L/trnT/nad6/cob/trnS2/trnQ/mNCR/trnC;且復(fù)制的26個基因隨機丟失形成新的基因順序;(e)GMGO1基因順序圖5 串聯(lián)重復(fù)/隨機丟失和重復(fù)/反密碼子突變假設(shè)過程Fig.5 The hypothetical process of gene rearrangement in the model of tandem duplication/random loss and duplication/anticodon mutation
對十足目動物的線粒體基因組研究發(fā)現(xiàn),線粒體基因組的排列順序可能與生態(tài)環(huán)境轉(zhuǎn)變之間有著重要的聯(lián)系[12,36]. 線粒體基因組的排列順序可能會在適應(yīng)新環(huán)境時發(fā)生變化. 例如柯氏絨鎧蝦(ShinkaiacrosnieriBaba & Williams,1998)和湯花深白蟹(Gandalfusyunohana)(Takeda,Hashimoto & Ohta,2000)這兩類適應(yīng)極高溫環(huán)境的十足類,其線粒體基因排列順序發(fā)生了變化[37-38];一種適應(yīng)從水生過渡到洞棲陸生生活的一種滑鰲蝦(Cheraxdestructor(Clark,1936)),其線粒體排列順序也發(fā)生了變化[3];中華絨螯蟹(EriocheirjaponicasinensisMilne-Edwards,1853)的線粒體基因組基因的加速重排可能提示適應(yīng)非海洋生活過程中的快速輻射進化[28]. 本文發(fā)現(xiàn)3種束腰蟹類的線粒體基因組重排變化較大,共有1個蛋白質(zhì)編碼基因和6個tRNA基因發(fā)生重排,這是否與它們對淡水環(huán)境的適應(yīng)性進化有關(guān),還需要通過更多相關(guān)類群的線粒體基因組數(shù)據(jù)進行分子進化研究.
另外,在溪蟹科淡水蟹類發(fā)現(xiàn)了線粒體基因組的高度重排現(xiàn)象[14],但是在擬地蟹科中,是否也會出現(xiàn)與這些已知的重排類型類似或者新的重排方式,這些都還有待進一步擴大擬地蟹科類群的取樣,獲得必要的線粒體基因組數(shù)據(jù),從而挖掘蘊含在線粒體基因組中的進化信息,并探索線粒體基因重排在擬地蟹科類群中的進化含義.
格氏束腰蟹的主要鑒別特征為背部頸溝較為明顯,且雄性腹部呈明顯的“沙漏形”(hourglass-shaped)[39]. Alcock[39]首次描述了格氏束腹蟹(Parathelphusa(Parathelphusa)grayi),模式標(biāo)本采自印度Moung Sal. 伍獻文[40]描述了常氏束腹蟹(Parathelphusa(Parathelphusa)chongiWu,1935),模式標(biāo)本采自中國云南,該物種系首個由中國學(xué)者發(fā)現(xiàn)和描述的中國淡水蟹類物種[1,41]. 隨后,這兩個物種均被厘定至束腰蟹屬(SomanniathelphusaBott,1968[42]),即格氏束腰蟹(Somanniathelphusagrayi(Alcock,1909))和常氏束腰蟹(Somanniathelphusachongi(Wu,1935)). 戴愛云等[43]描述了中華束腰蟹常氏亞種(SomanniathelphusasinensischongiDai,Feng,Chen,Song,1984),模式標(biāo)本采自中國云南. 隨后,戴愛云認(rèn)為中華束腰蟹常氏亞種(S.sinensischongi)是常氏束腰蟹(S.changi)的同物異名[1],并將該種歸并于常氏束腰蟹S.chongi. Ng等梳理了世界短尾類分類系統(tǒng),認(rèn)為常氏束腹蟹P.(P.)chongi(即常氏束腰蟹S.chongi)是格氏束腰蟹S.grayi的同物異名[2],并將該種歸并于格氏束腰蟹S.grayi.值得注意的是,常氏束腰蟹分布在印度MoungSai,而格氏束腰蟹S.grayi分布在我國云南,地理相隔較遠(yuǎn),很可能不是同一物種.束腰蟹S.Chongi屬種間雄性腹肢整體形態(tài)極為相似,形態(tài)特征差異不明顯,分類鑒定較為困難,加上缺乏對格氏束腰蟹S.grayi正模的詳細(xì)形態(tài)描述[39],因此常氏束腹蟹P.(P.)chongi和格氏束腰蟹S.grayi的分類厘定還有待進一步的研究.
線粒體基因排列順序可以作為特定譜系和分類群的共衍生性狀,并為系統(tǒng)發(fā)生和進化關(guān)系提供了重要的分子證據(jù)[44].trnH基因從nad5-nad4基因塊易位到nad3-nad5之間被認(rèn)為是短尾下目所共享的特征[28],本文所研究的格氏束腰蟹和已知的兩種束腰蟹均存在trnH基因的易位現(xiàn)象[14,17]. Zhang等在對溪蟹科淡水蟹的線粒體基因排列順序的進化歷程分析時發(fā)現(xiàn),小華溪蟹(SinopotamonparvumDai,Song,Li,Chen,Wang & Hu,1985)與小石蟹屬(TenuilapotamonDai,Song,Li,Chen,Wang & Hu,1984)物種共享一致的重排類型,且親緣關(guān)系較近,認(rèn)為小華溪蟹的分類地位應(yīng)重新厘訂[14]. 已知動物線粒體基因組的基因排列順序相對保守[44-46],因此不同的類群共享相同或相似的線粒體基因排列順序可能是來源于共同祖先的結(jié)果[14]. 本研究發(fā)現(xiàn),目前已有線粒體基因組序列的三種束腰蟹分別分布在我國云南(普文、芒掌、思茅、芒洪、景洪、勐洪、小勐養(yǎng)、曼尾、勐罕、勐養(yǎng)、勐海、麻栗坪)、江西(波陽、都昌、沿山)和海南島(壩王嶺、儋縣、黎母山、白沙)[1]. 雖然這3個物種呈異域分布,其分布區(qū)之間相隔較遠(yuǎn),但線粒體基因排列順序相一致,提示它們是由共同的祖先進化而來. 對于常氏束腰蟹與格氏束腰蟹的分類關(guān)系,線粒體基因組信息(包括DNA序列和基因排列順序)或可以提供新的證據(jù). 因此,亟需獲取分布于印度格氏束腰蟹的線粒體基因組數(shù)據(jù)做進一步驗證.
本文首次測定了格氏束腰蟹的線粒體基因組近全長序列,確定其為長度17 654 bp的未閉合環(huán)狀DNA. 與短尾類祖先類型線粒體基因組比較,格氏束腰蟹線粒體基因組基因順序與已公布的兩種束腰蟹線粒體基因順序變化一致,共涉及7個基因的重排(1個蛋白質(zhì)編碼基因和6個tRNA基因). 三種在我國云南、江西和海南島異域分布的束腰蟹種類所共享的線粒體基因排列順序是該類群重要的共近裔特征之一. 該研究為束腰蟹線粒體基因順序在其分類和分布方面提供了借鑒,也為擬地蟹科淡水蟹類線粒體基因組信息提供了新的分子證據(jù).