孟 乾,張志勇,張志偉,張曹進(jìn),陳淑吟,祝 斐,賈超峰,曹廣勇
( 江蘇省海洋水產(chǎn)研究所,江蘇省海水魚類遺傳育種重點(diǎn)實(shí)驗(yàn)室,江蘇 南通 226007 )
在生物體內(nèi)的蛋白質(zhì)翻譯過(guò)程中,編碼同一種氨基酸的不同密碼子稱為同義密碼子,而不同基因在蛋白質(zhì)編碼過(guò)程中會(huì)傾向于使用一些特定的同義密碼子,叫作同義密碼子的使用偏性,不同物種及不同功能基因的密碼子使用偏性均存在差異[1-5]。線粒體DNA(mtDNA)具有進(jìn)化速率快、核苷酸替代率高及母性遺傳等特點(diǎn),已成為魚類進(jìn)化、鑒定及種質(zhì)遺傳等研究的重要遺傳分子標(biāo)記,mtDNA的密碼子偏性研究有助于推進(jìn)魚類的鑒定、發(fā)育及遺傳育種等研究。
斑石鯛(Oplegnathuspunctatus)和條石鯛(O.fasciatus)均屬鱸形目、石鯛科、石鯛屬,在我國(guó)沿海均有分布,且具有美觀、營(yíng)養(yǎng)豐富、生長(zhǎng)快及抗逆性強(qiáng)等特點(diǎn),具有較高的觀賞與經(jīng)濟(jì)價(jià)值,其海水養(yǎng)殖產(chǎn)業(yè)具有發(fā)展前景[6-9]。目前,國(guó)內(nèi)外對(duì)條石鯛和斑石鯛的研究主要集中在選擇育種、人工繁殖技術(shù)、病害及分類等方面[7-15],而在mtDNA水平研究較少。孫鵬等[16]以mtCOX1和Cytb片段探討了條石鯛野生種群多樣性。此外,斑石鯛和條石鯛間已實(shí)現(xiàn)人工雜交,二者在基于mtCOX1、Cytb基因和D-loop序列片段的遺傳差異比較中顯示親緣關(guān)系較近[17-18]。筆者以斑石鯛和條石鯛mtDNA編碼蛋白基因序列為研究對(duì)象進(jìn)行密碼子偏好性分析,并與斑馬魚(Daniorerio)、金鼓魚(Scatophagusargus)、黑鯛(Acanthopagrusschlegelii)和真鯛(Pagrosomusmajor)mtDNA編碼蛋白質(zhì)的基因序列進(jìn)行比對(duì)和密碼子偏好性聚類分析,探討石鯛科與其他物種間的親緣關(guān)系,以期為探討兩者間的近緣雜交育種、種質(zhì)資源等研究提供理論依據(jù)。
本研究所用斑石鯛、條石鯛、斑馬魚、金鼓魚、黑鯛和真鯛的線粒體基因組基因序列均來(lái)源于美國(guó)國(guó)立生物技術(shù)信息中心GenBank數(shù)據(jù)庫(kù)(表1)。
表1 斑石鯛、條石鯛及其他物種的登錄號(hào)
相對(duì)密碼子使用度,是指對(duì)于某一特定的密碼子在編碼對(duì)應(yīng)氨基酸的同義密碼子間的相對(duì)概率,可直觀地反映密碼子使用的偏好性。當(dāng)某一密碼子相對(duì)密碼子使用度=1,代表該密碼子的使用沒(méi)有偏好性;相對(duì)密碼子使用度>1時(shí),表明該密碼子為使用相對(duì)較多的密碼子,反之亦然。第i個(gè)氨基酸的第j個(gè)密碼子的相對(duì)密碼子使用度(RSCUij)的計(jì)算公式[3]如下:
式中,xij是編碼第i個(gè)氨基酸的第j個(gè)密碼子的出現(xiàn)次數(shù),ni是編碼第i個(gè)氨基酸的同義密碼子的數(shù)量(值為1~6)。
用CodonW對(duì)斑石鯛和條石鯛mtDNA中編碼蛋白基因序列分別進(jìn)行分析,得出每條序列中各密碼子的相對(duì)密碼子使用度以及密碼子的第3位堿基中A、U、G、C的含量在第3位堿基總量中所占的比率(分別為A3s、U3s、G3s、C3s);用Microsoft Excel 2006統(tǒng)計(jì)分析數(shù)據(jù)。
將各密碼子含量以標(biāo)準(zhǔn)得分存為變量作為橫軸,相對(duì)密碼子使用度值以1為原點(diǎn)作為縱軸,以Microsoft Excel 2006作散點(diǎn)圖;每個(gè)物種的mtDNA編碼蛋白質(zhì)的基因作為一個(gè)對(duì)象,將密碼子的相對(duì)密碼子使用度作為變量,以偏好性密碼子的相對(duì)密碼子使用度(大于1)對(duì)基因的密碼子使用偏好性進(jìn)行聚類分析;去除斑石鯛等6個(gè)物種的mtDNA的ATP8、ND3和ND4L(序列長(zhǎng)度較短),每個(gè)基因(ND1、ND2、COX1、COX2、ATP6、COX3、ND6、ND4、ND5、Cytb)各自看成一類并以Mega 5.1進(jìn)行聚類分析。
斑石鯛和條石鯛的mtDNA編碼蛋白基因中的C3s分別為31.21%和35.86%,均大于A3s、U3s、G3s(表2),可見(jiàn)斑石鯛和條石鯛的mtDNA編碼蛋白基因偏愛(ài)使用以C堿基結(jié)尾密碼子,避免使用以G結(jié)尾密碼子。
表2 斑石鯛和條石鯛mtDNA編碼蛋白質(zhì)基因密碼子的A3s、U3s、G3s、C3s %
斑石鯛以UUC、ACC等30個(gè)密碼子的相對(duì)密碼子使用度均大于1(表3),為斑石鯛mtDNA編碼蛋白基因的偏好性密碼子,條石鯛比斑石鯛的mtDNA編碼蛋白基因的偏好性密碼子少2個(gè)(CCA和GUC),其中尤其偏愛(ài)使用以C結(jié)尾的密碼子(斑石鯛除AUC外,條石鯛除AUC和GUC外,其余的均為偏好性密碼子),其次偏愛(ài)以A結(jié)尾的密碼子(特別是CGA,其相對(duì)密碼子使用度分別為2.96和3.32);盡量避免使用以G結(jié)尾的密碼子(除斑石鯛CGG的相對(duì)密碼子使用度值為0.86,其余相對(duì)密碼子使用度均小于0.5)。
表3 斑石鯛和條石鯛線粒體編碼蛋白基因序列偏好密碼子的相對(duì)密碼子使用度
(續(xù)表3)
(續(xù)表3)
依據(jù)密碼子編碼氨基酸原理進(jìn)行計(jì)算,斑石鯛和條石鯛線粒體中的各種氨基酸含量基本一致,含量較高的4種氨基酸依次為亮氨酸>異亮氨酸>丙氨酸>蘇氨酸,其中除異亮氨酸偏好密碼子為AUU,其余3種氨基酸的偏好密碼子也均以AC結(jié)尾(圖1)。
圖1 斑石鯛和條石鯛各種氨基酸含量
斑石鯛與條石鯛線粒體編碼蛋白序列因子相關(guān)性分析x、y兩軸的分析結(jié)果表明,該2種魚線粒體編碼蛋白序列中,AC結(jié)尾的密碼子與GU結(jié)尾的密碼子明顯分開,距離中心較近的AC結(jié)尾與GU結(jié)尾密碼子比例相近,但A、C含量相對(duì)較高(圖2),表明該2種魚較偏好使用AC結(jié)尾的密碼子。
圖2 斑石鯛和條石鯛線粒體編碼蛋白序列的因子相關(guān)性分析
在對(duì)基因密碼子使用概率進(jìn)行聚類分析的過(guò)程中,將每個(gè)物種的mtDNA編碼蛋白質(zhì)的基因作為一個(gè)對(duì)象,將密碼子的相對(duì)密碼子使用度作為變量。除去相對(duì)密碼子使用度始終為1的編碼色氨酸和甲硫氨酸的密碼子UGG和AUG,再除去3個(gè)不編碼氨基酸的終止密碼子,取余下的59個(gè)中偏好性密碼子的相對(duì)密碼子使用度(大于1)對(duì)基因的密碼子使用偏好性進(jìn)行聚類分析。
聚類結(jié)果見(jiàn)圖3,大致分為2類:斑石鯛與條石鯛首先聚類,然后與金鼓魚聚為一類;金鼓魚和黑鯛首先聚為一類,說(shuō)明它們的密碼子使用的偏好性相似。此外,斑石鯛與金鼓魚幼魚階段形態(tài)相似:金鼓魚體黃褐色,體扁、吻短,散布許多黑圓斑,腹部銀白;斑石鯛體色較淡呈灰褐色,各鰭暗色,頭部、體側(cè)、胸鰭及各奇鰭基部密布許多黑斑(圖4)。
圖4 斑石鯛和金鼓魚外形
圖3 斑石鯛、條石鯛與其他物種的mtDNA編碼蛋白質(zhì)的基因密碼子偏好性聚類
將所研究的6個(gè)物種的每個(gè)mtDNA編碼蛋白質(zhì)的每個(gè)基因(ND1、ND2、COX1、COX2、ATP6、COX3、ND6、ND4、ND5、Cytb)各自看成一類,對(duì)每個(gè)基因序列進(jìn)行聚類分析。其結(jié)果為斑石鯛和條石鯛均首先聚為一類,它們的距離相對(duì)較近;斑石鯛、條石鯛2種魚在ATP6、ND2、COX1、ND5中首先聚類后,其次與金鼓魚聚為一類,這與密碼子偏好性聚類結(jié)果一致(圖5)。
圖5 最大似然法對(duì)斑石鯛、條石鯛及其他物種mtDNA編碼蛋白基因序列構(gòu)建的進(jìn)化樹
基因是生物遺傳信息的載體,蛋白質(zhì)是發(fā)揮生物功能的主要分子。密碼子是聯(lián)系兩者的元件,記錄了長(zhǎng)期進(jìn)化過(guò)程中物種內(nèi)在的功能適應(yīng)性變化,其使用情況必然具有重要的生物學(xué)意義。斑石鯛和條石鯛mtDNA編碼蛋白的序列偏好使用以AC結(jié)尾的密碼子,最高使用頻率的密碼子是CGA(相對(duì)密碼子使用度分別為2.96和3.32),其次是AAA(1.97和1.89) ,但總體而言以C結(jié)尾比A結(jié)尾密碼子偏好性略高,這與分析金魚(Carassiusauratus)[19]轉(zhuǎn)錄組偏好使用GC結(jié)尾密碼子分析結(jié)果存在差異,說(shuō)明物種密碼子使用在進(jìn)化過(guò)程中存在保守性,相近物種的密碼子使用偏好性相似,反之則密碼子的使用存在差異。斑石鯛和條石鯛mtDNA以G結(jié)尾密碼子避免使用,且與其線粒體COX1、Cyt b和D-loop 3種片段上組成分布一致[18]。以密碼子編碼氨基酸的原理計(jì)算,理論上亮氨酸的氨基酸含量最高,且含量較高的亮氨酸(CUA、CUC、CUU)、異亮氨酸 (AUU)、蘇氨酸(ACC、ACA)及丙氨酸(GCC、GCA)4種氨基酸均偏愛(ài)相同的密碼子,表明不同氨基酸組成也一定程度影響密碼子使用。
宋喬喬等[20]對(duì)牛亞科動(dòng)物線粒體基因密碼子偏好性進(jìn)行聚類分析,發(fā)現(xiàn)基于密碼子偏好性差異可以揭示物種間的親緣關(guān)系,可用于物種的分類研究。不同物種的密碼子偏好性差異與其親緣關(guān)系也密切相關(guān),密碼子偏好性差異小,則親緣關(guān)系近;反之,親緣關(guān)系遠(yuǎn)[21]。Duan等[22]比較了14種鲌亞科魚類密碼子偏好性的差異,發(fā)現(xiàn)屬間物種的密碼子偏好性是具有物種特異性,主要是受到進(jìn)化過(guò)程中的突變與自然選擇的影響?;蛲蛔兙哂械皖l性,故近緣物種密碼子在使用偏好性上總體相似,又有輕微差別。在本研究中,密碼子偏好性的聚類分析和基因序列的進(jìn)化分析結(jié)果顯示,密碼子偏好性的聚類分析中斑石鯛和條石鯛聚為一類;基因序列的進(jìn)化分析結(jié)果也顯示,黑鯛與真鯛在ATP6、ND2、Cytb、ND1、ND4、ND5、ND6聚為一類,表明斑石鯛與條石鯛、黑鯛與真鯛親緣關(guān)系較近,這與傳統(tǒng)分類學(xué)一致。斑石鯛、條石鯛與斑馬魚在基因序列(除ND4)及偏好密碼子聚類中均遺傳距離最遠(yuǎn),說(shuō)明石鯛科與斑馬魚在進(jìn)化過(guò)程中親緣關(guān)系較遠(yuǎn)。斑石鯛、條石鯛2種魚在密碼子偏好性聚類中首先聚為一類后,其次與金鼓魚聚為一類;基因序列的分析結(jié)果也顯示,在ATP6、ND2、COX1、ND5上存在相同結(jié)論,且金鼓魚和斑石鯛在幼魚階段外觀相似,表明石鯛科與金鼓魚親緣關(guān)系較近,與傳統(tǒng)分類學(xué)存在一定差異。密碼子偏好聚類中,黑鯛與金鼓魚先聚為一類,后與真鯛聚為一類,體現(xiàn)了金鼓魚較真鯛與黑鯛親緣關(guān)系更近,這與發(fā)育進(jìn)化樹及傳統(tǒng)分類學(xué)[23]存在較大分歧。Christianson[24]認(rèn)為,基于密碼子的偏好性進(jìn)行聚類,其結(jié)果與真實(shí)的系統(tǒng)發(fā)育關(guān)系不一定完全一致,這一指標(biāo)在較小的分類單元里比較可靠,但是在分歧較大的分類單元里,這一方法主要還是作為傳統(tǒng)系統(tǒng)樹構(gòu)建方法的補(bǔ)充和參考。
不同物種密碼子偏好性差異,產(chǎn)生原因可能是各物種生存環(huán)境不同,承受壓力不同,導(dǎo)致突變和選擇在物種之間程度有差異[25-26],此外,基因序列長(zhǎng)度[27-28]、編碼區(qū)GC含量[29]、翻譯效率[30]和編碼蛋白質(zhì)的結(jié)構(gòu)與功能[31]等均可引起密碼子使用偏性,至于這些因素具體如何影響同義密碼子偏好性仍有待進(jìn)一步研究。同時(shí)有研究表明,密碼子的使用偏性與基因的表達(dá)強(qiáng)弱有關(guān),高效表達(dá)的基因所使用的密碼子同低表達(dá)的基因相比較,它們具有明顯不同的基因使用頻率,高效表達(dá)的基因在密碼子使用上比非高效基因更有偏向性趨勢(shì),它們通常使用一套偏好性同義密碼子,同時(shí)發(fā)生偏好性使用的密碼子還對(duì)應(yīng)著含量最豐富的tRNA,提高翻譯效率[31-33]。通過(guò)優(yōu)化與改造密碼子,可促進(jìn)翻譯效率及提高生物中外源基因的表達(dá),如斑石鯛偏好密碼子的基因作為外源基因,可以不經(jīng)密碼子優(yōu)化,在條石鯛中獲得高效表達(dá);若依據(jù)斑石鯛的密碼子偏好性信息進(jìn)行密碼子改造,可提高以斑石鯛偏好密碼子的外源基因在其他模式生物中的表達(dá)效率。對(duì)于今后石鯛科魚類轉(zhuǎn)基因過(guò)程中對(duì)構(gòu)建合適的轉(zhuǎn)基因表達(dá)系統(tǒng)具有重要的指導(dǎo)意義,從而提高特定蛋白的表達(dá)量,增強(qiáng)轉(zhuǎn)基因育種的效果。
同時(shí),研究密碼子偏好性還有很多的意義。研究密碼子使用偏好性有利于改善靶基因在受體表達(dá)系統(tǒng)中的表達(dá)效果,通過(guò)對(duì)密碼子進(jìn)行改造優(yōu)化已經(jīng)成為提高外源基因在宿主細(xì)胞中的表達(dá)效率最有效且成功的途徑之一;通過(guò)對(duì)密碼子偏好性形成的主要因素探究,對(duì)于進(jìn)一步了解生物基因或基因組特征、分子進(jìn)化壓力及生態(tài)適應(yīng)等均具有重要啟示;還有許多其他方面的意義,如鑒定基因的表達(dá)水平高低,判斷是否發(fā)生基因重組,發(fā)現(xiàn)新基因等[34-36]。
本研究利用分析密碼子偏好性及聚類分析等生物信息學(xué)方法,在mtDNA水平上對(duì)斑石鯛和條石鯛編碼蛋白序列的密碼子使用特征進(jìn)行分析,明確了這2種魚的mtDNA密碼子偏好性,并比較與其他魚類密碼子使用偏好性差異。本研究結(jié)果可為探討斑石鯛和條石鯛新基因預(yù)測(cè)、功能基因組學(xué)與其他水生動(dòng)物在進(jìn)化中親緣關(guān)系等研究提供理論基礎(chǔ)。