郎大田, 王磊, 羅家剛, 祁岑, 王忻
(1.昭通學(xué)院 化學(xué)與生命科學(xué)學(xué)院,云南 昭通 657000;2.云南省糧油科學(xué)研究院,云南 昆明 650033)
現(xiàn)存的生物都需要靠自身的進(jìn)化來適應(yīng)變化的環(huán)境.基因型和基因數(shù)目的改變是適應(yīng)性進(jìn)化的重要機(jī)制,其中基因復(fù)制為生物進(jìn)化提供了原材料,是生物進(jìn)化的動(dòng)力源泉.隨著基因組學(xué)研究的不斷深入,發(fā)現(xiàn)越來越多的生物表型與基因復(fù)制有著密切的關(guān)系[1-14].
RNASE A基因超家族是研究分子進(jìn)化的最佳模型之一,僅在脊椎動(dòng)物中存在,截至目前在人的基因組中檢測(cè)到15個(gè)成員(RNase1-15)[15-17].其中RNase4基因是RNASE A基因超家族的一個(gè)重要成員,過去基于單基因水平(引物設(shè)計(jì),PCR擴(kuò)增,單基因測(cè)序)對(duì)RNase4基因的進(jìn)化研究相對(duì)較少,但隨著分子生物學(xué)和基因組學(xué)的迅速發(fā)展,越來越多的物種基因組陸續(xù)公布,RNase4基因的研究引起了越來越多學(xué)者的關(guān)注,在基因組水平對(duì)該基因的研究越來越多[15-17].特別是2013年Goo等[17]對(duì)20個(gè)哺乳動(dòng)物(僅包含哺乳動(dòng)物第一大類群嚙齒目中的幾內(nèi)亞豬、裸鼴鼠、小家鼠、褐家鼠和倉(cāng)鼠5個(gè)物種)基因組的RNase4基因進(jìn)行研究,驚奇地在幾內(nèi)亞豬中檢測(cè)到RNase4基因發(fā)生基因復(fù)制,而在另外的四個(gè)物種均為單拷貝[18].這一有趣的發(fā)現(xiàn)提示RNase4基因在嚙齒目中可能具有獨(dú)特的進(jìn)化模式.但該研究?jī)H包含嚙齒目的5個(gè)物種, 那么RNase4基因在嚙齒目的其他物種、屬、科甚至亞目中發(fā)生基因復(fù)制的時(shí)間以及進(jìn)化模式如何?因此,急需增加更多嚙齒目代表物種對(duì)RNase4基因進(jìn)行深入的進(jìn)化分析,以揭示上述未解決的科學(xué)問題.因此,我們對(duì)2013年Goo等[18]研究的嚙齒目 5個(gè)物種基因組及截至目前在NCBI上公布的所有嚙齒目的11個(gè)物種基因組進(jìn)行RNase4基因分析.
本次研究共包含嚙齒目10科16個(gè)物種(包括2013年Goo等[18]研究的5個(gè)物種).這16個(gè)物種覆蓋了嚙齒目的三個(gè)進(jìn)化枝:豪豬亞目、“與小家鼠相關(guān)的進(jìn)化枝”和“與松鼠相關(guān)的進(jìn)化枝”.
用小鼠RNase4基因的氨基酸序列和核酸序列分別作為查詢序列,采用先前多數(shù)學(xué)者采用的TBlastN和BlastN方法[15-17],E值為10-10分別對(duì)每個(gè)物種的基因組搜索同源序列,進(jìn)行分析.
使用ClustalX1.8.3[19]比對(duì)軟件進(jìn)行序列比對(duì),并進(jìn)行手工矯正.采用鄰接法(Neighbor-Joining,NJ)和最大似然法(Maximum Likelihood,ML)進(jìn)行系統(tǒng)樹構(gòu)建.選擇兔形目(Lagomorpha)中的穴兔(Oryctolaguscuniculus)和北美鼠兔(Ochotonaprinceps)的RNase4基因(Oc_RNase4,Op_RNase4)作為外群.使用MEGA5.0軟件構(gòu)建NJ樹[20-21],使用RaxML7.0.4軟件構(gòu)建ML樹[22].
本次研究為嚙齒目16個(gè)物種,22條RNase4基因序列,包括本次分析的11個(gè)物種(16條RNase4基因序列)和2013年Goo等.[17]研究的5個(gè)物種(6條RNase4基因序列).在這22條序列中,有5條序列的開放閱讀框,因移碼突變或者終止密碼子提前變?yōu)榧倩?白臀豚鼠和幾內(nèi)亞豬的RNase4基因有2個(gè)拷貝,鹿白足鼠和非洲跳鼠有1個(gè)真基因和2個(gè)假基因,奧氏更格盧鼠僅有1個(gè)假基因,其他11個(gè)物種的RNase4基因均為單拷貝(表1).這一結(jié)果揭示RNase4基因在白臀豚鼠、幾內(nèi)亞豬、鹿白足鼠和非洲跳鼠這四個(gè)物種發(fā)生基因擴(kuò)張.
表1 本研究的物種信息和RNase4基因序列數(shù)
接下來對(duì)發(fā)生基因擴(kuò)張的四個(gè)物種的旁系同源序列差異度進(jìn)行計(jì)算.幾內(nèi)亞豬的兩個(gè)基因(Cp_RNase4A,Cp_RNase4B)間僅有1個(gè)堿基和1個(gè)氨基酸的差異;白臀豚鼠中的RNase4A(Ca_RNase4A)基因在376-414 bp區(qū)域未測(cè)序到,用N替代,除去未測(cè)序到的這個(gè)區(qū)域,白臀豚鼠中2個(gè)基因(Ca_RNase4A,Ca_RNase4B)間僅有1個(gè)堿基和1個(gè)氨基酸的差異,這2個(gè)拷貝在白臀豚鼠基因組的同一個(gè)Contig上(AVPZ01000045.1),但位置相距約15 kb.幾內(nèi)亞豬和白臀豚鼠的拷貝間僅有1個(gè)氨基酸的差異,揭示RNase4基因這兩個(gè)物種中發(fā)生基因復(fù)制事件是在最近一段時(shí)間內(nèi),這也正是在基因組水平對(duì)基因復(fù)制的進(jìn)化模式的研究的優(yōu)點(diǎn)之一(基于單基因水平研究,拷貝間氨基酸差異數(shù)小于3,視為同一拷貝[23-25]),當(dāng)然不能排除是由于基因組組裝錯(cuò)誤所致,但我們認(rèn)為豚鼠科的幾內(nèi)亞豬和白臀豚鼠兩個(gè)基因組對(duì)RNase4基因的組裝同時(shí)出現(xiàn)錯(cuò)誤的可能性很小.倉(cāng)鼠科中的鹿白足鼠和跳鼠科的非洲跳鼠的RNase4基因,因僅有1個(gè)功能基因,另外2個(gè)為假基因,只能對(duì)其核酸序列的差異度進(jìn)行計(jì)算.鹿白足鼠3個(gè)拷貝(Pm_RNase4,Pm_RNase4psA和Pm_RNase4psB)中兩兩之間的堿基差異為12-14個(gè).非洲跳鼠 3個(gè)拷貝(Jj_RNase4,Jj_RNase4psA和Jj_RNase4psB)中兩兩之間的堿基差異都在100個(gè)堿基左右,拷貝間的差異如此之大,且在系統(tǒng)發(fā)育樹中非洲跳鼠3個(gè)拷貝的枝都相對(duì)較長(zhǎng)(圖2),于是對(duì)這3條序列分別在NCBI上進(jìn)行在線同源序列搜索,結(jié)果仍然與RNase4基因的相似度最高,這就揭示非洲跳鼠3個(gè)拷貝間有如此大的差異很可能是RNase4基因發(fā)生基因復(fù)制后,其中2個(gè)拷貝假基因化,不再受到選擇壓力,進(jìn)化速率快的結(jié)果.
嚙齒目的22條序列的長(zhǎng)度為423~537 bp,比對(duì)后的序列長(zhǎng)度為566 bp,包含信號(hào)肽(1-84 bp)和成熟肽(85~566 bp).17條功能基因比對(duì)后的氨基酸序列為179個(gè)氨基酸,這些序列幾乎都具有RNASE A基因超家族典型的序列特征:(1)有8個(gè)結(jié)構(gòu)半胱氨酸,形成二硫鍵;(2)有3個(gè)催化氨基酸殘基;(3)有序列標(biāo)簽“CKXXNTF”,但值得注意的是豪豬亞目中所有拷貝的蘇氨酸(T)突變?yōu)榻z氨酸(S)(圖1).
圖1 嚙齒目RNase4真基因的氨基酸序列對(duì)比
采用最大似然法(ML)和鄰接法(NJ)對(duì)RNase4基因的功能基因和假基因一起構(gòu)樹,得到相似的拓?fù)浣Y(jié)構(gòu)(圖2和圖3).
由圖2和圖3可以看出,拓?fù)浣Y(jié)構(gòu)支持嚙齒目分為三個(gè)進(jìn)化枝:“與松鼠相關(guān)的進(jìn)化枝”(ML BS=94%,NJ BS=54%)、“與小家鼠相關(guān)的進(jìn)化枝”(ML BS=84%,NJ BS=59%)和豪豬亞目(ML BS=100%,NJ BS=99%),且支持率都比較高.這三支的進(jìn)化關(guān)系為“與松鼠相關(guān)的進(jìn)化枝”最先分歧,豪豬亞目和“與小家鼠相關(guān)的進(jìn)化枝”形成姐妹群(ML BS=94%,NJ BS=54%),這一結(jié)果與2009年Shani等對(duì)嚙齒目的系統(tǒng)發(fā)育研究結(jié)果一致[26].
另外,由圖2和圖3還可以看出,RNase4基因在豪豬亞目豚鼠科的白臀豚鼠和幾內(nèi)亞豬(ML BS=100%,NJ BS=100%)、“與小家鼠相關(guān)的進(jìn)化枝”中的非洲跳鼠(ML BS=99%,NJ BS=99%)和鹿白足鼠(ML BS=100%,NJ BS=100%)中發(fā)生三次獨(dú)立基因復(fù)制,發(fā)生基因復(fù)制的時(shí)間是在嚙齒目中各科形成之后.在豚鼠科的白臀豚鼠和幾內(nèi)亞豬中均檢測(cè)到2個(gè)RNase4功能基因,并且是以基因的形式相互混合,這一結(jié)果揭示RNase4基因在白臀豚鼠和幾內(nèi)亞豬中發(fā)生一次基因復(fù)制事件,且基因復(fù)制是在這兩個(gè)物種形成之前,豚鼠科形成之后發(fā)生的.在非洲跳鼠和鹿白足鼠中均檢測(cè)到1個(gè)功能基因和2個(gè)假基因,并且基因是以物種的形式聚集,這一結(jié)果揭示RNase4基因在非洲跳鼠和鹿白足鼠中均獨(dú)立發(fā)生2次基因復(fù)制和2次假基因化事件,即“生與滅(birth and death)”的進(jìn)化模式,這一進(jìn)化模式在嚙齒目的EAR基因(RNASE A超基因家族中的2個(gè)成員)和其他基因家族的研究中也有報(bào)道[27-29].
圖2 基于嚙齒目 RNase4基因構(gòu)建的 ML 系統(tǒng)發(fā)育樹
圖3 基于嚙齒目 RNase4基因構(gòu)建的 NJ 系統(tǒng)發(fā)育樹
RNase4基因作為RNASE A超基因家族中的一個(gè)重要成員,在過去的分子進(jìn)化研究中相對(duì)較少,但隨著越來越多的基因組公布,在基因組水平對(duì)RNase4基因的研究引起了越來越多學(xué)者的關(guān)注,特別是對(duì)嚙齒目中的許多模式生物進(jìn)行深入進(jìn)化分析研究,能為后續(xù)的功能實(shí)驗(yàn)奠定基礎(chǔ).
由以上的研究可以看出RNase4基因在嚙齒目中的進(jìn)化模式比想象的復(fù)雜,在所研究的類群中發(fā)生了3次獨(dú)立基因復(fù)制事件,并且在每一次獨(dú)立的基因復(fù)制事件中有不同的進(jìn)化模式.同時(shí),該研究為后續(xù)對(duì)嚙齒目RNase4基因的深入研究提供了線索:(1)在倉(cāng)鼠科所分析的倉(cāng)鼠、鹿白足鼠、金黃地鼠和草原田鼠這4個(gè)物種中,RNase4基因僅在鹿白足鼠中發(fā)生基因復(fù)制事件,而其他3個(gè)物種為單拷貝,這就提示后續(xù)研究需要增加倉(cāng)鼠科代表物種,特別是增加與鹿白足鼠親緣關(guān)系較近的代表物種.在單基因水平進(jìn)行深入的分析研究,更加清晰地追溯RNase4基因在倉(cāng)鼠科中發(fā)生基因復(fù)制的時(shí)間和進(jìn)化模式,同時(shí)對(duì)RNase4基因發(fā)生復(fù)制的驅(qū)動(dòng)力進(jìn)行深入研究.(2)在跳鼠科中,本次研究?jī)H包含非洲跳鼠,并且檢測(cè)到RNase4基因發(fā)生2次基因復(fù)制和2次假基因化事件,這就帶來疑問:RNase4基因是僅在跳鼠科的非洲跳鼠,還是在跳鼠科的某一個(gè)或者某幾個(gè)屬,甚至整個(gè)跳鼠科中發(fā)生基因復(fù)制事件?這同樣需要增加跳鼠科代表物種來進(jìn)行深入研究.
當(dāng)然,對(duì)RNase4基因的研究并不局限于上述的進(jìn)化分析,功能方面的研究也急需加入.為了對(duì)基因復(fù)制發(fā)生后,旁系同源基因的命運(yùn)(新功能化、亞功能化和假基因化等)和活性進(jìn)行深入探討,需要對(duì)拷貝在不同組織的表達(dá)、酶活性和點(diǎn)突變等進(jìn)行研究.
另外,隨著基因組測(cè)序成本的降低和技術(shù)的成熟以及更多代表物種的基因組公布,在基因組水平對(duì)更多的生物類群進(jìn)行RNase4基因研究,促進(jìn)人們對(duì)該基因的認(rèn)識(shí),同時(shí)也為系統(tǒng)認(rèn)識(shí)動(dòng)物遺傳機(jī)制做出貢獻(xiàn).
[1] RUBIN C J,ZODY M C,ERIKSSON J,et al.Whole-genome resequencing reveals loci under selection during chicken domestication[J].Nature,2010,464(7288):587-591.
[2] ALFOLDI J,DI PALMA F,GRABHERR M,et al.The genome of the green anole lizard and a comparative analysis with birds and mammals[J].Nature,2011,477(7366):587-591.
[3] KIM E B, FANG X, FUSHAN A A,et al.Genome sequencing reveals insights into physiology and longevity of the naked mole rat[J].Nature,2011,479(7372):223-227.
[4] LINDBLAD-TOH K,GARBER M,ZUK O,et al.A high-resolution map of human evolutionary constraint using 29 mammals[J].Nature,2011,478(7370):476-482.
[5] XU X,PAN S,CHENG S,et al.Genome sequence and analysis of the tuber crop potato[J].Nature,2011,475(7355):189-195.
[6] THE TOMATO GENOME CONSORTIUM.The tomato genome sequence provides insights into fleshy fruit evolution[J].Nature,2012,485(7400):635-641.
[7] ABECASIS G R,AUTON A,BROOKS L D,et al.An integrated map of genetic variation from 1,092 human genomes[J].Nature,2012,491(7422):56-65.
[8] D'HONT A,DENOEUD F,AURY J M,et al.The banana (Musa acuminata) genome and the evolution of monocotyledonous plants[J].Nature,2012,488(7410):213-217.
[9] GROENEN M A,ARCHIBALD A L,UENISHI H,et al.Analyses of pig genomes provide insight into porcine demography and evolution[J].Nature,2012,491(7424):393-398.
[10]MAYER K F,WAUGH R,BROWN J W,et al.A physical, genetic and functional sequence assembly of the barley genome[J].Nature,2012,491(7426):711-716.
[11]PASANIUC B,ROHLAND N,MCLAREN P J,et al.Extremely low-coverage sequencing and imputation increases power for genome-wide association studies[J].Nat Genet,2012,44(6):631-635.
[12]QIU Q,ZHANG G,MA T,et al.The yak genome and adaptation to life at high altitude[J].Nat Genet,2012,44(8):946-949.
[13]SCALLY A,DUTHEIL J Y,HILLIER L W,et al.Insights into hominid evolution from the gorilla genome sequence[J].Nature,2012,483(7388):169-175.
[14]ZHANG G,FANG X,GUO X,et al.The oyster genome reveals stress adaptation and complexity of shell formation[J].Nature,2012,490(7418):49-54.
[15]CHO S,BEINTEMA J J,ZHANG J.The ribonuclease A superfamily of mammals and birds:identifying new members and tracing evolutionary histories[J].Genomics,2005,85(2):208-220.
[16]Cho S,Zhang J.Ancient expansion of the ribonuclease A superfamily revealed by genomic analysis of placental and marsupial mammals[J].Gene,2006,373:116-125.
[17]GOO S M,CHO S.The expansion and functional diversification of the mammalian ribonuclease a superfamily epitomizes the efficiency of multigene families at generating biological novelty[J].Genome Biol Evol,2013,5(11):2124-2140.
[18]GUPTA S K,HAIGH B J,GRIFFIN F J,et al.The mammalian secreted RNases: mechanisms of action in host defence[J].Innate Immun,2013,19(1):86-97.
[19]THOMPSON J D,GIBSON T J,PLEWNIAK F,et al.The CLUSTAL_X windows interface:flexible strategies for multiple sequence alignment aided by quality analysis tools[J].Nucleic Acids Res,1997,25(24):4876-4882.
[20]TAMURA K,PETERSON D,PETERSON N,et al.MEGA5:molecular evolutionary genetics analysis using maximum likelihood, evolutionary distance, and maximum parsimony methods[J].Mol Biol Evol,2011,28(10):2731-2739.
[21]KUMAR S,NEI M,DUDLEY J,et al.MEGA:a biologist-centric software for evolutionary analysis of DNA and protein sequences[J].Brief Bioinform,2008,9(4):299-306.
[22]STAMATAKIS A,HOOVER P,ROUGEMONT J.A rapid bootstrap algorithm for the RAxML Web servers[J].Syst Biol,2008,57(5):758-771.
[23]XU H,LIU Y,MENG F,et al.Multiple bursts of pancreatic ribonuclease gene duplication in insect-eating bats[J].Gene,2013,526(2):112-117.
[24]YU L,WANG X Y,JIN W,et al.Adaptive evolution of digestive RNASE1 genes in leaf-eating monkeys revisited: new insights from ten additional colobines[J].Mol Biol Evol,2010,27(1):121-131.
[25]YU L,ZHANG Y P.The unusual adaptive expansion of pancreatic ribonuclease gene in carnivora[J].Mol Biol Evol,2006,23(12):2326-2335.
[26]BLANGA-KANFI S,MIRANDA H,PENN O,et al.Rodent phylogeny revised: analysis of six nuclear genes from all major rodent clades[J].BMC Evol Biol,2009,9:71-83.
[27]OTA T,NEI M.Divergent evolution and evolution by the birth-and-death process in the immunoglobulin VH gene family[J].Mol Biol Evol,1994,11(3):469-482.
[28]NEI M,ROGOZIN I B,PIONTKIVSKA H.Purifying selection and birth-and-death evolution in the ubiquitin gene family[J].Proc Natl Acad Sci U S A,2000,97(20):10866-10871.
[29]ZHANG J,DYER K D,ROSENBERG H F.Evolution of the rodent eosinophil-associated RNase gene family by rapid gene sorting and positive selection[J].Proc Natl Acad Sci U S A,2000,97(9):4701-4706.